Wikipedia: Quellenangaben auf dem Prüfstand (Foto: unsplash.com, Oberon Copeland @veryinformed.com)

Die Qualität der in der Online-Enzyklopädie Wikipedia zusammengefassten Infos lässt sich mithilfe Künstlicher Intelligenz (KI) deutlich verbessern. Das glaubt zumindest das Londoner Startup Samaya AI, das mit "Side" ein eigenes KI-System entwickelt hat, das die Quellen von Wikipedia-Beiträgen automatisch nach ihrer Überprüfbarkeit und Zuverlässigkeit klassifiziert und bei Bedarf auch alternative Quellen vorschlägt. Bei ersten Tests vertrauten User bereits in 70 Prozent der Fälle lieber jenen Quellenangaben, die Side zutage förderte.

"Wikipedia ist heute mit einer halben Billion Seitenbesuchen pro Jahr eine der beliebtesten Websites und eine der wichtigsten Wissensquellen im Internet", so Fabio Petroni, Mitgründer und CTO von Samaya AI. Gerade deshalb sei es umso wichtiger, dass jedes Wissen, das über diese Seite verbreitet werde, genau zu überprüfen ist. "Wikipedia-User sollten in der Lage sein, Behauptungen, die auf der Seite aufgestellt werden, mithilfe von verlässlichen externen Quellen zu verifizieren. Um das zu ermöglichen, enthalten die Beiträge verlinkte Quellenangaben, die auf entsprechendes Hintergrundmaterial verweisen", erklärt der Experte.

Die Verbesserung der Qualität dieser Quellenangaben sei eine wichtige Herausforderung. "Es gibt einen gewaltigen Druck, um neue Werkzeuge zu kreieren, die Menschen dabei unterstützen können, dieses Ziel zu erreichen", betont Petroni. In seinem Unternehmen sei man davon überzeugt, dass dies mithilfe von KI und einem dazugehörigen Sprachmodell durchaus machbar ist. "Wir haben mit Side ein System entwickelt, das auf einem neuronalen Netzwerk basiert und all jene Zitate identifizieren kann, die wenig glaubwürdig erscheinen, und anschliessend auch selbst bessere vorschlagen kann", so der Firmenmitgründer.

Um die Qualität der Quellenangaben zu steigern, haben Petroni und sein Team ihr KI-System zunächst mit einem riesigen Datenset von Wikipedia-Einträgen gefüttert und trainiert. Anschliessend wurden damit dann Artikel überprüft, die das Modell bislang noch nicht analysiert hatte. Dabei wurde besonders auf eine korrekte Angabe von Quellen geachtet. Wenn diese nicht überprüfbar waren oder als wenig verlässlich eingestuft wurden, schlug Side selbst alternative Referenzen vor.

Bei einem Praxistest wurden die ursprünglich angeführten Wikipedia-Quellen dann mit jenen verglichen, die das KI-System ausgesucht hatte. Das Ergebnis war eindeutig: Wenn Side Quellen als nicht überprüfbar einstufte und Alternativen vorschlug, präferierten Anwender in 70 Prozent der Fälle die Referenzen des KI-Tools. In rund der Hälfte der Fälle fand Side genau die gleichen Quellen, die auch im entsprechenden Wikipedia-Artikel angeführt waren.



Der Online-Stellenmarkt für ICT Professionals