Symbolbild: Pixabay/Nikolay HG

Der Einsatz von Künstlicher Intelligenz kann mitunter kontraproduktiv sein. Im Rahmen einer rechtswissenschaftlichen Prüfung an einer US-Universität hat der Zugriff auf Künstliche Intelligenz (KI) gemäss einer Studie schlechteren Studenten zwar deutlich geholfen, die besten jedoch schwächer abschneiden lassen. Die Studienmacher haben dabei die Ergebnisse in den Abschlussprüfungen von 48 Studenten miteinander verglichen. Die Studierenden absolvierten ihre Prüfung zunächst regulär ohne KI und dann eine zweite mit der Unterstützung von GPT-4 des Microsoft-Partners OpenAI. Bei Multiple-Choice-Fragen wurde dabei eine Verbesserung von 29 Prozentpunkten gegenüber der ersten Prüfung ohne KI festgestellt.

Bei den leistungsschwächeren Studierenden war dabei die Steigerung wesentlich deutlicher ausgeprägt als bei den stärkeren, nämlich um 45 Prozentpunkte besser. Die der Top-Studenten sanken dagegen um etwa 20 Prozentpunkte. Wie der Forscher Daniel Schwarcz von der University of Minnesota gegenüber der Nachrichtenagentur Reuters betonte, könnte der Zugriff auf die KI dazu geführt haben, dass die Besten bei den Prüfungen nachlässig geworden seien. Möglicherweise habe die Technologie sie auch dazu veranlasst, sich weniger auf ihren juristischen Sachverstand zu verlassen. "Sobald jemand ein Problem für Sie umrissen hat, fehlt Ihnen gewissermassen die Geisteshaltung, um es unabhängig zu bewerten," so Schwarcz.

Die Ergebnisse der Untersuchung, die Schwarcz gemeinsam mit seinem Jura-Kollegen Jonathan Choi von der University of Southern California durchgefüht hat, sind erst kürzlich veröffentlicht worden. In der Studie kommen die Forscher zum kommt Schluss, "dass KI im Rechtsberuf einen ausgleichenden Effekt haben kann und Ungleichheiten zwischen Elite- und Nicht-Elite-Anwälten verringert". In vorherigen Untersuchungen erreichte eine ältere Version der KI die Ergebnisse von mittelmässigen Jura-Studenten. Eine Studie Mitte März ergab dann jedoch, dass GPT-4 - der Nachfolger von ChatGPT - die US-Anwaltsprüfung bestehen könnte. Sie beantwortete in der Studie fast 76 Prozent der Multiple-Choice-Fragen richtig und lag damit im Schnitt sieben Prozentpunkte besser als die menschlichen Prüflinge.