KI hat vorhersehbare und systematische Vorurteile

KI-Systeme denken nicht wie Menschen, sie sind sogar noch voreingenommener.

Die Untersuchung von Forschenden der Hebräischen Universität zeigt, dass moderne KI-Modelle zwar Elemente menschlichen Vertrauens erkennen, dieses Erkennen aber auf eine Weise organisieren, die sich grundlegend von menschlichem Urteil unterscheidet. Menschen bilden oft eine ganzheitliche, unscharfe Gesamteinschätzung einer Person. KI dagegen zerlegt Menschen in klar getrennte Dimensionen wie Kompetenz, Integrität und Wohlwollen und bewertet diese wie Spalten in einer Tabelle. Diese strukturierte Herangehensweise macht Entscheidungen konsistent, zugleich aber auch starr und vorhersehbar.

Dieses systematische Zerlegen hat zwei wichtige Konsequenzen. Erstens fängt KI zwar zentrale Signale menschlicher Beurteilung auf und kann damit in vielen Situationen brauchbare Vorhersagen liefern. Zweitens produziert diese Mechanik aber auch Vorurteile, die oft vorhersehbar und in manchen Fällen stärker sind als menschliche Vorurteile. In den untersuchten Szenarien, die von Kreditentscheidungen bis zur Einschätzung einer Betreuungsperson reichten, zeigten Modelle Unterschiede allein aufgrund demografischer Merkmale. Ältere Personen erhielten häufiger bessere Bewertungen, religiöse Zugehörigkeit beeinflusste die Kreditvergabe und in einzelnen Modellen spielten Geschlechterstereotype eine Rolle, obwohl alle sonstigen Informationen identisch waren.

KI täuscht Vertrauen vor, stützt sich dabei jedoch auf starre, strukturierte Bewertungsmuster.

Maschinen betrachten menschliche Eigenschaften isoliert, anstatt sich einen ganzheitlichen Eindruck zu verschaffen.

Ein zweites Ergebnis der Studie ist, dass es nicht das eine KI-Urteil gibt. Verschiedene Modelle können dieselbe Person unterschiedlich bewerten, sodass die Wahl des eingesetzten Systems reale Konsequenzen für Betroffene haben kann. Das macht die Modellwahl zu einer politischen und ethischen Entscheidung. Wenn ein Arbeitgeber, eine Bank oder eine öffentliche Stelle eine bestimmte KI in ihre Entscheidungsprozesse einbindet, bestimmt diese technische Entscheidung mit, wer Chancen erhält und wer nicht.

Was folgt daraus praktisch? Erstens müssen Entwicklerinnen und Entscheider erkennen, dass Modellkonsistenz nicht gleich Fairness ist. Ein stabiler Algorithmus kann systematisch diskriminieren. Zweitens braucht es gezielte Prüfungen über mehrere Modelle und Kontextbedingungen hinweg, um zu verstehen, wie bestimmte Merkmale gewichtet werden. Drittens sind Transparenz und Monitoring notwendig, damit Abweichungen zwischen menschlichen und algorithmischen Urteilen erkannt und adressiert werden können.

Die Ergebnisse sind ein Appell, die Aufmerksamkeit auf die Arbeitsweise von KI zu richten. KI kann nützliche Struktur und Vorhersagbarkeit beisteuern, doch genau diese Stärke kann zum Problem werden, wenn sie auf sozial sensible Bereiche angewandt wird, ohne dass wir die zugrundeliegenden Logiken und Verzerrungen verstehen. Die zentrale Frage lautet daher nicht mehr, ob wir Maschinen vertrauen, sondern ob wir nachvollziehen, wie Maschinen zu ihren Ergebnissen kommen.

Die Antworten von LLMs beruhen auf Mustern, nicht auf Fakten oder gar Verständnis. Wer die grundsätzliche Arbeitsweise von KI verstanden hat, weiß, dass diese Studie nur zu dem beschriebenen Ergebnis kommen konnte.

Nach oben scrollen