LLMs sind keine AGI und werden es niemals sein. Aktuelle Fähigkeiten von LLMs lassen sich durch einfache Phänomene erklären, die bei Weitem nicht an Denken oder Schlussfolgern heranreichen.
Reasoning (Schlussfolgern) ist unter LLM‑Befürwortern seit Langem ein umstrittenes Thema. Das liegt vor allem daran, dass diese Modelle eine Art Blackbox sind. Wir können nicht einfach hineinschauen und erklären, wie oder warum sie gerade diese Ausgabe erzeugt haben. Selbst die Leute, die LLMs beruflich entwickeln, geben das offen zu.
LLMs (und neuronale Netze allgemein) ähneln dem menschlichen Gehirn darin, dass wir erklären können, was einzelne Neuronen tun, aber setzt man genug davon zusammen, hat niemand wirklich eine Ahnung, was das Ganze dazu bringt, genau das Verhalten zu zeigen, das es tut. Selbst die besten Neurowissenschaftler verstehen das Gehirn als Ganzes nur unzureichend.
Wahres Schlussfolgern ist nur eine von vielen Theorien, die erklären, wie LLMs ihre Ausgaben erzeugen. Es ist außerdem diejenige, die die meisten Annahmen erfordert. Alle aktuellen Fähigkeiten von LLMs lassen sich durch weitaus einfachere Phänomene erklären, die bei weitem nicht an Denken oder Schlussfolgern heranreichen.
Wenn eine Maschine unzählige Trainingsdaten konsumiert und transformiert, die von Menschen erstellt, von Menschen diskutiert und von Menschen erklärt wurden, dann ist es sehr wahrscheinlich, dass deren Ausgabe menschlichem Schlussfolgern gleicht. Würde ich diesen Artikel fotokopieren, würde niemand behaupten, mein Kopierer habe ihn geschrieben und könne daher denken. Aber macht man den Prozess kompliziert genug, sieht es so aus, als könne er es doch.
Wahres Schlussfolgern vs. statistisches Mustererkennen
Für mich ist eine klare Unterscheidung zwischen wahrem Schlussfolgern und Mustererkennung, was passiert, wenn man den Zugang zu neuen Informationen entzieht. Viele behaupten, LLMs seien keine Plagiatsmaschinen, sie lernten wie Menschen durch Lehrer und Bücher und entwickelten dabei ein Verständnis.
Menschliche Forscher haben vieles durch Lesen von Büchern gelernt. Irgendwann aber erreichte jeder von ihnen einen Punkt, an dem genug Wissen vorhanden war, um eigene originelle Forschung in unerforschtem Terrain zu betreiben. Ein guter Forscher kann zu Themen forschen, zu denen es keine Quelle gibt, an der seine Arbeit überprüft werden kann. Das ist etwas, worin LLMs schlecht sind, bzw. gar nicht zu leisten fähig ist. Halluzinieren ist keine Forschung.
Einem LLM Zugang zum gesamten Internet und zum gesamten aufgezeichneten menschlichen Wissen zu geben und es dann mit einem für Menschen gedachten Quiz zu testen, ist ein billiger Taschenspielertrick. Ich könnte auch 100 % bei einer Multiple‑Choice‑Prüfung erreichen, wenn man mir erlaubte, alle Antworten zu googeln. Der wahre Maßstab für Intelligenz und Schlussfolgern eines LLMs sollte nicht das Umformulieren vorhandener Informationen sein, sondern die Fähigkeit, wirklich Neues zu schaffen.