KI löst IQ-Test: Schlauer als der Durchschnitts-Mensch?

Wie "schlau" ist künstliche Intelligenz wirklich? Ein KI-Modell schnitt bei einem Intelligenz-Test erstmals besser ab als der durchschnittliche Mensch. Einige andere kann man unterdessen weiterhin als "dumm" bezeichnen. Welche KI schlauer ist und woran sie momentan krachend scheitert.

Im Wettrennen um die beste, schnellste und leistungsfähigste künstliche Intelligenz (KI) folgt in den vergangenen anderthalb Jahren eine Erfolgsmeldung auf die andere. Milliarden werden in aussichtsreiche Start-ups gepumpt, Tech-Giganten wie Microsoft, Google oder Meta wetteifern um das leistungsfähigste Modell.

Aber wie "intelligent" ist die KI wirklich? Bisherige Kenngrößen und Erfolgsmeldungen lassen sich kaum auf den Menschen übertragen. Deshalb machte sich Blogger Maxim Lott daran, der KI einen Test zu geben, der für Menschen gemacht ist: Ein standardisierter IQ-Test.

Dumme und blinde KI

Lott gab verschiedenen KI-Modellen den norwegischen Mensa-IQ-Test (hier geht's zum IQ-Test). In 35 Bilderrätseln müssen Muster erkannt und daraus die richtige Antwort abgeleitet werden. Der Bevölkerungsdurchschnitt erreicht 100 Punkte, die Skala geht von 85 bis 145.

Die Ergebnisse waren überraschend: ChatGPT-4 von OpenAI zeigte zwar einen gewissen Ansatz von Logik, war aber zu schlecht für die Skala. Gemini, die KI von Google, scheiterte gar an allen Fragen. "Es war einfach dumm", schrieb Lott in seinem Blogpost.

Mehr lesen: KI - "Kein Entkommen" in Schule und Job

Er erkannte jedoch, dass die KI hauptsächlich Probleme damit hatte, die Bilder zu "verstehen". Deshalb übersetzte er die Rätsel in Text, sodass auch ein blinder Mensch die Chance hätte, sie zu lösen. Das änderte einiges.

Video: Wie friedlich ist künstliche Intelligenz?

KI knackt Durchschnitts-IQ

Erhalten die Sprachmodelle die Aufgaben jedoch in Text-, statt in Bildform, können sie damit schon mehr anfangen. Lott testete mehrere Modelle durch, eines davon knackte direkt den Durchschnitt und erreichte einen IQ von 101: Claude-3 des KI-Start-Ups Anthropic.

Wie der Blogger genau vorgegangen ist, lesen Sie in diesem Blogpost. Um mehr Systeme vergleichen zu können, schätzte er die IQ-Werte, die eigentlich außerhalb der Skala liegen.

Diesen IQ haben die unterschiedlichen KI-Modelle:

Claude-3 (Anthropic): 101
ChatGPT-4 (OpenAI): 85
Bing Copilot (Microsoft): 79
Gemini (Google): 76
Grok (xAI von Elon Musk): 68,5
Llama-2 (Meta): 67
Zufälliges Raten: 63,5

Vor allem das Ergebnis von Claude-3 überraschte. Das Modell wurde erst Anfang März auf den Markt gebracht und scheint einen großen Intelligenz-Sprung zu seinem Vorgänger gemacht zu haben (19 IQ-Punkte mehr als Claude-2).

Mehr lesen: KI-Forscher: Lieber Atomkrieg als unkontrollierte KI

Blickt man auf die bisher rasante Entwicklung der Modelle, erwartet Maxim Lott, dass die nächste Version von ChatGPT einen IQ von 106 haben könnte und damit auch "überdurchschnittlich" intelligent wäre.

Affen schlauer als KI

Besonders schwach schneiden die KIs von Meta und Elon Musks xAI ab. Sie konnten kaum mehr Fragen lösen als durch zufälliges Raten. Ihr geschätzter IQ von unter 70 ist niedriger als der von manchen Affen. Dem Gorilla Koko, der Gebärdensprache konnte, wurde ein IQ von 75 bis 95 zugeschrieben.

Gorilla Koko — Gorilla-Dame "Koko" mit Tierpsychologin Penny Paterson. Koko soll bis zu 2.000 englische Wörter in Gebärdensprache gekonnt und einen Sinn für humor gehabt haben. Koko starb im Jahr 2018 im Alter von 46 Jahren.

Ist KI wirklich schlau?

Wird uns die KI in den kommenden Jahren überholen und viel intelligenter als der Mensch? Wohl kaum. Die Tests zeigten wieder einmal, dass KI nicht grundsätzlich schlau ist, sondern einfach vorhersagen kann, was das wahrscheinlichste folgende Wort ist.

Vor allem an den Bilderrätseln ist die KI (noch) krachend gescheitert. Das liegt vermutlich auch daran, dass die Modelle nicht spezifisch auf IQ-Tests trainiert wurden.

Aber gerade deshalb ist dieser Test so aussagekräftig, da auch Menschen nicht speziell üben, um bei diesen Tests besonders gut abzuschneiden.

KI kann mittlerweile schon viele Aufgaben im Alltag unterstützen oder sogar übernehmen. Es aber weiterhin keinen Grund zur Sorge, dass wir Menschen demnächst durch KI ersetzt werden. Denn grundsätzlich "intelligent" ist sie (noch) nicht.

Zusammenfassung

Wie "schlau" ist künstliche Intelligenz wirklich?
Der Frage ging Blogger Maxim Lott nach und gab verschiedenen KI-Modellen einen IQ-Test.
Dabei schnitt Claude-3 erstmals besser ab als der durchschnittliche Mensch.
Doch der versucht offenbarte auch große Schwächen der Systeme.