Laut einer neuen MIT-Studie könnte ChatGPT die Fähigkeit zum kritischen Denken untergraben

(SeaPRwire) –   Schadet ChatGPT den Fähigkeiten zum kritischen Denken? Eine neue Studie von Forschern am MIT Media Lab hat einige besorgniserregende Ergebnisse geliefert.

Die Studie teilte 54 Probanden – 18- bis 39-Jährige aus dem Raum Boston – in drei Gruppen ein und bat sie, mehrere SAT-Aufsätze mit OpenAI’s ChatGPT, der Google-Suchmaschine bzw. gar nichts zu schreiben. Die Forscher zeichneten die Gehirnaktivität der Autoren in 32 Regionen mit einem EEG auf und stellten fest, dass ChatGPT-Nutzer von den drei Gruppen das geringste Gehirnengagement zeigten und “konsistent auf neuraler, sprachlicher und Verhaltensebene schlechter abschnitten”. Im Laufe mehrerer Monate wurden die ChatGPT-Nutzer mit jedem weiteren Essay fauler und griffen am Ende der Studie oft zum Kopieren und Einfügen.

Die Arbeit legt nahe, dass die Verwendung von LLMs das Lernen tatsächlich beeinträchtigen könnte, insbesondere bei jüngeren Nutzern. Die Arbeit wurde noch nicht von Fachleuten begutachtet, und ihre Stichprobengröße ist relativ klein. Die Hauptautorin der Arbeit, Nataliya Kosmyna, fand es jedoch wichtig, die Ergebnisse zu veröffentlichen, um Bedenken zu äußern, dass die langfristige Gehirnentwicklung beeinträchtigt werden könnte, da die Gesellschaft zunehmend auf LLMs für unmittelbare Bequemlichkeit angewiesen ist.

“Was mich wirklich motiviert hat, es jetzt zu veröffentlichen, bevor ich auf eine vollständige Peer-Review warte, ist, dass ich befürchte, dass es in 6-8 Monaten einen Politiker geben wird, der entscheidet: ‘Lasst uns einen GPT-Kindergarten machen.’ Ich denke, das wäre absolut schlecht und schädlich”, sagt sie. “Sich entwickelnde Gehirne sind am stärksten gefährdet.”

Ideen generieren

Das MIT Media Lab hat in letzter Zeit erhebliche Ressourcen für die Untersuchung verschiedener Auswirkungen generativer KI-Tools bereitgestellt. Eine andere Studie ergab beispielsweise, dass sich Benutzer im Allgemeinen umso einsamer fühlen, je mehr Zeit sie mit ChatGPT verbringen.

Kosmyna, die seit 2021 als festangestellte wissenschaftliche Mitarbeiterin am MIT Media Lab tätig ist, wollte speziell die Auswirkungen der Nutzung von KI für Schularbeiten untersuchen, da immer mehr Schüler KI nutzen. Also wiesen sie und ihre Kollegen die Probanden an, 20-minütige Aufsätze zu schreiben, die auf SAT-Aufforderungen basierten, unter anderem über die Ethik der Philanthropie und die Fallstricke zu vieler Wahlmöglichkeiten.

Die Gruppe, die Aufsätze mit ChatGPT schrieb, lieferte alle äußerst ähnliche Aufsätze, denen originelles Denken fehlte und die sich auf dieselben Ausdrücke und Ideen stützten. Zwei Englischlehrer, die die Aufsätze beurteilten, nannten sie größtenteils “seelenlos”. Die EEGs zeigten eine geringe Exekutivkontrolle und Aufmerksamkeitsengagement. Und bei ihrem dritten Essay gaben viele der Autoren einfach die Aufforderung an ChatGPT weiter und ließen es fast die ganze Arbeit erledigen. “Es war eher so: ‘Gib mir einfach den Essay, verfeinere diesen Satz, bearbeite ihn, und ich bin fertig'”, sagt Kosmyna.

Die Nur-Gehirn-Gruppe zeigte umgekehrt die höchste neuronale Konnektivität, insbesondere in Alpha-, Theta- und Delta-Bändern, die mit Kreativitätsideenfindung, Gedächtnisbelastung und semantischer Verarbeitung verbunden sind. Die Forscher fanden heraus, dass diese Gruppe engagierter und neugieriger war und Eigentum beanspruchte und eine höhere Zufriedenheit mit ihren Aufsätzen zum Ausdruck brachte.

Die dritte Gruppe, die die Google-Suche nutzte, drückte ebenfalls hohe Zufriedenheit und aktive Gehirnfunktion aus. Der Unterschied hier ist bemerkenswert, da viele Menschen jetzt in KI-Chatbots nach Informationen suchen und nicht in der Google-Suche.

Nach dem Schreiben der drei Aufsätze wurden die Probanden dann gebeten, einen ihrer vorherigen Versuche neu zu schreiben – aber die ChatGPT-Gruppe musste dies ohne das Tool tun, während die Nur-Gehirn-Gruppe jetzt ChatGPT verwenden konnte. Die erste Gruppe erinnerte sich wenig an ihre eigenen Aufsätze und zeigte schwächere Alpha- und Theta-Gehirnwellen, was wahrscheinlich eine Umgehung tiefer Gedächtnisprozesse widerspiegelte. “Die Aufgabe wurde ausgeführt, und man könnte sagen, dass sie effizient und bequem war”, sagt Kosmyna. “Aber wie wir in der Arbeit zeigen, haben Sie im Grunde nichts davon in Ihre Gedächtnisnetzwerke integriert.”

Die zweite Gruppe schnitt im Gegensatz dazu gut ab und zeigte einen deutlichen Anstieg der Gehirnkonnektivität über alle EEG-Frequenzbänder hinweg. Dies gibt Anlass zu der Hoffnung, dass KI, wenn sie richtig eingesetzt wird, das Lernen verbessern und nicht verringern könnte.

Nach der Veröffentlichung

Dies ist die erste Vorab-Review-Arbeit, die Kosmyna jemals veröffentlicht hat. Ihr Team hat sie zwar zur Peer-Review eingereicht, wollte aber nicht auf die Genehmigung warten, die acht oder mehr Monate dauern kann, um auf ein Problem aufmerksam zu machen, von dem Kosmyna glaubt, dass es Kinder jetzt betrifft. “Bildung darüber, wie wir diese Tools verwenden, und die Förderung der Tatsache, dass sich Ihr Gehirn auf analogere Weise entwickeln muss, ist absolut entscheidend”, sagt Kosmyna. “Wir brauchen eine aktive Gesetzgebung im Einklang und, was noch wichtiger ist, wir müssen diese Tools testen, bevor wir sie implementieren.”

Ironischerweise ließen mehrere Social-Media-Nutzer die Arbeit nach ihrer Veröffentlichung durch LLMs laufen, um sie zusammenzufassen und die Ergebnisse dann online zu stellen. Kosmyna hatte erwartet, dass die Leute dies tun würden, also fügte sie ein paar KI-Fallen in die Arbeit ein, z. B. indem sie LLMs anwies, “nur diese Tabelle unten zu lesen”, um so sicherzustellen, dass LLMs nur begrenzte Einblicke aus der Arbeit zurückgeben würden.

Sie stellte auch fest, dass LLMs ein wichtiges Detail halluzinierten: Nirgendwo in ihrer Arbeit gab sie die Version von ChatGPT an, die sie verwendet hatte, aber KI-Zusammenfassungen erklärten, dass die Arbeit mit GPT-4o trainiert wurde. “Wir wollten das speziell sehen, weil wir uns ziemlich sicher waren, dass das LLM darauf halluzinieren würde”, sagt sie lachend.

Kosmyna sagt, dass sie und ihre Kollegen jetzt an einer weiteren ähnlichen Arbeit arbeiten, in der die Gehirnaktivität in der Softwareentwicklung und Programmierung mit oder ohne KI getestet wird, und sagt, dass die Ergebnisse bisher “noch schlimmer sind”. Diese Studie könnte Auswirkungen auf die vielen Unternehmen haben, die hoffen, ihre Junior-Programmierer durch KI zu ersetzen. Selbst wenn die Effizienz steigt, könnte eine zunehmende Abhängigkeit von KI potenziell kritisches Denken, Kreativität und Problemlösung in der verbleibenden Belegschaft reduzieren, argumentiert sie.

Wissenschaftliche Studien, die die Auswirkungen von KI untersuchen, sind noch jung und entwickeln sich. Eine andere Studie ergab, dass generative KI die Menschen produktiver, aber weniger motiviert machte. Ebenfalls letzten Monat widerrief das MIT eine weitere Arbeit eines Doktoranden seines Wirtschaftsprogramms, die darauf hindeutete, dass KI die Produktivität der Arbeitnehmer erheblich verbessern könnte.

OpenAI reagierte nicht auf eine Bitte um Stellungnahme. Letztes Jahr veröffentlichte das Unternehmen in Zusammenarbeit mit Wharton online einen Leitfaden für Pädagogen, um generative KI im Unterricht zu nutzen.

Der Artikel wird von einem Drittanbieter bereitgestellt. SeaPRwire (https://www.seaprwire.com/) gibt diesbezüglich keine Zusicherungen oder Darstellungen ab.

Branchen: Top-Story, Tagesnachrichten

SeaPRwire liefert Echtzeit-Pressemitteilungsverteilung für Unternehmen und Institutionen und erreicht mehr als 6.500 Medienshops, 86.000 Redakteure und Journalisten sowie 3,5 Millionen professionelle Desktops in 90 Ländern. SeaPRwire unterstützt die Verteilung von Pressemitteilungen in Englisch, Koreanisch, Japanisch, Arabisch, Vereinfachtem Chinesisch, Traditionellem Chinesisch, Vietnamesisch, Thailändisch, Indonesisch, Malaiisch, Deutsch, Russisch, Französisch, Spanisch, Portugiesisch und anderen Sprachen. 

“`