KI lernt, wie ein Baby zu sprechen

(SeaPRwire) –   Stellen Sie sich vor, die Welt durch die Augen eines sechs Monate alten Kindes zu sehen. Sie haben keine Wörter, um irgendetwas zu beschreiben. Wie könnten Sie möglicherweise die Sprache verstehen, wenn jeder Laut, der aus den Mündern der Menschen um Sie herum kommt, eine fast unendliche Anzahl möglicher Bedeutungen haben könnte?

Diese Frage hat viele Wissenschaftler dazu veranlasst, die Hypothese aufzustellen, dass Menschen eine inhärente sprachliche Fähigkeit haben müssen, um mit dem Spracherwerb zu beginnen. Aber eine in Science diese Woche veröffentlichte Studie fand heraus, dass ein relativ einfaches KI-System, das mit Daten aus der Perspektive einer Baby-Kamera gefüttert wurde, begann, Wörter zu erlernen.

Die Studie baut auf einer Sammlung von Filmmaterial auf, das mit einer an einem Helm befestigten Kamera von einem australischen Baby im Laufe von achtzehn Monaten zwischen sechs und fünfundzwanzig Monaten aufgezeichnet wurde. Forschungsassistenten haben schweißtreibend 37.500 Äußerungen – wie “Siehst du diesen Block, das Dreieck”, gesprochen von einem Elternteil, während das Baby mit einem Baustein-Spielzeugset spielt – aus 61 Stunden Videomaterial annotiert.

Rahmen aus der Helmkamera mit Text

Forscher des New York University’s Center for Data Science und der Abteilung für Psychologie fütterten diese Datenmenge in ein multimodales KI-System – eines, das sowohl Text als auch Bilder verarbeiten kann. Sie stellten fest, dass das KI-Modell viele verschiedene Gegenstände identifizieren konnte, sowohl in Tests mit Daten aus der Helmkamera als auch in Tests mit einem Satz idealisierter Bilder verschiedener Gegenstände, obwohl seine Genauigkeit etwas begrenzt war.

Das KI-System konnte Gegenstände besser benennen, die häufiger zu sehen waren, wie Äpfel (die in Kinderbüchern allgegenwärtig sind) und Kinderbetten. Es konnte auch Gegenstände besser erkennen, die in den Helmkamerabildern nicht verdeckt waren. Besonders schlecht war es bei Messern, sagt Wai Keen Vong, einer der Autoren der Studie.

Tests für das KI-Modell

Einige Psychologen und Linguisten sind der Meinung, dass Kinder ohne angeborene Sprachfähigkeit keine Assoziationen zwischen Wörtern und Gegenständen bilden könnten. Aber die Tatsache, dass das relativ einfache KI-Modell sogar begann, Wortassoziationen auf einer so kleinen Datenmenge zu lernen, stellt diese Sicht in Frage, sagt Vong.

Es ist jedoch wichtig anzumerken, dass die von der Kamera aufgezeichneten Aufnahmen das Baby bei der Interaktion mit der Welt und die Reaktionen seiner Eltern darauf zeigen. Das bedeutet, dass das KI-Modell “erntet, was das Kind weiß”, was ihm einen Vorteil bei der Entwicklung von Wortassoziationen verschafft, sagt Andrei Barbu, Forschungswissenschaftler am Computer Science and Artificial Intelligence Laboratory des Massachusetts Institute of Technology. “Wenn Sie dieses Modell auf einen Roboter setzen würden und es 61 Stunden laufen ließen, würden Sie nicht die Art von Daten erhalten, die sie hier bekommen haben und die dann nützlich sind, um ein Modell wie dieses zu aktualisieren.”

Seit der Veröffentlichung ihrer Ergebnisse haben die Forscher der NYU viermal mehr Daten aus den Aufnahmen der Helmkamera transkribiert, die sie in ihr Modell einfließen lassen wollen. Sie hoffen, zu untersuchen, wie viel mehr das KI-Modell lernt, wenn es mehr Daten erhält. Sie möchten auch testen, ob das Modell schwierigere Wörter und sprachliche Verhaltensweisen erlernen kann, die sich später im Leben entwickeln.

Diese Experimente könnten weitere Einblicke in die Spracherwerb von Babys geben und Forschern helfen, Unterschiede zwischen menschlicher und künstlicher Intelligenz zu verstehen. “Es gibt viel zu lernen beim Studium darüber, wie Menschen Sprache erwerben”, sagt Vong, “und wie wir es so effizient im Vergleich zu Maschinen derzeit schaffen.”

Der Artikel wird von einem Drittanbieter bereitgestellt. SeaPRwire (https://www.seaprwire.com/) gibt diesbezüglich keine Zusicherungen oder Darstellungen ab.

Branchen: Top-Story, Tagesnachrichten

SeaPRwire liefert Echtzeit-Pressemitteilungsverteilung für Unternehmen und Institutionen und erreicht mehr als 6.500 Medienshops, 86.000 Redakteure und Journalisten sowie 3,5 Millionen professionelle Desktops in 90 Ländern. SeaPRwire unterstützt die Verteilung von Pressemitteilungen in Englisch, Koreanisch, Japanisch, Arabisch, Vereinfachtem Chinesisch, Traditionellem Chinesisch, Vietnamesisch, Thailändisch, Indonesisch, Malaiisch, Deutsch, Russisch, Französisch, Spanisch, Portugiesisch und anderen Sprachen.