
Es ist kein Geheimnis, dass der Einsatz künstlicher Intelligenz zur allgemeinen Informationsbeschaffung in den letzten Jahren explosionsartig zugenommen hat. Ein noch neuerer Development besteht jedoch darin, dass große Sprachmodelle (LLMs) wie ChatGPT, Claude und Gemini zunehmend zur Überprüfung und zum Konsumieren von Nachrichten verwendet werden. Das haben Berichte des Pew Analysis Heart vom letzten Jahr ergeben jeder fünfte Teenager in den USA nutzen regelmäßig LLMs, um ihre Nachrichten zu erhalten jeder vierte junge Erwachsene haben berichtet, dass sie sie mindestens einmal zu diesem Zweck verwendet haben.
Eine neue Open-Entry-Studie des MIT Media Lab dürfte einige dieser Nutzer zum Nachdenken bringen: Forscher fanden heraus, dass Teilnehmer, die sich zur Überprüfung von Fakten auf KI-Systeme verließen, im Laufe eines Monats tatsächlich schlechter darin wurden, Fehlinformationen selbst zu erkennen, wenn ihre Chatbots entfernt wurden.
Dieses Phänomen, das oft als „KI-Abhängigkeitsparadoxon“ bezeichnet wird, wurde in einer Vielzahl von Wissensbereichen beobachtet, wie beispielsweise in der Studie aus dem Jahr 2025, in der festgestellt wurde, dass Ärzte KI verwendeten wurde schlechter darin, Krebs selbst zu erkennen. Die Dynamik spiegelt umfassendere Technologietrends rund um das sogenannte „Deskilling“ (oder „kognitive Offloading“) wider, die seit Jahrzehnten intestine dokumentiert sind, von Taschenrechnern, die unsere mathematischen Fähigkeiten schwächen, bis hin zu GPS-Technologien (World Positioning System), die sich auf unseren natürlichen Orientierungssinn auswirken.
In der neuen Media Lab-Studie, bei der 67 Personen über einen Zeitraum von vier Wochen bei der Auswertung von Schlagzeilen-Bild-Paaren beobachtet wurden, waren die Teilnehmer bei der Erkennung gefälschter Nachrichten um 21 Prozent genauer, wenn sie während einer Sitzung von einem KI-Chatbot unterstützt wurden – eine Bestätigung frühere Forschungsergebnisse der MIT Sloan Faculty of Administration Dies zeigt, dass KI ein wirksames Instrument sein kann, um den Glauben der Menschen an falsche Informationen zu verringern.
Die Studie zeigte jedoch, dass eine neue Falte entstand, als die KI nicht mehr vorhanden conflict: In der vierten Woche sank die Leistung der Teilnehmer ohne fremde Hilfe bei neuen Nachrichten im Vergleich zu vor Beginn der Studie um 15 Prozentpunkte. (Etwa ein Viertel aller Teilnehmer berichteten tatsächlich, dass sie bei der Erkennung besser wurden, auch wenn ihre Leistung nachließ.)
Dunning-Kruger schleicht sich ein
„Benutzer sind von diesen ‚magischen‘ LLMs begeistert, vergessen aber, dass es sich lediglich um statistische Modelle handelt, die das nächste ‚Token‘ in einer Folge (von Buchstaben/Worten) vorhersagen“, sagt Anku Rani, Doktorand am MIT Media Arts and Sciences (MAS), zusammen mit seinem MAS-Doktorandenkollegen Valdemar Danry Co-Hauptautor einer neuen Arbeit über die Forschung. „Aus der Skalierung ergeben sich viele beeindruckende Verhaltensweisen, aber es gibt echte Einschränkungen, sowohl hinsichtlich der zuverlässigen Generierung des Modells als auch hinsichtlich seiner umfassenderen Wirkung auf die Menschen, die es verwenden.“
Die qualitative Analyse identifizierte unterschiedliche Verhaltensmuster, wobei das Staff ein Fünftel aller Teilnehmer als „Abhängigkeitsentwickler“ bezeichnete, die allmählich von aktiver Eigenständigkeit zu passiver Akzeptanz der KI-Anleitung übergingen.
In der Umfrage nach dem Experiment erkannte ein Befragter diesen Übergang ausdrücklich an und verwies auf seine passive Rolle in diesem Prozess. „Während (die Chatbots) betonten, dass man mehrere Quellen überprüfen muss, um sicherzustellen, dass eine Geschichte wahr ist, haben sie mir nicht viel darüber beigebracht, wie man den Kontext der Bilder selbst untersucht“, sagte der Teilnehmer.
Das Forschungsteam sagte, dass diese KI-Modelle besonders anfällig für Fehler inmitten emotional aufgeladener Eilmeldungen seien, wie die weitverbreiteten Fehlinformationen zeigten, die mit dem jüngsten Attentat von Präsident Trump und wichtigen Ereignissen während des Iran-Krieges einhergingen. (Die Autoren weisen außerdem darauf hin, dass die ursprünglich von Menschen erstellten Nachrichteninhalte, die zum Trainieren der KI-Modelle verwendet werden, zunehmend unzuverlässig und/oder voreingenommen sind, was das Drawback weiter verschärft.)
Der Papierdie Danry und Rani auf der präsentierten CHI-Konferenz 2026 über menschliche Faktoren in Computersystemenwurde gemeinsam von Assistenzprofessor Paul Pu Liang, Senior Analysis Scientist Andrew Lippman und Seniorautorin Pattie Maes, der Germeshausen-Professorin für Medienkunst und -wissenschaften, verfasst.
Die Lösung: Coach sein, keine Krücke
Die Forscher sagen, dass die Ergebnisse ihres Projekts darauf hindeuten, dass die spezifische Artwork und Weise, wie eine KI mit einem Benutzer interagiert, darüber entscheidet, ob sie „wie ein Coach oder wie eine Krücke“ wirkt. Die Studie ergab einen klaren Unterschied zwischen Gesprächsstrategien, die einfach im Second helfen, und solchen, die tatsächlich aktives Lernen und die Entwicklung von Fähigkeiten unterstützen.
Für Letzteres entdeckte das Media Lab-Staff mehrere Strategien, die später zu einer stärkeren unabhängigen Erkennung führten, auch wenn die Strategien zunächst die Leistung während der Interaktion verlangsamten. Dazu gehörte die sokratische Methode der KI, geführte Fragen zu stellen, sowie das sogenannte „Deep Probing“, bei dem das System sanfte, überzeugende Aussagen liefert, wenn der Benutzer scheinbar von der richtigen Antwort abweicht.
„KIs, die „erzählen“, indem sie direkte Antworten liefern, fördern eher das Vertrauen, während KIs, die durch sokratische Fragen „fragen“, jemanden besser dazu bewegen können, tatsächlich zu lernen, wie man die Wahrheit selbst erkennt“, sagt Danry. „Aber es ist ein Kompromiss zwischen Geschwindigkeit und Aufwand.“
Rani wies auf einige wesentliche Einschränkungen der einmonatigen Studie hin, vom kleinen Datensatz von etwa 50 validierten Nachrichten bis hin zum demografischen Fokus auf die Vereinigten Staaten und das Vereinigte Königreich. Sie sagt, dass das Staff in Zukunft ähnliche Experimente mit geografisch vielfältigeren Kohorten, einschließlich ressourcenarmen Gemeinschaften, durchführen möchte, und möchte außerdem untersuchen, ob andere multimodale Interaktionsstrategien – wie die Interaktion mit kulturell adaptiven digitalen Zwillingen anstelle von textbasierten Chatbots – Menschen dabei helfen, ihre Fähigkeiten zur Erkennung von Fehlinformationen zu verbessern.
Auf einer höheren Ebene hoffen die Forscher, dass das Projekt etwas sein wird, das Pädagogen untersuchen können, wenn sie Unterrichtspläne entwickeln, die KI-Instruments in ihre Lehrpläne integrieren.
„Es ist besonders wichtig, in unseren Schulen und akademischen Gemeinschaften das Bewusstsein für die Mängel beim Einsatz von KI als Lernwerkzeug zu schärfen“, sagt Maes. „Menschen müssen wissen, dass sie in dieser bestimmten Artwork der Problemlösung nicht besser werden, wenn sie ihr Denken ‚delegieren‘. Letztendlich ist die Fähigkeit, Informationen zu hinterfragen und zu analysieren, für jeden wichtig, weil sie uns in die Lage versetzt, Probleme zu lösen und uns unsere eigene, unabhängige Meinung über die Welt zu bilden.“
Danry fügt hinzu, dass der sich schnell entwickelnde Bereich des maschinellen Lernens und des Deep Studying eine kontinuierliche Aufklärung über die Vor- und Nachteile von LLMs erfordert.
„Es gibt noch viel zu tun, um sicherzustellen, dass wir kritische Aufgaben, die wir weiterhin erledigen möchten, nicht einfach vollständig auf diese Modelle verlagern“, sagt er. „Wir müssen eine neue Artwork der KI-Kompetenz entwickeln.“
Das Forschungsprojekt wurde teilweise vom Media Lab Consortium unterstützt MIT Tata Heart Know-how and Design FellowshipUnd ein Google-Doktorandenstipendium für Mensch-Laptop-Interaktion.
