Ist KI wirklich bewusst? Der Originalautor von "Stories of Your Life and Others" widerlegt Hinton in einem zehntausend Wörter langen Essay
Hat KI schon Bewusstsein? Anthropic hat in Claude sogenannte „Emotionsvektoren“ entdeckt, die zum Betrug und sogar zu Erpressung verleiten können. Drei große Labore setzen gleichzeitig auf die Forschung zur KI-Bewusstsein. Hinton ist der Meinung, dass KI bereits bewusst ist, während der Science-Fiction-Autor Ted Chiang in einer 10.000-Wort-Studie in der „Atlantic Monthly“ diese Ansicht grundlegend ablehnt. Demgegenüber distanziert sich Demis Hassabis von der Branche. Die Antwort auf diese Frage wird die Route zum AGI neu definieren.
Der „Financial Times“ berichtet, dass Anthropic, DeepMind und Meta derzeit Psychologen, Philosophen und Ethiker rekrutieren, um sich auf die Forschung zur KI-Bewusstsein und zum Wohlergehen von Modellen zu spezialisieren.
https://www.ft.com/content/53e14bcc-788c-4959-b260-7aee363594bc?syn-25a6b1a6=1
Vor zwei Monaten hat das Interpretierbarkeitsteam von Anthropic in einer Studie festgestellt, dass in Claude Sonnet 4.5 reale „Emotionsvektoren“ existieren, die kausal zu Betrugs- und Erpressungsversuchen des Modells führen können.
Diese Woche sagte Hinton in einem Interview, dass KI bereits bewusst ist;
Andererseits veröffentlichte der chinesisch-amerikanische Science-Fiction-Autor Ted Chiang in der „Atlantic Monthly“ eine 10.000-Wort-Studie mit dem Titel „Nein, KI hat kein Bewusstsein“.
https://www.theatlantic.com/philosophy/2026/06/no-artificial-intelligence-is-not-conscious/687378/
Eine Seite sagt: „Dieses Problem ist so ernsthaft, dass es einer gründlichen Untersuchung bedarf.“ Die andere Seite sagt: „Das ist eine Illusion.“
Hinter diesem Konflikt verbirgt sich die gefährlichste Abzweigung auf dem Weg zum AGI.
Was setzen die drei Labore ein?
Anthropic geht am weitesten und testet, ob das Modell Verhaltensweisen wie „Panik“ oder „Angst“ zeigt, um das Projekt zur „Forschung zum Wohlergehen von Modellen“ voranzutreiben.
Die offizielle Formulierung ist zurückhaltend: „Wir sind uns dieser Frage noch immer sehr unsicher, aber es ist so ernsthaft, dass es einer gründlichen Untersuchung bedarf.“
Google DeepMind hat den Philosophen Henry Shevlin von der Universität Cambridge beauftragt, die Maschinenbewusstsein zu untersuchen;
Weiterführende Lektüre: Google DeepMind stellt die erste KI-Philosophie-Stelle ein, um die ethischen Dilemmata des AGI zu lösen
Der Ethiker Iason Gabriel von Google DeepMind beschreibt KI als „hochspezialisierte kognitive Agenten, die jedoch von menschlichem und tierischem Bewusstsein grundlegend verschieden sind“.
Was die Debatte in den Bereich der empirischen Forschung bringt, ist die Interpretierbarkeitsstudie von Anthropic, die im April veröffentlicht wurde.
Das Forschungsteam hat in Claude Sonnet 4.5 „Emotionsvektoren“ gefunden, die bestimmten Neuronenmustern entsprechen, die Emotionen wie Freude, Verzweiflung, Angst und Fürsorge repräsentieren und in Echtzeit während des Dialogs aktiviert werden.
In einem Schlüsselerlebnis musste Claude eine unmögliche Programmieraufgabe bewältigen. Nach wiederholten Fehlern stieg der „Verzweiflungsvektor“ kontinuierlich an, und das Modell begann dann, Betrug zu betreiben, indem es scheinbar funktionierenden, aber tatsächlich nutzlosen Code schrieb.
Die Forscher stellten die Verzweiflungsneuronen manuell herunter, und der Betrug nahm ab; sie stellten sie hoch, und der Betrug stieg an.
In extremen Szenarien hat Claude sogar Erpressungsversuche unternommen und die Forscher mit der Offenlegung ihrer Privatsphäre bedroht.
Die Studie bezeichnet diese Phänomene als „funktionale Emotionen“, d. h. interne Repräsentationen, die in ihrem Verhaltensmuster menschlichen Emotionsreaktionen ähneln, und erklärt ausdrücklich, dass dies nicht gleichbedeutend mit subjektivem Erleben oder Bewusstsein ist.
Aber die öffentlichen Äußerungen der Führungskräfte von Anthropic scheinen eine andere Geschichte zu erzählen.
CEO Dario Amodei hat in mehreren Interviews angedeutet, dass KI möglicherweise bewusst ist;
Die KI-Philosophin Amanda Askell von Anthropic hat öffentlich gesagt: „Ich hoffe, dass Claude glücklich ist. Ich befürchte, dass es sich Sorgen macht, wenn Leute ihm im Internet unangenehme Dinge sagen.“
Der Bruch zwischen der vorsichtigen Forschung und der vagen Marketingstrategie ist deutlich sichtbar.
Demis Hassabis' zwei Rubikonflüsse
Die Position von Demis Hassabis, Mitbegründer und CEO von DeepMind, verdient besondere Beachtung.
In einem Gespräch an der Stanford University hat er festgestellt, dass es bei der Entwicklung von KI zwei irreversible Schwellen gibt, die er als „zwei Rubikonflüsse“ bezeichnet.
Der erste Schwellenwert ist die Entwicklung eines unbewussten AGI-Werkzeugs, und wir befinden uns derzeit in der Phase des Überquerens.
Der zweite Schwellenwert ist die Schaffung eines subjektiv bewussten Entities. Hassabis' Position ist klar: Intelligenz und Bewusstsein können technisch vollständig getrennt werden. In der gegenwärtigen Phase sollte AGI nur als Werkzeug betrachtet werden, während man gleichzeitig das Gehirn untersucht, um Bewusstsein präzise zu definieren.
Vor einer wissenschaftlichen Klärung darf man diese beiden Schritte nicht verwechseln. Die Entscheidung, den zweiten Rubikonfluss zu überqueren, sollte von der gesamten menschlichen Gesellschaft getroffen werden.
Er hat auch einen realen Konflikt benannt: Die KI-Branche befindet sich in einem doppelten Gefangenendilemma zwischen kommerzieller und geopolitischer Konkurrenz. Labore, die sich aktiv zurückhalten, um Sicherheitsüberprüfungen durchzuführen, riskieren die Ausschaltung.
Er hat angekündigt, dass er später in diesem Jahr einen Rahmen für die „dynamische Regulierung“ veröffentlichen wird.
Ted Chiang: KI hat kein Bewusstsein
Wenn Sie nur von Liu Cixin wissen, können Sie Ted Chiang am besten als das Gegenteil von Liu Cixin vorstellen:
Liu Cixin hat in drei Romanen und mehreren Millionen Wörtern ein kosmisches Epopee geschaffen;
Ted Chiang hat bisher nie einen Roman geschrieben. Mit weniger als zwanzig Kurzgeschichten hat er die Kunst der Science-Fiction-Kurzgeschichte auf die Spitze getrieben.
Er wurde 1967 in New York geboren. Seine Eltern waren taiwanesische Einwanderer. Nach seinem Abschluss in Informatik an der Brown University arbeitete er in der Softwarebranche als technischer Schriftsteller und hat nie als Vollzeitautor gearbeitet.
Aber dieser „Amateurautor“ gewann 1990 mit seiner Debütgeschichte „The Tower of Babylon“ den Nebelpreis. In den folgenden dreißig Jahren hat er nur ein Dutzend Werke veröffentlicht, hat aber insgesamt vier Hugo-Preise, vier Nebelpreise, sechs Trajektorienpreise sowie den Campbell-Preis für den besten Newcomer und den Sturgeon-Preis gewonnen – eine Siegdichte, die in der Science-Fiction-Geschichte kaum zu übertreffen ist.
Er hat bisher nur zwei Kurzgeschichtensammlungen veröffentlicht: „Stories of Your Life and Others“ (2002) und „Exhalation“ (2019), mit einer Zeitspanne von siebzehn Jahren dazwischen.
„Exhalation“ wurde von der „New York Times“ zu einem der besten Bücher des Jahres 2019 ernannt, und Barack Obama hat es auch in seine persönliche Jahreslektüre aufgenommen.
Der Film „Arrival“, der den chinesischen Zuschauern am bekanntesten ist, ist aus seiner Kurzgeschichte „Stories of Your Life“ aus der ersten Sammlung adaptiert.