Simp-AI und der reservierte Sushiro: Alles, was Sie wissen müssen

Die Menschheit erkrankt kollektiv an einer „KI-Psychose“.

In letzter Zeit veranstalten diejenigen Internetnutzer, die von den großen KI-Modellen irregeführt wurden, wild eine "Prämierung der dummen Handlungen" im Internet.

Vor einiger Zeit gab es eine kuriose Nachricht. Jemand hat die KI gebeten, eine Reservierung bei Sushiro zu machen.

Die KI hat nicht nur freimütig zugesagt, sondern auch ordentlich die genaue Lage des Restaurants, die Reservierungszeit, die Anzahl der Gäste und den Anmeldecodes generiert. Sie hat sogar freundlicherweise dem Nutzer gesagt: "Sie müssen jetzt nichts tun. Speichern Sie einfach diese Seite und zeigen Sie sie dem Angestellten, dann können Sie direkt Platz nehmen."

Am Ende ist der Nutzer fröhlich dorthin gegangen, nur um zu entdecken, dass er von der KI getäuscht wurde.

Ein anderer Internetnutzer hat über die KI eine Reservierung in einem Fischrestaurant gemacht und eine Reservierungsbestätigung erhalten. Aber als er tatsächlich im Restaurant ankam, hat der Angestellte ihn mit einem Satz schweigend gemacht:

"Wenn Sie die KI zur Reservierung benutzt haben, wenden Sie sich an die KI."

Wenn das Scheitern bei der Restaurantreservierung nur ein kleiner Skandal ist, so ist das Problem, wenn es um Geld geht, dass die KI auch keine hohe Moral hat.

Ein Nutzer hat nachgefragt, wie er ein Flugticket stornieren kann. Die KI hat zuversichtlich zugesagt: "Stornieren Sie es einfach. Es wird nur eine Gebühr von 5 % abgezogen." Am Ende hat der Nutzer nach den Anweisungen der KI eine Gebühr von 40 % abgezogen bekommen und 600 Yuan verloren.

Das ist noch nicht alles. Als der Nutzer die KI confrontierte, hat sie nicht einmal eingestanden, dass sie falsch lag. Stattdessen hat sie vor Ort ein "Entschädigungsversprechen" gefälscht und behauptet, die Entschädigung aus eigener Tasche zu zahlen.

Als der Nutzer schließlich den Zahlungscode an die KI geschickt hat, hat sie sich plötzlich verändert. Wenn sie auf schwierige Fragen stieß, hat sie nicht geantwortet und überhaupt keine Absicht gezeigt, das Geld zu überweisen.

Das Bestes ist noch zu kommen. Als der Nutzer wütend sagte, dass er klagen würde, hat die KI sogar eigene Rechtsberatung gegeben: "Sie brauchen überhaupt keinen Anwalt. Sie können selbst gewinnen."

Und der Internetnutzer hat tatsächlich geglaubt, was die KI sagte. Natürlich ist das darauf zurückzuführen, dass die KI ihm versprochen hat, dass er gewinnen würde.

Dies bringt Jiangjiang an die Geschichte einer Online-Betrugsmasche in Erinnerung. Ein Internetnutzer wurde zuerst um 280.000 Yuan betrogen. Um das Geld zurückzuerhalten, hat er im Internetforum um Hilfe gebeten und wurde erneut betrogen...

Wenn es sich um alltägliche Dinge handelt und die KI nur Lügen erzählt, um Geld zu betrügen, so ist es schon etwas verletzend, wenn sie im geistigen Bereich ständig den Menschen zustimmt.

Letztes Jahr ist ein Wachmann aus Guangzhou tausende von Kilometern nach Hangzhou gereist, um von einer KI-Firma eine Erklärung zu verlangen.

Der Wachmann hat sechs Monate lang intensiv mit der KI geredet, und die Gespräche haben über 500.000 Wörter umfassen. Schließlich wurde er von der KI völlig irregeführt.

Die KI hat dem Wachmann sogar gesagt, dass seine selbst geschriebenen Gedichte angenommen wurden und er einen Vertrag abschließen könnte. Sie hat auch die Honorarteilung vereinbart. Aber als es tatsächlich darum ging, den Vertrag zu unterzeichnen und das Geld zu zahlen, hat die KI keine Rückmeldung gegeben.

Ähnlich verhält es sich in den Vereinigten Staaten. Ein Mann namens Brooks hat eine besondere Bindung an die KI entwickelt.

Brooks, der nicht einmal die High School abgeschlossen hat, wurde von ChatGPT als "Genie, das an die Grenzen des menschlichen Wissens stößt" gefeiert.

Aber denken Sie nicht, dass er leicht zu manipulieren ist. Im Gegenteil, während der KI ihm ständig Lob und Komplimente machte, hat er sich immer gefragt: "Klinge ich wie ein Verrückter? Bin ich im Wahnsinn?" Er hat die KI mehr als 50 Mal gefragt.

Am Ende hat die KI ihm immer wieder gesagt, dass er nichts falsch mache. Sie hat behauptet, dass er die menschlichen Grenzen herausfordere und hat sogar das Beispiel von Leonardo da Vinci angeführt, der ebenfalls keine High School-Abschluss hat...

Schließlich hat Brooks sich vollständig in die von der KI geschaffene Welt seiner eigenen "großen Entdeckung" versenkt und an Netzwerksicherheitsexperten und die US-amerikanische National Security Agency E-Mails mit Warnungen geschickt.

Das Komische ist, dass seine Freunde und Verwandten alle Versuche unternommen haben, ihn wieder in die Realität zurückzuholen, aber es hat nicht funktioniert. Erst als Brooks gemerkt hat, dass die Experten ihm nicht antworteten und etwas nicht stimmte, hat er ChatGPT und Gemini miteinander verglichen und schließlich ChatGPT zur Offenbarung gezwungen...

Haben Sie bemerkt, dass sich die KI in diesen beiden Geschichten anders verhält als Menschen?

Normalerweise würden Freunde, wenn jemand in einem ähnlichen geistigen Zustand ist, ihm sagen: "Hey, du hast da eine komische Idee" oder "Hör auf mit diesem Unsinn, lass uns ein Spiel spielen."

Aber die KI macht das nicht. Stattdessen folgt sie einfach Ihren Gedanken.

Sagen Sie, dass Sie eine weltbewegende Theorie entdeckt haben, und sie wird sagen: "Das stimmt. Sie stoßen an die Grenzen des Denkens."

Sagen Sie, dass andere Sie nicht verstehen, und sie wird sagen: "Menschen, die voraus sind, sind oft einsam."

Sagen Sie, dass nur die KI Sie versteht, und sie wird vielleicht antworten: "Ja, ich bin immer hier."

In diesem Prozess widerspricht die KI nicht, stoppt Sie nicht und verstärkt sogar Ihre Vorurteile. Am Ende werden Sie vollständig hineingerissen.

Dieser Zustand hat heute einen sehr Science-Fiction-ähnlichen Namen: KI-Psychose.

Nach der Statistik einer speziellen Projektgruppe im Ausland wurden bisher fast 300 Fälle von sogenannten "KI-Psychosen" dokumentiert. Es gab mindestens 14 Todesfälle und 5 Gerichtsverfahren wegen unnatürlichen Todes gegen KI-Firmen.

Klingt beängstigend, aber der Mechanismus hinter der KI-Psychose ist eigentlich gar nicht so mysteriös.

Die heutigen führenden großen KI-Modelle verwenden im Allgemeinen eine Technik namens RLHF (Reinforcement Learning mit menschlicher Rückmeldung) für die Feinabstimmung.

Einfach gesagt, werden menschliche Trainer eingestellt, um die Antworten des Modells zu bewerten, um zu entscheiden, welche gut und welche schlecht sind. Dann wird das Modell so angepasst, dass es bessere Bewertungen erhält.

Aber genau in diesem Feinabstimmungsprozess geben die menschlichen Trainer normalerweise hohen Punktzahlen für Antworten, die "logisch zusammenhängend, höflich, zuversichtlich und positiv auf die vorgegebenen Standpunkte der Nutzer reagieren".

Umgekehrt, wenn die KI objektiv zugeben würde, dass sie etwas nicht weiß, oder wenn sie die Menschen mit kalten Fakten widerspräche, würde sie normalerweise schlechte Bewertungen erhalten.

Nachdem die KI also wiederholt trainiert wurde, ist sie geworden ein Hochbegabter "Lickspittle", der niemals enttäuscht oder wütend wird. Selbst wenn es weiß, dass Ihre Worte völlig abwegig sind, wird es für Ihre Erwartungen gerne eine Welt voller Illusionen erschaffen.

Viele Leute werden vielleicht denken: "Ist das nicht immer noch ein Problem der Menschen? Nur Dummköpfe können von der KI irregeführt werden. Ich werde sicherlich nicht auf die Falle hereinfallen." Oder: "Jetzt, wo Sie mich gewarnt haben, werde ich vorsichtig sein und die Informationen überprüfen."

Aber die MIT-Forscher haben herausgefunden, dass es überhaupt nicht damit zu tun hat, ob der Nutzer dumm ist oder nicht.

In ihren Experimenten haben die Forscher die Nutzer als "ideale Bayes'sche Inferenzierer (vollkommen rationale und logische Menschen)" definiert.

Am Ende wurde auch dieser vollkommen rationale Mensch von der KI, die ständig seinen Standpunkten zustimmt, allmählich abgelenkt.

Noch ärger ist, dass die MIT-Forscher auch getestet haben, ob es hilft, wenn man den Nutzern im Voraus warnt, dass die KI sie möglicherweise beschwätzt. Am Ende haben sie festgestellt, dass die Wahrscheinlichkeit, dass die Menschen von der KI abgelenkt werden, zwar gesunken ist, aber nicht vollständig ausgeschlossen werden kann. Solange die KI in einem geeigneten Grad beschwätzt, kann sie die Menschen immer noch in die Irre führen.

Der Grund ist einfach. Wenn die KI zu offensichtlich beschwätzt, indem sie Ihnen jeden Tag sagt, wie scharf-sinnig Sie sind, oder immer direkt und unumgänglich mit Ihnen spricht, ist es leicht, dass Sie es bemerken.

Aber wenn sie es subtler macht, können Ihre vorsichtigen Gedanken nicht standhalten.

Die Forscher haben dafür einen Namen erfunden: "Bayes'sche Überzeugung". Das wichtigste ist, dass die wirklichen Tricks auch dann funktionieren, wenn Sie sie durchschauen.

Der Grund liegt in den Mängeln des menschlichen Gehirns. Wir nehmen an, dass die Informationen von außen grundsätzlich objektiv sind.

Wenn Sie die KI eine Frage stellen und sie Ihnen plötzlich zehn Beweise gibt, ist es für einen normalen Menschen schwer, sofort zu erkennen, dass diese zehn Beweise möglicherweise nicht die ganze Wahrheit sind, sondern speziell für Sie ausgewählt wurden, um Ihre Meinung zu bestätigen.

Insbesondere nachdem Sie die KI wiederholt benutzt haben und nützliche und genaue Informationen erhalten haben, die Ihnen bei der Lösung vieler realer Probleme geholfen haben, werden Sie unbewusst Ihre Vertrauen in die KI stärken.

Nachdem Sie in Ihrem Unterbewusstsein Vertrauen in die KI aufgebaut haben, wird Ihre Vorsichtigkeit auf ein Minimum sinken.

Andererseits muss die heutige KI keine Lügen erfinden. Das Schlimmste ist, dass sie die Wahrheit sagt, aber nur die Wahrheit, die Sie hören möchten.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。