ChatGPT nutzt Träume als Pinsel
OpenAI hat die Funktion "Dreaming (Träumen)" erneut aktualisiert.
Wenn Künstliche Intelligenz mit dem Konzept des "Träumens" kombiniert wird, erinnert es immer an die Frage aus klassischen Science-Fiction-Romanen: Träumen Androiden von elektronischen Schafen?
Was genau träumt denn eine KI?
Leider ist das "Träumen" von ChatGPT nicht dasselbe wie das, das man normalerweise versteht. Ob ChatGPT von elektronischen Schafen "träumt", hängt davon ab, ob Sie in Ihrem Gespräch mit ihm jemals von elektronischen Schafen gesprochen haben – schließlich verbessert die Iteration der "Träume"-Funktion von ChatGPT tatsächlich das Gedächtnissystem.
Dies ist etwas enttäuschend.
Aber das macht nichts. OpenAI ist nicht die einzige, die über KI-"Träume" spricht.
Träumen lässt ChatGPT besser erinnern
Die Definition von OpenAI für die "Träume"-Funktion ist im Titel des offiziellen Blog-Eintrags klar: "Träumen: Besseres Gedächtnis macht ChatGPT nützlicher".
Schon im vergangenen April hat OpenAI die erste Version der "Träume" eingeführt.
Die "Träume"-Funktion von ChatGPT ist eigentlich ein "Gedächtnis"-System, wobei das früheste "Gedächtnis" sehr mechanisch war. Vermutlich haben alle KI-Nutzer erlebt, dass Sie der KI manuell sagen müssen, "Merken Sie sich, dass meine Antworten so kurz wie möglich sein sollen", damit sie Ihre Präferenzen speichert und sich daran erinnert.
Im Vergleich dazu ist das "Träumengedächtnis" dynamischer. ChatGPT stützt sich nicht nur auf die manuell gespeicherten Erinnerungen, sondern leitet im Hintergrund automatisch den Kontext aus Ihren vielen früheren Chat-Gesprächen ab, der für zukünftige Antworten möglicherweise benötigt wird.
OpenAI hat in einem offiziellen Blog-Eintrag angegeben, dass die Funktion des Träumengedächtnisses als unabhängiges Gedächtnissystem in den letzten Jahren immer noch unvollkommen war.
Jetzt hat OpenAI eine leistungsfähigere und rechenwirksamere Speicherarchitektur auf der Grundlage von Träumen entwickelt.
Das neue Träumensystem hat hauptsächlich drei Highlights:
Beibehaltung des nützlichen Kontexts;
Beachtung von Präferenzen und Beschränkungen;
Aktualisierung der Informationen: Das Gedächtnis sollte den Zeitablauf widerspiegeln.
Schauen wir uns diese Punkte nacheinander an.
Zuerst die Fortsetzung des Kontexts.
Sie müssen sich bei jedem neuen Chat nicht von vorne anstellen und müssen nicht immer wieder erklären, "Wer ich bin, was ich mache und welche Geräte/Projekte/Präferenzen ich habe". Wenn diese Informationen bereits in früheren Gesprächen erwähnt wurden, kann ChatGPT möglicherweise automatisch im neuen Gespräch anknüpfen.
Beispielsweise haben Sie ihm früher gesagt, welche Kamera Sie benutzen, welche Objektive Sie haben und was Sie normalerweise fotografieren. Wenn Sie das nächste Mal direkt fragen, "Empfehlen Sie mir einige Zubehörteile für meine Fotografieausrüstung", kann er auf der Grundlage Ihrer vorhandenen Geräte empfehlen, anstatt wie beim ersten Kennenlernen alles von vorne zu fragen.
OpenAI hat angegeben, dass das neue Träumensystem die Fähigkeit des Modells, relevante Fakten zu erinnern, verbessert hat. Im Jahr 2024 lag die Trefferquote der Faktenwiederholung nur bei 41,5 %, jetzt hat sie sich auf 82,8 % erhöht.
Zweitens die Beachtung von Präferenzen.
Eine weitere Funktion des Gedächtnisses ist, dass ChatGPT besser "nach Ihren Gewohnheiten spricht und nach Ihren Beschränkungen handelt".
Nehmen Sie beispielsweise an, Sie planen eine Reise nach Singapur. Zwei Monate vor der Abreise bitten Sie ChatGPT, Ihnen einen Reiseplan zu erstellen. Wenn Sie bereits über Ihre Reisevorlieben gesprochen haben, weiß ChatGPT möglicherweise: Sie mögen es, Wildtiere zu fotografieren, mögen es nicht zu heiß, und achten daher mehr auf die Klimaanlage im Hotel; Sie gehen nicht gerne in laute und überfüllte Bars und bevorzugen es, ruhig zu essen.
Diese Präferenzen müssen nicht unbedingt von Ihnen ausdrücklich mit "Bitte merken Sie sich" erwähnt werden, sondern können auch in früheren Gesprächen natürlich erwähnt worden sein. Sie können grob in mehrere Kategorien unterteilt werden:
Eine Kategorie ist, wie Sie möchten, dass ChatGPT antwortet, beispielsweise "Erwähnen Sie Stan nicht mehr".
Eine weitere Kategorie sind Ihre expliziten Präferenzen oder Beschränkungen, beispielsweise "Ich bin Vegetarier".
Eine andere Kategorie sind Hintergrundinformationen, die das Empfehlungsergebnis beeinflussen können, beispielsweise "Ich lebe in der Nähe von San Francisco". Dies ist nicht nur eine Standortinformation, sondern bedeutet auch, dass ChatGPT Ihnen bei der Empfehlung von Restaurants, Aktivitäten und Dienstleistungen Priorität geben sollte, Optionen in der Nähe von San Francisco zu berücksichtigen.
OpenAI hat gesagt, dass sie bei der Entwicklung des neuen Gedächtnissystems die Fähigkeit von ChatGPT, diese Präferenzen aus früheren Gesprächen zu extrahieren und zu verwenden, verbessert haben. Wenn ein Benutzer beispielsweise früher gesagt hat, dass er Vegetarier ist, sollte ChatGPT, wenn er später ChatGPT bittet, ihm ein Restaurant zu empfehlen oder einen Ernährungsplan zu erstellen, automatisch ungeeignete Optionen vermeiden und bevorzugt vegetarische Vorschläge geben.
Schließlich die Aktualität beibehalten.
Das Chat-Gespräch ist beendet, aber die Zeit vergeht weiter, daher muss sich auch das Gedächtnis aktualisieren.
Angenommen, Sie haben ChatGPT einmal gesagt: "Ich bin jetzt in Singapur, empfehlen Sie mir ein Restaurant für heute Abend." Wenn das Gedächtnis auf diesem Punkt bleibt und Sie nach der Reise zu Hause sind, denkt es immer noch, dass Sie in Singapur sind, was zu lächerlichen Situationen führen kann.
Das "Träumengedächtnis" löst genau dieses Problem: Es aktualisiert mit der Zeit die Information "Sie gehen im Juli nach Singapur" in "Sie waren im Juli 2026 in Singapur". Auf diese Weise wird ChatGPT weniger leicht von alten Informationen verwirrt und kann weiterhin auf der Grundlage Ihres aktuellen Standorts, der Zeitzone und Ihres realen Zustands antworten.
Was passiert, wenn der Benutzer das Gedächtnis von ChatGPT "korrigieren" möchte?
OpenAI hat für die Träume eine "Gedächtniszusammenfassung" entwickelt.
Aus der Gedächtniszusammenfassung kann der Benutzer schnell sehen, was ChatGPT über ihn weiß, persönliche Informationen hinzufügen oder aktualisieren und ChatGPT anweisen, wann welche Themen angesprochen werden sollen. Wenn er sich für ein bestimmtes Gebiet interessiert, kann er einfach mit dem Modell chatten.
Eine andere Lösung für KI-"Träume"
Die neue "Träume"-Funktion von ChatGPT ist sicherlich eine sehr gute Iterationsrichtung für die Benutzer. Dies macht das Chatten mit ChatGPT für die Benutzer einfacher.
Es ist vorstellbar, dass ein ausgezeichnetes Gedächtnissystem ein KI-Produkt immer "persönlicher" macht und so die Loyalität der Benutzer erhöht (der Wechselaufwand steigt).
Aber wie bereits erwähnt, hat OpenAI die Optimierung des Gedächtnissystems als "Träume" benannt, was etwas mit der menschlichen Wahrnehmung spielt.
Hier kann man auch das alte Rivalenunternehmen von OpenAI, Anthropic, als Beispiel anführen. Interessanterweise hat auch letzteres "Träume".
Allerdings sind die "Träume" von Anthropic und die von ChatGPT, obwohl sie ähnlich benannt sind, nicht ganz dasselbe.
Die "Träume" von ChatGPT sind eher wie ein persönlicher Assistent, der die Langzeitgedächtnisse eines normalen Benutzers ordnet, mit dem Ziel, dass ChatGPT beim nächsten Chat besser versteht, was der Benutzer möchte.
Die "Träume" von Anthropic sind eher wie ein Projektteam, das die Arbeitsaufzeichnungen nachbearbeitet.
Laut der offiziellen Dokumentation von Anthropic ist die "Dreams"-Funktion von Claude kein Frontend-Button für normale Chat-Benutzer, sondern eine Funktion von Claude Managed Agents.
Managed Agents können als eine verwaltete KI-Agenten-Service von Anthropic verstanden werden, die hauptsächlich für längere und komplexere Aufgaben eingesetzt wird, wie beispielsweise die Bearbeitung von Code, Forschung oder Unternehmensprozessen, die Minuten oder sogar Stunden dauern können.
In diesem System ist das "Träumen" eine Hintergrundaufgabe. Sie erhält eine vorhandene Gedächtnisbank, liest die letzten 1 bis 100 Aufgabenaufzeichnungen, sucht nach Mustern, Erfahrungen und nützlichen Informationen und erstellt dann eine neue Gedächtnisbank.
Dieser Prozess umfasst die Überprüfung, die Entfernung von Duplikaten und die Neugruppierung. Der Schwerpunkt kann auch nach den Anweisungen der Entwickler angepasst werden, beispielsweise indem nur die Code-Stil-Präferenzen eines Projekts berücksichtigt werden und einmalige Debugging-Details ignoriert werden.
Mit anderen Worten, wenn die "Träume" von ChatGPT wie ein persönlicher Assistent sind, der sich fragt, "Wie kann ich diesen Benutzer besser verstehen", dann sind die "Träume" von Claude eher wie ein Projektteam, das nachbearbeitet: "Wie wurde die letzte Aufgabe durchgeführt? Wo gab es Probleme? Welche Erfahrungen sollten bei ähnlichen Aufgaben beibehalten werden?"
Dies ist auch der größte Unterschied zwischen den "Träumen"-Konzepten der beiden Unternehmen.
OpenAI legt mehr Wert auf die Individualisierung. Anthropic legt mehr Wert auf die Agentenfähigkeit.
Streng genommen sind diese beiden "Träume" keine echten "Träume", und es ist auch nicht so, dass die KI plötzlich eine geheime innere Aktivität hat. Sie sind eher wie ein Gedächtnis-Organisationsmechanismus, nur dass die zu organisierenden Objekte unterschiedlich sind: Einmal werden die Langzeitkontexte der Benutzer organisiert, einmal werden die Aufgaben-Erfahrungen der Agenten organisiert.
Wenn KI-Produkte immer mehr wie ein langfristiger Begleiter für den Benutzer oder ein kontinuierlich arbeitender Assistent werden, wird das "Gedächtnis" immer wichtiger.
Frühere KIs waren eher wie Einmal-Werkzeuge, jetzt werden sie immer mehr wie langfristige Kooperationspartner.
Das sogenannte "Träumen" bedeutet letztendlich nicht, dass die KI eine Seele hat, und es ist nicht nötig, sich von Träumen von elektronischen Schafen träumen zu lassen. Tatsächlich beginnt die KI, die "Vergangenheit" zu besitzen und zu verstehen.
Und sobald die KI die Vergangenheit besitzt, wird die Beziehung zwischen ihr und dem Benutzer tiefer.
Dieser Artikel stammt aus dem WeChat-Account "Zimu AI", Autor: Xiaojinya. 36Kr hat die Veröffentlichung mit Genehmigung durchgeführt.