Wird Ihr KI-Agent mit der Zeit immer dümmer? Forscher der Chinese University of Hong Kong und der Zhejiang University entlarven die Lüge über das "Gedächtnis".
Haben Sie jemals eine solche Situation erlebt:
Sie haben einem Agenten eine Vektordatenbank zugewiesen und eine große Anzahl von historischen Gesprächen hochgeladen, aber er kann immer noch nicht auf Ihre Fragen antworten; oder Sie haben mit Cursor oder Claude Dutzende von Code-Runden geschrieben, aber es scheint, dass seine Verständnis Ihres Projekts sich nicht wirklich im Laufe der Zeit verbessert hat. Jede Runde fühlt sich an, als würde er Sie neu kennenlernen.
Dies ist weder ein Problem des Modells noch ein Problem der RAG-Konfiguration.
Forscher der Hongkonger Universität und der Zhejiang-Universität geben in einer neuen Studie eine grundlegendere Antwort: Wir haben dem Agenten keine echte Erinnerung gegeben. Wir haben ihm nur ein Notizbuch (Memo) gegeben.
Link zur Studie: https://arxiv.org/pdf/2604.27707
Die Studie wurde am 30. April 2026 als Vorabversion auf arXiv veröffentlicht und hat binnen etwa 10 Tagen in der internationalen akademischen Community zahlreiche Diskussionen ausgelöst. Der bekannte Account @dair_ai in der KI-Branche hat auf X (Twitter) über 26.100 Ansichten und über 700 Likes für die Weitergabe der Studie erhalten. Mehrere YouTuber haben auch spontan Präsentationsvideos erstellt, und es gibt auch mehrere Weiterveröffentlichungen auf Xiaohongshu.
01 Warum wird der Agent mit der Zeit dümmer?
Die derzeitigen gängigen Agenten-Erinnerungslösungen können grob in vier Kategorien unterteilt werden: Vektor-Speicherung, Retrieval-Augmented Generation (RAG), Notizbuch (Scratchpad) und Verwaltung des Kontextfensters.
Sie haben einen gemeinsamen Punkt: Sie sind alle „Suche“ und keine echte „Erinnerung“.
Die Autoren der Studie bezeichnen diese Art von Mechanismen insgesamt als „Notizbuch (Memo)“ und nicht als echte Erinnerung (True Memory).
Die Logik des Notizbuchs ist: Informationen speichern und bei Bedarf wieder abrufen. Dies ist völlig anders als das, was Menschen tun, wenn sie etwas „im Gedächtnis behalten“.
Der Kern dieses Unterschieds liegt in der wesentlichen Differenz des Generalisierungsschemas:
Retrieval-basierte Erinnerung: Generalisierung basierend auf der Ähnlichkeit mit gespeicherten Fällen. Wenn es in Ihren gespeicherten Fällen keine ähnlichen Situationen gibt, kann der Agent die Aufgabe nicht bewältigen.
Gewichts-basierte Erinnerung: Erfahrung in Regeln abstrahieren und diese Regeln auf bisher nie gesehenen Eingaben anwenden.
Wenn Menschen eine Sprache lernen, merken sie sich nicht jeden Satz, sondern internalisieren die grammatikalischen Regeln und können dann neue Sätze bilden, die sie noch nie gesprochen haben.
Die aktuelle „Erinnerung“ von Agenten ähnelt eher der retrieval-basierten Erinnerung.
02 Drei strukturelle Mängel
Die Autoren haben drei Schlüsselschwächen des aktuellen Kontext-Agenten-Erinnerungssystems zusammengefasst, und jeder dieser Mängel kann auf theoretischer Ebene bewiesen werden, nicht nur intuitiv vermutet werden.
Mangel 1: Informationsmenge ist nicht gleich Fähigkeit
Der Agent sammelt unbegrenzt Notizen an, kann aber keine echte Fachkenntnis entwickeln.
Die Kognitionswissenschaft hat bereits bewiesen (Chi et al., 1981), dass der grundlegende Unterschied zwischen menschlichen Experten und Anfängern nicht darin besteht, dass Experten mehr Informationen besitzen, sondern dass die Organisation des Wissens sich qualitativ verändert hat: Das Wissen von Experten ist nach tiefgreifenden Prinzipien neu strukturiert, nicht einfach aufgeschüttet.
Der aktuelle Agent kann dies nicht leisten. Am Ende jeder Sitzung bleiben die Gewichte des Modells vollständig unverändert, und beim nächsten Mal startet er wieder von demselben „Anfänger“-Punkt aus, nur mit ein paar mehr Notizen im Notizbuch.
Mangel 2: Generalisierungsgrenze – mathematische Analyse
Die Forscher haben mit der Stichprobenkomplexitätstheorie eine quantifizierbare Generalisierungslücke bewiesen:
Ein retrieval-basiertes Erinnerungssystem benötigt, um kombinatorisch neue Aufgaben zu bewältigen, Ω(k²) gespeicherte Fälle.
Bei der parametrischen Lernmethode (Gewichts-Erinnerung) sind hingegen nur O(d) Beispiele erforderlich (d ist die Komplexitätsdimension des Operators).
Das Wichtigste ist: Eine Vergrößerung des Kontextfensters kann diese Obergrenze nicht überwinden. Die Beschränkung kommt nicht von der Kapazität, sondern von der kombinatorischen Abdeckung. Wenn der Agent jemals die Situation „Regel A + Regel B gleichzeitig anwendbar“ nicht gesehen hat, kann er diese Kombination nicht bewältigen, egal wie viele Notizen Sie hinzufügen.
Hier ein anschauliches Beispiel: Nehmen wir an, der Agent hat die Fähigkeiten „Umrechnung von Celsius in Fahrenheit“ und „Zeitzonenumrechnung“ gelernt. Wenn er die Beispiele nur in der Vektordatenbank speichert, wird er wahrscheinlich an einer Kombinationsaufgabe wie „Umrechnung der Temperatur in Peking zur gleichen Zeit in New York“ scheitern. Menschen hingegen können solche Kombinationen nach dem Erlernen der Regeln natürlich bewältigen.
Mangel 3: Erinnerung-Vergiftung – strukturelle Sicherheitslücke
Die dauerhafte Speicherung von Erinnerungen ist strukturell anfällig für Angriffe auf die Erinnerung (Memory Poisoning). Die empirischen Daten, die in der Studie zitiert werden, sind erschreckend:
MINJA-Angriff: Mit minimalem Funktionsverlust kann eine Injektionserfolgsrate von 98,2% erreicht werden.
PoisonedRAG-Angriff: Mit nur 5 gegnerischen Texten kann eine Angriffs-Erfolgsrate von 90% erreicht werden.
Was noch gefährlicher ist, ist, dass, sobald die Injektion erfolgreich war, der schädliche Inhalt durch die dauerhafte Erinnerung in allen nachfolgenden Sitzungen fortwährend zirkuliert, und ein einzelner Angriff wird zu einer dauerhaften Invasion.
03 Hippocampus und Neokortex sind beide notwendig
Die theoretische Grundlage der Studie stammt aus der Theorie der komplementären Lernsysteme (Complementary Learning Systems, CLS) in der Neurowissenschaft.
Das Gehirn von Säugetieren löst das Erinnerungsproblem durch die Zusammenarbeit von zwei Systemen:
Hippocampus: Schnelle Aufzeichnung von Situationen und hochauflösende Speicherung neuer Erfahrungen
Neokortex: Langsame Integration, Umwandlung von Situationserinnerungen in abstrakte Regeln und Einbindung in die Gewichte
Beide Systeme sind unentbehrlich. Während des menschlichen Schlafs „spielt“ das Gehirn die Situationserinnerungen des Tages in den Neokortex „zurück“ und vollführt die Umwandlung von „etwas merken“ zu „etwas lernen“.
Der aktuelle KI-Agent hat nur den Hippocampus implementiert, d. h. schnelles Schreiben und Ähnlichkeits-Rückruf, ohne abstrakten Schritt.
Die Autoren der Studie vergleichen den aktuellen Agenten mit einer Person, die niemals schläft – ständig Notizen macht, aber sie nie ordnet und nie in der Lage ist, die vereinzelten Erfahrungen zu echter Fachkenntnis zu verarbeiten.
04 Was sagt die akademische Welt? Echte Diskussionen auf X
Nach der Veröffentlichung der Studie hat der Retweet von @dair_ai schnell heftige Diskussionen in der internationalen akademischen Community ausgelöst. Hier sind einige Übersetzungen repräsentativer Diskussionen:
05 Die Koexistenz von zwei Systemen, kein Neuanfang
Die Studie ist nicht nur eine „Kritik“, sondern schlägt einen Architekturansatz für die Koexistenz von zwei Systemen vor.
Der Kerngedanke ist: Behalten Sie das bestehende retrieval-basierte Situationserinnerungssystem (das Äquivalent des Hippocampus) bei und fügen Sie einen asynchronen Konsolidierungskanal hinzu, um die Situationserinnerungen schrittweise in die Modellgewichte (das Äquivalent des Neokortex) zu integrieren.
Die entsprechenden Technologien existieren bereits, von LoRA (leichtes Fine-Tuning) und MEMIT (Erinnerungsbearbeitung) bis hin zu TTT-Schichten (Training zur Testzeit) und SSR (Selbst-Distillation) usw.
Die Studie richtet konkrete Handlungsaufrufe an drei Zielgruppen:
Systementwickler: Implementieren Sie einen Konsolidierungskanal von der Situationsspeicherung zu den Gewichten, anstatt die Vektordatenbank unbegrenzt zu erweitern.
Benchmark-Designer: Führen Sie den Indikator „Kombinatorische Generalisierung über die Zeit (CGT)“ ein, um wirklich zu messen, ob der Agent lernt.
Forschungskommunität für kontinuierliches Lernen: Richten Sie Ihre Aufmerksamkeit erneut auf die Agenten-Szenarien, die von Natur aus einen kontinuierlichen Erfahrungsstrom, Belohnungssignale und eine reale Implementierungsumgebung bieten.
06 Zusammenfassung
Diese Studie ist im Wesentlichen eine Positionspapier, ohne eine große Anzahl von Experimenten, aber mit einem klaren Argumentationsrahmen und strengen theoretischen Beweisen.
Dass sie so viele Diskussionen ausgelöst hat, könnte genau darauf hinweisen: Dieses Problem haben fast alle Ingenieure und Forscher, die langfristig mit Agenten gearbeitet haben, schon irgendwie gespürt, aber bisher hat noch niemand es klar formuliert.
Wenn Sie ein langfristig funktionierendes Agentensystem entwickeln, bietet diese Studie eine wichtige Konzeptkalibrierung: Sind die „Erinnerungen“, die Sie speichern, wirklich Notizen oder echtes Lernen?
Dieser Artikel stammt aus dem WeChat-Account „New Intelligence Yuan“, Autor: ASI Revelation. 36Kr hat die Veröffentlichung mit Genehmigung durchgeführt.