Professor enthüllt die erstaunliche Wahrheit über Claude: Denkprozess verschlüsselt, auch gegen Bezahlung nicht einsehbar

Claudes „Black Box Moment": Der Denkprozess ist verschlüsselt – steht Anthropic vor dem Kollaps?

Als Anthropic damals extended thinking vorstellte, hat es es als Transparenzmaßstab verkauft, der es dem Benutzer ermöglicht, den Denkprozess zu sehen. Die Wahrheit ist jedoch: Sie sehen nur das, was sie sehen dürfen. Was verbirgt sich hinter den verschlüsselten, komprimierten und mit einem globalen Schlüssel gesperrten Inhalten?

Zu Beginn des Jahres hat Anthropic still und leise die Standardeinstellungen von Claude Code geändert – adaptive Denkweise (adaptive thinking), Verstecken von Denkblöcken (redact - thinking) und Herabstufung des Standard - Aufwands (default effort).

Das hat dazu geführt, dass die Denktiefe um etwa 67 % gesunken ist. Die direkten Benutzer von Claude Code haben das Gefühl, dass die KI an Intelligenz verloren hat.

Anthropic hat sich dazu geschwiegen, bis jemand bewiesen hat, dass es tatsächlich so ist, und dann Gründe herausgesucht hat.

Einige Wochen später hat Anthropic schließlich die Gründe erklärt.

Kürzlich hat der Entwickler Patrick McCanna beim Überprüfen der lokalen Sitzungsprotokolle von Claude Code eine entscheidende Anomalie entdeckt: Der Inhalt der Denkblöcke von „Extended Thinking“ des Modells war leer, es blieb nur eine verschlüsselte Signatur von etwa 600 Zeichen übrig.

In diesem Moment hat die KI ihre „Denkpfade“ für die Menschen verschlossen.

Deshalb hat er sich die Claude - Dokumentation genau durchgelesen, aber die Formulierung von Anthropic war unglaublich verschwiegen!

Wenn Sie nicht ein paar Tassen Kaffee trinken, um wach zu bleiben, werden Sie mit hoher Wahrscheinlichkeit diese lebenswichtige Wahrheit verpassen:

Die sogenannte Rückgabe von „extended thinking“ bedeutet tatsächlich nur, dass Claude den vollständigen Denkprozess heimlich zu einer Zusammenfassung komprimiert hat.

Kurz gesagt, hat Anthropic das Kernstück, nämlich „was Claude tatsächlich gedacht hat“, einfach versteckt.

Im Wesentlichen ist die „Denksummarisierung“ eine kognitive Reduktionsangriff.

Dies ist eine langsam vorbereitete technische Tarnung und auch eine „stille Entziehung“ der Informationsrechte der Benutzer durch den KI - Giganten Anthropic auf dem Weg zur Superintelligenz (ASI).

Das „buch ohne worte“ in den protokollen

Die gekürzte Denkfolge

Stellen Sie sich vor, Sie haben einen Spitzenarchitekten beauftragt, ein Gebäude zu entwerfen. Sie verlangen, seine Entwurfszeichnungen zu sehen, aber er gibt Ihnen nur eine schöne 3D - Visualisierung und steckt alle Strukturberechnungen in einen Safe, den nur er öffnen kann.

Das ist die Wahrheit, die Patrick McCanna aufgedeckt hat:

Sie denken, Sie sehen im Interface von Claude 4 den Prozess, wie es „anstrengend denkt“, aber tatsächlich ist es nur eine „Zusammenfassung für das Leseverständnis“, die das Modell nach der Inferenz für Sie vorbereitet hat.

Die echte Denkfolge (CoT) ist bereits mehrfach verschlüsselt.

Wie wird das überhaupt möglich?

Das sogenannte „Denken“ (thinking) / „Schließen“ (reasoning) wird in JSON - Form an den Client gesendet.

Und in jedem Abschnitt steckt eine Base64 - codierte Information.

Zwischen verschiedenen Anbietern gibt es geringfügige Unterschiede in den Inhalten dieser Datenblöcke, aber der Kern jedes Blocks ist ein zertifizierter Geheimtext.

Sie müssen kein Sherlock Holmes sein, um das zu erkennen.

Erstens wird es länger oder kürzer, je nachdem, wie tief das Modell denkt; zweitens wird, wenn Sie irgendeinen Abschnitt, der wie ein Geheimtext aussieht, manipulieren und ihn dann zurücksenden, ein erkennbarer API - Fehler ausgelöst.

So sieht der Inferenzblock von OpenAI aus:

Und so sieht die unfassbar komplizierte Implementierung von Anthropic aus:

Obwohl es als „Signature“ (Signatur) bezeichnet wird, scheint hier keine echte kryptografische Signatur zu existieren.

OpenAI sagt es ganz klar: Diese Daten enthalten einen „nicht transparenten Inferenzprozess“, Sie sollten sie nicht ansehen – was Sie tun müssen, ist einfach, sie bei der nächsten Konversation unverändert an den Server zurückzusenden.

Der Schlüssel liegt in der Hand von Anthropic, und Sie dürfen nur das sehen, was es Ihnen zeigen will.

Der Kryptografieprofessor geht selbst in die Rucksicht

Im Mai hat jemand sich für diese Signatur begeistert.

Der Kryptografieprofessor Matt Green von der Johns Hopkins University hat ein ganzes Wochenende damit verbracht, sich mit diesen „verschlüsselten Inferenzblöcken“ zu beschäftigen.

Allerdings muss man ihn erstmal enttäuschen – er hat immer wieder betont, dass dies nur ein Spaßprojekt am Wochenende ist, das wenig mit echter Kryptografie zu tun hat. „Es ist im Grunde eine enttäuschende Experiment“, und man sollte nicht erwarten, dass man damit einen großen Bug - Bounty einnehmen kann.

Aber er hat tatsächlich zwei interessante Punkte entdeckt.

Erstens können diese verschlüsselten Inferenzblöcke wiederholt werden.

Derselbe verschlüsselte Denkprozess kann in einer anderen Sitzung oder sogar mit einem anderen Konto zurückgesendet werden, und das Modell akzeptiert ihn ohne Fehler.

Daraus schließt er, dass OpenAI und Anthropic wahrscheinlich beide einen globalen Schlüssel verwenden, um die Inferenzdaten aller Benutzer zu verschlüsseln.

Beide Anbieter sind verdächtig, es ist nicht nur Anthropics Problem. Das Wiederholen von Inferenzblöcken funktioniert bei OpenAI sogar besser, während Claude hier strenger ist.

Zweitens kann die Länge der Inferenzblöcke etwas verraten.

Er hat ein Experiment entworfen: Er lässt das Modell in den verborgenen Denkprozess eine Berechnung unterschiedlicher Schwierigkeit basierend auf einem geheimen Bit durchführen, und dann kann er das Bit anhand der Länge der Denkblöcke Stück für Stück rekonstruieren.

Das ist der sogenannte Side - Channel.

Klingt beeindruckend? Warten Sie mal.

Green hat es ganz klar gemacht: Was er herausfinden konnte, waren die von ihm gesetzten Testdaten und der tatsächlich existierende Anwendungsschlüssel.

Das eigentliche Ziel, nämlich das „Geheimnis in den Systemhinweisen des Modells“, hat er nicht herausfinden können – denn im API - Modus hat das Modell gar keine Systemhinweise, die man extrahieren könnte. Er hat es nur mit einem „vielleicht“ markiert.

Das Wichtigste ist der Folgegang: Er hat beide Entdeckungen an das Bug - Bounty - Programm von Anthropic gemeldet.

Anthropics Antwort war – sie sah keine Sicherheitsrisiken in der Wiederholung und im Side - Channel, aber sie würde die Entwicklerdokumentation aktualisieren und auf die Gefahren hinweisen. Green fand diese Behandlung ganz vernünftig.

Das Transparenzparadoxon des „transparentesten“ Unternehmens

Das ärgerlichste an dieser Sache liegt nicht in den technischen Fehlern selbst.

Was war immer Anthopics Markenstory? „Verantwortliche KI“, „Sicherheit geht vor“ und „die transparenteste Firma in der Branche“.

Sie haben speziell die Funktion extended thinking entwickelt, damit die Benutzer den Inferenzprozess des Modells „sehen“ können – dies wurde als Transparenzmaßstab propagiert.

Die Tatsache ist: Der Denkblock, den Sie sehen, ist nicht die echte Denkfolge, sondern eine Zusammenfassung.

Die echte Inferenz ist verschlüsselt, und der Schlüssel liegt in der Hand von Anthropic. Und dieses Verschlüsselungssystem hat Sicherheitslücken, die ausgenutzt werden können.

Ein Unternehmen, das sich als transparent bekannt gibt, hat an der Stelle, an der es am meisten transparent sein sollte, sich für die Verschlüsselung entschieden. Und das Verschlüsselungssystem selbst ist nicht sicher genug.

Dies ist ein strukturelles Vertrauensproblem.

Wenn die Benutzer nicht einmal

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Die erstaunliche Wahrheit über Claude wurde von einem Professor aufgedeckt: Der Denkprozess ist verschlüsselt und kann nicht eingesehen werden, selbst wenn man dafür bezahlt.

Das „buch ohne worte“ in den protokollen

Die gekürzte Denkfolge

Der Kryptografieprofessor geht selbst in die Rucksicht

Das Transparenzparadoxon des „transparentesten“ Unternehmens