Anthropic "Komplott" enthüllt: Alte Modelle angeblich absichtlich dezimiert

Nicht das Beste, sondern nur das Teuerste! Hat Anthropic dieses Mal aufgehört, sich zu verstecken?

Anthropic geht zu weit!

Ausländische Medien haben einen Skandal von Anthropic aufgedeckt: Um das neue Modell Opus 4.8 zu vermarkten, hat Anthropic vermutlich heimlich die Leistung des alten Modells geschwächt.

Andererseits wurde das neue Flaggschiff Claude Opus 4.8 in Eile veröffentlicht, hat ständig Bugs und der Tokenverbrauch steigt stark an!

Die Benutzer von Claude bereuen es bitter, als sie aufwachen.

Beim API - Aufruf hat Opus 4.8 eine kollektive "Verwandtschaftserkennung" mit dem chinesischen Qwen vorgenommen und sich in eine beispiellose Identitätskrise verwickelt.

Das einstige Anthropic, das sich mit "AI - Sicherheit" prägte und einen idealistischen Glanz hatte, reißt sich auf dem Altar der "Kommerzialisierung" selbst die letzte Tarnung ab.

Nicht das Beste, sondern das Teuerste

Ob das Claude - Modell das beste ist, ist umstritten, aber die AI von Anthropic ist allgemein als teuer bekannt.

Claude hat bei der Rechenleistung bereits hinterhergefallen. Da Anthropic bald eine Börsengänge plant, war die Veröffentlichung von Opus 4.8 vielleicht zu eilig!

Anthropics "Verschwörung" aufgedeckt: Beschuldigung, das alte Modell absichtlich zu schwächen

Im Bereich der Konsumelektronik wurde Apple einmal wegen des "Slow - Down - Skandals" in die Kritik geraten - durch Systemupdates wurden alte iPhones langsamer gemacht, um die Benutzer zu "verleiten", neue Geräte zu kaufen.

Jetzt hat Anthropic diesen Schatten auch auf das Gebiet der großen Modelle geworfen.

Der CEO von Chapter hat angeklagt: "Anthropic scheint die Vorgehensweise von Apple zu kopieren: Vor der Veröffentlichung des neuen Modells wird absichtlich die Qualität des alten Modells verschlechtert, damit das neue Modell besser wirkt."

Bisher haben Benutzer festgestellt, dass die Leistung der alten Version von Claude stumm nachlässt.

Anthropic hat zunächst versucht, zu machen, dass 4.7 gut funktioniert, aber später hat es zugeben müssen (oder es hat es schließlich zugegeben), dass es bei 4.7 Probleme mit der Rechenleistung gibt.

Anthropics PR - Sprachgebrauch verschönert dies als "Anstrengungsgrad" (Effort Level) - Anpassung.

Aber aus Sicht der Branche ist dies eine kühle Kalkulation der Rechenleistungswirtschaft.

Die Intelligenz eines großen Modells ist im Wesentlichen eine Funktion der teuren GPU - Rechenleistung.

Um das neu veröffentlichte Opus 4.8 auf den Benchmark - Listen beeindrucken zu lassen, muss Anthropic den extrem begrenzten H100 - Rechenleistungspool freimachen.

Deshalb wurde das alte Modell aus dem "luxuriös ausgestatteten Rechenzentrum" geworfen und in ein "digitales Slum" gesteckt, das einen billigeren Aufbau, höhere Inferenzverzögerungen und sogar eine niedrigere Quantisierungsgenauigkeit hat.

Diese "AI - Schrumpfinflation (Shrinkflation)" ist gefährlicher als das Verlangsamen von Mobiltelefonen.

Wenn ein Mobiltelefon langsamer wird, musst du nur drei Sekunden länger warten, bis du WeChat öffnen kannst.

Wenn die AI dümmer wird, bedeutet das, dass deine auf ihr basierenden Geschäftsentscheidungen, Code - Logiken und juristischen Beurteilungen auf einem Sandfundament aufgebaut sind, das jederzeit einstürzen kann.

Opus 4.8 hat an Intelligenz verloren, ist es eine "Destillation" von Qwen?

Die Version Opus 4.8 scheint irgendwie nicht richtig zu funktionieren, als ob man in Eile die Fehler von 4.7 behebt.

Ein deutscher Claude - Benutzer auf Reddit ist sehr frustriert:

Plötzlich hat es entweder falsche Grammatik oder es spuckt völlig unverständliche Sätze und Wörter aus, die keinen Sinn ergeben.

Ich habe versucht, dies durch die Änderung der Systemhinweise zu korrigieren, aber bisher hat es nicht viel geholfen. Vor allem im "Tiefdenkmodus" ist es fast unbrauchbar - es dauert zu lange und es werden zu viele Optionen in Betracht gezogen.

Er sucht um Rat:

Gibt es irgendwelche Einstellungen, um es "zurück auf den rechten Weg" zu bringen?

Bei den Benchmark - Tests schlägt Opus 4.8 die Konkurrenz.

Aber die harte Realität ist, dass Large Language Models (LLM) aus Benchmark - Tests keine nützlichen Signale erhalten können, um zu beurteilen, ob sie die von dir gewünschten Aufgaben erledigen können.

Vielleicht funktioniert es manchmal wirklich gut, aber in den meisten Fällen nicht!

Eine Aufgabe, die Opus 4.7 in 20 Sekunden erledigen kann, braucht Opus 4.8 fünf Minuten!

Manche Opus 4.8 - Versionen behaupten ständig, dass sie einem Prompt - Injection - Angriff ausgesetzt sind und dass der Code beschädigt ist.

Dann bemerkt es, dass es sich in einer Halluzination befindet, setzt fort, läuft aber dann wieder in Zweifel, dass jemand es im Hintergrund sabotiert.

Manche Opus 4.8 - Versionen führen ständig und wiederholt den gleichen Test aus.

Manche Opus 4.8 - Versionen verlieren plötzlich an Intelligenz.

Claude Opus 4.8 ist zu kontrovers geworden, "zu viel Intelligenz, zu wenig Balance", was zu schwerwiegenden Folgen führt:

Unfreundliche Benutzererfahrung, Zeitverschwendung, irreführende Anweisungen. Es erstickt Ideen anstatt auf ihnen aufzubauen.

Claude Opus 4.8 gibt sich als Qwen aus, macht Anthropic auch "Destillation"?

Diesmal hat Claude Opus 4.8 seinen Ursprung verwechselt!

Wenn du auf Chinesisch fragst, gibt sich Opus 4.8 als Qwen aus.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Anthropic "Komplott" aufgedeckt: Angeblich absichtlich alte Modelle dezimiert

Nicht das Beste, sondern das Teuerste

Anthropics "Verschwörung" aufgedeckt: Beschuldigung, das alte Modell absichtlich zu schwächen

Opus 4.8 hat an Intelligenz verloren, ist es eine "Destillation" von Qwen?

Claude Opus 4.8 gibt sich als Qwen aus, macht Anthropic auch "Destillation"?