Ein KI-Modell, das Claude Mythos übertrifft, ist entstanden?
Während sich alle noch über das plötzliche Verschwinden von Claude Fable 5 wundern, hat Sakana AI kündigte mit großer Prahlerei an: Unser Fugu kann mit Fable mithalten und ist nicht von Exportkontrollen betroffen.
Das stärkste Modell von Anthropic, Claude Fable 5, ist weltweit verboten, und es ist nicht bekannt, wann es wieder freigegeben wird.
Zuvor hat OpenRouter die Fusion - Funktion eingeführt, die eine KI - Intelligenz auf Fable - Niveau zu halber Preis ermöglicht.
Gerade jetzt hat die KI - Firma Sakana AI, die vom Erfinder des Transformers, Llion Jones, und anderen gemeinsam gegründet wurde, diese Strategie ebenfalls gelernt.
Sie behaupten, dass das Fugu Ultra - Modell die Leistung von Claude Fable und Mythos erreicht.
In der Ankündigung von Fugu wird die "Spitzenfähigkeit ohne Risiko von Exportkontrollen" als zentraler Verkaufspunkt klar benannt, was eine ziemliche Provokation darstellt.
Im strengsten Branchen - Benchmark für Ingenieurwesen, Wissenschaft und logisches Denken hält Fugu mit führenden Modellen wie Fable und Mythos Schritt.
Eine neue Tendenz entsteht: Anthropics Fable 5 wird zum neuen Benchmark.
Die großen Modelle gehen, die Orchestrierung wird zur Herrin
Mythos wurde am 9. Juni veröffentlicht und am 12. Juni offline genommen, es hat nur 72 Stunden überlebt.
Dies ist das erste Mal, dass die US - Regierung ihre Autorität für Exportkontrollen nutzt, um ein bereits deploytes Spitzen - KI - Modell offline zu nehmen: Nicht nur ausländische Benutzer werden eingeschränkt, sondern auch ausländische Staatsbürger in den USA und sogar ausländische Mitarbeiter von Anthropic selbst.
Der Zugang kann plötzlich weg sein, binnen einer Nacht kann er abgeschnitten werden.
Dies hat alle Benutzer von Claude Fable 5 völlig überrascht.
Heute ist die Fähigkeit zur Modell - Orchestrierung nicht nur eine technische Optimierung, sondern eine Notwendigkeit.
Nach OpenRouter geht Sakana AI in die nächste Spitzenlage der KI und bricht die Hegemonie der großen Modelle.
Kollektive Intelligenz ist die praktikabelste Gegenmaßnahme gegen diese übermäßige Machtkonzentration.
Der Kernvorteil von Fugu liegt darin:
Hinter ihm steht ein ganzes Pool von frei wechselbaren KI - Agenten. Wenn ein einziger Anbieter Einschränkungen verhängt, kann es automatisch umgehen und mit einem anderen Modell weiterarbeiten, wodurch die Systemresilienz erheblich verbessert wird.
Sakana Fugu selbst ist ein Sprachmodell, das nach der Schulung verschiedene große Sprachmodelle aus dem Agenten - Pool aufrufen kann - einschließlich der Rekursion seines eigenen Instanz.
Fugu orchestriert dynamisch die weltweit besten Modelle, um komplexe mehrstufige Aufgaben zu bewältigen.
In der Zukunft geht es nicht darum, wer das größte Modell hat, sondern darum, wer die weltweiten Modelle am besten, stabilsten und autonomsten "orchestrieren" kann.
Die Intelligenzgrenze eines einzelnen Modells ist immer noch wichtig, das Scaling Law ist immer noch wichtig, aber die Zeit der Orchestrierungs - Modelle ist da.
Mythos übertreffen, ohne brutale Rechenleistung zu nutzen
Fugu ist kein traditionelles KI - Modell.
Es ist ein Mehr - Agenten - System, das die verschiedenen Fähigkeiten seiner Agenten nutzt und verstärkt und einen neuen Weg für den Aufstieg der KI - Fähigkeiten weist.
Fugu ist auf dem gleichen Niveau wie Fable 5 und Mythos Preview.
In Bezug auf Agenten - Programmierung und Softwareentwicklung zeichnet sich Fugu - Ultra besonders aus. In den beiden Test - Benchmarks SWE Bench Pro und Terminal Bench 2.1 hat es das aktuelle Optimum erreicht, und seine Leistung hat sich erheblich verbessert.
In diesen beiden Benchmarks hat Fugu - Ultra eine Verbesserung von 5 % - 6 % gegenüber dem zweitbesten Modell erreicht.
Dies entspricht der Verbesserung, die durch ein gesamtes Hauptversion - Upgrade der Anbieter dieser Spitzenmodelle erreicht wird.
In Bezug auf wissenschaftliches Denken hat das Sakana Fugu - Modell ebenfalls eine deutliche Leistungssteigerung gezeigt, sogar übertrifft es Mythos Preview und Fable 5.
Diese Entdeckung bestätigt eines der zentralen Motive für das Training von Sakana Fugu:
Intelligente Orchestrierung sollte eine weitere Dimension zur Leistungssteigerung werden, ohne dass es auf die Erhöhung der Trainingsrechenleistung ankommt.
Ein markantes Merkmal eines intelligenten Orchestrierers ist die Anpassungsfähigkeit.
Während des gesamten Evaluierungsprozesses hat das Fugu - Modell eine kontinuierliche und vielfältige Anpassungsfähigkeit bei seiner Routing - Verteilung gezeigt.
Dies zeigt, dass das neue Modell die verschiedenen Fähigkeiten der Mitglieder des Modellteams genau lernen kann und die entsprechenden Modelle gezielt aufrufen kann.
Um die Gesamt - Benchmark - Punktzahl zu ergänzen, hat das Sakana Fugu - Modell drei Spitzen - Baseline - Modelle verglichen: Gemini 3.1 Pro (high), Opus 4.8 (max) und GPT 5.5 (xhigh) (die zufällig anonymisiert als Modell A, Modell B und Modell C bezeichnet werden).
Diese Aufgaben betonen das reale Verhalten von Agenten, wie z. B. langfristige Forschung, Programm - Synthese, Optimierung, CAD - Generierung usw.
Wie kann ein Modell alle Intelligenzen beherrschen?
Fugu orchestriert dynamisch die weltweit besten Modelle, um komplexe mehrstufige Aufgaben zu bewältigen.
Mit nur einer API können Sie heute direkt kollektive Intelligenz in Ihren Arbeitsablauf integrieren.
Beim Start wird Sakana Fugu zwei Modelle anbieten, die über eine OpenAI - kompatible API zugänglich sind:
• Fugu bietet im täglichen Arbeitsalltag eine starke Leistung bei geringer Latenz.
• Fugu Ultra ist das Flaggschiff - Modell, das speziell für schwierige mehrstufige Probleme optimiert ist und die höchste Antwortqualität anstrebt.
Fugu Ultra wird einen tieferen und stärkeren Pool von Experten - Agenten koordinieren, um anspruchsvolle Aufgaben wie KI - Forschung, Netzwerksicherheitsanalyse und Patentuntersuchungen zu bewältigen.
Sakana Fugu basiert hauptsächlich auf zwei ICLR 2026 - Publikationen.
Für jede Aufgabe hat Fugu gelernt, mehrere Expertenmodelle selbst zusammenzustellen, zu orchestrieren und zu koordinieren, ohne sich auf einen von Menschen entworfenen Arbeitsablauf zu verlassen.
Fugu nutzt ein vortrainiertes Sprachmodell als Kern und koordiniert den Pool der Arbeitsmodelle basierend auf seinen eigenen verborgenen Zuständen.
Fugu führt parallel einen leichten Auswahlkopf und den Sprachmodellkopf des Basis - Modells aus.
Es nimmt einen verborgenen Zustand ℎ aus dem Kernnetzwerk als Eingabe und gibt für jedes Arbeitsmodell im Pool 𝐿 Logits aus.
Das ausgewählte Modell wird immer als Arbeitsmodell aufgerufen, was den Koordinationsraum reduziert und die Orchestrierungs - Latenz verringert.
Das Forschungs - Team hat auch die Singulärwert - Skala der ausgewählten Parameter - Matrizen in der LM - Schicht feinjustiert, die durch rote Diagonalen angezeigt werden.
In der obigen Abbildung ist der verborgene Zustand an der Position, die als <Head Input> markiert ist, die Eingabe für den leichten Kopf.
Es ist zu beachten, dass der leichte Kopf auf internen verborgenen Zuständen arbeitet, nicht auf dem endgültigen decod