Japan entwickelt KI-Modell, das mit Fable 5 konkurriert

Ein Ausdruck des Produktdenkens

Am Morgen habe ich eine Nachricht gelesen. Ein japanisches KI-Unternehmen hat ein neues Modell vorgestellt und behauptet, es könne mit dem derzeit stärksten menschlichen Modell, Fable 5, mithalten.

Nachdem ich ihre technische Dokumentation gelesen habe, finde ich, dass das ziemlich abstrus ist.

Dieses Unternehmen namens Sakana AI hat das Sakana Fugu-Serie-Orchestrator-Modell vorgestellt. In gewisser Weise kann man dieses Fugu nicht einmal als Modell bezeichnen, sondern eher als einen Verteiler.

Denn das Fugu ist nicht die Basis eines großen Modells, sondern es ruft je nach Aufgabenart die Fähigkeiten anderer Modelle auf.

Beispielsweise, wenn ein Benutzer eine Programmieraufgabe stellt, ruft Fugu Claude Opus 4.8 auf. Wenn ein mathematisches Problem gestellt wird, ruft Fugu GPT-5.5 auf.

Natürlich ist der tatsächliche Ausführungsprozess sicherlich komplizierter als ich es beschrieben habe, aber der grundlegende Logik ist ungefähr so.

Also produziert Fugu selbst eigentlich keine Modellfähigkeiten, es ist eher ein "Transporter" von Modellen.

Unter dieser technischen Architektur und Logik haben sie auch einige Benchmark-Tests mit Modellen wie Opus 4.8 und GPT-5.5 durchgeführt.

Die Ergebnisse zeigen, dass Fugu Ultra die Ergebnisse von Opus 4.8 übertrifft.

Außerdem ist die Leistung von Fugu Ultra in Engineering-, Wissenschafts- und Schlussfolgungstests annähernd oder noch besser als die des derzeit stärksten Fable 5 und Mythos Preview.

Als ich das sah, dachte ich, dass diese Firma wahnsinnig anmaßend ist.

Sie nutzen die Fähigkeiten anderer Modelle, aber behaupten trotzdem, dass ihr eigenes Modell in allen Vergleichs Tests die anderen übertrifft.

Natürlich kann man nicht sagen, dass sie völlig nutzlos sind. Wenn man Wasser verkauft, muss man es zumindest verpacken und verarbeiten. In meiner Meinung liegt die Kernfähigkeit von Fugu in der Aufgabenklassifizierung und -scheduling.

Aktuell behaupten alle Modelle, sehr leistungsstark zu sein, aber tatsächlich haben sie jeweils ihre Stärken. Es gibt kein allumfassendes Modell, das alle Aufgaben bewältigen kann.

Deshalb hat Fugu diese Nachfrage erkannt und ein solches Produkt entwickelt.

Sie erkennen und beurteilen die Art der Aufgaben, die die Benutzer stellen, und zerlegen dann die Aufgaben. Beispielsweise in Forschung-, Programmierung- und Schlussfolgungsaufgaben. Sie entscheiden auch, ob multimodale Fähigkeiten benötigt werden.

Dann rufen sie je nach den segmentierten Aufgaben verschiedene Arbeitsmodelle auf. Diese Arbeitsmodelle sind eigentlich einige der derzeitigen Mainstream-Modelle, wie Claude, GPT und Gemini.

Selbst innerhalb einer Aufgabe können sie je nach der Aufgabenzerlegung die Fähigkeiten verschiedener Modelle nutzen.

Dieses Modell, das die Stärken anderer Modelle kombiniert, hat Fugu zu diesen Ergebnissen in den Tests verholfen. Im Wesentlichen spielt es die Rolle eines Schedulers.

Was die Preise angeht, kostet Fugu Ultra 5 US-Dollar pro Million Token für die Eingabe und 30 US-Dollar für die Ausgabe. Wenn der Kontext länger als 272k ist, ist es etwas teurer.

Derzeit kann man es auch über die API nutzen. Es gibt einen speziellen API Key und eine Entwicklerdokumentation.

Der Grund, warum ich euch heute über dieses Beispiel rede, ist, dass ich ein Problem aufzeigen möchte: Die Konkurrenz in der KI-Branche könnte sich in Zukunft ändern.

In der Vergangenheit ging es um die Modellfähigkeiten, in Zukunft wird es um die Anwendungsfähigkeiten gehen.

In der nächsten Zeit wird die Obergrenze der Weiterentwicklung der Modellfähigkeiten möglicherweise nicht so hoch sein wie zuvor. Deshalb werden viele auf Benutzer-Szenarien basierende Anforderungen allmählich realisiert.

Fugu ist ein typisches Beispiel. Es ist wie Hao123 in der Vergangenheit, es spielt nur die Rolle eines Zwischenschalters.

Aber diese Art des einheitlichen Zugangs löst tatsächlich viele Szenario-spezifische Anforderungen.

Ich habe selbst beim Nutzen von Agenten solche Probleme. Die Anforderungen in verschiedenen Szenarien werden an verschiedene Agenten delegiert, und jeder Agent nutzt ein anderes Modell.

Obwohl das Zwischensystem das Problem lösen kann, dass man mit einem API Key alle Modelle nutzen kann, muss man immer noch die einzelnen Modelle konfigurieren.

Der Vorteil von Fugu ist, dass es die interne Routing ermöglicht, was in gewisser Weise Nutzwert für die Benutzer schafft.

Aber ich denke, dass die Unsicherheit für dieses "Wasserverkaufs"-Unternehmen darin besteht, ob die Modelle, die es nutzt, langfristig unterstützt werden.

Denke mal darüber nach: Wenn der Zugang von dir übernommen wird und die Modelle selbst nur noch als Anbieter fungieren, ist das offensichtlich nicht im Interesse der Modellhersteller.

Es ist möglich, dass wenn Fugu eine gewisse Größe erreicht hat, es wahrscheinlich unter Druck gerät und das Geschäftsmodell dann nicht mehr funktionieren wird.

Ich denke, dass dieses Beispiel für Produktmanager möglicherweise eine Inspiration sein kann.

Produktentwicklung ist nie einfach die Erfindung neuer Technologien, sondern die Kombination von Technologien mit Szenarien, Benutzern, Anforderungen und Produktpositionierung.

Obwohl ich die langfristige Entwicklung von Fugu nicht optimistisch betrachte, ist dieser Gedanke trotzdem wertvoll. Man muss das Problem erkennen, die Anforderungen identifizieren, zum Szenario zurückkehren und eine Lösung finden.

Manchmal ist es bei der Produktentwicklung nicht das Schwierigste, das Produkt herzustellen, sondern die Anforderungssignale zu erkennen.

Die KI-Zeit ist so schnell hereingebrochen, aber ich denke, dass der Wert von Produktmanagern sogar gestiegen ist.

Bei den Szenarien, die Erkennung, Einsicht, Beurteilung und Entscheidung erfordern, braucht man immer noch gute Produktmanager.

Wenn Produktmanager mit diesen Fähigkeiten mit KI kombiniert werden, wird die Produktivität explodieren.

Schließlich habe ich nachgeschlagen, was das Wort "Fugu" bedeutet. Es heißt "Pufferfisch".

Scheint, dass die Japaner es mit einem Fisch unter Kontrolle haben wollen.

Dieser Artikel stammt aus dem WeChat-Account "Tang Ren" (ID: RyanTang007). Autor: Tang Ren. Veröffentlicht von 36Kr mit Genehmigung.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Japan hat ein KI-Modell entwickelt, das mit Fable 5 konkurriert, aber ich finde das etwas lächerlich.