Das Rätsel gelöst: Pony Alpha - Ein chinesisches Produkt, Xiaolong triumphiert in KI-Programmierung!

Große Unternehmen verfolgen OpenAI, und Xiaolong lernt von Anthropic.

In den letzten beiden Tagen ist ein Modell namens Pony Alpha aufgrund seiner hervorragenden Leistung in Bezug auf Coding-Fähigkeiten plötzlich der beliebteste Name in der AI-Szene geworden.

OpenRouter hat das Entwicklerteam von Pony Alpha nicht angegeben. Aber nach mehrfachen Erkundigungen von Zimu AI stammt dieses Modell von einem der sogenannten "Sechs kleinen Drachen" in der AI-Branche und ist aus der kommenden neuen Generation von Modellen dieses Unternehmens hervorgegangen.

In Bezug auf die Coding-Fähigkeiten hat Pony Alpha seine ausgezeichneten Planungs- und Aufruf-Fähigkeiten im Szenario von AI-Agenten gezeigt. In einigen öffentlichen Tests hat es mit nur zwei Phasen der Interaktion den Prozess des Aufbaus eines RPG-Spielprojekts automatisch abgeschlossen.

Zufällig genug hat "Der dunkle Seite des Mondes" (einer der "Sechs kleinen Drachen") vor einigen Wochen auch ein wichtiges Update für sein Kimi 2.5 vorgenommen. Es betont das Verständnis, die Modifikation und die Zusammenarbeit von Code bei langen Kontexten und bringt das Coding auf die Ebene des technischen Einsatzes.

In den letzten zwei Jahren wird AI-Coding immer als einer der sichersten kommerziellen Richtungen für große Modelle angesehen. GitHub Copilot hat bereits über 20 Millionen Nutzer und wird von vielen Unternehmen eingesetzt. Es ist eines der größten bezahlten AI-Produkte derzeit.

Als das derzeit am meisten beachtete AI-Programmierprodukt hat Claude Code innerhalb von sechs Monaten nach seiner Einführung einen Jahresumsatz von etwa einer Milliarde US-Dollar erzielt, was zeigt, dass AI-Coding bereits über echte kommerzielle Einnahmekapazität verfügt.

Die Nutzungsrate der Entwickler gibt ebenfalls ein positives Feedback. Eine Umfrage von Stack Overflow im Jahr 2025 zeigt, dass über 80 % der Entwickler bereits AI-Tools in ihrer Arbeit verwenden, wobei die Programmierbezogenen Anwendungen den höchsten Anteil haben.

Vor diesem Hintergrund ist der Aufstieg der "kleinen Drachen" in der AI-Coding-Branche im Wesentlichen ein Versuch, im Wettlauf um die AGI gegen die führenden Unternehmen einen Weg zu finden, der sowohl die fortschrittliche Produktivität repräsentiert als auch stabile Einnahmen generieren kann.

01 Der Kampf um die roten Umschläge ist noch nicht beendet, der Coding-Kampf beginnt erneut

In dieser Frühlingsfest-Saison hat die intuitive Wahrnehmung der Masse von AI hauptsächlich von den roten Umschlägen ausgegangen. Große Unternehmen wie Yuanbao, Qianwen und Baidu haben nacheinander eine große Anzahl von roten Umschlägen verteilt und in der Konkurrenz um den ursprünglichen AI-Eingang hintereinander her gerannt.

Aber auf dem Modellmarkt spielt sich ein anderer "Frühlingsfest-Saison" still im Hintergrund ab. In der vergangenen Woche haben OpenAI und Anthropic fast gleichzeitig "Coding" zu einem produktorientierten Schritt gemacht: OpenAI hat die Desktop-Version von Codex eingeführt und auf die langfristigen Aufgaben mehrerer Agenten hingewiesen; Anthropic hat Opus 4.6 veröffentlicht und Claude Code verbessert.

Im Gegensatz zu traditionellen Ergänzungstools ist Claude Code als ein technischer Agent konzipiert, der direkt Code-Repositories lesen, Terminals und Testprozesse aufrufen kann. Es unterstützt die geschlossene Schleife von Aufgabenaufteilung, Befehlsausführung und Ergebnisüberprüfung und nähert sich eher der Arbeitsweise echter Entwickler.

Der Kern dieser Veränderung liegt darin, ob das Modell die Fähigkeit zur Aufgabenautonomie besitzt. Genau vor diesem Hintergrund ist das Auftauchen von Kimi 2.5 und Pony Alpha ein wichtiger Schritt der chinesischen Modelle auf der Coding-Bühne.

Schauen wir uns zunächst Kimi 2.5 an. Laut der offiziellen Dokumentation hat Kimi 2.5 die sogenannte "Agent Swarm" (Intelligent-Agenten-Cluster)-Architektur eingeführt, die automatisch bis zu etwa 100 Unter-Agenten erstellen kann, um verschiedene Teilprobleme in einer Aufgabe parallel zu bearbeiten.

Diese Design kann bei komplexen Arbeitsabläufen, die mehrere Schritte erfordern, die parallele Ausführung und den Aufruf von Tools ermöglichen.

In diesem Prozess wird eine Coding-Aufgabe nicht mehr von einem einzigen Modell erledigt, sondern in mehrere Teilaufgaben aufgeteilt und von verschiedenen Agenten parallel bearbeitet. Diese Parallelität ist nicht die parallele Generierung, sondern die Trennung der Aufgaben.

In den offiziellen Beispielen kann man sehen, dass aus einer einfachen natürlichen Sprachaufforderung eine vollständige Front-End-Oberfläche generiert und die Interaktionseffekte realisiert werden können.

Agent Swarm muss keine Unter-Agenten oder Arbeitsabläufe im Voraus definieren. Bei komplexen Aufgaben werden automatisch Unter-Agenten für "Suche, Debugging, Schreiben, Validierung" zugewiesen und parallel vorangetrieben. Im Vergleich zur seriellen Ausführung traditioneller Einzel-Agenten kann diese Methode die Aufgabenabschließungszeit deutlich verkürzen.

Diese Art der Mehr-Agenten-Scheduling mit "Aufgabenaufteilung + Zustandssynchronisierung" liegt nicht auf der Generierungsgeschwindigkeit, sondern auf der Reduzierung des Risikos von Kontextkonflikten und logischen Rückläufen bei komplexen Aufgaben. Sie eignet sich besser für die Ausführung von langfristigen technischen Prozessen.

Was Pony Alpha betrifft, so gibt es keine offizielle Whitepaper für dieses auf OpenRouter beliebte Modell. Aber die öffentliche Modellbeschreibung und die Tests in der Community zeigen, dass es in der langfristigen Aufgabenplanung und der technischen Ausgabe relativ gut abschneidet.

OpenRouter zeigt, dass Pony Alpha ein relativ großes Kontextfenster (etwa 200.000 Tokens) hat. In mehreren Testfällen hat Pony Alpha alle von den Nutzern gestellten Testaufgaben erfolgreich abgeschlossen, meistens in Form von einmaliger Generierung vollständiger Arbeitsabschnitte für Datenvisualisierung, Algorithmusimplementierung und Front-End-Anzeige.

Im Szenario des Aufbaus einer Spielarchitektur kann Pony Alpha in einer einzigen Generierung gleichzeitig die numerische Berechnung, die Zustandsverwaltung und die Visualisierung durchführen und die bestehende Struktur bei nachfolgenden Änderungsanweisungen nicht zerstören.

Nach den Testfällen in der Community hat ein Entwickler Pony Alpha zusammen mit Claude Code verwendet, um ein Minecraft-Projekt auszuführen. Innerhalb von etwa zwei Stunden wurden etwa 170 KB reiner JavaScript-Code generiert, und die Qualität der Ausgabe wurde als "übererwartet" bewertet.

Weitere Tests haben gezeigt, dass das Modell in Detailaufgaben wie der SVG-Generierung "ein Ästhetik- und Vollständigkeitsniveau nahe an dem von Claude Opus 4.5" aufweist.

Offensichtlich zielen Pony Alpha, Kimi 2.5 und ihre amerikanischen Kollegen wie Claude alle auf dasselbe Problem ab, wenn es um die Verbesserung der Coding-Fähigkeiten geht: wie man komplexe "technische" Aufgaben abwickeln kann.

Deshalb wird AI-Coding als eine der kommerziellsten Richtungen angesehen. Im Gegensatz zu traditionellen Chatbots erfordert der Agentic-Arbeitsablauf vom Modell mehrere Runden von Tool-Aufrufen, Langzeitkontext-Gedächtnis und komplexe Aufgabenplanung, was zu einem exponentiellen Anstieg des Token-Verbrauchs pro Interaktion führt.

Stabile und kontinuierliche Produktivitätsausgabe ist die Richtung, in die sich AI-Coding im B2B-Szenario entwickeln muss.

In diesem Sinne ist "Der Aufstieg der kleinen Drachen in AI-Coding" kein bloßer technischer Slogan, sondern eine realistische Wahl:

Die großen Unternehmen können sich entscheiden, mit roten Umschlägen und finanziellen Mitteln die Macht über die Modelle zu erlangen. Aber für Start-ups müssen sowohl die Macht als auch die Kommerzialisierung durch die Modelle realisiert werden.

Mit anderen Worten, es ist durchaus möglich, dass die chinesischen "kleinen Drachen" in der AI-Coding-Branche 2026 zuerst erfolgreich sein werden.

02 Vielleicht müssen die chinesischen AI-Coding-Karten von den kleinen Drachen gespielt werden

Yao Shunyu, der Chefwissenschaftler des CEO von Tencent, hat einmal beurteilt: In der AI-Coding-Branche werden nur die besten oder die teuersten Modelle langfristig abonniert.

Im Moment wird die Bedeutung dieser Aussage immer konkreter.

In den letzten Jahren haben die großen chinesischen Internetunternehmen in die AI-Coding-Richtung nicht schwach gelassen. Beispielsweise hat Baidu "Wenxin Kuaima" entwickelt, das als ein Unternehmens-Intelligent-Agenten-Programmierassistent positioniert ist.

Alibaba hat auf der Basis der AI-Fähigkeiten seiner großen Modellfamilie Qwen im Jahr 2025 Qwen3-Coder entwickelt, der sich auf die Codegenerierung und technische Aufgaben konzentriert und in einigen Codierungsszenarien mit internationalen Mainstream-Modellen konkurrieren kann.

ByteDance hat durch Entwicklertools wie Trae die großen Modelle tiefgehend mit IDEs und Editoren integriert und die plattformübergreifende Codierungshilfe und das Debugging unterstützt.

Das bemerkenswerte Gemeinsame dieser Produkte der großen Unternehmen ist: Sie sind tiefgehend mit ihren eigenen großen Modellsystemen integriert und richten sich an die komplexen Prozesse von internen Projekten und Unternehmensnutzern.

Sie betonen oft Unternehmensanforderungen wie Normen, Sicherheit und private Bereitstellung und verbessern die technische Effizienz durch die Kopplung mit IDEs und Cloud-Dienstplattformen. Sie werden nicht unbedingt direkt zu einem standardisierten, extern abonnierbaren Produkt zusammengefasst.

Dieser Ansatz spiegelt die strategische Logik der großen Unternehmen wider: Für sie ist AI-Coding zunächst eine Infrastruktur zur Verbesserung der internen Effizienz und der geschäftlichen Zusammenarbeit, nicht aber ein unabhängiger Wettlauf für die kurzfristige Kommerzialisierung.

Sie verfügen über riesige interne Code-Bibliotheken, reife technische Systeme und zahlreiche Anwendungsfälle für Ingenieure. Deshalb priorisieren sie die Internalisierung ihrer Fähigkeiten und die Einbettung in die bestehenden Forschungs- und Entwicklungsprozesse, anstatt sofort eine skalierbare Ausgabe zu erzielen, um den externen Markt zu validieren.

Im Vergleich dazu sind die Produktpositionen von Kimi 2.5 und Pony Alpha von Anfang an eher auf die nach außen sichtbare und skalierbare Agenten-Fähigkeit ausgerichtet.

Hinter diesem Unterschied liegt nicht die Überlegenheit oder Mangel an Fähigkeiten, sondern die unterschiedlichen Ziele und Anreizmechanismen: Die großen Unternehmen priorisieren die Lösung von Effizienz- und Sicherheitsproblemen innerhalb ihrer eigenen technischen Grenzen, während einige "kleine Drachen" versuchen, die Agenten-Fähigkeit zu einem extern validierbaren, abonnierbaren und skalierbaren Produkt zu machen.

Mit anderen Worten, AI-Start-ups haben keine eigene Basis. Alle technischen Verbesserungen müssen der Erschließung des Marktes dienen.

Ohne die Unterstützung von Werbung, E-Commerce oder Cloud-Diensten ist die Kommerzialisierung für Start-ups, die sich für die eigene Entwicklung von Basis-Modellen entscheiden, nicht mehr eine "Zusatzleistung", sondern eine Voraussetzung für die Weiterentwicklung der nächsten Generation von Modellen.

Im Vergleich zu allgemeinen Gesprächen oder Inhaltsgenerierung ist AI-Coding einer der wenigen Anwendungsbereiche, in denen die Zahlungsbereitschaft der Nutzer klar ist, die Wiederholungskauf-Logik stimmt und die Preissetzung hoch genug ist.

Deshalb ist es eher in der Nicht-Großunternehmen-Camp, dass diejenigen am meisten versuchen, ein erfolgreiches Produkt in der AI-Coding-Ebene zu entwickeln.

Nehmen wir Anthropic als Beispiel. Das Claude-Modell dieser Firma war zuvor nicht so ein kommerziell erfolgreiches Produkt wie ChatGPT, hat aber bei Entwicklern und Unternehmensnutzern einen sehr guten Ruf erworben.

Anthropic hat bei der Modellgestaltung kontinuierlich die Stabilität bei langen Kontexten, die Konsistenz bei Tool-Aufrufen und die Fähigkeit zur Einhaltung von Beschränkungen verbessert. Sein Ziel ist nicht die einmalige Generierungseffektivität, sondern die Reduzierung der Fehlerquote und der Nacharbeitskosten des Modells in realen technischen Prozessen.

Wenn diese Fähigkeiten in den realen Arbeitsablauf eingebunden werden, sind sie sehr schwer zu ersetzen. Deshalb kann Anthropic im professionellen Entwicklungsbereich in gewissem Sinne parallel mit OpenAI konkurrieren.

Dieser Weg ist auch für chinesische AI-Start-ups von Referenzwert.

Die jüngste Verbesserung der Coding- und komplexen Aufgabenbearbeitungsfähigkeiten von Kimi 2.5 sowie die eher technisch ausgerichteten AI-Programmiertools wie Pony Alpha senden nicht das Signal, dass "das Modell wieder verbessert wurde", sondern dass sich die Produktlogik von "Code schreiben können" zu "an der Entwicklung teilnehmen können" verändert hat.

An der Entwicklung teilnehmen bedeutet, in die gesamte Kette von Bedarfsaufteilung, Codeverständnis, -modifikation, -prüfung und kontinuierlicher Iteration einzusteigen. Aber nur wenn diese komplexen Szenarien funktionieren, gibt es eine reale Grundlage für die Wiederholungskäufe und die langfristige Bezahlung im B2B-Bereich.

Deshalb ist die AI-Coding-Karte im Wesentlichen nicht nur ein Streit um die technische Route, sondern eine Differenzierung der Überlebensstrategien.

Die großen Unternehmen können sich Zeit lassen, ihre Fähigkeiten internisieren und sich nicht beeilen, Einnahmen zu erzielen. Aber für Start-ups, die sich für die eigene Entwicklung von Basis-Modellen entscheiden, hat derjenige, der sich zuerst im Coding-Szenario fest etabliert, die beste Chance, im nächsten Runden weiterhin mitzuspielen.

Im Moment ist AI-Coding eher ein stiller, aber realer kommerzieller Ausdauersport.

Auf diesem Laufstreifen zeigen einige chinesische "kleine Drachen" bereits Anzeichen eines Aufstiegs.

Dieser Artikel stammt aus dem WeChat-Account "Zimu AI", Autor: Li Zhaofeng, Redakteur: Wang Jing, veröffentlicht von 36Kr mit Genehmigung.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Das Rätsel ist gelöst! Pony Alpha ist ein Produkt aus China. Xiaolong hat sich in der KI-Programmierung erfolgreich durchgesetzt.

01

Der Kampf um die roten Umschläge ist noch nicht beendet, der Coding-Kampf beginnt erneut

02

Vielleicht müssen die chinesischen AI-Coding-Karten von den kleinen Drachen gespielt werden