Chinesische KI-Programmierung erreicht Platz zwei weltweit. Wir testen fünf Modelle: Welches ist das ultimative Vibe Coding-Tool?
Übertrifft GPT-5.5, Gemini 3.5 Flash und DeepSeek V4 Pro. Das neueste Flaggschiffmodell Qwen3.7 Max von Alibaba hat auf der Programmierwettbewerbsliste den zweiten Platz belegt, nur hinter Claude Opus 4.7.
Screenshot der Liste vom 26. Mai
Abgesehen von der Benutzerwahl in realen Szenarien hat Qwen3.7 Max auch auf traditionellen festen Bewertungslisten für große Modelle, wie der Terminal-Benchmark für Endgerätefähigkeiten und der SWE-Benchmark für Programmierfähigkeiten, den ersten Platz unter den chinesischen Modellen errungen.
Obwohl wir in den letzten vier Jahren derartige Aktualisierungen von Ranglisten schon häufig gesehen haben, können wir uns nicht zurückhalten, das Qwen-Modell, das GPT 5.5 übertrifft, auszuprobieren und zu sehen, wie es tatsächlich performt.
Es ist bekannt, dass die derzeit beliebteste Kombination des Coding Agents wohl Codex mit GPT 5.5 ist.
Was wäre, wenn wir das Standardmodell in Codex durch Qwen3.7 Max ersetzen und dann Codex für alltägliche Aufgaben nutzen? Würde es dann besser funktionieren als GPT 5.5?
Qwen3.7 Max erhalten
Da derzeit verschiedene Anbieter Token-Sonderangebote anbieten, bietet auch Alibaba Cloud 1 Million kostenlose Tokens, die auf der Alibaba Cloud BaiLian-Plattform genutzt werden können.
Der Preis von Qwen3.7 Max beträgt derzeit auf der offiziellen Alibaba Cloud-Website zeitweise die Hälfte. Die Eingabe kostet 6 Yuan pro Million Tokens, die Ausgabe 18 Yuan pro Million Tokens. Neue Benutzer können auch an einem Sparplan mit 50 % Rabatt teilnehmen und für 10 Yuan pro Monat 20 Yuan an Token-Kontingent erhalten. Der Standard-Token-Plan kostet derzeit 198 Yuan pro Monat.
Insgesamt gesehen liegt der Preis von Qwen3.7 Max gemäß den Daten der Plattform OpenRouter für die Aggregation großer Modelle in einer mittleren Position. Im Vergleich zum stark reduzierten Preis von DeepSeek ist er natürlich höher, aber im Vergleich zu Opus 4.7 und GPT 5.5 ist er doch deutlich günstiger.
Wir haben direkt 20 Yuan für das "Ideal für Einsteiger"-Paket aufgeladen, das für alle Modelle gültig ist. Hier ist jedoch zu beachten, dass der 50 %-Rabatt nur für ein Paket gilt. Wenn Sie also das 10-Yuan-Paket kaufen, können Sie nicht auch die halbpreisen Pläne für 50 oder 250 Yuan kaufen.
DeepSeek, Claude, GPT, Gemini und Qwen gemeinsam testen
Nachdem wir den API-Schlüssel und 1 Million kostenlose Tokens erhalten haben, haben wir zuerst auf der Alibaba Cloud BaiLian-Plattform und auf der offiziellen Qianwen-Website Qwen3.7 Max für einige übliche Frontend-Webseitenentwürfe getestet, um seine Entwicklungsfähigkeiten zu prüfen.
Für einen physikalischen Simulations-Test, bei dem die Unterschiede gut sichtbar sind, haben wir einen einfachen Hinweis verwendet: "Erstelle mit HTML+CSS+JS eine Animation, die die Bewegung von Flüssigkeit in einem Behälter simuliert. Der Behälter kann verschoben werden, um die Neigung zu ändern."
Qwen3.7-Max, generiert auf der offiziellen Qianwen-Website
Qwen3.7 Max hat diese Simulationsherausforderung erfolgreich bewältigt und zusätzlich Funktionen wie die Anpassung der Farbe, das Schütteln und die Regulierung der Flüssigkeitsmenge hinzugefügt.
DeepSeek hat eine einfachere Lösung geliefert, aber keine Fehler gemacht.
DeepSeek V4, generiert auf der offiziellen Website
Die von GPT-5.5 generierte Flüssigkeit sieht etwas seltsam aus. Obwohl sie sich in die entsprechende Richtung bewegt, wenn der Winkel geändert wird, ist die Wellenform eher ablenkend.
GPT-5.5 Ultra, generiert von Codex
Bei Gemini 3.5 Flash scheint es bei der Generierung der Webseite ein Problem zu geben. Die Flasche wird immer hinter der Steuerkonsole versteckt und muss manuell herausgezogen werden. Mit demselben Hinweis liefert es jedoch tatsächlich viele anpassbare Elemente. Es bietet nicht nur verschiedene Flaschentypen, sondern auch die Möglichkeit, die Farbe der Flüssigkeit und verschiedene Einstellungen anzupassen.
Gemini 3.5 Flash, generiert auf der offiziellen Website, Canvas-Option ausgewählt
Das von Claude Opus 4.7 generierte Gefäß ist recht einfach gestaltet, und die simulierte Bewegung der Flüssigkeit sieht in starken Schwingungen eher wie das Pulsieren einer Schallwelle aus.
Claude Opus 4.7, generiert mit der Claude Code-Anwendung
Dann haben wir versucht, dass es ein kleines Spiel generiert. Obwohl die Spieltests bereits im vergangenen Jahr übliche Testprojekte bei Vibe Coding waren, haben wir diesmal die KI gebeten, ein 2048-Spiel mit sechseckigen Feldern zu erstellen. Der Hinweis lautete: "Erstelle ein spielbares 2048-Spiel, aber mit sechseckigen Feldern."
Die von Qwen3.7 Max generierte Seite sieht sehr gut aus. Man kann sehen, dass die meisten der 10 Referenzen aus CSDN-Tutorials zur Generierung von 2048-Spielen stammen.
Das endgültige Spiel ist spielbar, aber es gibt manchmal unvorhersehbare Situationen. Beispielsweise werden gleiche Zahlen in derselben Richtung manchmal nicht an der richtigen Position addiert.
Qwen3.7 Max, generiert auf der offiziellen Website
DeepSeek V4 hat ähnliche Ergebnisse wie im vorherigen Test geliefert. Allerdings werden für die Steuerung des sechseckigen Spielfelds nur die Tasten WASD angegeben.
DeepSeek V4, generiert auf der offiziellen Website
Claude Opus 4.7 hat in diesem Test am besten abgeschnitten. Es hat wirklich verstanden, wie das Spiel eingerichtet werden sollte. Die Bewegung der Felder entspricht den Regeln des Wabenmusters und lässt sich gut verstehen.
Claude Opus 4.7, generiert mit der Claude Code-Anwendung
Mit der Unterstützung von Codex kann GPT 5.5 nach der Generierung des Spiels automatisch den Browser öffnen, um zu überprüfen, ob es Probleme gibt, und die Konsoleninformationen nutzen, um den Projektcode zu reparieren. Die generierte Webseite ist auch sehr gut, aber bei der Überwachung der Mausbewegung auf dem Bildschirm ist es nicht so gut wie Opus 4.7.
GPT-5.5 Ultra, generiert von Codex
Gemini 3.5 Flash fügt wie immer viele zusätzliche Elemente hinzu. Für das Spielthema hat es drei Hintergrundstile, Cyber, Dunkelgold und Makaron, geschrieben und sogar einen "eingebauten High-End-Synthesizer" hinzugefügt.
Während des Spielens werden nativ von Web Audio generierte retro 8-Bit-Raumschiffe-Sounds (Vereinigung, Verschiebung, Levelabschluss, Tod) abgespielt, was das Spielerlebnis sofort auf eine neue Stufe hebt.
Gemini 3.5 Flash, generiert auf der offiziellen Website, Canvas-Option ausgewählt
Bei der Gestaltung einer normalen Webseite haben wir es gebeten, eine Website für ein U-Bahn-Museum zu erstellen. Der Hinweis war nur: "Entwerfe eine thematische Website namens U-Bahn-Museum, die eine hohe Immersionswirkung hat."
Wir hofften, dass die großen Modelle so viele Informationen wie möglich über U-Bahnen in verschiedenen Städten, Logos von Welt-U-Bahnen auflisten würden und dass der Stil der gesamten Website künstlerisch sein sollte, mit einem speziellen Stil und ausreichenden Effekten.
Ehrlich gesagt, ist es schwierig