StartseiteArtikel

Schreiben Sie Code anhand von Bildern. Entwerfen Sie eine Website für nur 0,3 Yuan. Das neue AI-Coding-Modell von ByteDance ist wirklich unglaublich leistungsstark.

量子位2025-11-11 15:45
Nativ kompatibel mit Claude API, die niedrigste Aufrufgebühr in China.

Ein neuer Spitzenreiter im Programmier-Modellbereich ist aufgetaucht.

Heute hat die Volcengine ein neues Code-Modell namens Doubao-Seed-Code vorgestellt, das speziell für Agentic-Programmieraufgaben optimiert ist.

Es hebt sich in drei verschiedenen Aspekten hervor.

Erstens: Spitzenleistung (SOTA). In Kombination mit der TRAE-Entwicklungsumgebung kann es Probleme schneller und genauer lösen und hat die SWE-Bench Verified-Liste an der Spitze platziert.

Zweitens: Preis. Der Aufrufpreis ist der niedrigste in China. Die Volcengine bietet außerdem ein Paket für nur 9,9 Yuan an. Mit dem Preis einer Tasse Kaffee können Sie verschiedene Zeitvertreibsspiele programmieren, wie z. B. das Spiel "Versteck dich vor dem Chef im Büro" (doge).

Zuletzt: Migrationskosten. Doubao-Seed-Code ist von Haus aus kompatibel mit der Anthropic API. Wenn Sie es in die Claude Code-Umgebung migrieren, müssen Sie keine komplexen Einstellungen vornehmen. Die Migration erfolgt fast kostenlos.

Trotzdem müssen wir am Ende die praktischen Ergebnisse betrachten.

Lassen Sie uns es praktisch testen...

Praktischer Test von Doubao-Seed-Code

Wie gewohnt führen wir einen Coding-Test durch. Zunächst legen wir einige fortschrittliche Aufgaben fest, um die Fähigkeiten des Modells zu prüfen.

Zunächst die Grundfunktionen, dann die Interaktionsoptimierung, danach die Engineering-Umgestaltung und schließlich das Design einer vollständigen Website...

Logisch aufeinander aufbauend und in der Schwierigkeit von einfachen visuellen Umsetzungen bis hin zur Lösung komplexer Probleme, wird so die Gesamtsfähigkeit von Doubao-Seed-Code Schritt für Schritt getestet.

Im ersten Schritt konzentrieren wir uns auf einfache Aufgaben, um die Fähigkeit zur visuellen Umsetzung von Grundelementen zu prüfen.

Bitte erstellen Sie eine Animationssequenz mit einem Galaxie-Partikeleffekt. Anforderungen:

1) Verwenden Sie Canvas zur Darstellung des Partikelsystems. 2) Die Partikel sollen zufällig auf der Leinwand verteilt sein, um den Sternenhimmel zu simulieren. 3) Die Partikel sollen unterschiedliche Größen und Helligkeiten haben, um Sterne in unterschiedlicher Entfernung zu simulieren. 4) Fügen Sie eine Mausinteraktion hinzu, sodass die Partikel bei Bewegung der Maus leicht reagieren. 5) Verwenden Sie einen dunklen Farbverlauf als Hintergrund, um die Tiefe des Universums zu vermitteln. Bitte verwenden Sie HTML5 Canvas und JavaScript zur Umsetzung.

Diese Aufgabe hat eine einfache Kernanforderung ohne komplexe Interaktionen. Das Modell hat in etwas mehr als einer Minute vollständigen HTML5 Canvas + JS-Code erstellt. Nach Ausführung des Codes sind die Partikel zufällig verteilt, die Unterschiede in Größe und Helligkeit geben tatsächlich den Eindruck von Entfernung, und die leichte Reaktion auf die Mausbewegung funktioniert auch.

Das Ergebnis ist sehr gut. Das Modell kann einfache visuelle Aufgaben schnell erledigen, verwendet die richtige Technologie und hat keine Fehler in den Grundfunktionen.

Als nächstes überprüfen wir die Fähigkeit des Modells, "visuelles Design + komplexe Interaktionslogik" zu verstehen und zu optimieren.

Diesmal rufen wir die API in Claude Code auf. Ich muss sagen, die "nahtlose Integration" ist wirklich reibungslos. Die native Kompatibilität mit der API ist großartig!

Tatsächlich funktioniert Doubao-Seed-Code nicht nur in Claude Code, sondern auch in anderen gängigen intelligenten Programmierumgebungen wie Cursor, Cline und Codex CLI nahtlos mit den Tools, die Entwickler täglich verwenden.

Erstellen Sie eine vollständige HTML-Seite im Minecraft-Stil, die eine Reißverschlussform darstellt. Wenn ich die Maus nach oben und unten bewege, soll der Reißverschluss sich wie ein echter Reißverschluss öffnen und schließen. Die Öffnungs- und Schließgeschwindigkeit soll langsam sein. Anforderung: Verwenden Sie keine JavaScript-Frameworks oder -Bibliotheken, die die Anwendungsstruktur oder das Komponentenparadigma ändern (z. B. React, Vue, Angular). Sie können CDN-Verweise auf Drittanbieter-Bibliotheken verwenden, um die Anforderungen zu erfüllen, wie z. B. Three.js oder p5js. Das Endprodukt muss aus reinen HTML-, CSS- und JS-Dateien bestehen. Wenn Sie mehrere Dateien (HTML/CSS/JS) erstellen müssen, stellen Sie sicher, dass alle Dateiverweise relative Pfade verwenden.

Die Aufgabe besteht darin, eine interaktive Reißverschlussanimation im Minecraft-Stil zu entwickeln. Im Vergleich zum ersten Schritt wurde die Interaktionsanforderung "Öffnen und Schließen des Reißverschlusses durch Mausbewegung nach oben und unten (langsam)" hinzugefügt.

Das Modell hat nach der ersten Fertigstellung des Projekts sehr nett die Ausführungsleistung überprüft und einige Vorschläge zur Geschwindigkeitsanpassung gegeben.

Der Minecraft-Stil und die Reißverschlussform sind vorhanden, aber die Interaktionsweise sieht überhaupt nicht wie ein Reißverschluss aus...

Ist das ein Problem mit der Anweisung? Dann verbessern wir sie noch weiter:

Diese Interaktionsweise sieht nicht wie ein realer Reißverschluss aus.

Das Modell hat schnell das Problem erkannt und festgestellt, dass die Interaktionslogik nicht mit der realen Situation übereinstimmt.

Das Ergebnis nach der ersten Verbesserung ist wie folgt:

Obwohl es beim ersten Versuch nicht perfekt war, war die Anpassung effizient, und die Reaktion bei mehrfachen Interaktionen war auch ziemlich reibungslos.

Als nächstes überprüfen wir die Fähigkeit von Doubao-Seed-Code, Engineering-Probleme zu lösen. Wir geben ihm einen alten Code und lassen ihn die Fehler finden und das Projekt umgestalten.

Das Testmaterial ist ein Notizbuchprojekt mit mehreren Problemen.

(Dateien zur Verfügung gestellt) Finden Sie die Fehler in diesem Code und führen Sie eine strukturelle Umgestaltung durch.

Nachdem Doubao-Seed-Code die Aufgabe erhalten hat, hat es zunächst die Probleme im alten Code identifiziert und die Fehler auf bestimmte Codezeilen eingegrenzt.

Anschließend hat es umgestalteten Code erstellt und eine Optimierungsliste aufgeführt.

Ein Vergleich der beiden Codes zeigt, dass der alte Code auf der linken Seite in der Menüerstellungsmodulstruktur ungeordnet ist und keine getrennte Gestaltung hat. Der umgestaltete Code hat das Menü- und Dateibearbeitungsmodul getrennt und Tastenkombinationen zugewiesen.

Betrachten wir eine bestimmte Funktion, zum Beispiel das Modul zum Öffnen von Ordnern. Im alten Code auf der linken Seite gibt es Zeichencodierungsprobleme, und es wird keine Fehlerbehandlung für nicht vorhandene Dateien durchgeführt. Der neue Code hat diese Probleme behoben.

Man kann sehen, dass das Modell bei komplexen Engineering-Problemen wie "viele Fehler + ungeordnete Struktur" über die Fähigkeit zur systematischen Diagnose und professionellen Umgestaltung verfügt.

Das umgestaltete Notizbuch sieht so aus:

Abschließend entwickeln wir ein vollständiges Projekt, um die Fähigkeit des Modells, mehrere Anforderungen zu integrieren und umzusetzen, zu testen.

Entwickeln Sie für mich eine Führungswebsite für das Kaiserpalastmuseum. Es muss eine Einführung in die wichtigsten Paläste geben, begleitet von hochauflösenden Bildern der im Museum aufbewahrten Kunstwerke. Am wichtigsten ist, dass auf jeder Einführungseite eines Palastes ein Audioführungsbutton vorhanden sein muss. Beim Klicken auf diesen Button soll eine professionelle sprachliche Beschreibung abgespielt werden, die von KI generiert wurde.

Da keine Materialien im Voraus bereitgestellt wurden, hat das Modell im gelieferten Code einen Leitfaden zur Bildersetzung hinzugefügt, in dem ausführlich erklärt wird, wie man Materialien nach Bedarf sucht und Platzhalterbilder ersetzt. So wurde das Problem des fehlenden Materials gelöst.

Das Endresultat zeigt, dass die Website eine vollständige Struktur hat, alle Kernfunktionsmodule enthält, die Logik für den Audioführungsbutton reserviert ist und alle Funktionen implementiert sind.

Außerdem hat es das Problem der Materialien in der praktischen Nutzung berücksichtigt. Ich muss sagen, es ist sehr umfassend!

Warten Sie mal, da gibt es noch etwas Interessanteres. Doubao-Seed-Code kann sogar Code anhand von Bildern schreiben!

Aktuell können nur einige ausländische Modelle wie die Claude-Serie und GPT-4V Code anhand von UI-Entwürfen oder Screenshots generieren.

Wenn Doubao-Seed-Code dies kann, wäre es ein echtes Alleinstellungsmerkmal unter den chinesischen Programmier-Modellen.

Lasst uns es sofort