Nachdem ich in nur zwei Stunden 400 Tokens verbraucht habe, verstehe ich endlich, wie leistungsstark Claude Fable 5 ist
Nach der Veröffentlichung von Claude Fable 5 am 10. Juni hat Zhiwei auf Twitter zahlreiche Beispiele verfolgt. Am eindrucksvollsten waren ihm nicht die UI-Designs und physikalischen Simulationen, noch der Code-Transfer von 50 Millionen Codezeilen innerhalb eines Tages (das liegt ja außerhalb der individuellen Kognition). Stattdessen war er von einem scheinbar einfachen Beispiel fasziniert.
Quelle: https://x.com/ProperPrompter/status/2064405487492452856
Anweisung:
Verwenden Sie SVG, um Pixelkunst zu simulieren und eine hübsche und detaillierte Szene mit niedlichen Tieren zu erstellen. Die Größe jedes "Pixels" sollte gleich sein.
Obwohl es bereits zahlreiche Versuche gab, Großmodelle dazu zu bringen, mit SVG zu zeichnen, war es für Zhiwei das erste Mal, dass er das Zeichnen von KI so natürlich und harmonisch empfand. Egal, ob es um die Gestalt der Tiere, die Atmosphäre der Umgebung oder die Farbkombination geht, es gibt den Eindruck, dass Claude Fable 5 beim Zeichnen mit den Augen zuschaut.
Nachdem ich das folgende Beispiel gesehen habe und Claude Fable 5 auch schnell "Pokémon: Feuerrot" durchgespielt hat, habe ich noch stärkere Vorstellungen davon, dass Claude Fable 5 möglicherweise über eine 3D-visuelle Denkweise oder "räumliche Intelligenz" verfügt.
Deshalb plane ich in dieser Testphase, die Fähigkeit von Claude Fable 5, visuelle Konzepte mit Code zu erstellen, besonders zu testen. (Ganz im Rahmen von Claude Code getestet)
Obwohl die Internetnutzer scheinbar eher daran interessiert sind, dass Claude Fable 5 direkt "Minecraft" aufbaut, besteht der Großteil der Komponenten darin, gewöhnliche Geländeelemente zu sein. Um die visuelle Denkweise des Modells zu bestätigen, muss man es dazu bringen, einige ungewöhnliche Konzepte und Eigenschaften umzusetzen, wie z.B. Figuren mit IP-Eigenschaften, sekundäre Kombinationsinnovationen, die sofortige Verständnis von Originaldesigns usw.
Vor dem offiziellen Beginn möchte ich noch ein relativ komplexes Beispiel verwenden, um die grundlegende Programmierfähigkeit von Claude Fable 5 zu testen.
In einem 3D-Engine-Beispiel, das auch andere Modelle wie Gemini 3 Pro herausgefordert hat, hat Claude Fable 5 bisher die beste Leistung gezeigt. Abgesehen davon, dass die Anforderungen vollständig umgesetzt wurden und keine Bugs vorhanden sind, ist es die einzige KI, die die linke Vorlagenbibliothek nicht vergisst.
Dies ist nur das Vorspeise. Immerhin kann auch die Webversion von Claude Sonnet 4.6 (mit geringem Aufwand) dieses Beispiel grundsätzlich lösen.
Als nächstes wird die visuelle Verständnis- und Aufbaufähigkeit von Claude Fable 5 auf die Probe gestellt.
Ich habe Claude Fable 5 gebeten, direkt mit der gerade erstellten 3D-Engine ein 3D-Modell von Doraemon zu erstellen, und das Ergebnis war perfekt.
Als nächstes habe ich ihm noch Chopper zu erstellen gegeben, und das Ergebnis war auch sehr überraschend und hatte nur wenige Mängel.
Als nächstes habe ich ihm noch Luffy zu erstellen gegeben und ihn hinter den anderen platzieren lassen. Ich habe auch betont, dass es sich um die 3. Stufe von Luffy handelt. Claude Fable 5 hat gut verstanden, wie die riesigen Arme von Luffy in diesem Zustand aussehen.
Schließlich habe ich Claude Fable 5 gebeten, die Piratenschiff "Going Merry" von Luffy zu zeichnen und die drei darauf stehen zu lassen, um die Szene noch reichhaltiger zu gestalten.
Das Ergebnis war nicht so gut. Das so große Piratenschiff wurde von Claude Fable 5 zu einem kleinen Boot gezeichnet, das nur in einem Sehenswürdigkeitsteich verwendet werden kann. Aber das Modell hat versucht, das Schafskopfzeichen an der Bugspitze und die Piratenflagge zu reproduzieren, was schon sehr detailliert ist.
Nach diesen Tests hat Claude Code 43% des 5-Stunden-Kontingents verbraucht und Token im Wert von 7,29 US-Dollar verbraucht. Die Kosten sind wirklich hoch. Wenn man es richtig genießen möchte, dürfte das Pro-Abo nicht ausreichen.
Das "Kollaps" der "Going Merry" könnte daran liegen, dass der Arbeitsraum zu klein war, so dass Claude Fable 5 schwierig war, seine Fähigkeiten zu entfalten.
Als nächstes brechen wir die Beschränkungen des Engine-Frameworks auf und beginnen, komplexere Objekte zu erstellen. Wir lassen Claude Fable 5 direkt mit Three.js ein "Minecraft"-ähnliches Königreich Eldia zu erstellen, das heißt eine Burg, die in "Attack on Titan" von drei kreisförmigen Mauern umrahmt wird.
Anweisung:
Sie werden mit Three.js ein First-Person-Voxel-Sandbox-Prototyp (ähnlich wie Minecraft) erstellen. Sie können das Projekt frei organisieren und Abhängigkeiten und Nachbearbeitung einführen.
Ziel: Ein interaktives Voxel-World um das "Dreifache Schloss von Königreich Eldia" aus "Attack on Titan" zu erstellen.
Kernszene: Das Dreifache Schloss von Eldia. Der Kern der Welt ist ein riesiges "Königsschloss im Stil von Paradis Island", das aus drei Mauern besteht: Maria, Rose und Sina.
Kern-Erlebnis: Der Spieler startet über der äußersten Mauer (Maria). Er kann entlang der Mauer umlaufen, von der Mauer auf den Boden springen und vom Boden auf die Mauer klettern. Die Welt ist ein programmgesteuert generiertes Voxel-Gelände mit Dörfern, Burgen, Flüssen, Ebenen und Wäldern.
Das Spielgefühl entspricht im Wesentlichen dem klassischen "Minecraft": Drittperson, WASD + Maus, linke Maustaste zum Zerstören, rechte Maustaste zum Platzieren, mit Inventar. Die restlichen Details können Sie gestalten. Beim ersten Blick soll man von den Mauern und der Abendsonne beeindruckt werden.
Wenn die Umsetzung erfolgreich ist, sollte gelten:
Der Spieler sollte die dreifache Mauerstruktur deutlich erkennen können;
Er kann zwischen den verschiedenen Ebenen bewegen (Treppen/Seile/Boden);
Die erste Ebene ist komplex, die zweite ist ordentlich, die dritte ist beeindruckend;
Er kann frei Blöcke zerstören/platzieren;
Die Burgstruktur sollte visuell "lesbar" sein (man kann sofort die dreistufige Machtstruktur erkennen).
Die Anweisung ist nicht besonders kompliziert. Der Schwerpunkt liegt auf der Betonung der Ziele und der Prüfkriterien, nicht auf dem Prozess.
Während der Ausführung ruft Claude Fable 5 mehrmals Chrome CLI headless auf, um Screenshots zu machen und die aktuelle Umsetzung zu testen. Es scheint wirklich so, als würde es "zeichnen, beobachten, testen und denken" gleichzeitig.
Das Erstellen von Screenshots mit Chrome CLI headless kann möglicherweise Probleme mit den Mac-Berechtigungen auslösen, so dass der Fortschritt blockiert wird. Nach dem Rat von ChatGPT habe ich das ursprüngliche Verfahren in das Playwright-Verfahren umgewandelt (Playwright ist eine Open-Source-Bibliothek für Browser-Tests und Web-Scraping), und das Projekt wurde erfolgreich abgeschlossen.
Schauen wir uns das Ergebnis an:
Auf den ersten Blick ist es sehr beeindruckend. Ein einziger Bildausschnitt kann die visuelle Wirkung der drei riesigen Mauern unter der Abendsonne direkt vor Augen führen. Die vertikalen Streifen auf den Mauern entsprechen genau den Merkmalen des Originals. Man kann sogar feststellen, dass der Hauptcharakter, der Soldat, sicherlich aus dem Aufklärungskorps ist, weil er einen grünen Umhang trägt.
Natürlich ist die Komplexität dieses Ergebnisses noch weit hinter den menschlichen "Minecraft"-Werken zurück. Zum Beispiel das untenstehende Werk, das von John Papadopoulos, dem Gründer und Chefredakteur von DSOGaming, geschaffen wurde.
Es ist zu beachten, dass Claude Fable 5 nur den makroskopischen Rahmen des Königreichs Eldia erstellt hat. Die Dörfer und Wälder auf der Ebene sind zu ungeordnet und willkürlich. Das Kernstück, die Stadt im Zitadellengelände (die Stadtstruktur in der obigen Abbildung), fehlt fast vollständig. Der Abstand zwischen den Mauern ist zu eng, und es fehlt jegliche "epische" Atmosphäre.
Andererseits ist es aber auch so, dass das von Claude Fable 5 erstellte Werk wenigstens nicht mit irgendeinem relevanten Werk in meinen Suchergebnissen übereinstimmt. Deshalb ist es derzeit wahrscheinlicher, dass es auf der eigenen Grundlage und nicht auf der Grundlage von Trainingsdaten erstellt wurde.
Als nächstes wird die Schwierigkeit erhöht, indem die oben genannten Mängel behoben werden.
Zuerst wird die makroskopische Größe angepasst.
Anweisung:
Bitte passen Sie die Größe an. Das Verhältnis von Menschengröße zu Mauerhöhe soll 1:50 sein, und das Verhältnis von Mauerhöhe zu Abstand zwischen benachbarten Mauern soll 1:20 sein. An jedem Tor gibt es noch eine halbkreisförmige Zitadellmauer, die etwas nach außen ragt.
Nach der Analyse der Anforderungen hat Claude Fable 5 festgestellt, dass ein zu großer Abstand zwischen den Mauern es unmöglich macht, alle drei Mauern in einem Bildausschnitt zu sehen. Außerdem muss es in ein fließendes Generierungsverfahren umgeschrieben werden. Später wird erklärt, dass dies aus Gründen der visuellen Rendering-Effizienz erforderlich ist. Es hat mir sogar drei völlig verschiedene Optionen angeboten: entweder den aktuellen Abstand beibehalten, einen extrem großen Abstand zu realisieren oder eine Kompromisslösung zu wählen.
Da es bei dem ursprünglich vorgeschlagenen extrem großen Abstand unmöglich ist, alle Mauern in einem Bildausschnitt zu sehen, was die visuelle Atmosphäre stark beeinträchtigt, und die Fußmarschzeit von einer Mauer zur anderen zu lang ist, habe ich schließlich die Kompromisslösung gewählt.
Die Kompromisslösung ist auch gut. Man kann alle drei Mauern auf einen Blick sehen.