Der vollautomatische Arbeitsablauf: Wunsch oder nur mentale Massage?

Das nationale Modell ist wirklich preiswert. Ich habe sechs Stunden damit verbracht und insgesamt dreizehn Yuan ausgegeben.

Was ist das verzweifelteste an der AI - Coding?

Wenn ich nur eine Stimme hätte, würde ich sie für ein Abbruch in der Mitte geben.

Nach einer halben Stunde Arbeit, nachdem ich gerade den Rahmen des Projekts aufgebaut habe, bricht es in der Mitte ab.

Zehn Detail - Bugs tauchen auf. Ich habe drei von ihnen behoben, und dann bricht es in der Mitte ab.

Nachdem ich über hundert Zeilen Code geschrieben und den Test noch nicht abgeschlossen habe, bricht es in der Mitte ab.

Angesichts dieser Halbfabrikate können die hilflosen Menschen nicht einmal den nächsten Prompt ausdenken. Sie können nur sagen: "Weiter, weiter. Was hast du geändert? Rückgängig machen, Rückgängig machen. Sprich mit uns in Chinesisch."

Die Frage ist nun, gibt es überhaupt eine Möglichkeit, die Menschen vollständig aus dem Arbeitsfluss der AI zu entfernen, damit sie von Anfang bis Ende alleine arbeitet und nicht mehr mich, der nicht einmal so schlau wie Doubao ist, quält?

Ja, Bruder, es gibt eine. Kürzlich hat Peter Steinberger, der Gründer von Xiaolongxia, ein neues Konzept namens "Loop Engineering" vorgeschlagen.

Einfach ausgedrückt, besteht dieses Ding darin, dass der Mensch im Voraus eine Anweisung für die AI schreibt, und danach muss er sich um nichts mehr kümmern. Die AI arbeitet dann in einer Schleife.

Nur dass diese Anweisung leicht mehrere Dutzend Seiten im PDF - Format umfasst und alle Arten von detaillierten Anforderungen für die praktische Arbeit der AI enthält. Sie ist wie die Plus - Ultra - Pro - Max - Version des Prompt - Engineerings.

Von der Code - Schreibung über den Test, die Bug - Suche, die Reparatur, den erneuten Test und die erneute Reparatur... Kurz gesagt, erst wenn die Endbedingungen erfüllt sind, wie "Alle Tests bestanden, Benchmark um xx% verbessert, 20 Schleifendurchläufe", kann die AI ihre Arbeit beenden.

Als ein neues AI - Jargon hat sich herausgestellt, dass die meisten Menschen Loop Engineering skeptisch gegenüberstehen.

Einige finden, dass es zwar einfach aussieht, aber in der Praxis unmöglich zu handhaben ist. Andere befürchten, dass die Token - Kosten so hoch werden, dass man nach einem Fehlversuch pleite ist. Wieder andere sagen, dass es nichts anderes ist als altes Wein in neuen Schläuchen, da diese Konzepte in der Softwareentwicklung schon lange existieren.

Aber das klingt vielleicht noch zu abstrakt. Deshalb habe ich ein einfaches Loop - Engineering - Projekt aufgebaut, um Ihnen den Experimentierprozess zu zeigen und zu überprüfen, ob es sich um eine neue Spielweise oder nur um Hype handelt.

Nach der gesamten Prozess - Erfahrung habe ich das Gefühl, dass die Idee, die Menschenhände durch Vollautomatisierung zu entlasten, gut ist, aber in der Praxis nicht so reibungslos funktioniert.

Unser Ziel in diesem Experiment ist es, mit Loop Engineering die AI dazu zu bringen, alle möglichen Methoden anzuwenden, um die Ausgabe des Stable Diffusion v1.5 - Modells zu optimieren, damit die generierten Bilder stabiler und schöner werden.

Vielleicht haben Sie von Stable Diffusion schon etwas gehört, aber nicht viel. Als Pionier unter den Bildgenerierungsmodellen war seine frühe Leistung im Vergleich zu GPT und Midjourney eher mangelhaft, sogar etwas gruselig.

Genau diese mangelhafte und instabile Leistung lässt aber viel Raum für Optimierung.

Selbst ohne Änderung des Basis - Modells kann Stable Diffusion durch die Änderung von Prompt - Wörtern, Modellparametern (Inferenzschritte, Scheduler, Seed usw.) und lokale Neuzeichnung bessere Bilder generieren.

Wie im folgenden Beispiel: Ein kleiner Anpassung der Prompt - Wörter ändert das Ergebnis komplett.

Wenn man Loop Engineering anwendet und die AI automatisch mehr Methoden und Fälle ausprobieren lässt, ist die Zukunft doch vielversprechender, oder?

Um die AI gut arbeiten zu lassen, habe ich sorgfältig den Open - Source - Programmier - Agenten OpenCode ausgewählt und ihn mit DeepSeek V4 Pro verbunden, damit sie den Code ändern können.

Für den Testteil haben wir ein Drittmodell eingeführt. Qwen 3.5 Plus bewertet die Qualität der generierten Bilder, um Fairness zu gewährleisten.

Als nächstes habe ich die AI - Anweisung geschrieben. Einige Dutzend Seiten Dokument und drei Runden Gespräche mit dem GPT - Lehrer waren kein Problem.

Einfach ausgedrückt, besteht der gesamte Prozess darin, dass DeepSeek das Modell ändert und Bilder generiert -> Qwen gibt eine Bewertung -> DeepSeek ändert das Modell weiterhin basierend auf der Bewertung.

Nachdem alles bereit war, habe ich den gesamten Prozess persönlich durchlaufen und mich sehr gut gefühlt. Dann habe ich mit Zuversicht den Startknopf gedrückt.

Aber die Realität war nicht so reibungslos wie erwartet...

Hier ist eines der Endresultate des Experiments. Bei denselben Prompt - Wörtern sieht das Ergebnis nach der Loop - Iteration sogar schlechter aus als vor der Iteration.

Während des wiederholten Anpassens des Experiments habe ich festgestellt, dass es bei Loop Engineering tatsächlich viele Fallstricke gibt.

Zunächst ist es wirklich schwierig, eine vernünftige Anweisung zu schreiben.

Die Informationsbandbreite, die ein Mensch verarbeiten kann, ist begrenzt. In einem mehrseitigen Anweisungsdokument kann es vorkommen, dass die Optimierungsmethoden nicht richtig festgelegt sind oder die Endbedingungen der Loop - Iteration nicht berücksichtigt werden.

Wenn ein Detail nicht richtig behandelt wird, kann es zu einer großen Verschwendung von Zeit und Token führen. Man prüft den Bericht nach Stunden der Loop - Iteration und stellt fest, dass es schon am Anfang falsch gelaufen ist.

Selbst wenn man die Anweisung wiederholt optimiert und das Experiment anpasst, kann man am Ende nur Zeit und Geld verschwenden.

Mein erstes Experiment dauerte eine Stunde, das zweite fünf Stunden. Die Ergebnisse waren mäßig und haben die erwartete Verbesserung der Bildqualität nicht erreicht.

Zweitens neigt Loop Engineering, wenn es keine Möglichkeit zur Zwischenanpassung gibt, dazu, immer weiter von der richtigen Richtung abzuweichen.

Das traditionelle Prompt - System zwischen Mensch und Maschine ist zwar umständlich, aber zumindest kann der Mensch die Runden beobachten. Wenn das Bild schlecht aussieht, kann man vermuten, dass ein Parameter nicht richtig eingestellt ist, und den Prompt ändern. Es geht darum, das Problem gezielt zu lösen.

Obwohl die Menschen bei der Code - Schreibung nicht mehr so gut sind wie die AI, haben sie in Bezug auf Erfahrung noch einen Vorteil.

Bei Loop Engineering ist es jedoch anders. Sein Kern besteht darin, die Regeln im Voraus festzulegen und die AI in diesen Regeln in einer Schleife arbeiten zu lassen.

Wenn also irgendwo in der Mitte etwas schief geht, zum Beispiel wenn das Bewertungsmodell nicht so schlau ist und "Das Bild ist nicht fein genug" als Hauptproblem ansieht, kann DeepSeek in jeder Iteration mehr Weichzeichner, Details und Farben hinzufügen. Am Ende kann das Ergebnis aber so aussehen, dass die Personen im Bild nicht mehr realistisch aussehen, und der Mensch hat keine Möglichkeit, die Fehler zu korrigieren.

Links der roten Linie ist das Beispielbild vor der Loop - Iteration, rechts ist das Beispielbild nach 20 Loop - Iterationen.

Schließlich ist Loop Engineering nicht für alle Arten von Projekten geeignet.

Nehmen wir ein einfaches Beispiel: Wenn es in unserem Experiment eine halbe Stunde dauert, ein Bild zu generieren, ist es offensichtlich nicht rentabel, mit Loop - Iterationen das Glück zu versuchen.

Im Allgemeinen eignet sich Loop Engineering nur für Aufgaben, bei denen das Testziel klar ist, die Iterationsprüfung schnell ist, die Fehlerkosten niedrig sind und der Kontext nicht zu komplex ist. Es ist sehr eingeschränkt.

Aber muss Loop Engineering, das von so vielen Experten gelobt wird, keine Vorteile haben?

Ich kann nur sagen, dass es wirklich toll ist, wenn man den Startknopf drückt.

Mit blindem Vertrauen alle Druck auf die AI zu werfen, ohne zu überwachen und ohne nachzudenken, und einfach auf das Ergebnis und den Bericht zu warten, das ist sicherlich der Traum jedes Entwicklers.

Aber dieses Ding ist zu unkontrollierbar. Wenn man unendlich viele Token und unbegrenzte Rechenleistung hat und mehrere Projekte gleichzeitig starten kann, dann hat man vielleicht die Chance, in kurzer Zeit ein gutes Ergebnis zu erzielen.

Für normale Menschen empfehle ich jedoch, nicht so leicht in diesen Token - Friedhof zu treten.

Quellen der Bilder und Informationen:

https://addyosmani.com/blog/loop-engineering/

https://learnprompting.org/docs/image_prompting/fix_deformed_generations?srsltid=AfmBOooFXWJ64UP3M67iHWe6cwOpuclQoV6JVZ1pNAHJbqUSLr66oTcA

Xiaohongshu, eigene Tests von Momo

Dieser Artikel stammt aus dem WeChat - Account "Chaping X.PIN", Autor: Momo Motiantian, Redakteure: Jiang Jiang & Mianxian. 36Kr hat die Veröffentlichung autorisiert.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Der vollautomatische Arbeitsablauf, den sich alle am meisten wünschen, ist möglicherweise nur eine mentale Massage