Von Chatting bis 24-Stunden-"Arbeit": Der Aufstieg eines erfahrenen KI

Finde Aufgaben, die für KI geeignet sind, und überlasse sie ihr. So kannst du dich auf das konzentrieren, was du wirklich gut kannst und was wichtig ist.

Das Übersetzungsbüro von Shen ist ein Übersetzungsteam unter dem Dach von 36Kr. Es konzentriert sich auf Bereiche wie Technologie, Geschäft, Arbeitsplatz und Lebensstil und stellt vor allem neue Technologien, neue Ansichten und neue Trends aus dem Ausland vor.

Herausgeberhinweis: Hör auf, AI nur als Dialogfeld zu betrachten. Die echte Effizienz liegt nicht darin, dass "du fragen kannst", sondern darin, dass die KI-Agenten für dich arbeiten, wenn du Feierabend hast. Dies ist eine paradigmatische Revolution im Arbeitsfluss. Dieser Artikel ist eine Übersetzung.

Meine Erfahrung ist, dass man bei der Einführung eines wirklich sinnvollen Tools zwangsläufig drei Phasen durchläuft: (1) Die Phase der Ineffizienz; (2) Die Phase der Mittelmäßigkeit; und schließlich (3) Die Phase der Entdeckung, in der das Arbeitsverfahren und das Leben verändert werden.

In den meisten Fällen muss ich mich zwingen, die erste und die zweite Phase zu überstehen, weil ich normalerweise bereits ein Arbeitsverfahren habe, das mir angenehm und zufriedenstellend ist. Die Einführung eines neuen Tools fühlt sich an wie eine Zunahme der Arbeitsbelastung, und ich möchte diese zusätzliche Energie nicht aufwenden. Aber um ein umfassender qualifizierter Entwickler zu werden, entscheide ich mich normalerweise dafür, durchzuhalten.

Das ist meine Reise, um den Wert von KI-Tools zu entdecken, und worauf ich mich jetzt konzentriere. In einer Welt voller Übertreibungen und Hypes hoffe ich, dass dieser Artikel eine detailliertere und rationalere Perspektive bietet und erklärt, wie meine Meinung über KI sich im Laufe der Zeit entwickelt hat.

Schritt 1: Verwerfe Chatbots

Hör sofort auf, versuchen, mit Chatbots (z. B. ChatGPT oder Gemini in der Webversion) echte Arbeit zu erledigen. Chatbots haben sicherlich ihren Wert und sind ein Teil meines täglichen KI-Arbeitsflusses, aber ihre Nützlichkeit bei der Programmierung ist sehr begrenzt. Denn in den meisten Fällen hoffst du einfach darauf, dass sie basierend auf ihrer vorherigen Ausbildung das richtige Ergebnis liefern. Und wenn sie fehlschlagen, musst du sie (d. h. du) manuell wiederholt darauf hinweisen, was falsch ist. Das ist äußerst ineffizient.

Ich denke, jeder hat seine erste KI-Erfahrung über eine Dialogoberfläche gemacht, und wenn man das erste Mal versucht, KI zur Programmierung zu nutzen, schreibt man wahrscheinlich einfach in ein Chatfenster und lässt es Code schreiben.

Als ich noch ein fester Skeptiker gegenüber KI war, war mein erster "Wow"-Moment, als ich ein Screenshot des Befehlspanels von Zed an Gemini schickte und es daraus mit SwiftUI eine Kopie erstellen ließ. Ich war überrascht, wie gut es das geschafft hat. Das Befehlspanel in der macOS-Version von Ghostty unterscheidet sich nur minimal von der Version, die Gemini in wenigen Sekunden für mich erstellt hat.

Aber als ich versuchte, diese Methode auf andere Aufgaben anzuwenden, war ich enttäuscht. Bei der Bearbeitung bestehender Projekte habe ich festgestellt, dass die Dialogoberfläche oft nicht zufriedenstellend funktioniert, und das ständige Kopieren und Einfügen von Code und Terminalausgaben zwischen den Oberflächen hat mich sehr frustriert. Offensichtlich ist es effizienter, es selbst zu tun.

Um den echten Wert zu entdecken, musst du "Agenten" (KI-Agenten) nutzen. Agenten sind ein gängiger Begriff in der Branche und bezeichnen große Sprachmodelle, die in der Lage sind, kontinuierlich zu kommunizieren und externe Aktionen aufzurufen. Ein Agent sollte mindestens die folgenden Fähigkeiten haben: Dateien lesen, Programme ausführen und HTTP-Anfragen stellen.

Schritt 2: Reproduziere deine eigene Arbeit

Im nächsten Schritt meines Lernprozesses habe ich Claude Code ausprobiert. Um es direkt zu sagen: Ich war zunächst nicht sehr beeindruckt. In der Praxis habe ich keine idealen Ergebnisse erzielt. Ich musste alles, was es generierte, nochmal bearbeiten, und das hat mehr Zeit gekostet als wenn ich es selbst geschrieben hätte. Ich habe Blogbeiträge gelesen und Videos geschaut, aber ich war immer noch nicht überzeugt.

Anstatt aufzugeben, habe ich mich gezwungen, alle meine manuellen Änderungen mit einem Agenten zu reproduzieren. Ich habe die Arbeit also zweimal gemacht. Zuerst habe ich die Arbeit manuell erledigt und dann den Agenten angewiesen, dasselbe Ergebnis zu erzielen (natürlich konnte der Agent meine fertige Lösung nicht sehen).

Dieser Prozess war sehr schmerzhaft, weil er die Arbeit verlangsamte. Aber ich habe genug Erfahrung in der Welt der nicht-KI-Tools, um zu wissen, dass diese Anlaufschwierigkeiten normal sind. Wenn ich nicht alles geben würde, um es auszuprobieren, könnte ich keine fundierten Schlüsse ziehen.

Aber so habe ich eine professionelle Intuition entwickelt. Ich habe schnell die Erfahrungen anderer mit ersten Prinzipien bestätigt, und das eigene Erleben hat mir ein tieferes Verständnis für die zugrunde liegenden Logiken gegeben.

Teile die Aufgabe in unabhängige, klare und ausführbare Teilaufgaben auf. Erwarte nicht, dass du in einem einzigen langen Dialog ein ganzes "Eulenbild" zeichnen kannst.
Bei unklaren Anforderungen teile die Arbeit in zwei unabhängige Schritte auf: "Planung" und "Durchführung".
Wenn du dem Agenten eine Möglichkeit gibst, seine Arbeit zu überprüfen, kann er normalerweise seine Fehler selbst beheben und Funktionsverluste vermeiden.

Im Allgemeinen habe ich herausgefunden, was Agenten in dieser Phase gut können und was nicht, und wie ich vorgehen muss, um die gewünschten Ergebnisse zu erzielen.

Dies hat meine Effizienz erheblich gesteigert, sodass ich langsam begann, Agenten automatisch zu nutzen und feststellte, dass sie fast so schnell waren wie ich selbst (aber ich habe sie immer noch nicht als schneller empfunden, weil ich die meiste Zeit auf den Agenten geschaut habe).

Hier ist eine Erfahrung, die ich nochmal betonen möchte: Ein Teil der Effizienzsteigerung kommt davon, zu wissen, wann man nicht einen Agenten einsetzen sollte. Die Verwendung eines Agenten für Dinge, bei denen er mit hoher Wahrscheinlichkeit scheitert, ist eine Zeitverschwendung. Die Fähigkeit, diese Fallstricke zu vermeiden, spart Zeit.

In dieser Phase habe ich festgestellt, dass der Wert der Agenten groß genug war, um sie in meinen Arbeitsfluss aufzunehmen, obwohl ich noch keine Nettoeffizienzsteigerung spürte. Aber es machte mir nichts aus. Ich war zufrieden mit der Leistung von KI als Werkzeug.

Schritt 3: Nutze Agenten "vor Feierabend"

Um die Effizienz weiter zu steigern, habe ich ein neues Modell eingeführt: Ich nehme am Ende des Tages 30 Minuten Zeit, um einen oder mehrere Agenten zu starten. Meine Annahme ist, dass ich Effizienz gewinne, wenn die Agenten in meiner Freizeit Fortschritte machen. Einfach ausgedrückt: Anstatt zu versuchen, in der vorhandenen Zeit mehr zu tun, versuche ich, in meiner Abwesenheit mehr zu tun.

Wie bei meinen vorherigen Versuchen war ich zunächst nicht erfolgreich und frustriert. Aber bald habe ich wieder einige sehr hilfreiche Arbeitsbereiche entdeckt:

Tiefgehende Recherche: Ich lasse den Agenten in einem bestimmten Bereich recherchieren, z. B. alle Bibliotheken finden, die ein bestimmtes Protokoll verwenden und in einer bestimmten Programmiersprache geschrieben sind, und für jede Bibliothek eine mehrseitige Zusammenfassung erstellen, die Vor- und Nachteile, Entwicklungsaktivität, Community-Bewertungen usw. enthält.
Parallele Exploration: Ich lasse verschiedene Agenten meine unklare Ideen ausprobieren, an denen ich noch nicht arbeiten konnte. Ich erwarte nicht, dass sie ein endgültiges Produkt entwickeln, aber vielleicht haben sie mir die nächsten Tag einige Wissenslücken aufgedeckt, wenn ich offiziell mit der Aufgabe beginne.
Sortierung und Prüfung von Issues und Pull Requests. Agenten sind sehr gut darin, gh (GitHub CLI) zu nutzen, also habe ich ein Skript geschrieben, um schnell eine Reihe von parallelen Aufgaben zur Sortierung von Issues zu starten. Ich lasse die Agenten nicht direkt antworten, ich möchte nur einen Bericht am nächsten Tag, um mich bei der Auswahl von hochwertigen oder wenig aufwändigen Aufgaben zu leiten.

Es sei angemerkt, dass ich die Agenten nicht wie einige andere Leute über Nacht laufen lasse. In den meisten Fällen können die Agenten ihre Aufgabe in halb einer Stunde erledigen. Aber in der zweiten Hälfte des Arbeitstages bin ich normalerweise müde und verliere schnell den Fokus, was meine Effizienz stark beeinträchtigt. Deshalb ist es für mich sinnvoll, meine Energie auf das Starten dieser Agenten zu verwenden, damit ich am nächsten Morgen schneller in die Arbeit einsteigen kann.

Ich bin zufrieden und fühle, dass ich etwas mehr tun kann als vor der Einführung von KI, auch wenn es nur ein bisschen ist.

Schritt 4: Vergib sichere Aufgaben an Agenten

An diesem Punkt bin ich mir sehr sicher, was KI gut kann und was nicht. Für bestimmte Aufgaben bin ich überzeugt, dass KI ein grob richtiges Ergebnis liefern kann. Also ist der nächste Schritt meiner Reise: Ich lasse die Agenten alle diese Aufgaben erledigen, während ich mich anderen Dingen widme.

Genauer gesagt nehme ich am Anfang des Arbeitstages die Ergebnisse der Sortierungsagenten aus der letzten Nacht, wähle manuell die Issues aus, die die Agenten fast sicher bewältigen können, und lasse sie im Hintergrund laufen (nacheinander, nicht parallel).

Währenddessen befasse ich mich mit anderen Dingen. Ich schaue nicht mehr Social Media an (zumindest nicht mehr als ohne KI) und schaue keine Videos. Ich bin immer noch in meinem normalen, vor der KI-Ära üblichen Denkmodus und bearbeite die Aufgaben, die ich gerne oder müssen mache.

Ein sehr wichtiger Punkt in dieser Phase ist: Schalte die Desktop-Benachrichtigungen der Agenten aus. Der Wechsel zwischen verschiedenen Kontexten ist sehr aufwändig. Um effizient zu bleiben, habe ich festgestellt, dass es meine Aufgabe als Mensch ist, zu bestimmen, wann ich die Agenten unterbreche, und nicht umgekehrt. Lass die Agenten dich nicht stören. Schau in deinen natürlichen Pausen kurz auf den Fortschritt und mache dann weiter.

Noch wichtiger ist, dass ich denke, dass diese Strategie, "sich anderen Dingen zu widmen", die negativen Auswirkungen der weit verbreiteten Studie von Anthropic über die Bildung von Fertigkeiten ausgleichen kann. Es ist eine Art Kompromiss: Wenn du Aufgaben an Agenten vergibst, musst du die dazugehörigen Fertigkeiten nicht selbst trainieren, aber für die Aufgaben, die du weiterhin manuell erledigst, wirst du natürlich deine Fertigkeiten verbessern.

An diesem Punkt bin ich fest in die Phase "nie wieder zurück" gekommen. Ich fühle mich effizienter, aber auch wenn nicht, gefällt mir am besten, dass ich jetzt meine Programmier- und Denkarbeit auf die Aufgaben konzentrieren kann, die ich wirklich liebe, und dennoch die lästigen Aufgaben, die ich nicht mag, anständig erledigen kann.

Schritt 5: Baue ein Unterstützungsystem auf

Es ist offensichtlich, dass die Effizienz viel höher ist, wenn der Agent das richtige Ergebnis direkt erzeugt oder nur minimal manuell bearbeitet werden muss. Der sicherste Weg, dies zu erreichen, ist es, dem Agenten schnelle und hochwertige Tools zur Verfügung zu stellen, die ihm automatisch mitteilen, wenn er einen Fehler macht.

Ich weiß nicht, ob es in der Branche einen allgemein akzeptierten Begriff dafür gibt, aber ich nenne es gerne "Harness Engineering". Das Kernkonzept ist, dass du, wenn du feststellst, dass der Agent einen Fehler macht, Zeit investierst, um das Problem mit technischen Mitteln zu lösen, sodass der Agent diesen Fehler in Zukunft nicht mehr macht. Ich habe keine Absicht, neue Begriffe zu erfinden. Wenn es einen bestehenden Begriff gibt, würde ich ihn gerne verwenden.

Dies zeigt sich hauptsächlich in zwei Formen:

Bessere implizite Anweisungen (AGENTS.md): Bei einfachen Problemen, wie dem wiederholten Ausführen falscher Befehle oder der Suche nach falschen APIs, kannst du AGENTS.md (oder ähnliche Dateien) aktualisieren. Hier ist ein Beispiel aus Ghostty. Jede Zeile in dieser Datei basiert auf den vorherigen Fehlern des Agenten und hat fast alle ähnlichen Probleme gelöst.
Echte Programmiertools: Zum Beispiel Skripte zum Screenshot erstellen oder zum Ausführen von gefilterten Testsets. Dies erfordert normalerweise auch Änderungen an AGENTS.md, damit der Agent weiß, dass diese Tools existieren.

Das ist mein gegenwärtiger Stand. Wenn ich sehe, dass der Agent etwas falsch macht, investiere ich Zeit, um zu verhindern, dass er es wiederholt. Oder umgekehrt, ich versuche alles, um sicherzustellen, dass der Agent selbst überprüfen kann, ob er im Großen und Ganzen richtig liegt.

Schritt 6: Lasse immer einen Agenten laufen

Während ich Schritt 5 umsetze, arbeite ich auch an einem Ziel: Ich möchte, dass ein Agent immer läuft. Wenn kein Agent aktuell arbeitet, frage ich mich: "Gibt es etwas, das ein Agent für mich tun kann?"

Ich mag es besonders, dieses Modell mit langsamen, tiefgründigen Modellen wie dem Deep-Modus von Amp (im Wesentlichen GPT-5.2-Codex) zu kombinieren. Diese Modelle können einige kleine Änderungen möglicherweise erst nach 30 Minuten oder länger fertigstellen. Aber das Gute ist, dass die Ergebnisse normalerweise sehr gut sind.

Ich laufe derzeit keine (oder zumindest habe ich keine Absicht, mehrere) Agenten gleichzeitig. Ich denke, dass es für mich ein guter Kompromiss ist, einen Agenten laufen zu lassen. So kann ich die Freude am tiefgreifenden manuellen Arbeiten genießen und gleichzeitig meinen etwas klobigen, aber unglaublich effizienten Roboterfreund im Auge behalten.

"Lasse immer einen Agenten laufen" ist derzeit noch ein Ziel, das ich anstrebe. Ich muss sagen, dass ich derzeit nur in 10 % bis 20 % meiner Arbeitszeit einen Agenten im Hintergrund laufen lassen kann. Aber ich versuche aktiv, diesen Anteil zu erhöhen.

Ich will nicht einfach nur Agenten laufen lassen. Ich will sie nur starten, wenn es wirklich Aufgaben gibt, bei denen sie mir helfen können. Eine Herausforderung bei diesem Ziel besteht darin, mein eigenes Arbeitsverfahren und meine Tools zu verbessern, damit ich hochwertige Aufgabenströme für die Agenten erstellen kann. Dies ist eigentlich auch wichtig, wenn es keine KI gibt!

Aktueller Stand

Das ist mein heutiger Stand.

Durch diese Reise bin ich persönlich beim Einsatz moderner KI-Tools erfolgreich geworden. Ich glaube, dass ich es aus einer realistischen und angemessenen Perspektive betrachte. Es ist mir eigentlich egal, ob KI immer beliebt bleiben wird. Ich bin einfach ein Softwarekünstler, der aus Liebe zum Handwerk Dinge erschaffen möchte.

Die Branche entwickelt sich rasant, und ich bin sicher, dass ich in Zukunft diesen Artikel lesen werde und mich über meine damalige Naivität lachen werde. Aber wie die Leute sagen: Wenn du dich nicht vor deinem früheren Selbst schämen kannst, hast du vielleicht nicht weiterentwickelt. Ich hoffe nur, dass ich in die richtige Richtung entwickle!

Ich habe keine finanziellen Interessen in diesem Bereich. Natürlich gibt es neben der Praktikabilität auch andere Gründe, warum man KI meiden kann. Ich respektiere voll und ganz die

本文来自翻译, 如若转载请注明出处。