StartseiteArtikel

Die Programmier-„Magie“ des AI-Gurus Karpathy: Offenlegung einer vierstufigen Toolkette, mit Cursor als Hauptwerkzeug und GPT-5 als Sicherung

智东西2025-08-25 20:40
Hier ist der neueste Programmierleitfaden für große Sprachmodelle!

Nachrichten von Zhidongxi vom 25. August. Heute hat der ehemalige Leiter der KI bei Tesla und Mitbegründer von OpenAI, Andrej Karpathy, seine geheimen Tipps für die KI-unterstützte Programmierung preisgegeben.

▲ Ausschnitte aus einigen Tweets von Andrej Karpathy

Seine KI-unterstützte Programmierung konzentriert sich nicht auf ein einzelnes Tool, sondern "beschäftigt" mehrere Tools, die je nach Bedarf eingesetzt werden.

Zusammengefasst lässt sich Karpathys Vorgehen bei der KI-unterstützten Programmierung in 4 Phasen einteilen. Zu 75 % nutzt er die Autovervollständigungsfunktion des Cursor-Editors. Danach verwendet er Large Language Models, um bestimmte Codeabschnitte zu ändern. In der dritten Phase setzt er unabhängige KI-Programmiertools wie Claude Code und Codex ein, um größere Funktionsmodule zu realisieren. Schließlich nutzt er GPT-5 Pro, um die schwierigsten Probleme zu lösen. Er bezeichnet GPT-5 Pro als die "letzte Verteidigungslinie".

▲ Flussdiagramm von Andrej Karpathys KI-unterstützter Programmierung

Der Grund dafür ist, dass Entwickler derzeit nicht mit einem einzigen Programmiertool alle Entwicklungsanforderungen erfüllen können, und jedes Tool hat seine eigenen Stärken und Schwächen. Beispielsweise ist der Cursor-Editor gut in der Autovervollständigung von Code, erfordert aber häufiges Neustarten. Unabhängige KI-Programmiertools können für Inhalte programmieren, die der Entwickler nicht kennt, erfordern aber regelmäßiges Codebereinigen, Anpassen des Code-Stils und Bearbeiten der "Codeästhetik". GPT-5 Pro kann die schwierigsten Probleme lösen und kann in 10 Minuten versteckte Bugs finden, die weder der Mensch, noch der Cursor-Editor, noch Claude Code finden können.

Aus Karpathys geteiltem KI-Programmier-Workflow geht hervor, dass die derzeitigen KI-Programmiertools Vor- und Nachteile haben, und Entwickler kombinieren diese Tools, um eine effiziente unterstützende Programmierung zu erreichen.

01. Cursor ist das Haupttool, unabhängige KI-Programmiertools unterstützen, GPT-5 Pro löst die schwierigsten Probleme

Der genaue Arbeitsablauf, den Karpathy in seinen Tweets erwähnt, lautet wie folgt:

In seinem Prozess der Large Language Model-unterstützten Programmierung wird 75 % der Zeit für die Autovervollständigungsfunktion des Cursor-Editors genutzt, die durch die Tab-Taste ausgelöst wird.

Der Grund dafür ist, dass Karpathy festgestellt hat, dass das Schreiben konkreter Codeausschnitte oder Kommentare an der richtigen Stelle im Code eine effiziente Methode ist, um die "Aufgabenanforderungen" an das Large Language Model zu übermitteln. Das heißt, der Schlüssel liegt in der genauen Übertragung der Aufgaben Details. Wenn er die gewünschte Wirkung mit Worten beschreibt, erfordert dies nicht nur viel Text, sondern führt auch zu deutlichen Verzögerungen. Indem er die Anforderungen direkt im Code an der richtigen Stelle zeigt, ist es viel schneller.

Manchmal muss er diese Autovervollständigungsfunktion jedoch häufiger einschalten und ausschalten, damit sie gut funktioniert.

▲ Beschreibung in Karpathys Tweet über die Verwendung des Cursor-Editors

Die zweite Verwendungsmethode ist: Karpathy wählt einen bestimmten Codeausschnitt aus und fordert das Large Language Model auf, ihn zu ändern.

▲ Beschreibung in Karpathys Tweet über die Verwendung des Large Language Models zum Ändern von Code

Die dritte Verwendungsmethode ist, dass er außerhalb des Cursor-Editors unabhängige KI-Programmiertools wie Claude Code und Codex ausführt. Dies geschieht normalerweise, wenn er größere Funktionsmodule realisieren muss und die Anforderungen mit Prompt-Wörtern leicht zu beschreiben sind.

Was die Bewertung dieser Tools angeht, sagt Karpathy, dass diese Tools ihm wirklich geholfen haben, aber die Gesamterfahrung war gemischt, und manchmal waren sie sogar etwas nervig. Er verwendet nicht den "Modus ohne Schritt-für-Schritt-Bestätigung" (YOLO mode), weil diese Tools leicht abweichen und redundant Inhalte schreiben können, die er überhaupt nicht will und braucht. Deshalb muss er oft die ESC-Taste drücken, um die Generierung zu unterbrechen.

Karpathy meckert, dass er noch nicht gelernt hat, mehrere Tools gleichzeitig zu nutzen, um die Effizienz zu steigern, denn es reicht schon, ein Tool gut zu nutzen.

Probleme umfassen die Schwierigkeit, die CLAUDE.md-Dokumentation effizient zu pflegen und zu aktualisieren. Er muss oft Zeit für "Codebereinigung", Anpassen des Code-Stils oder Bearbeiten von Problemen im Zusammenhang mit der "Codeästhetik" aufwenden.

Beispielsweise sind diese KI-Tools beim Schreiben von Code zu defensiv und missbrauchen try/catch-Anweisungen. Sie komplizieren die abstrakte Logik, schreiben übermäßig langen und redundant Code. Viele Probleme, die mit einer Listen-Abstraktion oder einer einfachen if-else-Anweisung gelöst werden können, werden stattdessen mit verschachtelten if-else-Strukturen geschrieben. Sie schreiben auch mehrere ähnliche Codeabschnitte wiederholt, anstatt sie in eine einfache Hilfsfunktion zu kapseln.

Dies beweist, dass KI-Tools kein Konzept von "Codeästhetik" haben.

Karpathy erwähnt jedoch, dass diese Tools in bestimmten Situationen unverzichtbar sind. Beispielsweise, wenn er "Vibe Coding" (Stimmungsprogrammierung) betreibt und sich nicht gut mit dem relevanten Bereich auskennt. Er erwähnt, dass diese KI-Programmiertools sehr nützlich sind, wenn er kürzlich Rust-Code geschrieben, SQL-Befehle ausgeführt oder andere Inhalte bearbeitet hat, mit denen er normalerweise wenig zu tun hat.

Er hat auch versucht, Claude Code anzuweisen, ihn während des Schreibens von Code zu unterrichten, aber das Tool will nur Code schreiben und ist nicht bereit, Zeit für Erklärungen zu verwenden. Er hat auch versucht, Claude Code um die Hyperparameter-Optimierung zu bitten, das Ergebnis war interessant, aber nicht gut.

Karpathy erwähnt auch einige Situationen, in denen die Rolle dieser Tools sehr wichtig ist, wie die Erstellung von risikolosen, einmaligen benutzerdefinierten Visualisierungsdiagrammen, kleinen Tools oder Debugging von Code. Diese Tools können sehr zeitaufwändig sein. Er gibt ein Beispiel: Um einen bestimmten Bug zu finden, kann Claude Code schnell 1000 Zeilen speziellen Visualisierungs- oder Debugging-Code schreiben, und nach dem Finden des Bugs kann dieser Code gelöscht werden.

Er meint, dass wir in einer Zeit des Code-Überflusses leben, und Entwickler können tausende von Zeilen hochgradig maßgeschneiderten, einmaligen Code schreiben. Code ist nicht mehr so kostspielig und wertvoll wie früher.

▲ Beschreibung in Karpathys Tweet über die Verwendung unabhängiger KI-Programmiertools

Die letzte Verteidigungslinie ist GPT-5 Pro. Karpathy sagt, dass er es verwendet, wenn er die schwierigsten Probleme hat.

Er erwähnt, dass es oft vorkommt, dass weder er selbst, noch der Cursor-Editor, noch Claude Code einen Bug finden können, aber GPT-5 Pro kann in 10 Minuten versteckte Bugs finden. Karpathy glaubt, dass GPT-5 Pro sehr leistungsfähig ist und auch seltene Dokumentationen und akademische Artikel recherchieren kann.

Für andere komplexere Aufgaben, wie das Optimieren der abstrakten Logik von Code, sagt Karpathy, dass die Ergebnisse gemischt sind. Manchmal hat es gute Ideen, aber nicht alle Vorschläge sind nützlich. Oder wenn er es bittet, eine umfassende Literaturrecherche über "die Implementierungsmethode einer bestimmten Technologie" durchzuführen, gibt es sehr relevante Referenzen und Informationsquellen.

Insgesamt glaubt Karpathy, dass mit der Unterstützung vieler Tools mit,Vor- und Nachteilen die Möglichkeiten im Bereich der Programmierung vollkommen geöffnet sind. Dies kann jedoch auch zu einer gewissen Angst führen, dass man nicht auf dem neuesten Stand der Branche bleibt. Deshalb hatte er am vergangenen Sonntag im Bad plötzlich viele Ideen, und er ist auch sehr neugierig, was andere in der Praxis entdecken.

▲ Beschreibung in Karpathys Tweet über die Verwendung von GPT-5 Pro

02. Entwickler kombinieren Programmiertools, die Kommentarsektion gibt Karpathy Vorschläge

Viele Netizens in der Kommentarsektion stimmen Karpathys Arbeitsablauf zu. Sie erwähnen, dass die Tools teilweise unterschiedlich sein können, aber im Allgemeinen wählen sie die Strategie, verschiedene KI-Arbeitsunterstützungstools zu kombinieren.

In der Kommentarsektion geben viele Netizens Vorschläge für die Probleme, die Karpathy hat. Beispielsweise können sie einen Agenten für Context Engineer erstellen, um Entwicklern bei der Aktualisierung von Claude.md zu helfen. Um zu vermeiden, dass Claude Code ständig abweicht, können sie es auffordern, eine detaillierte aber einfache Problemzusammenfassung bereitzustellen und es an Grok zu geben. Oder sie können versuchen, Befehle per Sprachtranskription zu geben.

03. Schlussfolgerung: Entwickler kombinieren Tools, um effiziente unterstützende Programmierung zu erreichen

Immer mehr Entwickler nutzen KI-Tools, um effizienter und bequemer Code zu schreiben. Spezifische Anwendungsfälle umfassen die Autovervollständigung von Codezeilen, die Behebung von Codefehlern und das Testen von Code.

In der praktischen Erfahrung haben KI-Programmiertools jedoch Probleme wie falsch geschriebenen Code und redundanten Code. Aus Karpathys geteiltem KI-unterstützten Programmierablauf und der Interaktion der Netizens in der Kommentarsektion geht hervor, dass in der Anfangsphase der Entwicklung von KI-Programmiertools, wenn es nicht möglich ist, alle Benutzeranforderungen mit einem einzigen Tool zu erfüllen, Entwickler verschiedene Tools kombinieren, um die Stärken in verschiedenen Programmierphasen zu nutzen und eine effiziente und genaue unterstützende Programmierung zu erreichen.

Dieser Artikel stammt aus dem offiziellen WeChat-Account „Zhidongxi“ (ID: zhidxcom), Autor: Cheng Qian. 36Kr hat die Veröffentlichung mit Genehmigung erhalten.