AI-Experte Andrej Karpathy: Spielen mit Krebse führte zu "AI-Psychose", Unruhe bei ungenutzten Tokens

Kapasi spricht über die Tricks des Garnelenzucht, Programmierung mit KI und die großen Probleme von OpenAI.

Zhi Dongxi berichtete am 23. März, dass im Podcast, der am vergangenen Samstag veröffentlicht wurde, Andrej Karpathy, Mitbegründer von OpenAI und KI - Experte, seine Erfahrungen und Methoden in der KI - Programmierung und der OpenClaw - Welle systematisch zusammenfasste. Er meinte lachend, dass er aufgrund der raschen Entwicklung im Bereich der Künstlichen Intelligenz wie in einem Zustand der "geistigen Verwirrung" sei und zwischen verschiedenen neuen Dingen herumgerannt fühle. Er stellte auch fest, dass die Engpässe bei den gegenwärtigen KI - Programmieragenten nicht nur in der Modellfähigkeit lagen: "Wenn ein Agent nicht gut funktioniert, liegt es meist an den fehlenden Fähigkeiten."

"Ich habe in letzter Zeit fast kein einziges Codezeile mehr selbst geschrieben." Aus Karpathys Sicht wurde der Arbeitsablauf in der Softwareentwicklung in nur wenigen Monaten von den Agenten vollständig verändert. Jetzt schreibt nicht mehr der Mensch den Code, sondern der Mensch nutzt natürliche Sprache, um eine Gruppe von Agenten anzuweisen, systemweite Aufgaben zu erledigen. Früher schrieb er 80 % des Codes selbst, heute werden 80 % oder sogar mehr von den Agenten erledigt.

Außer der Verwendung von Agenten in der Programmierung hat die Explosion von OpenClaw auch Karpathys Leben verändert. Er hat einen OpenClaw namens "Dobby" entwickelt, der direkt die Haushaltsführung übernimmt. Er scannt automatisch und verbindet Lautsprecher, Beleuchtung, Sicherheitssysteme und andere Geräte, sucht selbst nach APIs, erstellt Steuerungsebenen und kann auch eine Warnung senden, wenn ein Fremder in die Nähe kommt.

Diese Erfahrung hat Karpathy zu der Einschätzung geführt: Viele Apps sollten APIs sein, die von Agenten aufgerufen werden können. Agenten sind die Bindeglieder. Was OpenClaw besonders macht, ist nicht, dass es eine einzelne Funktion am besten ausführt, sondern dass es näher an der von Menschen gewünschten Form der Künstlichen Intelligenz ist.

Es ist erwähnenswert, dass unter dem Tweet, der diesen Podcast ankündigte, Noam Brown, ein ehemaliger Kollege von Karpathy bei OpenAI und einer der Autoren des OpenAI o1 - Modells, einen "feurigen" Tweet veröffentlichte, in dem er fragte, warum Karpathy in diesem kritischen Moment nicht in einem führenden KI - Labor forscht.

Karpathy hat in dem Podcast auch auf diese Frage reagiert. Wenn man sich zu eng an ein führendes KI - Labor bindet, ist es schwierig, eine völlig unabhängige Position zu behalten. Nach dem Verlassen des Labors ist man eher mit der Position der gesamten Menschheit übereinstimmend. Es besteht ein "Interessenkonflikt" zwischen finanziellen Anreizen und gesellschaftlicher Verantwortung, ein Problem, das bereits bei der Gründung von OpenAI bestand und bis heute nicht gelöst ist.

Karpathy ist der Meinung, dass es eine gute Idee ist, für eine Zeit in einem führenden KI - Labor zu arbeiten, hochwertige Arbeiten zu leisten und dann zu gehen. So kann man die aktuelle Entwicklung verfolgen, ohne vollständig von einer Institution kontrolliert zu werden, und auch einen Beitrag zum Ökosystem leisten. Diese Äußerung hat etwas von der "Prometheus - Steuerung des Feuers" und könnte möglicherweise der Grund für seine rasche Rückkehr von OpenAI sein.

In diesem Podcast hat Karpathy auch seine Gedanken über automatisierte Forschung, die "zackige" Verteilung der Fähigkeiten großer Modelle, die Konkurrenz zwischen Open - Source - und Closed - Source - Modellen sowie die Umgestaltung der Beschäftigung und der Softwareform geteilt. Im Folgenden sind die Kerninhalte dieses Podcasts:

1. KI - Programmierung: Seit Dezember letzten Jahres hat sich das Paradigma der KI - Programmierung vollständig verändert. Heute programmiert der Mensch nicht mehr, sondern drückt seine Ideen an die Agenten aus.

2. Produktivitätsangst: Die größte Sorge in der Branche ist nicht mehr, ob man die GPU voll ausnutzen kann, sondern ob man die Tokens nutzen kann. "Ich bin besorgt, wenn ich meine Abonnement - Tokens nicht verbraucht habe, das heißt, ich nutze die Token - Durchsatzleistung nicht aus."

3. Automatisierte Forschung: Die Künstliche Intelligenz kann komplexe Forschungsprojekte in hohem Maße automatisieren. Der Mensch muss sich aus allen Prozessen zurückziehen und so viel wie möglich automatisieren, um eine extrem hohe Token - Durchsatzleistung zu erreichen.

4. Die Fähigkeiten der Modelle sind zackig verteilt: Die Fähigkeiten der Modelle in verschiedenen Bereichen sind immer noch ungleichmäßig. Das Gefühl beim Gespräch mit der Künstlichen Intelligenz ist wie das, wenn man gleichzeitig mit einem Genie - Programmierer und einem 10 - jährigen Kind spricht.

5. Generalisierungsproblem: Die Intelligenz hat sich nicht vollständig ausgebreitet. Die Verbesserung der überprüfbaren Fähigkeiten führt nicht zu einer Verbesserung der weichen Fähigkeiten des Modells. Beispielsweise kann das Modell zwar besser in der Programmierung werden, aber seine Witze sind immer noch die schlechten Witze von vor fünf Jahren.

6. Berufswahl: Die Arbeit in einem führenden Labor ist nicht frei. Es gibt zu viele Interessenkonflikte und Positionseinschränkungen. Außerhalb dieser Institutionen ist man eher mit der Position der "gesamten Menschheit" übereinstimmend.

7. Open - Source vs. Closed - Source: Eine vollständig geschlossene Künstliche Intelligenz birgt systemische Risiken. Wenn ein Open - Source - Modell nicht das stärkste ist, sollte es bestenfalls nur etwas hinterherhinken und die Rolle eines "gemeinsamen Arbeitsraums" für die Branche einnehmen, um ein ausgewogenes Machtverhältnis sicherzustellen.

8. Ein großes Modell vs. spezialisierte kleine Modelle: Es wird mehr "Spezialisierung" großer Modelle geben, aber die Technologien für kontinuierliches Lernen, Feintuning und Gewichtsänderungen sind noch nicht ausgereift.

9. Roboter: Die Manipulation von Atomen (physikalische Welt) ist um das 100.000 - fache schwieriger als die Manipulation von Bits (digitale Welt), aber der Gesamtmarktpotenzial (TAM) der physikalischen Welt könnte größer sein als der der reinen digitalen Welt.

10. Künstliche Intelligenz und Bildung: Die Zeit, in der Menschen sich gegenseitig Wissen vermitteln, neigt sich dem Ende zu. In Zukunft könnte das Bildungsmuster darin bestehen, dass zuerst der Agent etwas versteht und dann die Menschen lehrt.

Im Folgenden ist die vollständige Übersetzung des Podcast - Inhalts:

01. Geringe Effizienz bei der KI - "Hummer" - Programmierung? Wahrscheinlich liegt es an den fehlenden Fähigkeiten!

Moderator: Ich erinnere mich, dass ich einmal in dein Büro kam und dich sehr konzentriert angetroffen habe. Ich habe dich gefragt, was du machst, und du hast gesagt: "Ich muss täglich 16 Stunden 'programmieren'." Programmieren ist sogar kein richtiges Verb mehr. Du drückst eigentlich deine Ideen an die Agenten aus. Erzähl mir von deinen Erfahrungen.

Karpathy: Ich fühle mich ständig in einem Zustand der "KI - geistigen Verwirrung" (KI - Psychose), und das gilt auch heute noch oft. Denn als Individuum kannst du jetzt mehr erreichen. Früher warst du durch die Tippgeschwindigkeit und andere Faktoren eingeschränkt, aber jetzt ist es dank dieser Agenten völlig anders.

Seit Dezember letzten Jahres hat sich mein Arbeitsstil wirklich gewandelt. Früher schrieb ich 80 % des Codes selbst und überließ 20 % den Agenten. Jetzt schreibe ich nur noch 20 % selbst, und 80 % oder sogar mehr werden von den Agenten erledigt. Seitdem habe ich fast kein einziges Codezeile mehr selbst geschrieben.

Wenn du einen Softwareingenieur fragst und siehst, was er tut, wirst du feststellen, dass sich der Standardarbeitsablauf bei der Softwareentwicklung seit Dezember letzten Jahres vollständig verändert hat.

Dies ist eine enorm große Veränderung. Ich habe auch mit meinen Eltern darüber gesprochen. Eigentlich sind die normalen Menschen nicht darauf aufmerksam, dass sich etwas ändert oder wie dramatisch diese Veränderung ist.

Also bin ich jetzt in einem Zustand der "geistigen Verwirrung", versuche zu verstehen, was überhaupt möglich ist, und dränge diese Möglichkeiten an ihre Grenzen. Ich frage mich: Wie kann ich nicht auf eine einzelne Konversation mit Claude Code oder Codex beschränkt sein? Wie kann ich mehr erreichen? Wie kann ich diese Fähigkeiten besser nutzen? In welchen Szenarien können diese OpenClaw eingesetzt werden? Es gibt so viele neue Dinge.

Ich denke, ich muss an der Spitze stehen. Ich sehe auf Twitter, dass viele Leute verschiedene Versuche machen, und es klingt alles sehr überzeugend. Wenn ich nicht an der Spitze bin, fühle ich mich sehr unwohl. Dieser Zustand der "geistigen Verwirrung" ist im Wesentlichen darauf zurückzuführen, dass wir noch immer erforschen, "was möglich ist", und dass dieser Bereich im Grunde noch unbekannt ist.

Moderator: Wenn du dir Sorgen machst, dann können wir andere erst recht nicht locker sein. Wir haben ein Team, dessen Ingenieure überhaupt keinen Code mehr selbst schreiben. Alle tragen Mikrofone und flüstern ständig an die Agenten. Dies ist das seltsamste Arbeitsumfeld, das ich je gesehen habe. Früher dachte ich, sie wären verrückt, aber jetzt akzeptiere ich es völlig: "Oh, das ist der richtige Weg." Du bist einfach einen Schritt voraus. Was hält dich jetzt bei der Exploration oder bei der Durchführung von Projekten auf?

Karpathy: Wenn ein Agent nicht gut funktioniert, liegt es meist daran, dass der Mensch die nötigen Fähigkeiten nicht beherrscht. Es ist nicht, dass der Agent nicht in der Lage ist, sondern dass du noch nicht verstehst, wie du die vorhandenen Dinge kombinieren sollst. Beispielsweise sind die Anweisungen in der Datei agents.md nicht gut genug formuliert, oder es fehlt ein geeignetes Gedächtniswerkzeug. Letztendlich handelt es sich um ein Problem der Fähigkeiten.

Die beste Methode ist, die Agenten parallel arbeiten zu lassen, wie es Peter Steinberg (Autor von OpenClaw) tut. Peter hat ein sehr lustiges Foto - er sitzt vor einem Monitor, dessen Bildschirm voller Codex - Agenten ist. Wenn die Anweisungen richtig formuliert sind und man den Hochleistungsmodus aktiviert, dauert jede Aufgabe etwa 20 Minuten. Er hat etwa 10 Repositories zu überprüfen und wechselt zwischen den Agenten, um ihnen Aufgaben zuzuweisen.

So kannst du mit größeren Einheiten arbeiten, nicht nur "hier eine Codezeile ändern, dort eine neue Funktion hinzufügen", sondern "diese neue Funktion an Agent 1 zuweisen, diese andere Funktion, die nicht im Konflikt steht, an Agent 2", und dann die Ergebnisse entsprechend deiner Wertschätzung des Codes überprüfen.

Dies sind die "makroskopischen Aktionen" bei der Bearbeitung von Code - Repositories. Ein Agent führt Forschung durch, ein anderer schreibt Code, und ein weiterer plant neue Implementierungen. Alles wird in diesen makroskopischen Aktionen vorangetrieben. Du musst diese Art von Spielzeug beherrschen und eine Art Muskelgedächtnis entwickeln. Dies lohnt sich, weil es wirklich nützlich ist und du neue Dinge lernst. Deshalb kommt es zur "geistigen Verwirrung".

02. "Ich bin besorgt, wenn ich meine Abonnement - Tokens nicht verbraucht habe, das heißt, ich nutze die Token - Durchsatzleistung nicht aus."

Moderator: Meine Intuition sagt mir, dass ich jedes Mal, wenn ich auf die Agenten warte, denke, dass ich etwas anderes tun sollte, richtig? Wenn ich noch Tokens übrig habe, sollte ich parallel mehr Aufgaben hinzufügen. Das ist sehr stressig, denn wenn du nicht denkst, dass die Token - Kosten ein Engpass sind, dann bist du selbst der eigentliche Engpass im System.

Karpathy: Das bedeutet zumindest, dass du dein Abonnement nicht voll ausnutzst. Im Idealfall sollte man, wenn Codex ausgelastet ist, zu Claude oder anderen Tools wechseln. Ich habe diesen Modus kürzlich getestet. Ich bin besorgt, wenn ich meine Abonnement - Tokens nicht verbraucht habe, das heißt, ich nutze die Token - Durchsatzleistung nicht aus.

Als ich promovierte, hatte ich auch eine ähnliche Erfahrung. Ich war besorgt, wenn die GPU nicht ausgelastet war - obwohl ich GPU - Rechenleistung hatte, nutzte ich die FLOPS nicht voll aus. Aber jetzt geht es nicht mehr um FLOPS, sondern um Tokens. Wie hoch ist deine Token - Durchsatzleistung? Wie viele Tokens steuerst du?

Moderator: Ich finde es sehr interessant, dass in den letzten mindestens zehn Jahren in vielen engineering - Aufgaben die Menschen nicht an der Rechenleistung gebremst wurden, aber jetzt plötzlich die gesamte Branche an der Ressourcenbeschränkung scheitert. Jetzt, wo die Fähigkeiten plötzlich gestiegen sind, stellst du fest: "Oh, es war nicht, dass ich keine Rechenleistung bekommen konnte, der Engpass war ich selbst."

Karpathy: Es ist ein Problem der Fähigkeiten. Die Forschung kann dich verbessern. Ich finde es sehr spannend, denn wenn du stärker wirst, kannst du neue Dinge entdecken.

Moderator: Wohin denkst du, dass es gehen wird? Wenn Karpathy täglich 16 Stunden iteriert und andere Menschen auch durch die Programmier - Agenten stärker werden, wie würde dein Niveau der Meisterschaft in einem Jahr aussehen?

Karpathy: Wie sieht Meisterschaft aus? Am Ende des Jahres, in zwei, drei, fünf oder zehn Jahren? Ich denke, dass alle in Richtung der oberen Schichten des Technologiestapels gehen möchten. Es geht nicht nur darum, einzeln mit den Agenten zu chatten, sondern wie mehrere Agenten zusammenarbeiten und wie Teams kooperieren. Alle versuchen, herauszufinden, wie das aussehen könnte.

Ich denke auch, dass OpenClaw ein interessanter Ansatz ist, denn ich spreche hier von einer Art von OpenClaw, der die Dauerhaftigkeit auf ein neues Niveau hebt. Es ist ein kontinuierlich laufender Prozess, nicht ein interaktiver Vorgang. Er hat seine eigene kleine Sandkiste, arbeitet selbständig, auch wenn du nicht darauf achtest, und hat ein komplexeres Gedächtnisystem und andere Funktionen, die in den Agenten noch nicht implementiert sind.

Das Gedächtnisystem von OpenClaw ist viel komplexer als das Standardmodell. Im Standardmodell wird das Gedächtnis einfach komprimiert, wenn der Kontext voll ist.

Moderator: Denkst du, dass OpenClaw die Benutzer mit diesem Aspekt überzeugt, oder eher durch den breiteren Zugang zu Tools?

Karpathy: Ich denke, dass OpenClaw viele sehr gute Ideen hat. Peter hat es wirklich gut gemacht. Ich habe ihn kürzlich getroffen und mit ihm gesprochen. Er ist sehr bescheiden, aber ich denke, dass er gleichzeitig in fünf verschiedenen Dimensionen innoviert und diese dann integriert. Beispielsweise die "Seelendokumentation (soul.md)". Er hat wirklich eine attraktive und interessante Persönlichkeit geschaffen. Ich denke, dass viele Agenten diesen Aspekt nicht richtig umsetzen.

Claude hat eine gute Pers

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Der AI-Experte Andrej Karpathy hat selbst angegeben: Durch das Spielen mit Krebse hat er "AI-Psychose" entwickelt und fühlt sich unruhig, wenn die Tokens nicht aufgebraucht sind.

01. Geringe Effizienz bei der KI - "Hummer" - Programmierung? Wahrscheinlich liegt es an den fehlenden Fähigkeiten!

02. "Ich bin besorgt, wenn ich meine Abonnement - Tokens nicht verbraucht habe, das heißt, ich nutze die Token - Durchsatzleistung nicht aus."