Der Vater von Claude Code: "Geschmack" als kein menschlicher Wettbewerbsvorteil - Wie gestaltet sich Personalauswahl, wenn Ingenieure keinen Code mehr schreiben?

Letztendlich ist das, was wir dem Modell beibringen, dasselbe, was wir Kindern beibringen.

Viele Leute sagen, dass im Zeitalter der KI Geschmack die letzte Verteidigungslinie der Menschen ist. Aber Boris Cherny ist anderer Meinung.

Er ist ein technisches Mitglied von Anthropic und einer der Kernbauer von Claude Code. Er schreibt jeden Tag mit Modellen Code und untersucht auch Modelle mit Modellen. Und der Trend, den er sieht, ist: Der sogenannte „Geschmack“ wird auch schnell von Modellen gelernt.

Wenn ein Modell sogar weiß, „was getan werden soll“, was bleibt dann den Menschen übrig?

In einem kürzlichen Interview sprach Boris über dieses Thema.

Video-Adresse: https://www.youtube.com/watch?v=RkQQ7WEor7w&t=1s

Zusätzlich äußerte er sich auch zu einigen anderen Schlüsselfragen, wie:

Wie verändert Claude Code im Grunde das Unternehmenssystem?

Wenn ein Modell den größten Teil des Codes schreiben kann, lohnt es sich noch, Softwareingenieure einzustellen? Wenn ja, wonach sollte man dann suchen?

Warum sind viele Leute in Anthropic Member of Technical Staff und gibt es keine klaren Hierarchien und Aufgabenteilungen?

Warum ist der kontraintuitivste Rat an alle Unternehmer „weniger Leute einstellen, mehr Tokens verteilen“?

…

Oberflächlich gesehen handeln diese Fragen um die Entstehung und Iteration eines Produkts, aber die Antworten auf jeder Ebene deuten auf eine noch grundlegendere Veränderung hin: Die Arbeitsweise von Organisationen wird von den Modellen selbst neu definiert.

Und die Antworten, die Boris gibt, sind sehr wertvoll, um darüber nachzudenken.

Wie ist Claude Code entstanden?

Als der Moderator Boris nach der Entstehung von Claude Code fragte, war seine Antwort etwas überraschend.

Nach seiner Erzählung war Claude Code nicht von Anfang an ein geplantes Kernprodukt von Anthropic. Es war sogar in gewisser Weise ein Zufallsprodukt.

Ende 2024 trat Boris dem Labs-Team von Anthropic bei. Die Aufgabe dieses Teams besteht nicht darin, bestehende Produkte zu warten, sondern zukünftige Produktformen zu erkunden. Einerseits müssen sie ständig die Grenzen der Modellfähigkeiten erweitern; andererseits suchen sie auch nach neuen Produkten, die diese Fähigkeiten wirklich nutzen können. Insbesondere auf dem Gebiet der Programmierung ist dies der Fall.

Damals befanden sich die meisten KI-Programmiertools auf dem Markt noch in zwei Richtungen. Eine Richtung ist die automatische Vervollständigung, die Entwicklern hilft, die nächste Codezeile zu vervollständigen; die andere Richtung ist ein Q&A-Assistent, mit dem Entwickler die Bedeutung eines Codesegments oder die Lösung eines Fehlers fragen können. Aber Boris meinte, dass es damals noch keinen echten Coding-Agenten gab.

Also beschloss das Team, einen radikaleren Versuch zu unternehmen: Anstatt das Modell als Hilfsmittel zu verwenden, sollten sie es direkt zum Entwicklungssubjekt machen. Sie wollten sehen, was passieren würde, wenn man ein Programmierprodukt von Grund auf um einen Agenten herum aufbauen würde.

Allerdings gab Boris auch ehrlich zu, dass das ursprüngliche Claude Code nicht gut funktionierte.

Über einen langen Zeitraum konnte es nur etwa 10 % bis 20 % seiner Arbeit erledigen. Der größte Teil des Codes musste er immer noch selbst schreiben. Das heute bekannte Claude Code hat sich von dem damaligen Produkt vollkommen gewandelt.

Warum legt Anthropic so viel Wert auf Programmierung?

Viele Menschen denken, dass der Grund, warum Anthropic auf die Programmierung Wert legt, einfach ist – der Programmiermarkt ist groß genug und hat einen hohen kommerziellen Wert. Aber die Erklärung, die Boris gibt, ist völlig anders.

Er sagte, wenn man zufällig einen Mitarbeiter in Anthropics Büro anhalten und ihn fragen würde, warum er hierher gekommen sei, würde man mit hoher Wahrscheinlichkeit die gleiche Antwort erhalten: KI-Sicherheit.

Nach Boris Ansicht war die Kernmission von Anthropic seit seiner Gründung die KI-Sicherheit. Ob Interpretierbarkeitsforschung, Alignment-Forschung oder andere Sicherheitsrichtungen, im Grunde versucht man, das Verhalten von Modellen zu verstehen. Aber all diese Forschungen stoßen letztendlich auf dasselbe Problem: Es reicht nicht, die Modelle nur im Labor zu beobachten. Die Forscher müssen auch beobachten, was passiert, wenn die Modelle in die reale Welt gelangen.

Und die Programmierung ist genau ein nahezu ideales Experimentierfeld.

Im Gegensatz zu Schreiben, Zeichnen oder anderen offenen Aufgaben hat die Programmierung ein äußerst klares Feedback-System. Ob ein Code funktioniert oder nicht, ob ein Programm die Tests besteht oder nicht, ob die Kompilierung erfolgreich ist oder fehlschlägt, die Antworten sind oft sehr eindeutig. Gleichzeitig bietet das Internet eine riesige Menge an Code als Trainingsdaten. Im Vergleich zu einer Aufgabe wie der Gedichtschreibung, bei der es unzählige gute Antworten geben kann, ist der Raum der richtigen Lösungen für Programmierprobleme viel enger und daher leichter zu überprüfen.

Deshalb hat Anthropic schon frühzeitig stark auf die Programmierung, die Werkzeugnutzung und die Computernutzung geachtet. Diese Bereiche haben nicht nur kommerziellen Wert, sondern bieten vor allem eine natürliche Experimentierumgebung, um zu untersuchen, wie Modelle mit der realen Welt interagieren.

Von dieser Perspektive aus ist Claude Code nie nur ein Produktivitätstool für Programmierer gewesen. In Boris Erzählung ist es auch eine wichtige Experimentierplattform für Anthropic, um zukünftige KI-Systeme zu verstehen.

Warum ist Claude Code plötzlich so viel stärker geworden?

Nach der Einführung der Entstehung von Claude Code stellte der Moderator eine Frage, die viele Menschen wissen möchten. Da Claude Code zu Beginn nur etwa 10 % bis 20 % von Boris Arbeit erledigen konnte, was ist dann passiert? Schließlich hat Boris kürzlich öffentlich erklärt, dass er seit sechs Monaten keinen Code mehr von Hand geschrieben hat. Von der Fähigkeit, nur einen kleinen Teil der Aufgaben zu erledigen, bis hin zur fast vollständigen Übernahme der Entwicklungsarbeit, hat sich offensichtlich eine große Veränderung ereignet.

Auf diese Frage gab Boris eine überraschend einfache Antwort. Er sagte, dass die Außenwelt oft die Aufmerksamkeit auf die Produktfunktionen richtet, aber wenn er an die Momente denkt, die wirklich zu einem Sprung in der Fähigkeit geführt haben, ist der wichtigste Grund eigentlich nur einer: Das Modell ist stärker geworden.

Im vergangenen Jahr hat das Anthropic-Team tatsächlich Claude Code ständig verbessert. Sie haben eine Menge an Ingenieurarbeit geleistet und verschiedene neue Interaktionsformen und Produktformen hinzugefügt. Zu Beginn war Claude Code nur ein Befehlszeilentool, später wurde es auf den Desktop, das Mobilgerät, Slack, GitHub und andere Szenarien erweitert. Das Team hat auch ständig neue Funktionen wie den Plan-Modus und andere Mechanismen getestet, die Entwicklern helfen, mit dem Agenten zusammenzuarbeiten. Aber nach Boris Ansicht gehören all diese Verbesserungen zu den inkrementellen Verbesserungen.

Was wirklich die Obergrenze von Claude Code bestimmt, ist das zugrunde liegende Modell selbst.

Er erwähnte einige Schlüsselmomente. Von Sonnet 4, Opus 4 bis hin zu Opus 4.5 hat jedes Mal, wenn die Modellfähigkeit gestiegen ist, sich dies direkt in der Leistung von Claude Code widerspiegelt.

Der Moderator fragte dann, ob die Erfahrungen mit der Verwendung von Claude Code die Modellentwicklung umgekehrt beeinflussen würden. Boris antwortete, dass fast alle Mitarbeiter in Anthropic täglich Claude Code verwenden, einschließlich derjenigen, die Modelle entwickeln, die Produkte entwickeln … Das gesamte Unternehmen nutzt es.

Es gibt also keine separate Feedback-Kanal. Das Feedback ist selbst ein Teil der täglichen Arbeit des Unternehmens.

Wenn die Forscher bei der Verwendung Probleme entdecken, werden die Modelle-Teams diese Probleme sehen; nachdem die Modellfähigkeit gestiegen ist, werden die Mitarbeiter sofort die Veränderungen in der praktischen Arbeit spüren. Das Produkt und das Modell sind nicht zwei parallele Linien, sondern entwickeln sich im gleichen Zyklus gemeinsam.

Wie viel Produktivität hat Claude Code für Anthropic gebracht?

Boris sagte, dass man in einem KI-Labor lange genug gearbeitet hat, man sich daran gewöhnt, in Exponentialfunktionen zu denken. Viele interne Indikatoren – ob Einkommen, Nutzungsmenge oder Modellfähigkeit – sehen eher wie Exponentialkurven aus, daher ist man sogar daran gewöhnt, logarithmische Koordinaten zu verwenden, um die Veränderungen zu beobachten.

Und die Codeproduktion zeigt einen ähnlichen Trend.

Nach den von Anthropic öffentlich gemachten Angaben hat die Codeproduktion pro Ingenieur seit der breiten Verwendung von Claude Code im Unternehmen um etwa das Dreifache zugenommen. Aber Boris betonte besonders, dass diese Daten schon veraltet sind. Der tatsächliche Anstieg liegt weit über diesem Wert.

Interessanterweise ist dieser Anstieg während der schnellen Expansion des Unternehmens aufgetreten.

Nach traditioneller Erfahrung sinkt die durchschnittliche Produktivität eines Unternehmens normalerweise, wenn die Anzahl der Ingenieure zunimmt. Neue Mitarbeiter müssen das System lernen, und die alten Mitarbeiter müssen Fragen beantworten, was die Kommunikationskosten der Organisation ständig erhöht.

Aber Boris beobachtete das Gegenteil. Früher brauchte ein neuer Ingenieur möglicherweise Wochen, um sich mit dem internen System vertraut zu machen. Jetzt dauert dieser Prozess oft nur zwei Tage.

Der Grund liegt nicht in einer revolutionären Veränderung des Schulungssystems, sondern darin, dass sich die Leute daran gewöhnt haben, direkt Claude zu fragen. Neue Mitarbeiter müssen nicht wissen, wie man in der Datenbank sucht. Sie müssen nicht einmal wissen, an wen sie sich wenden sollen. In Anthropic wird oft die Antwort gegeben, wenn jemand fragt, wie man in der Datenbank sucht: „Öffne Claude und lass Claude in der Datenbank suchen.“ Viele versteckte Kenntnisse, die früher von erfahrenen Ingenieuren beherrscht werden mussten, werden jetzt auf den Agenten übertragen. In Boris Ansicht ist dies vielleicht die wichtigste Veränderung.

Claude Code erhöht nicht nur die Codegenerierungsgeschwindigkeit, sondern verringert auch allmählich die Kosten für den Wissensaustausch innerhalb der Organisation. In der Vergangenheit hat das Unternehmen auf die schichtweise Weitergabe von Wissen gestützt, um den Wissensaustausch zu gewährleisten. Jetzt werden immer mehr Kenntnisse direkt in das Modell eingebettet.

Von der Lochkarte bis zum Vibe Coding

Die Menschen erhöhen nur erneut die Abstraktionsebene der Programmierung

Da Claude Code so stark ist, schreiben die neuen Ingenieure in Anthropic noch Code? Nachdem der Moderator diese Frage gestellt hatte, wechselte das Gespräch auf die Frage: Wie definiert man „Code schreiben“?

Nach Boris Ansicht ist die Entwicklungsgeschichte der Softwareentwicklung im Wesentlichen eine Geschichte des ständigen Anhebens der Abstraktionsebene.

Sein Großvater programmierte in der Sowjetzeit mit Lochkarten. In dieser Zeit mussten Programmierer Löcher in Papierkarten machen und dann die Karten in den Computer geben, um das Ergebnis zu erhalten. Später kam die Assemblersprache. Dann kamen Fortran, Cobol. Dann Java, Python, JavaScript. Jedes Mal, wenn die Abstraktionsebene erhöht wurde, dachte man, dass dies nicht mehr das echte Programmieren sei. Diejenigen, die Assembler schreiben, halten diejenigen, die Hochsprachen schreiben, für unterlegen, und diejenigen, die C schreiben, finden Python zu einfach. Und Boris meint, dass das, was heute passiert, im Grunde nicht anders ist. Die Menschen erhöhen nur erneut die Abstraktionsebene der Programmierung.

Er beschrieb den Verlauf seiner Arbeit im vergangenen Jahr. Anfangs arbeitete er wie die meisten Entwickler: Er öffnete die IDE, schrieb Code und benutzte gelegentlich die automatische Vervollständigung. Dies war die traditionelle Softwareentwicklungsmethode.

Nachdem Claude Code aufgetaucht ist, hat sich seine Arbeitsweise geändert: Er beschreibt Claude seine Anforderungen, lässt Claude den Code schreiben und übernimmt selbst die Überprüfung und Korrektur. In dieser Phase gibt der Mensch immer noch direkt Befehle an das Modell. Nur der Code wird vom Modell generiert. Aber Boris meint, dass dies eigentlich nur eine Übergangsphase ist.

Die wirklich interessante Veränderung ist erst kürzlich passiert. Er sagte: Jetzt gebe ich Claude sogar nicht mehr direkt Anweisungen. Seine Arbeit hat sich in eine andere Form gewandelt. Er schreibt verschiedene automatisch laufende Prozesse und Schleifen. Diese Schleifen stellen Fragen an Claude, zerlegen Aufgaben, verwalten den Kontext und koordinieren die Arbeit mehrerer Claude-Instanzen.

Mit anderen Worten: Früher gab der Mensch Claude Befehle. Jetzt gibt ein Programm für ihn Claude Befehle. Und seine Arbeit besteht darin, diese automatisch laufenden Systeme zu entwerfen. Er fasste es mit einem sehr kurzen Satz zusammen: Meine Arbeit besteht darin, Schleifen zu schreiben.

Es scheint, dass Boris nicht nur den Code an Claude auslagert, sondern auch die Kommunikation mit Claude selbst automatisiert. Dies ist nicht mehr der bekannte Copilot-Modus. Es ist eher ein System, in dem mehrere Agenten kontinuierlich laufen.

Boris erwähnte, dass er im vergangenen November sogar seine IDE deinstalliert hat. Der Grund war nicht eine symbolische Gestik, sondern dass er feststellte, dass er seine IDE einen Monat lang nicht geöffnet hatte. Da er sie überhaupt nicht benutzte, hat er sie natürlich deinstalliert. In dieser Zeit hat er normalerweise fünf bis zehn Claude-Instanzen gleichzeitig laufen lassen, wobei verschiedene Claude-Instanzen verschiedene Aufgaben übernahmen, und er war hauptsächlich für die Überwachung des gesamten Prozesses verantwortlich.

Ingenieure schreiben keinen Code mehr

Wonach sucht man bei der Einstellung?

Zu diesem Zeitpunkt stellte der Moderator eine sehr interessante Frage: Wenn ein Ingenieur heute Anthropic beitreten möchte, wie würde Anthropic ihn bewerten? Oder anders ausgedrückt: In einer Welt, in der immer weniger Menschen Code von Hand schreiben, wonach sucht ein Unternehmen eigentlich?

Boris Antwort führte fast direkt zur anschließenden Diskussion über die Organisationsform. Er sagte, dass die Claude Code-Teams am liebsten Menschen der folgenden Art haben: Generalisten.

Der Grund ist einfach: In der Vergangenheit hatte die Softwareorganisation eine sehr klare Aufgabenteilung – User-Researcher waren für das Verständnis der Benutzer zuständig, Designer für das Design des Produkts, Produktmanager für die Planung der Anforderungen und Ingenieure für die Umsetzung der Funktionen. Jeder arbeitete in seinem eigenen Bereich, wie auf einem Fließband.

Aber das Claude Code-Team hat in den letzten sechs Monaten festgestellt, dass diese Aufgabenteilung schnell auseinanderfällt. Jeder Ingenieur im Team macht fast täglich verschiedene Dinge, die ursprünglich nicht in die Aufgaben eines „Ingenieurs“ fielen. Manche kommunizieren direkt mit den Benutzern, manche gestalten die Interaktion, manche ziehen Daten, analysieren Daten und erstellen Dashboards. Niemand beschränkt sich auf einen engen Bereich.

Boris gab sogar ein extremeres Beispiel: Die Designer von Anthropic schreiben auch Code, und die Finanzmitarbeiter schreiben auch Code. Satya Nadella nennt diese Rolle „Builder“. Diese Bezeichnung ist möglicherweise genauer als „Ingenieur“, denn die echte Grenze liegt nicht darin, „ob man Code schreiben kann“, sondern darin, „ob man eine Idee in die Realität umsetzen kann“.

Aus Boris Sicht hat die KI nicht einfach die Programmierer ersetzt. Sie hat wirklich die Beziehung zwischen Wissen und Umsetzung verändert. In der Vergangenheit konnte eine Person nicht mehrere Rollen gleichzeitig übernehmen, hauptsächlich weil die Lernkosten zu hoch waren. Jetzt verringern die Modelle ständig die Übergangskosten zwischen diesen Fähigkeiten. Daher werden diejenigen, die in Zukunft am besten positioniert sind, möglicherweise nicht die tiefsten Experten in einem bestimmten Bereich sein, sondern diejenigen,

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Der Vater von Claude Code: „Geschmack“ ist kein menschlicher Wettbewerbsvorteil. Wenn Ingenieure keinen Code mehr schreiben, wonach richtet sich dann die Personalauswahl?