10 Wochen Arbeitsaufwand vs. KI in nur 4 Tagen! Ganze Aufzeichnung der Anthropic-Pressemitteilung: Dein komplexes Projekt ist für das Modell nur ein Spielzeug

Nach der Arbeitszeit der menschlichen Ingenieure lässt man die KI selbst die Bugs beheben, die CI laufen lassen und die PRs zusammenführen.

Wenn Sie die neueste Entwicklerkonferenz „Code w/ Claude“ von Anthropic vor einigen Tagen verpasst haben, dann verpassen Sie möglicherweise den größten Paradigmenwechsel in der Geschichte der Softwareentwicklung.

Die zentrale Botschaft der gesamten Konferenz lautet: Die Fähigkeiten von KI-Modellen wachsen exponentiell, während die Entwicklungsmodelle der meisten Unternehmen noch im linearen Stadium verharren. Um den Entwicklern diesen Abstand zu überbrücken, hat Anthropic drei entscheidende Waffen hervorgebracht: Ein stärkeres Grundmodell, die neue Agentenorchestrierungsfähigkeit der Claude Platform und die Claude Code-Desktopanwendung, die die tägliche Entwicklung vollständig revolutioniert.

Bei dieser Keynote haben fast ausschließlich die Leiterinnen und Leiter der eigenen Produkt- und Engineering-Teams von Anthropic gesprochen. Die Chief Product Officer Ami Vora hat zunächst den Hintergrund klargemacht. Die Leiterin der Produktforschung, Dianne Penn, hat erklärt, warum die Modellebene weiterhin explosive Wachstumspotenzial hat. Das Claude Platform-Team hat mit einer fiktiven Demonstration von Monddrohnen die neuen Fähigkeiten wie Multi-Agenten, Outcomes und Dreaming aufgedeckt. Im Abschnitt über Claude Code haben Cat Wu und der Leiter von Claude, Boris Cherny, eine andere Linie klar gemacht: Die synchrone Programmierung rückt in den Hintergrund, und der asynchrone Entwicklungsfluss, der Aufgaben kontinuierlich ausführt, Pull Requests automatisch repariert und CI-Fehler automatisch behandelt, wird zur neuen Standardoption.

Jetzt folgen wir dieser Hauptlinie: Wie will Anthropic den nächsten Entwicklungsfluss definieren? Welchen Teil hat die Claude Platform und Claude Code jeweils vorangetrieben?

Ami Vora: Guten Morgen, meine Damen und Herren! Ich freue mich, Sie alle hier zu sehen. Vielen Dank für Ihr Kommen.

Als ich mir heute überlege, warum ich hier stehe, denke ich an den Moment, als ich zum ersten Mal erfolgreich Code ausgeführt habe. Ich bin nicht von klein auf mit Programmierung aufgewachsen. Ich bin am Fuße der Appalachen aufgewachsen, habe nie einen Computer selbst gebaut und auch nicht viel Computerspiele gespielt. Mein erster Versuch, ein komplexes Projekt zu erstellen, war in einer Informatikvorlesung an der Universität. Das war schon lange her. Damals mussten wir uns an der Serverkonsole anmelden, weil nur dieser Server genug Rechenleistung hatte, um unsere Raytracing-Programme auszuführen.

Einige von Ihnen kennen sicherlich diese Szene: Das Summen der Server, der Geruch von übernachtetem Pizza und Kaffee und der typische Geruch eines Serverraums im Keller ohne Fenster. Aber ich erinnere mich noch an das Gefühl, als ich auf die „Kompilieren“-Taste gedrückt habe und auf das Ergebnis gewartet habe. Als ich feststellte, dass das Programm tatsächlich lief, war ich von einer reinen Freude, der Begeisterung wie bei der Entdeckung eines neuen Kontinents, der Erleichterung und der Überraschung, dass ich etwas geschaffen hatte, das es bisher nicht gegeben hatte, total fasziniert. Genau dieses Gefühl hat mich total in seinen Bann gezogen und ist der Grund, warum ich heute hier stehe.

Die Zeit hat sich gewandelt. Was ich damals nur in der Universitätscomputerhalle anstehen musste, um zu bekommen, ist heute für jeden Menschen auf der Welt zu jeder Zeit und an jedem Ort zugänglich. Kein Warten an der Schlange, kein unangenehmer Geruch und keine Barrieren, aber das Gefühl der Begeisterung, Freude und Erleichterung ist immer noch dasselbe. Ich weiß, dass viele von Ihnen dasselbe Gefühl haben. Oft höre ich von Leuten: „Claude lässt mich mich wie einen Superhelden fühlen.“ Das ist das Lob, das ich am liebsten höre.

Wir sehen, wie Sie diese Superkräfte einsetzen. Beispielsweise hat Scott MacVicar, der Leiter der Entwicklungsinfrastruktur von Stripe, ein Team, das 50.000 Zeilen Scala-Code in Java umschreiben musste, um das JDK zu aktualisieren. Sie schätzten zunächst, dass dies 10 Wochen Arbeitszeit der Ingenieure in Anspruch nehmen würde. Mit Hilfe von Claude haben sie es jedoch in nur 4 Tagen geschafft.

Manchmal ist die Geschwindigkeit nicht nur ein Effizienzfaktor, sondern auch ein Weg, um neue Ziele zu erreichen. Felicia Curcuru, Mitbegründerin und CEO von Binti, hat ein Software-System entwickelt, das Sozialarbeiterinnen und Sozialarbeitern hilft, Pflegefamilien für Waisenkinder zu finden. Das Bearbeiten von Dokumenten, die Hausbesuche und die Qualitätskontrollen … In diesem Jahr hat ihr Team mit der Claude API die Sozialarbeiterinnen und Sozialarbeiter von der mühsamen Papierarbeit befreit und den gesamten Antragsverfahren für Pflegefamilien um 20 Tage verkürzt. 20 Tage – das ist nicht nur ein kalter Effizienzindikator, sondern bedeutet, dass ein Kind 20 Tage früher ein Zuhause hat.

Das Gefühl der Begeisterung, Freude, Erleichterung und der Entdeckung neuer Dinge ist das, was ich von Ihnen gehört habe. Ich vermute, dass Sie dieses Gefühl auf verschiedene Weise erleben. Einige von Ihnen sind täglich an der Spitze der Technologie, andere versuchen, die Leute um sich herum mitzunehmen, und wieder andere sind hier, weil sie wie ich das starke Rütteln der technologischen Platten spüren und die Zukunft verstehen möchten. Vertrauen Sie mir, ich spüre alle diese Gefühle oft in einem Morgen. Ich komme oft mit einem Plan zur Arbeit, und um die Mittagszeit habe ich diesen Plan schon zerschmettert, weil es wieder einen neuen Durchbruch gegeben hat. Klingt das bekannt?

Wenn wir einen Schritt zurücktreten und uns die Geschwindigkeit ansehen, mit der sich diese Modelle entwickeln, wird alles verständlich. Bei Anthropic sprechen wir oft von einem „exponentiellen Sprung“. Ich denke, das ist genau das, was wir alle gerade spüren. Erinnern Sie sich noch? Vor nur zwei Jahren war das ultimative Ziel im Bereich der Modelle, eine anständige E-Mail zu schreiben, und wir waren schon dankbar. Vor einem Jahr standen wir auf dieser Bühne, und der Hauptartikel war über Opus 4. Damals war es noch wie ein Mondlandungsplan, einen Agenten stundenlang ohne menschliche Eingriffe laufen zu lassen.

Vor sechs Monaten konnten die Agenten bereits über Nacht End-to-End-Aufgaben ausführen, und wir konnten morgens die Ergebnisse überprüfen. Erst letzten Monat hat Mythos den gesamten Quellcode von OpenBSD gelesen und einen Fehler entdeckt, der 27 Jahre lang verborgen war und den menschlichen Überprüfungen, Fuzz-Tests und statischen Analysen fast 30 Jahre lang entgangen war. Die technologischen Sprünge werden immer größer, und die Zeitintervalle werden kürzer.

Obwohl die Fähigkeiten der Modelle exponentiell wachsen, verwenden die meisten Organisationen KI immer noch auf traditionelle Weise. Dies führt zu einer Kluft zwischen „was die KI kann“ und „was die KI tatsächlich für Menschen löst“. Die Überbrückung dieser Kluft und die Umwandlung der Modellfähigkeiten in ein Werkzeug für die Lösung von Problemen durch normale Menschen – das ist die Mission der Entwickler. Das tun Sie bereits sehr erfolgreich. Auf der Claude Platform hat die Anzahl der API-Aufrufe im Vergleich zum Vorjahr um fast 17-fach zugenommen. Bei Claude Code verbringen die Entwickler im Durchschnitt 20 Stunden pro Woche damit, Claude auszuführen.

Wir befinden uns ebenfalls in einer Phase des rasanten Fortschritts. Wir möchten, dass Sie heute mit einem klaren Bild der Zukunft gehen, damit Sie sich darauf vorbereiten können und mit uns den exponentiellen Wachstumstrend nutzen können. Ich möchte betonen, dass wir heute kein neues Modell veröffentlichen. Das Thema von heute ist, wie wir unser Produkt für Sie verbessern können, damit Sie die Kluft für die ganze Welt überbrücken können. Heute Vormittag werden wir Ihnen das Ganze vorstellen.

Zunächst wird Dianne über unsere Grundlage, die Modellebene, sprechen. Sie wird über die Fortschritte und die zukünftigen Pläne unserer Spitzenmodelle berichten. Auf der Claude Platform werden wir die Claude Managed Agents erheblich verbessern, einschließlich: Zielorientierung (Outcomes), Modellträume (Dreaming) und Multi-Agenten-Orchestrierung. Angela und Katelyn werden Ihnen zeigen, wie die Platform Ihnen die Infrastruktur abnimmt und Sie vor der Bürokratie bewahrt. Bei Claude Code werden Cat und Boris Sie anleiten, wie Sie neue Primitive wie Routines verwenden können, damit Claude Code selbständig agieren kann, auch wenn Sie nicht am Computer sitzen.

All dies führt schließlich zu Ihnen und den Produkten, die Sie kreieren werden. Denn die meisten Menschen werden nie die Claude API aufrufen oder in der Kommandozeile „Claude“ eingeben. Sie werden die KI nur über die Produkte erleben, die Sie auf der Claude Platform entwickeln. Ob es ein Designer ist, der mit Canva nach neuen Inspirationen sucht, ein Anwalt, der mit Legora schnell Rechtsdokumente erstellt, oder ein Entwickler, der den weltweit besten Programmieragenten nutzt. Vielen Dank an Sie, die Sie die KI in die Welt tragen. Wir können nicht alle Tools für alle Probleme alleine entwickeln. Das können nur Sie.

Um Ihnen unseren Dank auszudrücken, haben wir eine gute Nachricht. Ab heute werden wir die Rate Limits für Claude Code und die Claude Platform-Entwickler erhöhen, um Ihnen zu helfen, die Kluft weiterhin zu überbrücken. Genauer gesagt verdoppeln wir nicht nur die 5-Stunden-Rate Limits für Claude Code für die Pro-, Max-, Team- und die auf Sitzplätzen basierenden Enterprise-Pläne, sondern erhöhen auch die API-Limits für Claude Opus deutlich.

Dies ist möglich, weil wir unser Rechenleistungspartnerprogramm erweitert haben. Wir arbeiten mit SpaceX zusammen und nutzen die volle Rechenleistung ihres Colossus 1-Rechenzentrums. Wir werden diese Ressourcen direkt an unabhängige Entwickler und kleine Teams investieren. Im Laufe der Zeit werden wir weiterhin nach Wegen suchen, um Ihnen zu helfen, das volle Potenzial von Claude auszuschöpfen, sei es durch die bestehenden Rechenleistungspartnerschaften oder durch künftige riskantere Investitionen.

Vielen Dank für Ihr Kommen heute. Vielen Dank, dass Sie mit uns zusammen die KI in der realen Welt definieren. Vielen Dank, dass Sie die Superkräfte in die Hände der Menschen legen. Jetzt möchte ich die Leiterin unseres Produktforschungsteams, Dianne, begrüßen. Danke!

Dianne Penn: Danke, Ami. Ich bin Dianne und bin 2023 bei Anthropic gekommen. Seit Claude 2 habe ich die Entstehung jedes Modells miterlebt. Wenn jemand zählt, haben wir 18 Claude-Versionen, die von Haiku, Sonnet, Opus bis hin zu Mythos reichen, an Benutzer und Entwickler wie Sie verteilt.

Wir haben uns sehr bemüht, Opus 3 so zu gestalten, dass es sowohl perfekt dem JSON-Format folgt als auch der König im Schreiben von langen Codeabschnitten ist. Bei Sonnet 3.5 New (das Sie jetzt endlich als Sonnet 3.6 nennen) haben wir Claude beigebracht, wie es sicher mit dem Computer umgehen kann. Bei Sonnet 3.7 war es manchmal etwas zu eifrig, also haben wir es auf die richtige Weise für Benutzer und Entwickler zugänglich gemacht, damit Sie seine Eigenschaften kennenlernen können. Vor einem Jahr haben wir mit Claude 4 das perfekte Gleichgewicht zwischen Denkfähigkeit und Rechenleistung bei Tests gefunden. Wir haben nie aufgehört, uns zu verbessern. In den letzten 12 Monaten haben wir 8 Spitzenmodelle an Entwickler und Benutzer ausgeliefert. Jede Generation baut auf der vorherigen auf und ermöglicht es Ihnen, eleganteren Code zu schreiben und Produkte zu entwickeln, die weiter gehen als je zuvor.

Die Modellebene ist die Grundlage für alle Innovationen, über die Sie heute hören werden. Dies ist die wichtigste Übereinkunft. Mit dem Anstieg der Intelligenz der Modelle rückt Ihre Startlinie vor, und Sie können Dinge tun, die sich bisher kaum vorstellen ließen. Bei Anthropic sprechen wir oft von einem „exponentiellen Sprung“, wie Ami es gerade erwähnt hat. Für mich bedeutet dies: Wenn das Modell schlauer wird, können Sie für die Benutzer exponentiell mehr Anwendungsfälle schaffen. Beispielsweise ist die „Agentenprogrammierung“ mit eigener Planungsfähigkeit weitaus revolutionärer als die einfache „Code-Vervollständigung“. Auf diese Weise eröffnen neue Produkte und neue Erfahrungen neue Märkte und vergrößern den gesamten Markt.

In den Augen des Forschungsteams ist der „exponentielle Sprung“ nicht einfach nur eine Verbesserung der SWE-Benchmark-Scores. Es geht darum, neue Fähigkeiten zu schaffen und zu verfolgen, die es ohne unsere gezielte Gestaltung nicht gäbe: Tool-Aufrufe, die Übernahme des Betriebssystems, die adaptive Denktiefe in Abhängigkeit von der Schwierigkeit des Problems, der Agentenzyklus, der Hunderten von Schritten lang an seinem Ziel festhält, und das sehr lange Kontextfenster, das es Claude ermöglicht, neues Wissen aufzunehmen. Diese Fähigkeiten beschränken sich nicht auf das Schreiben von Code. Heute kann Claude bereits visuelle Designs generieren und verbessern, komplexe Geschäftsdokumente analysieren und erstellen und sich in der unsicheren Geschäftswelt zurechtfinden. Dies liegt daran, dass das unterliegende Modellhirn intelligent und stark genug ist, um all dies zu ermöglichen.

Wenn Sie auf der Grundlage von Claude entwickeln, setzen Sie sich auf eine Modellproduktlinie, die diese Fähigkeiten zuerst geschaffen und am längsten an ihrer Stabilität gearbeitet hat. Lassen Sie mich Ihnen ein praktisches Beispiel mit der neuesten Version, Opus 4.7, geben. Das Coding-Agentenunternehmen Amp hat alle ihre „Intelligent-Modes“ auf Opus 4.7 umgestellt, weil es nicht nur in den Benchmarks übertrifft, sondern vor allem, weil sie festgestellt haben, dass sie viele redundante Hilfsmittel und Tools weglassen können, weil das Modell intelligent genug ist, um ohne diese Unterstützung auszukommen. Rakuten hat unsere Modelle in ihren Benchmarks getestet und festgestellt, dass die Anzahl der gelösten Produktionsaufgaben dreimal so hoch war wie zuvor. Intuit hat festgestellt, dass Opus 4.7 sogar in der Planungsphase seine eigenen logischen Fehler finden, korrigieren und die Ausführung wiederholen kann und schließlich einen schnelleren und saubereren Code liefert.

Am Tag nach der Veröffentlichung von Opus 4.7 haben wir das „Claude Design“ im Anthropic-Labor vorgestellt, eines meiner Lieblingsprojekte dieses Jahres. Menschen beginnen bereits, Claude Design und Claude Code zusammenzusetzen, um produktionsreife Benutz

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

10 Wochen Arbeitsaufwand, der KI nur 4 Tage! Ganze Aufzeichnung der Anthropic-Pressemitteilung: Das komplexe Projekt, auf das du stolz bist, ist in den Augen des Modells nur ein Spielzeug.