10.000-Wortige Präsentation des Chief Product Officers von Anthropic: Warum ist die Entwicklung eines "Phänomenprodukts" in der Ära der Künstlichen Intelligenz so schwierig?

In der Ära der Künstlichen Intelligenz ist es schwierig, Abstraktionen vorzunehmen.

Mike Krieger, Mitbegründer von Instagram und Chefproduktmanager von Anthropic, hat mit Claude in nur zwei Stunden das Produkt neu aufgebaut, das er einst ein ganzes Jahr lang entwickelt hat. Nicht nur ist es funktionsfähig, sondern es verfügt sogar über einige zusätzliche Bildfilter.

Dies an sich ist nicht wichtig. Wichtig ist, wie Sie wissen, ob Sie das Richtige tun. Mike hat viele Teams gesehen, die in der Welle der AI-Beschleunigung immer schneller laufen, die Funktionen immer mehr stapeln, aber das Produkt immer unhandlicher wird und schließlich Dinge herstellen, die die Nutzer überhaupt nicht brauchen und nur Schönheit ohne Substanz haben.

Deshalb fragt Mike in der Podcast-Serie "AI & I" immer wieder: Warum gibt es in der Zeit der AI-beschleunigten Entwicklung immer noch keine phänomenalen Produkte?

Er lenkt das Problem auf die "Effizienzillusion", die durch "Vibe Coding" (Stimmungsprogrammierung) entsteht. Die von der AI bewirkte Effizienzexplosion macht es den Entwicklern stattdessen schwieriger, eine realistische Einschätzung des Produkts zu entwickeln: Was sollte behalten werden, was sollte entfernt werden und wann sollte man von vorne anfangen.

Wenn das Schreiben von Code so einfach wird wie das Essen, werden immer mehr Produkte zu sorgfältig gepflegten "Gewächshausbäumen". Sie scheinen buschig zu sein, haben aber nie die Stürme der Nutzerrückmeldungen überstanden und sind daher sehr empfindlich.

Mikes Lösung besteht darin, entschlossener "von vorne zu beginnen", das Produkt früher in die reale Welt zu bringen, um es den Stürmen auszusetzen, und sich auf ein echtes "Agent-native" Design zu konzentrieren. Das bedeutet, dass die Software nicht mehr ein kalter Befehlstool ist, sondern ein kollaboratives Partner, das die unterliegenden Funktionen autonom nutzen und die Absichten der Nutzer wirklich verstehen kann.

Was bedeutet ein "Agent-native" Produkt überhaupt? Wie sollte ein Team in der AI-Zeit aufgebaut werden? Und warum sind "Neustart" und "Frühe Veröffentlichung" die derzeit am meisten unterschätzten Produktmethoden? Die Antworten finden Sie in dem folgenden Gespräch.

Teilnehmer des Gesprächs:

Dan Shipper: CEO des AI-Medienlabors Every und Moderator der Podcast-Serie "AI & I"

Mike Krieger: Mitbegründer von Instagram, Chefproduktmanager (CPO) von Anthropic und einer der Leiter von Anthropic Labs

Bildquelle: Screenshot aus "AI & I"

Das folgende ist der vollständige Text des Gesprächs (übersetzt):

Funktionsüberlastung unter der Effizienzillusion in der AI-Zeit

Dan Shipper: Wie wir vor der Aufnahme gesprochen haben, hat sich die unterliegende Infrastruktur oder der gesamte Entwicklungsprozess unserer Produkte stark verändert. Was ist in der Produktentwicklung leichter geworden, was ist schwieriger geworden oder bleibt möglicherweise unverändert? Erzählen Sie mir von Ihren gegenwärtigen Erfahrungen im Vergleich zu Ihren frühen Tagen bei Anthropic oder Instagram. Was hat sich verändert?

Mike Krieger: Wir kennen alle die Geschichte von Instagram. Damals hatten wir ein anderes Produkt namens Burbn, an dem wir ein Jahr lang arbeiteten, aber es funktionierte nicht. Erst später haben wir uns auf Instagram umgestellt. Die Entwicklung und Veröffentlichung von Instagram dauerte nur etwa drei Monate.

Ich frage mich, was heute unbedeutend ist und was in der Entwicklungsprozesse im Wesentlichen nicht leichter geworden ist. In jenem Jahr hätten wir die Sackgassen früher entdecken können, aber der Prozess an sich war auch wertvoll. Beispielsweise haben wir das Produkt am Anfang zu komplex gestaltet und mussten es später vereinfachen.

Ich habe festgestellt, dass selbst heute die Modelle sehr gut darin sind, Funktionen hinzuzufügen, aber nicht unbedingt darin, zu verstehen, was aus dem Produkt entfernt werden sollte. Denn das erfordert viel praktische Erfahrung in der realen Welt.

Der gegenwärtige Prozess besteht darin, Schritt für Schritt Dinge hinzuzufügen.

Heute können Sie, insbesondere bei den Dingen, die wir im Labor entwickeln, in wenigen Stunden von 0 auf 1 oder sogar von 0 auf N kommen. Aber in diesem Prozess trifft das Modell viele Entscheidungen selbst. Selbst wenn Sie es auffordern können, Nachfolgeaktionen und Rückmeldungen zu geben, braucht der Entwickler Zeit, um die Intuition dafür zu entwickeln, welche Funktionen notwendig sind und welche wegfallen können.

Deshalb frage ich mich immer wieder, warum es in der Zeit der AI-beschleunigten Entwicklung immer noch keine phänomenalen Produkte gibt.

Ich denke, ein Teil des Grundes liegt darin, dass, obwohl die AI die Effizienz erhöhen kann, es immer noch Zeit braucht, um zu verstehen, welche Art von Intervention Sie in die Welt einbringen möchten, und auf dieser Grundlage zu entwickeln. Sobald Sie wissen, was Sie bauen möchten, wird der eigentliche Bauvorgang tatsächlich viel einfacher. Ich habe Claude angewiesen, Burbn neu zu entwickeln, und es hat nur etwa zwei Stunden gedauert, bis es funktionsfähig war. Es hat auch Filter hinzugefügt, die Burbn damals nicht hatte und die wir später für Instagram entwickelt haben. Claude hat die endgültige Richtung des Produkts vorausgesehen und die Filter daher bereits integriert.

Ich erinnere mich, dass mein Partner Kevin eine Woche lang alle Filter für die erste Version von Instagram entwickelt hat, während ich den Rest der App aufgebaut habe. Damals habe ich oft bis 4 Uhr morgens wachgeblieben und dann bis Mittag geschlafen. Das war meine Tagesroutine.

In diesem Prozess treffen Sie viele Entscheidungen, beispielsweise wie die Standortfunktion funktionieren sollte. Wir müssen eine Methode finden, die sowohl die Entwicklung beschleunigt als auch den Menschen hilft, diese Entscheidungen zu verstehen. Andernfalls erhalten Sie entweder sehr durchschnittliche Produkte, die kaum eine Chance haben, sich durchzusetzen, oder Produkte, die Ihre tiefere Einsicht in das Gebiet oder das Produkt nicht widerspiegeln.

Die "Gewächshausbäume" durch Vibe Coding

Dan Shipper: Das bringt mich auf zwei Dinge. Erstens habe ich immer einen Gedanken im Kopf: Wenn Sie einen Baum im Innenraum pflanzen und ihn nicht dem Wind aussetzen, wird er nicht so stark werden. Denn im Wachstumsprozess braucht er diese äußeren Kräfte, um ein echter Baum zu werden. Wenn Sie ihn in einer windstillen Umgebung im Innenraum pflanzen, können Sie zwar einen Baum züchten, aber er wird geneigt und sehr empfindlich sein, ganz anders als ein Baum in freier Natur.

Ich denke, dass das auch für das, was Sie beschreiben, zutrifft.

Unsere heutige Entwicklungsgeschwindigkeit ist sehr hoch. Der ursprüngliche inkrementelle Prozess, bei dem man Schritt für Schritt etwas macht und dann von den Nutzern Rückmeldungen erhält, kann jetzt ersetzt werden, indem man einfach einen kompletten Baum "im Innenraum pflanzt". Sie haben ein komplettes Ding, aber jedes einzelne Schritt hat nicht die gleiche Intuition und Erfahrung hinter sich, die für die Schaffung eines großartigen Produkts notwendig sind.

Mike Krieger: Ich mag auch diese Metapher sehr. Als wir angefangen haben, an Instagram zu arbeiten, waren wir sehr fasziniert von Eric Ries (Schöpfer der Lean Startup-Methodik) und der Lean Startup-Philosophie sowie dem gesamten YAGNI-Prinzip (You Ain't Gonna Need It, Sie werden es später nicht brauchen, d.h. "nicht überdesignen").

Aber ich habe festgestellt, dass in einem Projekt, das wir kürzlich im Labor entwickelt haben, wir die V1-Version übermäßig entwickelt haben, bevor wir mit den frühen Tests (Early Access) begannen. Sie denken: "Oh, wenn es diese Option gibt, warum fügen wir das nicht auch hinzu?" Das ist nur die Arbeit eines PR (Pull Request, Merge-Anfrage). Wenn Sie also in Claude Code einen sehr guten Prozess gefunden haben, geben Sie den Befehl, gehen zum Mittagessen und kommen zurück, wenn es fertig ist. Sie denken: "Toll, wir haben es hinzugefügt."

Aber wir haben festgestellt, dass wir zwar eine Funktionsmatrix geschaffen haben, aber es vor der Veröffentlichung schwierig ist, sie zu testen und zu warten, und es ist sogar schwierig, es neuen Nutzern zu erklären. Eine andere Metapher, die mir jemand gegeben hat, gefällt mir auch sehr: Es ist wie "die Charaktere einer Fernsehserie Episode für Episode kennen zu lernen". Im Vergleich dazu, "wenn Sie plötzlich in die letzte Episode geworfen werden", denken Sie: "Warte mal, was machen diese Dinge? Wer sind diese Leute? Ich werde erwartet, dass ich bereits alle Hintergrundinformationen habe."

Ich habe das gleiche Gefühl, wenn ich an etwas langfristig arbeite. Aber ich denke, die Baum-Metapher ist auch sehr passend. Ein vollständig gewachsener Baum zu zeigen, bringt einfach zu viel Information mit sich. Da gibt es sicherlich etwas dran. Heute ist es wichtig, wie Sie ein Produkt entwickeln und es einfach halten, und nicht, dass Sie alles, was Sie "können", in die erste Version packen.

Dan Shipper: Ich habe das gleiche Problem. Gestern bin ich bis 4 Uhr morgens aufgeblieben, um eine App namens Proof, die ich spontan in Every entwickelt habe, zu debuggen und zu reparieren. Es ist ein "Agent-native" kollaborativer Marketing-Editor, mit dem Sie Planungsdokumente usw. schnell mit Ihrem Team oder anderen Agenten teilen können.

Dies ist meine zweite oder dritte Iteration des gesamten Produkts von Anfang bis Ende. Es ist wirklich interessant, dass das heute möglich ist. Aber in den vorherigen Iterationen habe ich festgestellt, dass ich mich so sehr in das Vibe Coding (Stimmungsprogrammierung: Entwickler schreiben keine konkreten Codezeilen mehr, sondern treiben die AI dazu an, die gesamte App zu generieren, indem sie "Absichten vermitteln, Stimmung einstellen und Gefühle beschreiben") verliebt habe, dass ich dachte: "Ja, ich will das machen und auch das." Am Ende habe ich ein unhandliches Ungeheuer geschaffen.

Später habe ich mich von unserem anderen Produkt, Monologue, inspirieren lassen. Ich bin nicht sicher, ob Sie es kennen. Es ist eine sehr einfache Spracherkennungs-App, die von GM Naveen betrieben wird. Es konzentriert sich darauf, eine einfache Sache sehr gut zu machen. Hier habe ich gesehen, wie effektiv etwas sein kann, das äußerst raffiniert ist und seinen Zweck perfekt erfüllt, in dieser Zeit, in der jeder Produkte entwickeln kann.

Also habe ich das alte Produkt weggeworfen und eine sehr einfache Version neu entwickelt, die nur ein teilsames Markdown-Link ist. Dann hat das Produkt innerhalb von Every wie wild verbreitet sich, und jeder benutzt es ständig.

Jetzt haben wir es veröffentlicht, und es ist ein Riesenhit. Deshalb habe ich letzte Nacht die ganze Zeit wachgelegen, um es zu reparieren, und dachte: "Ich bin zu alt für das Zeug, ich kann das nicht mehr so machen." Das bringt mich an die Zeit zurück, als ich in meinen 20ern oder noch in der Universität war und mich mit Technologie und Entwicklung beschäftigt habe. Es war interessant, aber auch anstrengend. Jetzt ist alles möglich, und ich habe festgestellt, dass ich meinen Mentalitätszustand wirklich anpassen muss. Wie gehen Sie mit diesem Problem um?

Es lohnt sich, ein paar Tage lang von vorne anzufangen, anstatt zu reparieren

Mike Krieger: Übrigens erinnere ich mich, dass unser größter Fehler bei der Entwicklung von Burbn war, dass wir im Laufe der Zeit immer mehr Funktionen hinzugefügt haben, anstatt sie zu entfernen. Sie denken: Mit acht Funktionen kann man kein gutes Produkt machen, vielleicht mit der neunten. Aber genau das Gegenteil ist der Fall. Es macht das Produkt nur immer komplexer.

Ich denke, es gibt zwei Aspekte, um dieses Problem zu lösen. Erstens sind wir heute eher bereit, von vorne anzufangen. Laut der klassischen Theorie, wie Fred Brooks in "The Mythical Man-Month" erwähnt hat, sollten Sie Software nicht neu schreiben, weil Sie so alle Essenz der V1-Version zerstören würden, und es gibt das sogenannte "Second System Syndrome".

Bildquelle von "The Mythical Man-Month": addictbooks

Diese Theorien sind heute immer noch sehr sinnvoll, aber der Unterschied ist, dass die Modelle jetzt Ihnen helfen können, den Code zu vergleichen (Diff), und im Wesentlichen können sie Ihnen helfen, zu überprüfen, ob Sie etwas aus der ersten Version vergessen haben. Zweitens ist es nicht mehr ein einjähriger Neuaufbauplan, der ein Unternehmen untergraben könnte, wie beispielsweise die berühmte Netscape-Neuauflage. Heute dauert ein Neuaufbau nur etwa ein paar Tage, insbesondere wenn Sie auf dem bestehenden Quellcode aufbauen.

Wir haben tatsächlich mehrere Projekte, bei denen wir zunächst eine vollständige Version gebaut haben, aber als wir feststellten, dass wir es zu komplex gemacht haben oder einige Kernannahmen falsch getroffen haben, haben wir direkt die V2 von vorne begonnen und darauf aufgebaut. Natürlich machen wir das normalerweise vor der Veröffentlichung.

Sie denken nicht: "Oh, mein Gott, ich habe ein Jahr lang vergeblich gearbeitet", sondern: "Oh, das war letzte Woche, diese Woche kann ich es neu machen und viele unnötige Dinge entfernen."

Funktionsmäßig und vom Produktentwicklungsprozess her lernen wir, früher zu veröffentlichen. Wir haben eine starke Unternehmenskundschaft, und die Menschen haben Erwartungen an die erste Version.

Aber wir dürfen nicht davon ausgehen, dass wir vor der Veröffentlichung jedes einzelne Kopplungselement oder jede Funktion kennen, die das Produkt haben muss. Stattdessen müssen wir auf die Rückmeldungen der Nutzer vertrauen. Wir haben eine Gruppe von starken internen Testern, die wir "Ant foodters" nennen (Anmerkung des Übersetzers: In der Tech-Szene gibt es den berühmten Begriff "Dogfooding", was bedeutet, dass ein Unternehmen sein eigenes Produkt intern testet. Die Mitarbeiter von Anthropic nennen sich "Ants", also nennen sie ihre interne Tests "Antfooding", d.h. "Ameisenfutter essen"). Wir können zunächst interne Tests und Rückmeldungen durchführen. Aber bis das Produkt wirklich in die reale Welt kommt, kann das nur so weit bringen.

Nehmen wir Co-worker als Beispiel. Wir haben dieses Produkt schon lange entwickelt. Sobald wir beschließen, es zu veröffentlichen, bauen wir eine V1-Version, die das Problem auf die einfachste Weise löst, und bringen es innerhalb von 10 Tagen auf den Markt. Das ist eine gute Motivation, uns bewusst zu machen, dass die V1 zwar noch 100 Funktionen haben könnte, aber es derzeit nicht tut. Es muss nur genug nützlich sein, um etwas zu beweisen. Ich bin nicht sicher, ob es nützlicher wäre, es noch zwei Monate zu entwickeln und 50 Funktionen hinzuzufügen.

Tatsächlich können wir dort einen "Gewächshausbaum" bauen, aber sobald es in die reale Welt kommt, werden die Nutzer sagen

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

10.000-Wortige Präsentation des Chief Product Officers von Anthropic: Warum ist es so schwierig, ein "Phänomenprodukt" in der Ära der Künstlichen Intelligenz zu entwickeln?

Funktionsüberlastung unter der Effizienzillusion in der AI-Zeit

Die "Gewächshausbäume" durch Vibe Coding

Es lohnt sich, ein paar Tage lang von vorne anzufangen, anstatt zu reparieren