Andrew Ng über "Ambient Programming": Lassen Sie sich nicht vom Namen täuschen, Programmieren mit KI ist nicht einfach.
Wichtige Punkte:
- Der Fortschritt in der KI wird nicht nur von der "Größe" getrieben. Die zukünftigen Antriebskräfte stammen aus der Erweiterung von Modellen, autonomen Workflows, Multimodalität und der Anwendung neuer Technologien, nicht von einem einzigen Weg.
- Andrew Ng ist der Meinung, dass die größte Hürde für die Anwendung von autonomen KI-Systemen nicht rein technischer Natur ist, sondern der Mangel an Fachkräften, die in der Lage sind, Fehleranalysen durchzuführen und die Entwicklung anhand von Bewertungen anzutreiben, sowie an Ingenieurkompetenzen.
- Derzeit sind die am besten etablierten und wirtschaftlich am wertvollsten erscheinenden Anwendungen von autonomen KI-Systemen KI-Programmierassistenten (z. B. Claude Code) und allgemeine Fragen-Antwort-Assistenten (z. B. ChatGPT).
- Angesichts der raschen Veränderungen in der KI haben Gründer mit einem tiefen technischen Verständnis und einer Intuition für Technologie einen Vorteil gegenüber Gründern, die nur über einen kommerziellen Hintergrund verfügen.
- Der Schlüssel zu guten Produktmanagern liegt in ihrer Fähigkeit, sich in die Kunden hineinversetzen zu können. Sie müssen in der Lage sein, Informationen aus verschiedenen Quellen zu integrieren, um ein Mentalmodel der Nutzer zu erstellen und daraus schnell Entscheidungen zu treffen.
- In den nächsten Jahren wird die KI die Arbeitsweise in allen Bereichen grundlegend verändern. Personen, die KI-Werkzeuge gut einsetzen können, werden ihre Produktivität und ihr Potenzial wie nie zuvor entfalten können.
Der bekannte Wissenschaftler und Professor an der Stanford University, Andrew Ng, war kürzlich Gast im Investment-Podcast "No Priors" und teilte seine tiefgehenden Einsichten in die zukünftige Entwicklung der KI-Fähigkeiten mit.
Andrew Ng ist ein Pionier in der KI-Branche. Er war Mitbegründer von Google Brain, der Online-Bildungsplattform Coursera und der Risikokapitalgesellschaft AI Fund. Kürzlich hat er das Konzept der "autonomen Künstlichen Intelligenz (Agentic AI)" eingeführt und ist in den Vorstand der Amazon.com e.V. eingetreten.
In einem neuesten Interview hat Andrew Ng darauf hingewiesen, dass der Antrieb für den Fortschritt in der KI von der Erweiterung von Modellen, autonomen Workflows, Multimodalmodellen und der Anwendung neuer Technologien in vielfältigen Wegen kommen wird, nicht von einer einzigen Abhängigkeit von der Größenexpansion. Er ist der Ansicht, dass die größte Hürde für die Umsetzung von Agenten derzeit nicht die Technologie selbst ist, sondern der Mangel an Fachkräften, die in der Lage sind, Fehleranalysen und Bewertungen durchzuführen.
Er hat auch betont, dass die KI das Startup-Paradigma neu formt: Die enorme Steigerung der Ingenieurleistung macht die Produktverwaltung zum neuen Engpass, und Gründer mit einem tiefen technischen Verständnis und einer Intuition für Technologie gewinnen erneut an Bedeutung.
Wenn man in die Zukunft blickt, ist Andrew Ng der Meinung, dass Personen und Teams, die KI-Werkzeuge gut einsetzen können, ein weitaus größeres Potenzial entfalten werden, als derzeit vorstellbar ist, und die Arbeitsweise in allen Branchen grundlegend verändern werden.
Im Folgenden finden Sie die wichtigsten Inhalte des neuesten Interviews mit Andrew Ng:
01 Der nächste Stopp in der Evolution der KI: "Mehrere Beine gehen"
Frage: Sie interessieren sich für so viele Bereiche. Vielleicht sollten wir mit der Kernfrage beginnen: Woher wird die Verbesserung der KI-Fähigkeiten in Zukunft kommen? Wird es von größeren Modellen oder effizienterer Datenverarbeitung abhängen?
Andrew Ng: Der zukünftige Fortschritt wird nicht nur aus einer einzigen Richtung kommen, sondern von mehreren Aspekten gemeinsam angetrieben. Wir können möglicherweise noch Potenzial in der Größenexpansion ausloten, aber es wird schwieriger als in der Vergangenheit. Die öffentliche Wahrnehmung der KI wird in hohem Maße von wenigen Unternehmen mit starken PR-Fähigkeiten beeinflusst. Wenn man an den Fortschritt in der KI denkt, denkt man oft zuerst an die "Größe".
Tatsächlich können echte Durchbrüche auch aus anderen Dimensionen kommen. Zum Beispiel gibt es viel Raum für autonome Workflows, die Gestaltungsweise von Multimodalmodellen und die Erkundung von Anwendungen. Darüber hinaus gibt es neue Technologien wie das Diffusionsmodell. Es wurde ursprünglich hauptsächlich für die Bildgenerierung verwendet, aber kann es in Zukunft auch auf die Textgenerierung erweitert werden? Diese Richtungen sind ebenfalls aufregend. Deshalb wird die Entwicklung der Künstlichen Intelligenz niemals von einem einzigen Weg abhängen.
Frage: Sie haben das Wort "autonome Künstliche Intelligenz (Agentic AI)" erstmals eingeführt. Was war Ihre Motivation?
Andrew Ng: Als ich beschloss, das Wort "autonome Künstliche Intelligenz" zu verwenden, gab es noch nicht viele Leute, die es so nannten. Mein Team hat mich sogar davon abgehalten, ein neues Wort zu erfinden. Aber ich habe es trotzdem verwendet, und ich war überrascht, dass es später wirklich populär wurde. Ich habe dieses Konzept eingeführt, weil es vor einigen Jahren oft zu Debatten kam: "Ist das ein Agent? Nein? Was ist eigentlich ein Agent?"
Meiner Meinung nach ist die Frage, ob etwas ein Agent ist, eine Frage des Grades: Einige haben eine starke Autonomie und können Pläne erstellen, mehrstufige Schlussfolgerungen ziehen und komplexe Aufgaben erledigen; andere sind stärker von menschlichen Hinweisen abhängig und haben eine schwächere Agenten-Eigenschaft. Anstatt sich mit der Definition zu beschäftigen, sollten wir anerkennen, dass verschiedene Systeme in unterschiedlichem Maße Agenten-Eigenschaften aufweisen. So können wir unsere Zeit und unsere Energie wirklich auf die Forschung und Entwicklung konzentrieren.
Also habe ich angefangen, das Wort "autonome Künstliche Intelligenz" zu verbreiten. Ich hatte nicht erwartet, dass viele Marketingmitarbeiter diesen Begriff schnell aufgegriffen und weitergeleitet haben. So ist das "autonome Künstliche Intelligenz" populär geworden. Der Hype auf dem Markt ist schneller als erwartet, und die echten Geschäftsentwicklungen dauern länger. Offensichtlich ist die Geschwindigkeit der Vermarktung schneller als die tatsächliche Entwicklung.
Frage: Was halten Sie für die größte Hürde bei der Realisierung echter Agentenanwendungen?
Andrew Ng: Wenn man die technischen Komponenten betrachtet, gibt es noch einige Bereiche, die verbessert werden müssen. Beispielsweise ist die Fähigkeit, Computer zu bedienen, in einigen Szenarien erfolgreich, aber die Fehlerrate ist immer noch nicht niedrig. Außerdem ist die Entwicklung von Schutzmechanismen und Bewertungssystemen, wie man Modelle effizient und systematisch bewerten und optimieren kann, immer noch eine große Herausforderung.
Ich denke jedoch, dass der größte Hindernis für die Umsetzung von autonomen KI-Systemen der Mangel an Fachkräften ist. Der Unterschied zwischen vielen Teams liegt nicht in der technischen Stapelung, sondern in der Fähigkeit, eine Bewertungsgetriebene Fehleranalyse durchzuführen. Erfahrene Teams zerlegen ständig Probleme, analysieren, was funktioniert und was nicht, und verbessern gezielt; unerfahrene Teams versuchen eher zufällig und machen weniger Fortschritte.
In der Realität könnten viele Unternehmensabläufe von Agenten automatisiert werden, aber aufgrund des Mangels an Fachkräften mit den erforderlichen Fähigkeiten und den passenden Werkzeugen ist es schwierig, diese Abläufe zu industrialisieren und zu skalieren. Die Erstellung von Agenten-Workflows erfordert oft die Integration von externem Wissen, das sich in den Köpfen der Menschen befindet. Wenn es in Zukunft keine KI geben sollte, die "Mitarbeiter interviewen" oder sogar "Bildschirme sehen" kann, wird es in den nächsten ein bis zwei Jahren immer noch erforderlich sein, dass menschliche Ingenieure intensiv beteiligt sind, um die Umsetzung der Workflows voranzutreiben.
Frage: Also ist der realistischere Weg derzeit immer noch, dass Menschen Daten sammeln, Feedbackschleifen aufbauen usw. Gibt es noch andere Herausforderungen?
Andrew Ng: Ja. Nehmen wir als Beispiel: Viele Unternehmen haben einen ähnlichen Prozess - ein Kunde sendet eine Datei, die zuerst in Text umgewandelt werden muss; dann muss möglicherweise aus Gründen der Compliance eine Netzwerksuche durchgeführt werden, um die Zuverlässigkeit des Lieferanten zu überprüfen; anschließend muss die Datenbank abgefragt werden, um den Preis zu bestätigen; und schließlich muss die Datei archiviert werden. Dies ist ein typischer Mehrzustands-Agenten-Workflow, der als nächste Generation der RPA (Robotic Process Automation) betrachtet werden kann.
Das Problem besteht darin, dass die Folgen eines Fehlers im Prozess möglicherweise sehr schwerwiegend sein können. Beispielsweise wird das Datum auf der Rechnung falsch extrahiert? Die Überprüfungsanfrage wird an die falsche Person gesendet? Es ist fast unmöglich, dass der Prozess von Anfang an perfekt funktioniert. Welche Fehler haben die größte Auswirkung auf das Geschäft? Beispielsweise: "Stört man den CEO zu oft? Welche Überprüfungen möchte er persönlich durchführen?" Diese Hintergrundurteile erfordern oft die Kontrolle eines erfahrenen Produktmanagers oder Ingenieurs. In Zukunft können Agenten diese komplexen Situationen möglicherweise unabhängig behandeln, aber zumindest derzeit ist es noch sehr schwierig.
Frage: Aber dieses Wissen existiert weder in den Internet-Vorhersagedaten noch kann es leicht aus Handbüchern extrahiert werden.
Andrew Ng: Ja. Die Erstellung von Agenten-Workflows hängt stark von proprietären Daten ab, nicht von dem allgemeinen Wissen im Internet. Dies macht den Prozess komplex und oft frustrierend, aber es ist auch eine echte Chance. Deshalb denke ich immer noch, dass es eine sehr lohnende und vielversprechende Arbeit ist.
02 Auf den Weg zum "Selbsthochfahren": Zwei Wege zur Selbstentwicklung der KI
Frage: Was ist aus Ihrer Sicht das beste Beispiel für eine autonome KI-Anwendung?
Andrew Ng: In diesem Bereich haben mich einige KI-Programmierassistenten sehr beeindruckt. Aus wirtschaftlicher Sicht gibt es derzeit zwei besonders prominenten Wege: Der eine ist die Frage-Antwort-Anwendung, wie beispielsweise OpenAI's ChatGPT, das offensichtlich zum Marktführer geworden ist und ein echtes Hochgeschwindigkeitswachstum aufweist; der andere ist der Programmierhilfs-Agent.
Mein persönlicher Favorit ist Claude Code. Es zeigt eine starke Autonomie in der Planungskapazität und kann verstehen, was die Zielsoftware ist, eine Aufgabenliste erstellen und die Ausführung schrittweise durchführen. Diese Fähigkeit, mehrstufige Aufgaben zu planen und nach einem Plan umzusetzen, macht es zu einem der wenigen Agenten, die derzeit wirklich autonom sind und in der Praxis eingesetzt werden können.
Natürlich gibt es auch einige Richtungen, die ich für noch nicht ausgereift halte, wie beispielsweise bestimmte "Computer-Nutzungsszenarien" - wie Online-Shopping, Webbrowsing usw. Diese Anwendungen funktionieren zwar in der Demonstration gut, aber es ist noch ein weiter Weg bis zur tatsächlichen Massenproduktion.
Frage: Was halten Sie für die Ursache für diesen Unterschied? Ist es, dass die Aufgabenstandards nicht klar definiert sind und die Operationen zu viel Variabilität aufweisen? Oder gibt es bei Programmier-Szenarien bessere Trainingsdaten oder klarere Ausgabespezifikationen?
Andrew Ng: Ich denke, es gibt hauptsächlich zwei Gründe: Einerseits sind Ingenieure von Natur aus gut darin, komplexe Systeme zum Laufen zu bringen; andererseits ist der wirtschaftliche Wert von Programmierassistenten äußerst direkt und enorm. Dies zieht viele intelligente Menschen an, die sowohl Benutzer als auch natürliche Intuition für das Produkt haben, und treibt so die schnelle Entwicklung in dieser Richtung voran.
Frage: Wann glauben Sie, dass Modelle effektiv "selbsthochfahren" können (bootstrapping)? Beispielsweise, kann ein Codierungs-Agent selbst den Code für ein Modell schreiben?
Andrew Ng: Ich denke, wir nähern uns diesem Ziel schrittweise. Tatsächlich haben einige führende Basis-Modell-Unternehmen öffentlich erklärt, dass sie in großem Umfang KI zur Unterstützung bei der Codeerstellung einsetzen.
Was mich ebenfalls aufregt, ist eine andere Richtung: Die Nutzung von Agenten-Workflows, um Trainingsdaten für die nächste Generation von Modellen zu generieren. Beispielsweise wird in der Forschungsarbeit zu Llama erwähnt, dass die ältere Version von Llama durch "langes Nachdenken" komplexe Aufgaben generieren kann, und diese Aufgaben können dann verwendet werden, um die neuere Version von Llama schneller zur Lösung zu bringen. Dieser Ansatz ist sehr interessant. Dies zeigt erneut, dass der Fortschritt in der KI niemals von einem einzigen Weg abhängt, sondern von unzähligen intelligenten Menschen aus verschiedenen Perspektiven gleichzeitig vorangetrieben wird.
Frage: Ich erinnere mich, dass Sie früher die Bezeichnung "vibe coding" nicht so gerne verwendet haben und stattdessen lieber "KI-unterstützte Programmierung" bevorzugten. Was ist der Unterschied zwischen diesen beiden?
Andrew Ng: Ja. "Vibe coding" klingt so, als müsste ich mich nur entspannen und alle von der KI vorgeschlagenen Änderungen akzeptieren. Manchmal funktioniert das auch, aber es ist kein vollständiges Bild. Tatsächlich ist die Programmierung für mich eine anstrengende geistige Arbeit, wenn ich einen halben Tag oder sogar einen ganzen Tag damit verbringe. Ehrlich gesagt, bin ich oft sehr müde, nachdem ich einen ganzen Tag mit KI-unterstützter Programmierung verbracht habe.
Deshalb bevorzuge ich die Bezeichnung "schnelle Ingenieurarbeit". Die KI kann uns wirklich helfen, ernsthafte Systeme und reife Produkte in einer viel höheren Geschwindigkeit zu entwickeln als bisher, aber im Wesentlichen bleibt es eine solide Ingenieurarbeit - nur wird sie schneller erledigt.
03 Die Effizienzrevolution in der KI: 2 Personen + Wochenende = 6 Ingenieure + drei Monate
Frage: Glauben Sie, dass dies das Wesen von Startups verändert? Zum Beispiel, wie viele Personen benötigt ein Team, wie sollte ein Produkt aufgebaut werden und wie sollte der Prozess gestaltet werden? Oder bleibt die grundlegende Methode des Startens eines Unternehmens gleich, nur haben die Leute jetzt stärkere Werkzeuge und sind effizienter?
Andrew Ng: Aus meiner Erfahrung als Startup-Beteiligter und Beobachter der Branche verändert die schnelle Ingenieurarbeit und die KI-unterstützte Programmierung tatsächlich die Art und Weise, wie wir Unternehmen gründen. Das ist sehr aufregend. Eine Aufgabe, die in der Vergangenheit vielleicht