Signale von Andrew Ng: Chinas KI - Die Chance liegt in der Ausführungsberechtigung, nicht im Modell

Die Schwierigkeit bei der Kommerzialisierung von Agenten liegt nicht nur in der Leistungsfähigkeit der Modelle, sondern auch darin, ob Unternehmen bereit sind, einen Teil ihrer operativen Ausführungsbefugnisse an KI zu übertragen.

Urteil: Wenn KI von der Beantwortung von Fragen zum Erledigen von Aufgaben für Menschen übergeht, liegt die eigentliche kommerzielle Schwierigkeit nicht mehr nur in der Auswahl des Modells, sondern darin, ob Unternehmen es wagen, einen Teil ihrer Geschäftsprozesse an sie zu übergeben.

Andrew Ng hat in seinem Buch einen Schlüsselpunkt aufgezeigt: Bei der Verbesserung von KI-Systemen ist es besser, zuerst zu verstehen, wann und warum das System fehlschlägt und wo man anfangen sollte, es zu verbessern, anstatt ständig das Modell zu wechseln. Dieser Ansatz hat in der Vergangenheit die Optimierung von Bilderkennung und Suchsortierung geleitet.

Heute, wenn wir über Agenten sprechen, hat die Bedeutung dieser Logik sich geändert: Wenn die Aufgabe der KI von „Fragen beantworten“ zu „Aufgaben für Menschen erledigen“ wird, ändert sich auch das Maßstab von der Modellbewertung zu der Frage, ob Unternehmen es wagen, ihr Aufgaben zu übertragen und wer für die Fehler verantwortlich ist, wenn etwas schief geht.

Dies ist die Essenz, die chinesischen KI-Unternehmer hinter der aktuellen Agenten-Welle am besten verstehen sollten.

Unter der Oberfläche liegt die neue Ausführungsgewalt

In den letzten Jahrzehnten war die Logik von Unternehmenssoftware immer „Mensch bedient das System“. Unabhängig davon, ob es sich um CRM, Finanzsysteme oder Code-Repositories handelt, beschränkt sich die Software auf die Aufzeichnung, Normierung und Archivierung. Die Entscheidungen, Bestätigungen und die Verantwortung liegen immer beim Menschen.

Die tiefgreifende Veränderung, die Agenten bringen, besteht darin, dass die Software versucht, von der „Aufzeichnung, was Sie getan haben“ zur „Erledigung eines Teils Ihrer Aufgaben“ zu wechseln. Dies ist weit mehr als nur die Umwandlung von Buttons in Dialogfelder. Der Kern ist eine Übertragung von Macht – was wir die Ausführungsgewalt nennen.

Das bedeutet, dass das System beginnt, Geschäftsprozesse zu übernehmen, voranzutreiben und sogar abzuschließen, die ursprünglich nur von Menschen ausgeführt werden konnten: Ein neuer Kundenbeleg erstellen, eine Zahlungsgenehmigung initiieren, eine externe E-Mail senden, eine Codeänderung einreichen. Sobald die Aktionen die Grenze der „Empfehlung“ überschreiten und in den Bereich der „Ausführung“ gelangen, hängt der Erfolg nicht mehr von der Qualität des Modells ab, sondern von den Regeln in der Firma, die bestimmen, wer die Macht hat, wer genehmigen muss und wer die Konsequenzen trägt.

Andrew Ngs jüngste Diskussionen über Agenten-Arbeitsabläufe, Kontextzentren und Programmieragenten haben genau diese Signalwirkung. Der Fokus des Wettbewerbs verschiebt sich langsam von „wer schön reden kann“ zu „wer die Aufgabe aufteilen, Werkzeuge einsetzen, die Ergebnisse überprüfen, bis zur Fertigstellung iterieren kann und der gesamte Prozess nachvollziehbar, überprüfbar und im Falle eines Fehlers jemand in Verantwortung genommen werden kann“.

Ob eine einzelne Aufgabe gut erledigt wird, liegt in der Verantwortung des Modells; ob ein Prozess vollständig abgeschlossen werden kann, ist eine geschäftliche Angelegenheit. Das erste beantwortet die Frage „kann es getan werden“, das zweite muss die Frage beantworten „wird die Firma die Aufgabe akzeptieren, nachdem sie erledigt ist“.

Die Ausführungsgewalt wird von Unternehmen nicht leichtfertig übertragen

Hinter jeder kleinen Aktion in einem Unternehmen steckt ein Regelwerk: Wer hat die Berechtigung für diese Aufgabe, worauf basiert die Entscheidung, wer muss genehmigen, ist die Aktion protokolliert und wer trägt die Verantwortung. Dies ist die unterliegende Logik des Betriebs eines Unternehmens.

Viele Agentenprodukte stoßen hier an ihre Grenzen. Sie können Lösungen entwickeln, aber den Prozess nicht vorantreiben; sie können Informationen zusammenfassen, aber das System nicht steuern; sie können Code schreiben, aber das interne Regelwerk des Unternehmens nicht verstehen; sie können Fragen zu Vorschriften beantworten, aber nicht wissen, ob die Vorschriften geändert wurden; sie können Empfehlungen geben, aber bei Problemen keine Verantwortung übernehmen.

Das Problem liegt oft nicht darin, dass das Modell nicht intelligent genug ist, sondern dass der Agent überhaupt nicht weiß, wie die internen Prozesse eines Unternehmens funktionieren. Er weiß nicht, welche interne Schnittstelle geändert wurde, was für Datenfelder nicht berührt werden dürfen, an welchem Punkt die Zustimmung eines Vorgesetzten erforderlich ist, ob diese Kundeninformationen versendet werden dürfen und wie man im Falle eines Fehlers rückgängig machen, reparieren und die Verantwortung zuweisen kann.

Andrew Ng hat Programmieragenten als Beispiel genommen und darauf hingewiesen, dass sie aufgrund fehlender aktueller und genauer API-Dokumentation „raten“ und fehlerhaft aufrufen. Für Agenten, die in Unternehmen arbeiten sollen, ist dieses Problem noch fataler: Sie müssen mit den Systemen verschiedener Abteilungen, komplexen Genehmigungsregeln, historischen Daten und einer Vielzahl interner Vorschriften umgehen. Für die arbeitenden Agenten ist genaue Information nicht nur Referenzmaterial, sondern das „Bauprojekt“, anhand dessen sie arbeiten können. Ohne dieses Projekt ist die Ausführungsgewalt nicht möglich.

Derjenige, der das Budget genehmigen kann, ist die „Kontrollschicht“, nicht das Chatfenster

Dies weist auf eine grundlegendere und vielleicht weniger aufsehenerregende Möglichkeit hin: die Schaffung einer internen Kontrollschicht in Unternehmen. Die verstreuten Wissensbestände, Regelwerke, Bedienungsanleitungen, API-Dokumentationen, Berechtigungssysteme und Geschäftssysteme müssen alle miteinander verbunden und verwaltet werden, so dass sie für Agenten ein Handlungsleitfaden werden, den sie verstehen müssen und den sie unter keinen Umständen überschreiten dürfen.

Frühere Wissensbestände haben das Problem „der Mensch kann es finden“ gelöst, während die Kontrollschicht in der Agenten-Ära das Problem lösen muss: „Die KI kann auf der Grundlage richtiger Informationen arbeiten und kann nachträglich erklären, warum sie so gehandelt hat, welche Ressourcen sie verwendet hat und ob sie die Grenzen überschritten hat.“

Die Kontextschicht löst das Problem „wissen, was man tun muss“, die Kontrollschicht löst das Problem „bis wohin man es darf“.

Ein Unternehmen wird nicht leichtfertig etwas, das gut chatten kann, in den Kernprozess einfügen, aber es könnte für ein System bezahlen, das den Kontext, die Berechtigungen, die Schnittstellen und die Betriebsprotokolle kontrollieren kann. Diese Fähigkeit mag nicht so spannend zu erzählen sein, aber es ist einfacher, dass die Kunden das Budget genehmigen und den Zahlungsprozess durchführen.

Die Agenten an der Vorderseite mögen cool sein, aber die „Verbindungs-Kontroll-Audit“-Kette, die Agenten in Unternehmen sicher und konform funktionieren lässt, wird möglicherweise früher echte Einnahmen generieren.

Die Essenz des Prozesses ist die Verantwortungskette, nicht der Dialogfluss

Um einen Wert zu schaffen, müssen Agenten in reale Systeme wie ERP, CRM, OA, Finanz- und Lieferketten integriert werden können. Dieser Weg klingt nicht so aufregend, aber es ist wahrscheinlicher, dass die Kunden dafür bezahlen, als wenn man einen neuen Chat-Eingang schafft.

Ein Vertriebs-Agent, der nur Gesprächsabläufe generieren kann, hat nur einen begrenzten Wert; wenn er die Kundenphasen aus dem CRM lesen, das Angebotsystem automatisch aufrufen, To-Do-Aufgaben generieren und in das System zurückschreiben kann, hat er den Vertriebsprozess erst abgeschlossen.

Ein Finanz-Agent, der nur Vorschriften erklären kann, hat nur einen begrenzten Wert; wenn er automatisch Rechnungen und Verträge vergleichen, bei Abweichungen automatisch eine Warnung auslösen, den Genehmigungsprozess starten und Auditspuren hinterlassen kann, hat er den Finanzprozess erst abgeschlossen.

Ein Kundenservice-Agent, der nur Fragen beantworten kann, ersetzt nur den Wissensbestand; wenn er automatisch Fragen beurteilen, Bestellungen prüfen, Berechtigungen überprüfen, Tickets erstellen oder weiterleiten kann, hat er den Kundenserviceprozess erst abgeschlossen.

Sein Wert kommt nicht von der Ähnlichkeit mit einem Menschen, sondern davon, ob er ein zuverlässiger Bestandteil des Unternehmens werden kann. „Zuverlässig“ bedeutet: Wissen, was man tun kann und was nicht, alle Aktionen protokollieren, im Falle eines Fehlers zurückverfolgen und rückgängig machen können.

Deshalb werden die ersten Agenten, die tatsächlich verkauft werden können, wahrscheinlich aus sehr spezifischen Geschäftsprozessen stammen: der Kundenbetreuungsprozess von Außenhandelsverkäufern, die Online-Kundenschlichtung in Filialen, die Gerätewarnung und Auftragsvergabe in Fabriken, die interne Compliance-Abfrage in Finanzinstituten, der interne Code-Assistent in Entwicklungsteams. Sie haben keine grandiose Geschichte über „allgemeine Intelligenz“, aber es ist wahrscheinlicher, dass sie Einnahmen generieren. Noch wichtiger ist, dass sie leichter an ähnliche Kunden verkauft werden können.

Die Spezialisierung bedeutet nicht, den Markt zu verkleinern, sondern zuerst die Zahlen zu klären: Wen man tatsächlich bedient, welche Aufgaben man erledigt und wie hoch die Kosten pro Aufgabe sind. Erst wenn ein Unternehmen in derselben Situation zehn Kunden nacheinander gewinnen kann und die Implementierungskosten pro Kunde immer niedriger werden, ist die Skalierbarkeit in Sicht.

Wenn jeder Kunde von Grund auf angepasst, das System neu angebunden und die Akzeptanzkriterien neu definiert werden müssen, wird das Geschäft zu aufwändig.

Die Zukunft von Programmieragenten: Nicht nur Code schreiben

Andrew Ng hat gesagt, dass Programmieragenten die Geschwindigkeit von verschiedenen Entwicklungsprojekten sehr unterschiedlich beschleunigen können. In China ist dies noch deutlicher, da viele wertvolle Dinge in den privaten Code-Repositories, internen Komponenten, veralteten Dokumenten, alten Bugs und alten Systemen von Unternehmen versteckt sind, nicht auf der öffentlichen GitHub-Plattform.

Deshalb liegt die Chance für chinesische Programmieragenten nicht nur darin, Programmierern beim Schreiben von Code zu helfen, sondern auch darin, in die tatsächlichen Entwicklungsprozesse von Unternehmen einzudringen: Sie müssen interne Code und Abhängigkeiten verstehen, Probleme anhand von historischen Tickets analysieren, bei der Schreibung von Tests helfen, protokollieren, wer was geändert hat und sicherstellen, dass sensible Code nicht ausgeleakt wird.

Ein Agent, der nur Code schreiben kann, wird möglicherweise nicht von den Kunden akzeptiert; ein Agent, der die Wiederholungsarbeit reduzieren, die Testarbeit verringern, das alte Code des Teams ordnen und sicherstellen kann, dass alles im sicheren Rahmen läuft, hat eine höhere Wahrscheinlichkeit, in die Einkaufsliste aufgenommen zu werden. Der Unterschied zwischen den beiden liegt wieder in diesen vier Worten: Integration in den Geschäftsprozess.

AgentOps ist keine Wartung, sondern Ausführungssteuerung

Sobald Agenten tatsächlich für Menschen arbeiten, werden die Kunden sofort fragen: Was hat es getan? Warum hat es so gehandelt? Welches Werkzeug hat es aufgerufen? Hat es sich ungebührlich verhalten? Kann man es rückgängig machen, wenn es etwas falsch gemacht hat? Ist die Aktion protokolliert? Wer hat es angewiesen? Wem wurden die Ergebnisse übermittelt?

Obwohl diese Fragen scheinbar Wartungsfragen sind, handelt es sich in Wirklichkeit um Fragen der Kontrollgewalt. Die traditionelle Wartung dient dazu, sicherzustellen, dass das System nicht abstürzt, während die Wartung von Agenten darauf abzielt, sicherzustellen, dass sie nicht über ihre Befugnisse hinausgehen und nicht außer Kontrolle geraten. Dies ist keine zusätzliche Funktion, sondern eine Vorbedingung für die Inbetriebnahme von Agenten.

In Bereichen wie Finanzen, Verwaltung und Medizin können Agenten, die keine strengen Berechtigungssteuerungen, Betriebsprotokolle, Auditverfolgungen und Rückgängigmachmechanismen haben, nur für Demonstrationen verwendet werden. Nur Agenten, die überwacht, kontrolliert werden können und bei Problemen sofort abgeschaltet werden können, haben die Chance, tatsächlich eingesetzt zu werden.

Von Produkt zu Unternehmen: Die Hürde der Kommerzialisierung

Nach der Agenten-Welle werden die Investoren nicht nur darauf achten, ob ein Projekt über Agenten verfügt. Sie werden praktischere Fragen stellen: In welchem spezifischen Bereich eines Unternehmens wird es eingesetzt? Wer entscheidet über die Finanzierung? Wie misst man den Erfolg? Kann es wirklich Personal sparen? Wird es als Projekt, Jahresabonnement oder nach Verbrauch abgerechnet? Wer ist für Probleme verantwortlich?

Für ein Startup, das Agenten entwickelt, ist möglicherweise nicht das Modell am wertvollsten, sondern das tiefe Verständnis der Geschäftsprozesse einer bestimmten Branche, die Erfahrung im Umgang mit verschiedenen Systemen, ein reifes Berechtigungs- und Auditkonzept oder eine einzigartige Methode zur Akzeptanzprüfung von bestimmten Aufgaben. Der Wachstumszyklus liegt darin, dass je mehr Kunden es nutzen, desto mehr Branchenprozesse, Werkzeugverbindungen und Wissen gesammelt werden; der Wachstumshebel liegt darin, dass die Kosten für die Bearbeitung des zweiten, dritten und weiteren ähnlichen Kunden immer niedriger werden.

Ein realistischerer Weg besteht darin, sich von einem kleinen, aber soliden Geschäftspunkt aus zu bewegen: Der Kundenstamm ist klar definiert, die Aufgaben sind genau beschrieben, der Erfolg kann gemessen werden und die Lieferkosten können kontrolliert werden. Zuerst muss man in einem Prozess beweisen, dass die Kunden bereit sind, zu bezahlen und dass das Projekt rentabel ist, bevor man die wiederverwendbaren Teile in ein Standardprodukt umwandelt.

An diesem Punkt wird die Rolle des Kapitals klar: Es dient nicht dazu, die Nachfrage zu überprüfen oder Lücken in individuellen Projekten auszufüllen, sondern dazu, die bereits bewiesenen Fähigkeiten schneller auf mehr Kunden und Szenarien zu übertragen.

Geld kann Fähigkeiten verstärken, aber es kann Ihnen keine Fähigkeiten geben.

Ob ein Agent in den Geschäftsprozess eines Kunden integriert werden kann, bestimmt, ob der Kunde das Budget genehmigt. Ob der Kunde von „Probe“ zu „unverzichtbar“ wird, bestimmt, ob ein Agentenprodukt zu einem echten Agentenunternehmen werden kann.

Autor

Yan Jun, Autor bei SCMP Opinion, ehemaliger Leiter für Regierungsangelegenheiten und Zusammenarbeit mit Behörden bei Kuaidi/Didi, Technologie-Unternehmer. Er hat ein Technologieunternehmen gegründet und betrieben, das mehrere Finanzierungsrunden absolvierte. Er folgt seit langem der Kapitalentscheidung, der Einnahmenqualität, der Marktzugang, der Projektlieferung und der Bewertungslogik von KI-, Roboter- und Hardtech-Projekten nach ihrer Einbindung in reale Branchensysteme.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Signale von Andrew Ng zum Thema Agenten: Die Chance für Chinas KI liegt in der Ausführungsberechtigung, nicht im Modell