Das, wovor AI-Anwendungsunternehmen am meisten Angst haben, wenn man sie fragt, ist nicht, wie stark ihr Modell ist, sondern der "Menschenanteil" dahinter.
Autor: Yan Jun
Wenn die Anwendungen von Künstlicher Intelligenz (KI) sich noch auf Demos, Produktvorstellungen und Finanzierungsnachrichten beschränken, werden am häufigsten Modelleparameter, Reaktionsgeschwindigkeit und Benutzererfahrung diskutiert.
Sobald jedoch die Produkte tatsächlich in die Kundenbetriebe gelangen, die Beschaffung abgenommen, die Finanzierungsdue diligence durchgeführt, die Börsengänge dokumentiert und die Exit-Transaktionen abgeschlossen werden, tritt ein eher unbeachtetes Problem auf: Wie viel von dem, was das System scheinbar automatisch erledigt, wird tatsächlich vom System selbst erledigt, und wie viel wird durch Menschen im Hintergrund aufrechterhalten?
Dies ist das Problem der „Menschlichkeit“ (Anteil an menschlicher Beteiligung), mit dem KI-Anwendungsunternehmen früher oder später konfrontiert werden müssen.
Die sogenannte „Menschlichkeit“ ist keine Ironie und keine Ablehnung von KI, sondern eine sehr realistische Bewertung bei der Leistungserbringung: Je automatisierter ein Ergebnis erscheint, desto dringender muss gefragt werden, wie viel davon auf menschliche Überprüfung, ferngesteuerte Übernahme, Qualitätssicherung, Implementierung, Betriebsunterstützung und Wartung vor Ort bei den Kunden angewiesen ist.
Hier wird nicht über Unternehmen mit großen Basis-Modellen, noch über Chip-, Rechenleistung- oder Infrastrukturunternehmen gesprochen, sondern über KI-Anwendungsunternehmen, die näher am Geschäftsprozess der Kunden liegen: intelligente Kundenbetreuung, Unternehmenswissensdatenbanken, Vertriebsankündigungen, Inhaltsüberprüfung, KI-Agenten, intelligente Bürotools, Branchenlösungen mit großen Modellen sowie verschiedene automatisierte Produkte für vertikale Szenarien.
Viele Menschen wissen eigentlich nicht, dass hinter KI-Anwendungen möglicherweise Menschen stehen.
Investoren haben Projekte gesehen, bei denen die Demo reibungslos lief und es auch Kunden gab. Erst als man sich jedoch nach der Gewinnspanne, der Lieferzeit und der Personalausstattung erkundigte, wurde klar, dass hinter dem Umsatzwachstum ein beträchtliches Team für Implementierung und Leistungserbringung stand.
Industriekunden haben ähnliche Szenarien erlebt: In der Pilotphase war das Lieferanten-Team fast täglich online und löste Probleme sofort. Erst nach der offiziellen Inbetriebnahme wurde klar, dass das System immer noch stark auf menschliche Unterstützung angewiesen war. Fragen wie wer die Daten einsehen kann, wer für Fehler verantwortlich ist und wie die Abnahmeberichte geschrieben werden, wurden zu viel realeren Problemen.
Die Gründer selbst sind oft am besten darüber informiert. In der Anfangsphase wird das Produkt durch Menschen ergänzt, um Grenzfälle zu behandeln, vor Ort zu helfen und Stichproben zu sammeln. Dies ist eine äußerst häufige Arbeitsweise, wenn KI-Anwendungen in reale Szenarien eingeführt werden. Das eigentliche Problem besteht nie darin, ob es am Anfang im Hintergrund Menschen gibt, sondern darin, ob diese Menschen nach sechs Monaten oder einem Jahr in das Produkt integriert wurden und es zu einer automatisierten Fähigkeit gemacht haben, oder ob sie weiterhin im Lieferungsprozess bleiben und neue Service-, Betriebs- und Organisationskosten verursachen.
Zwei Arten von menschlicher Beteiligung
Die Automatisierung von KI-Anwendungen ist niemals rein ein Problem der Modelle.
In der realen kommerziellen Leistungserbringung besteht ein KI-Anwendungsprodukt normalerweise aus Modellen, Regeln, Daten, Qualitätssicherung, menschlicher Überprüfung, Ausnahmebehandlung, ferngesteuerter Übernahme, Kundenprozessen und Betriebsteams.
Fast alle Bereiche wie Kundenbetreuung, Wissensdatenbanken, Überprüfung, Vertrieb, Büroautomatisierung, Unternehmens-Agenten und Branchenlösungen müssen diesen Schritt durchlaufen: Die KI behandelt zunächst standardisierte Aufgaben, während Menschen Ausnahmen, sensible, niedrig vertrauenswürdige oder hochriskante Aufgaben übernehmen.
Der eigentliche Schlüssel liegt nicht darin, ob Menschen beteiligt sind, sondern darin, wohin die menschliche Beteiligung schließlich führt.
Die erste Art von Menschen sind diejenigen, die dem Produkt helfen zu lernen.
Sie führen Datenmarkierungen, Stichprobenauswahl, Modellbewertungen, Qualitätssicherungsstichproben, Sammlung von Ausnahmebeispielen, menschliche Rückmeldungen und Prozessschulungen durch. Ihr Wert liegt nicht darin, dass sie langfristig die Arbeit für das System erledigen, sondern darin, dass sie die anormalen Eingaben, Prozessunterbrechungen, langschwänzigen Probleme und Überprüfungserfahrungen vor Ort bei den Kunden schrittweise in Modelle, Regeln, Standardoperatingprocedures (SOP), Bewertungsmechanismen und Produktgrenzen umsetzen.
Die zweite Art von Menschen sind diejenigen, die bereits Teil der Lieferstruktur geworden sind.
Sie antworten anstelle des Systems auf Kundenfragen, übernehmen Aufgaben ferngesteuert, erledigen Bestellungen manuell, behandeln Prozesse, die ursprünglich als automatisiert zugesagt wurden, oder halten die Lieferergebnisse langfristig über das Projektteam aufrecht.
Diese Art von menschlicher Beteiligung bedeutet nicht, dass das Unternehmen keinen Wert hat, aber es ändert die Geschäftsnatur des Unternehmens. Die Kunden denken, sie kaufen eine KI-Anwendung, aber tatsächlich erhalten sie möglicherweise ein Personal-Service-System mit einer KI-Oberfläche. Die Investoren denken, sie investieren in ein Softwareunternehmen mit hoher Gewinnspanne und Skalierbarkeit, aber am Ende sehen sie möglicherweise, dass hinter dem Umsatzwachstum mehr Implementierungs-, Service-, Qualitätssicherungs- und Projektbetriebspersonal erforderlich ist.
Die zugrunde liegende Logik dieser Bewertung ist eigentlich sehr einfach: Die Menschen, die dem Produkt helfen zu lernen, machen das System letztendlich automatisierter; die Menschen, die Teil der Lieferstruktur geworden sind, machen das Unternehmen letztendlich schwerer.
Diese Unterscheidung bestimmt nicht nur die Kostenstruktur, sondern auch die Preis- und Bewertungslogik.
Ein schwereres KI-Anwendungsunternehmen kann natürlich auch sehr wertvoll sein, insbesondere in Branchen mit hohen Eintrittshürden, komplexen Organisationsprozessen und stark maßgeschneiderten Szenarien. Aber wenn ein Unternehmen im Wesentlichen eher wie ein „KI-ergänztes Serviceunternehmen“ wirkt, kann es nicht dauerhaft die Geschichte eines Standard-SaaS- oder leichten Softwareunternehmens erzählen, wenn es um Umsatzqualität, Gewinnspanne und Skalierbarkeit geht.
Aber es geht nicht nur um die Kosten
Viele Menschen denken bei der „Menschlichkeit“ zunächst an die Kosten.
Dies ist sicherlich richtig. Menschliche Überprüfung, ferngesteuerte Übernahme, Lieferung vor Ort, langfristige Wartung, Qualitätssicherungsteams, ausgelagerte Überprüfung – all dies fließt direkt in die Kostenstruktur ein und spiegelt sich schließlich in der Gewinnspanne, der Lieferzeit und der Unternehmensgröße wider.
Aber was leichter unterschätzt wird, ist, dass die „Menschlichkeit“ gleichzeitig ein Datenproblem, ein Verantwortungsproblem und ein Compliance-Problem ist.
In vielen KI-Anwendungsszenarien kommen menschliche Überprüfung, Qualitätssicherungsstichproben, Aufrüstung der Kundenbetreuung, Übernahme von Ausnahmen und ausgelagerte Verarbeitung mit Benutzereingaben, Audioaufnahmen, Bildern, Unternehmensdokumenten, Geschäftsdaten, Bestellinformationen und sogar sensiblen personenbezogenen Daten in Kontakt.
Wenn das System nur für Tourenführung, Marketing oder einfache Fragen und Antworten verwendet wird, ist das Problem relativ beherrschbar. Aber sobald es in Bereiche wie Finanzen, Medizin, Verwaltung, Versicherung, Unternehmenswissensdatenbanken, Rechtsberatung, Altenbetreuung und Kundenbetreuung kommt, ändert die menschliche Einmischung direkt die Verantwortungsstufe.
In diesem Fall müssen die Kunden nicht nur wissen, wie hoch die Genauigkeit ist, sondern auch eine Reihe konkreterer Fragen: Können die Menschen im Hintergrund die Originaldaten einsehen? Sind die Daten anonymisiert? Wer hat Zugangsberechtigungen? Wird die Verarbeitung ausgelagert? Wird der Zugangsprozess protokolliert? Wird der Benutzer informiert? Kann der vollständige Bearbeitungsprozess nach einer Beschwerde nachverfolgt werden?
Je tiefer die KI-Anwendung in den Geschäftsprozess der Kunden eindringt, desto weniger kann sie sich nur auf die „Modellfähigkeit“ berufen. Sie muss auch in der Lage sein, Fragen zu beantworten, wie der Vertrag geschrieben wird, wie die Datenschutzrichtlinie veröffentlicht wird, wie das Datenverarbeitungsabkommen vereinbart wird, wie die Zugangsberechtigungen gestaffelt werden, wie die Prüfprotokolle aufbewahrt werden und wie die Ausnahmebehandlungsprozeduren in Bezug auf die Verantwortlichkeit geregelt werden.
Die Kunden kaufen nicht nur eine Oberfläche mit einem starken „KI-Faktor“, sondern ein System, bei dem die Automatisierungsrate, die menschliche Übernahme, der Datenzugang und die Verantwortungsgrenzen klar definiert sind.
Deshalb sollten die Industriekunden vielleicht eher die folgenden Fragen stellen: Werden automatische und manuelle Tätigkeiten getrennt aufgezeichnet? Ist die menschliche Übernahme in das Service Level Agreement (SLA) aufgenommen? Können die Menschen im Hintergrund die Kundendaten einsehen? Ist die Automatisierungsrate und die Übernahmerate im Abnahmebericht angegeben? Kann man bei der Vertragsverlängerung eine Abnahme der Übernahmerate, eine Zunahme der Nutzungsrate und eine Verringerung der Lieferzeit sehen?
Diese Fragen sind nicht besonders aufwendig, aber sie kommen der realen Beschaffungsentscheidung näher als die Fragen nach den „Modellparametern“ oder der „Multimodularität“. Denn sobald die KI tatsächlich in das Geschäftssystem integriert wird, tragen die Kunden die Verantwortung, nicht die Fantasie.
Eingangspunkt für die Due Diligence
In der Vergangenheit, als viele KI-Anwendungsunternehmen noch nicht an der öffentlichen Kapitalmärkte notiert waren, basierte die Beurteilung der Außenstehenden oft auf der Modellfähigkeit, den Finanzierungsnachrichten, der Benutzererfahrung und den Demo-Ergebnissen.
Es schien, dass es genug war, wenn das Produkt intelligent, schnell und „automatisiert“ genug war.
Aber mit der zunehmenden Anzahl von KI-Unternehmen, die sich einer strengeren Informationsoffenlegung unterziehen, werden viele Probleme, die früher als „technischer Fortschritt“ verkauft werden konnten, nun als Finanzprobleme, Lieferungsprobleme und Probleme der Umsatzqualität neu interpretiert.
Die öffentliche Berichterstattung über die Analyse der Börsengangsdokumente hat den Markt gewarnt. 36Kr hat in Berichten über Zhipu AI und MiniMax erwähnt, dass die Gewinnspannen der beiden Unternehmen deutlich unterschiedlich sind und die Kostenstrukturen ebenfalls variieren. Die Berichte haben auch darauf hingewiesen, dass die Gehälter des Service- und Implementierungsteams sowie die Rechnungen für Rechenleistung in verschiedenen Unternehmen unterschiedliche Kostendrucke und Lieferungsprofile erzeugen.
Ein anderer Bericht über die Bemühungen der beiden Unternehmen, an die Kapitalmärkte zu gehen, hat erwähnt, dass MiniMax zwischen 2023 und 2025 einen schnellen Umsatzwachstum verzeichnete, während die Branche insgesamt noch in einer Phase von hohem Wachstum, hohen Investitionen und hohen Verlusten ist.
Diese Daten dürfen natürlich nicht grob interpretiert werden.
Die Kosten für Service- und Implementierungspersonal bedeuten nicht, dass die Menschen im Hintergrund alle Aufgaben für das System erledigen. Unternehmens-KI-Anwendungen erfordern ohnehin Implementierung, Betrieb, Wartung, Kundensupport und Lokalisierung. Die Kostenstrukturen von B2B-, B2G-, lokalen Implementierungen, C2C-KI-Anwendungen und API-Plattformen sind von Natur aus unterschiedlich.
Aber diese Offenlegung lässt zumindest ein Problem nicht mehr ignoriert werden: Wie wird der Umsatz von KI-Anwendungsunternehmen tatsächlich erzielt?
Wenn die menschliche Beteiligung hauptsächlich Teil des Lernmechanismus des Produkts ist, sollte die pro-Kunde-Lieferkosten theoretisch mit zunehmender Anzahl von Kunden sinken und die Lieferungsmethode zunehmend standardisiert werden.
Wenn die menschliche Beteiligung bereits eine Voraussetzung für die Lieferung ist, wird der Personalaufwand mit dem Umsatzwachstum ebenfalls steigen.
Das erste bedeutet, dass das Produkt stärker wird, das zweite, dass die Organisation schwerer wird.
Deshalb wird die „Automatisierungsrate“ zum wichtigsten Eingangspunkt für die Due Diligence von KI-Anwendungsunternehmen.
Die Automatisierungsrate ist keine bloße Werbebotschaft, sondern sie verbindet die Produktfähigkeit, die Personalkosten, die Umsatzqualität und die Kapitalbewertung.
Investoren sollten nicht nur sehen, was die KI in der Demo erledigt, sondern auch, was passiert, nachdem die Kunden das Produkt tatsächlich nutzen: Wie hoch ist die Automatisierungsrate? Wie hoch ist die menschliche Übernahmerate? Wird der Grund für die Übernahme protokolliert? Fließt die Übernahmeerfahrung in die Produktentwicklung zurück? Hat die Lieferzeit für ähnliche Kunden abgenommen? Kommt die Verbesserung der Gewinnspanne von einer Verringerung der Modellkosten oder von einer Standardisierung der Lieferung? Kommt die Vertragsverlängerung der Kunden eher von der Systemleistung oder von der langfristigen Präsenz des Service-Teams?
In strengeren Beschaffungs- und Abnahmeprozessen können die Kunden sogar die Obergrenze der menschlichen Übernahmerate, die Klassifizierung der Übernahmeszenarien und die Art der Protokollierung in die Vertragsklauseln aufnehmen. Die genauen Schwellenwerte können natürlich nicht von einer Branche auf die andere übertragen werden, aber die Frage, ob die Übernahmerate kontinuierlich sinkt, sollte definitiv ein dauerhaft zu verfolgendes Kriterium bei der Abnahme und Vertragsverlängerung sein.
Diese Fragen tauchen selten auf Finanzierungs-Pressemitteilungen auf, aber sie werden definitiv in den Due-Diligence-Fragebögen erscheinen.
Was sollten Gründer beachten?
Für Gründer ist es nicht schlimm, in der Anfangsphase Personal einzusetzen.
Oft ist die menschliche Beteiligung sogar ein notwendiger Bestandteil, wenn das Produkt in reale Szenarien eingeführt wird: Sie hilft dem Team, die Kunden zu verstehen, häufige Probleme zu identifizieren, Grenzfälle zu erkennen, Prozesse zu trainieren und wiederholbare Lieferungsmethoden zu entwickeln.
Das eigentliche Problem ist, dass das Team selbst nicht mehr unterscheiden kann, welche Menschen das Produkt trainieren und welche bereits Teil der Lieferstruktur geworden sind.
Sobald diese Grenze verschwimmt, werden die Verkäufer immer übertrieben sprechen, die Kunden werden das Produkt wie eine Software kaufen, die Investoren werden es wie ein Produkt mit hoher Gewinnspanne bewerten, während das Team weiterhin auf Projektbasis, vor Ort und stark betriebsabhängig liefert. Kurzfristig kann der Umsatz steigen, aber langfristig wird die Bilanz die Wahrheit offenbaren.
Wenn ein KI-Anwendungsunternehmen mit der Geschichte eines Softwareunternehmens finanziert, aber langfristig wie ein Serviceunternehmen liefert, wird das Kapital bei der nächsten Finanzierungsrunde, der Börsengangsdokumentation oder der Due Diligence bei einer Fusion oder Übernahme das Unternehmen eher anhand der Umsatzqualität, der Gewinnstruktur und der Skalierbarkeit der Lieferung neu bewerten.
Das Problem liegt nicht an der „Schwere“ an sich, sondern daran, ob das Unternehmen seine Geschäftsnatur korrekt definiert hat.
Deshalb sollten die Gründer desto früher die folgenden internen Indikatoren festlegen, desto besser können sie spätere Probleme vermeiden: Sinkt die menschliche Übernahmerate kontinuierlich? Sinkt die Lieferzeit für ähnliche Kunden kontinuierlich? Verbessert sich die Gewinnspanne pro Kunde? Fließen die manuell behandelten Ausnahmebeispiele wirklich in die Produktentwicklung ein? Kommt die Vertragsverlängerung der Kunden eher von der Systemleistung oder von der Präsenz des Teams? Wird die Implementierungserfahrung in standardisierte Module umgesetzt? Wird die manuelle Qualitätssicherung in ein automatisches Bewertungssystem umgewandelt?