Roundtable: Einen Schritt vor dem Konsens – Das wahre Spiel der KI-Investitionen | 2026 WAVES
Künstliche Intelligenz (KI) ist kein vorübergehender Trend, sondern wird zur Horizontlinie. Und der Horizont bedeutet - man sieht sein Ende nicht, aber er ist immer da.
Derzeit ist die KI - Branche in vollem Aufschwung, und es besteht noch kein breiter Konsens in der Branche. Doch echte Chancen entstehen oft vor dem Konsens. Lassen Sie uns nun in die echte Runde des KI - Venture - Capital - Diskussionsforums eintauchen, das einen Schritt vor dem Konsens geht!
Im Folgenden finden Sie den Inhalt des Rundtischgesprächs, nachbearbeitet und editiert von 36Kr:
Ba Rui | Stellvertretende Chefredakteurin von "An Yong" (Moderatorin)
Zhu Tianyu | Verwaltungsgesellschaftsleiter von BlueRun Ventures
Qin Shentao | Gründer und CEO von OriginFlow
Ba Rui: Hallo, liebe Teilnehmer! Das Thema unseres Gesprächs ist "Einen Schritt vor dem Konsens". Im vorherigen Gespräch wurde über nicht - konsensfähige Inhalte gesprochen. In diesem Gespräch geht es um Dinge, die einen Schritt vor dem Konsens liegen.
Hier anwesend sind zwei Personen. Einer ist Zhu Tianyu, der Verwaltungsgesellschaftsleiter von BlueRun Ventures, der sehr früh in Investitionen eingreift. Der andere ist Qin Shentao, der Gründer von OriginFlow, der frühzeitig ins Unternehmertum gestartet ist. Beide haben den Mut, einen Schritt vor dem Konsens zu gehen. Dies basiert auf sehr zuverlässigen Urteilen. Heute möchten wir über diese Dinge sprechen.
Zur Einführung: Herr Zhu Tianyu trat 2009 bei BlueRun Ventures ein. Unter seiner Leitung hat BlueRun Ventures in Star - Unternehmen wie Li Auto, "Dark Side of the Moon", Zhiyuan Robotics und Genspark investiert. Herr Zhu Tianyu hat frühzeitig gesagt, dass Early - Stage - Investoren der erste Investor eines Unternehmers sein sollten und dass sie bereits in der unsichersten Phase echte Geldbeträge investieren sollten. Im Jahr 2017 hat er auch festgestellt, dass KI kein kurzfristiger Trend, sondern ein Markenzeichen ist. Der andere ist Qin Shentao, ein junger Tsinghua - Doktor aus dem Jahr 2001. Er gründete letztes Jahr OriginFlow, ein Unternehmen, das mit nicht - invasiven Bewegungsnerven - Schnittstellen die Infrastruktur für die Interaktion mit der physischen Welt für körperliche intelligente Roboter bereitstellt. Das klingt etwas kompliziert. Später kann Shentao Ihnen genau erklären, was das Unternehmen tut. Es heißt, dass das Unternehmen innerhalb von fünf Monaten der offiziellen Betriebszeit die Finanzierung von der Angel - Runde bis zur Pre - A1 - Runde abgeschlossen hat, mit einer Gesamtinvestition von über 500 Millionen Yuan. Dies ist ein sehr hoher Betrag. BlueRun Ventures war auch der Mit - Lead - Investor in der Angel - Runde und hat in drei aufeinanderfolgenden Runden zusätzliche Investitionen getätigt. Es heißt, dass BlueRun Ventures am Vormittag kommuniziert und am Nachmittag bereits das Investitionsintentionsschreiben ausgestellt hat. Ich habe diese Tatsache bestätigt. Er hat gesagt, dass die Ausstellung am Nachmittag nur aufgrund einiger formaler Abläufe verzögert wurde. Tatsächlich hat er nur 30 Minuten gebraucht, um die Entscheidung zu treffen. Ich möchte also Herrn Zhu Tianyu fragen, warum Sie sich so schnell entschlossen haben, in diesen jungen Mann zu investieren?
Zhu Tianyu: Zunächst einmal ist unser Titel "Einen Schritt vor dem Konsens". Dies ist eigentlich eine zu hohe Anforderung und überbewertet. Es ist schwierig, sich so zu sehen. Aber als ich mit Shentao sprach, entschied ich mich in weniger als 30 Minuten, in dieses Projekt zu investieren. In meinen bisherigen Investitionserfahrungen gab es nur wenige Projekte, die ein ähnliches Gefühl auslösten, wie Genspark. Auch hier war die Kommunikation etwa 30 Minuten lang. Ähnliche Erfahrungen hatte ich auch bei der Investition in Li Auto, KIMI und andere Unternehmen.
Zurück zu Ihrer Frage, warum ich mich so schnell zu einer Investitionsentscheidung entscheiden konnte. Die Kerngründe liegen hauptsächlich in drei Punkten: Erstens basiert die Early - Stage - Investition nicht einfach auf den Informationen und Merkmalen des Projekts selbst, sondern auf früheren, eigenen strukturierten Ansichten über die globalen Herausforderungen und zu lösenden Probleme. Vor etwa drei oder vier Jahren, also um die Zeit der Entstehung von ChatGPT, hatten wir eine Vorstellung von den Investitionsinhalten in den kommenden großen Zyklen, die wir "Dreifache Überlagerung" nannten. Die "Drei Wellen" können als drei Kurven auf einem Koordinatensystem verstanden werden, die sich überlagern und drei treibende Faktoren entsprechen. Der erste treibende Faktor ist die allgemein bekannte AGI. Der zweite ist die Robotik, die alle relevanten körperlichen und physikalischen Antriebsgebiete umfasst. Der dritte heißt 3D - Interaktion. Ich denke, dass die Kombination von AGI, Robotik und 3D - Interaktion für uns als Early - Stage - Investitionsgesellschaft die Chancen definiert, in den nächsten zehn oder sogar dreißig Jahren in diesen drei treibenden Faktoren kontinuierlich zu investieren. Ich denke, dass das von Shentao studierte Geschäft genau diesen drei treibenden Faktoren entspricht. Es besteht ein deutlicher Unterschied zwischen der Elektromechaniksteuerung und der körperlichen Intelligenz. Die körperliche Intelligenz beobachtet hauptsächlich die Bewegungen der menschlichen Hand und entscheidet über die Steuerung durch die Rücklösung von Sprache. Shentao und seine Kollegen analysieren die von der Großhirnrinde kommenden Daten über das Elektromechaniksystem, um die unterliegende Steuerlogik der menschlichen Bewegung zu verstehen. Aus den Perspektiven der Robotik, der Interaktion und der KI - Intelligenz passt dieser Ansatz perfekt zu unseren gesuchten Schlüsselpunkten. Daher ist diese Richtung sehr attraktiv.
Zweitens betrachte ich als Gründer von Shentao sein Alter nicht als Kriterium für meine Beurteilung. In den kurzen 30 Minuten der Kommunikation habe ich sein Alter völlig ignoriert. Ich sah einen Unternehmer, der für seine Zielrichtung voller Leidenschaft und Problemlösungsfreude ist. Wenn man seine Lebenserfahrungen der letzten zwanzig Jahre betrachtet, hat alles, was er bisher gesammelt hat, für sein gegenwärtiges Unternehmen gewirkt. In diesem Moment hat er die Kenntnisse aus verschiedenen Bereichen zusammengeführt und setzt sich ganz seiner Lieblingsarbeit in der Technologieentwicklung aus. Er setzt all seine Kräfte ein, um die Probleme zu lösen. Solch ein reiner und fokussierter Unternehmer ist sehr selten. Darüber hinaus ist seine Darstellung der Branche und seine Beurteilung von Menschen und Dingen sowie seine geistige Reife weit über seinem Alter.
Der dritte Punkt, der meiner Meinung nach von größter Wichtigkeit ist, ist, dass diese Richtung die vergleichenden Vorteile Chinas voll ausnutzt. Dies entspricht der zugrunde liegenden Logik unseres Fonds, der in mehreren Unternehmen im Bereich der körperlichen Intelligenz investiert. China hat nicht nur im Bereich der Künstlichen Intelligenz einen Vorteil in der Talentdichte, sondern auch in der Fertigungsindustrie eine hervorragende Gesamtleistung und eine starke Industriekette. Daher denke ich, dass es von der Perspektive der körperlichen Interaktion, der Daten und der Intelligenz sehr vielversprechend ist, Daten mit einer Kombination aus Hardware und Software zu sammeln, zu analysieren und die Welt zu verstehen. Hierbei handelt es sich nicht nur um die unterste Ebene der Daten, sondern es kann darüber hinaus ein sehr vielversprechender kommerzieller Raum aufgebaut werden.
Wie bereits erwähnt, haben wir erfolgreich in Projekte wie KIMI, Genspark und Zhiyuan investiert. Wir sind möglicherweise die einzige oder eine der wenigen frühen Investitionsgesellschaften in China, die gleichzeitig in die Basis - Large - Language - Modelle, die körperliche Intelligenz und die Anwendungen investiert hat und so frühzeitig Chancen ergreifen konnte. Dies waren also alle die Überlegungen, die mich in den 30 Minuten überzeugten und hinter meiner Entscheidung standen, zu investieren.
Ba Rui: Haben Sie nach den 30 Minuten Gespräch Ihre Investitionsabsicht gezeigt?
Zhu Tianyu: Ich habe privat mit meinem Kollegen per WeChat gesagt: "Wir müssen diesen Mann gewinnen."
Ba Rui: Haben Sie Herrn Zhu Tianyus kleine Aktion bemerkt, Shentao? Haben Sie nach dem Gespräch gedacht, dass Sie so schnell einen Term Sheet erhalten würden? Wie haben Sie reagiert?
Qin Shentao: Während des Gesprächs gab es Augenkontakte, und man konnte das Vertrauen spüren. Ehrlich gesagt sind wir glücklich. Die KI befindet sich derzeit an einem beispiellosen industriellen Wendepunkt. Daher waren die Schwierigkeiten bei der Finanzierung nicht allzu groß. Aber wenn man sich für einen Partner entscheidet, merkt man deutlich, dass die Motive der anderen unterschiedlich sind. BlueRun Ventures hat mir einen anderen Eindruck gemacht. Ich erinnere mich, dass sie bereits vor dem offiziellen Gespräch über diese Richtung jahrelang intensiv nachgedacht hatten und nach einer echten Lösung suchten. Als unsere Lösung mit ihrem langjährigen Suchzustand kollidierte, dachte ich, dass es egal ist, welche Schwankungen die Branche in Zukunft haben wird, diese Menschen sind es wert, zusammen mit ihnen zu gehen.
Ba Rui: Shentao, möchten Sie kurz erklären, was Ihr Unternehmen tut? Die Definition war zuvor ziemlich lang.
Qin Shentao: Wenn wir über AGI sprechen, hat sich ihre Entwicklung bisher hauptsächlich um zwei Modalitäten herumgedreht. Die erste ist die Textmodalität: OpenAI und Anthropic konnten bei der Fähigkeit der Large - Language - Modelle einen Durchbruch erzielen. Dahinter liegt eine Kernbasis, die wir als das Hochladen menschlicher Kenntnisse bezeichnen können. Dies ist im Laufe der letzten dreißig Jahre seit den neunziger Jahren des vergangenen Jahrhunderts auf dem Internet schrittweise erfolgt: Die gesamte Menschheit hat bei der Nutzung von Internetprodukten eine große Menge an logischen menschlichen Kenntnisdaten in Form von Tokens gesammelt und festgelegt.
Die zweite Modalitätspraktik ist die Videomodalität, deren typischer Vertreter die automatische Fahrweise ist. Menschen haben während des Fahrens über die Datenerfassungseinrichtungen im Auto mit relativ geringen Kosten eine riesige Menge an Videodaten aus der speziellen Szenario der automatischen Fahrweise gesammelt, die die Robotaxi - Plattform bei der Erfassung und Modellierung der visuellen Modalität unterstützt. Hinter diesem Hochladen von Kenntnissen stecken mindestens 300.000 Nutzerfahrzeuge, die mit hoher Häufigkeit auf realen Straßen fahren und kontinuierlich Daten liefern.
Heute müssen wir uns aber einer dritten Modalität stellen - der Fähigkeit, dass intelligente Agenten mit der realen physischen Welt in körperliche Interaktion treten können. Die echte körperliche Intelligenz basiert auf der Kernfähigkeit nach dem physischen Kontakt. Dies unterscheidet sich von der automatischen Fahrweise grundlegend: Die automatische Fahrweise ist ein typisches kontaktloses Szenario. Sobald es um physischen Kontakt geht, wird man feststellen, dass die genaue Definition und Modellierung der "Bewegung" - Modalität bisher von der Branche nicht intensiv erforscht wurde und es keine fertige Infrastruktur gibt, um die entsprechende Datensammlung durchzuführen.
Hier ein einfaches Datenbeispiel: Es gibt 8 Milliarden Menschen auf der Welt, und jeder ist pro Tag mehr als 12 Stunden wach. Wenn alle physischen Interaktionsdaten der gesamten Menschheit gesammelt werden könnten, würde dies pro Tag fast 100 Milliarden Stunden an realen physischen Interaktionsdaten ergeben. Die realen Interaktionsdaten, die derzeit für das Training von generativen KI - Modellen verwendet werden, betragen möglicherweise nur einige hunderttausend Stunden. Es besteht also eine Größenordnung an Unterschied.
Wenn wir glauben, dass die physische AGI die letzte industrielle Revolution in der Geschichte der menschlichen Zivilisation ist, müssen wir einen soliden Unterbau aufbauen: Wir müssen den Datensammeltrichter vergrößern und die physischen Interaktionsdaten aus dem menschlichen Produktions - und Lebensalltag auf effiziente Weise hochladen. Dieses Sammelsystem muss nicht - invasiv sein - es darf die natürlichen Aktivitäten der Menschen nicht stören, die normale Produktionsabläufe nicht beeinträchtigen und an die Sammelhäufigkeit, die Genauigkeit und die Langzeitkonsistenz der Datensammlung sehr hohe Anforderungen stellen. Es muss ein echtes "in - the - wild" - System sein, nicht ein "in - the - lab" - System.
Ba Rui: Zurück zur Investition. Ich möchte Herrn Zhu Tianyu fragen.
Im aktuellen Primärmarkt ist es nichts Neues, schnell zu investieren. Insbesondere bei beliebten Projekten und Star - Unternehmern ist es nicht ungewöhnlich, sofort einen Term Sheet auszustellen oder wie Sie sofort die Entscheidung zu treffen. Aber Sie haben früher gesagt, dass die echten Chancen nicht in der Geschwindigkeit des Mitmachens liegen, sondern darin, ob man die strukturellen Veränderungen früher als andere erkennen kann. In den letzten zwei Jahren ist die körperliche Intelligenz sehr beliebt, und OriginFlow befindet sich in der Mitte der Wellen. Es hat in fünf Monaten 500 Millionen Yuan finanziert. Wie können Sie sich davon überzeugen, dass Sie bei der Investition in Shentao die strukturellen Veränderungen erkannt haben und nicht von der Hype - Welle mitgerissen wurden?
Zhu Tianyu: Ich habe bereits erwähnt, dass wir das Konzept der "Dreifachen Überlagerung" haben. Ich möchte es noch etwas genauer erklären. Dieses Konzept bringt uns dazu, ständig zu fragen, welche neuen Chancen diese treibenden Faktoren hervorbringen werden. Beispielsweise haben wir im Bereich der körperlichen Intelligenz lange Zeit beobachtet, dass das Datenschwerpunktproblem ein allgemeines Problem ist. Wie Shentao gerade sagte, suchen alle nach einer besseren Methode, um Daten zu sammeln.
Wir interessieren uns seit langem für KI. Sie haben auch erwähnt, dass es um die Frage geht, ob KI ein Trend oder ein Markenzeichen ist. Die KI - Welle von 2014 und 2015 war hauptsächlich auf die Computer - Vision basierte diskriminative KI ausgerichtet, was sich von der aktuellen generativen KI grundlegend unterscheidet. Damals habe ich gesagt, dass es kein Trend, sondern ein Markenzeichen ist, um den Einfluss auf den Wert zu unterscheiden. Aber der Einfluss dieser Welle bedarf keiner weiteren Debatte.
Andererseits, wenn man sich die KI selbst anschaut, um die Tiefe des Wertes zu verstehen und wie wir in der Richtung der körperlichen Intelligenz die physische Welt erkennen und trainieren sollen, sind die Anforderungen an die Daten sehr hoch. Daher suchen wir ständig nach einer Lösung. Ich habe früher eine wichtige Aussage gemacht: In jedem technologischen Zyklus ist der beste Zustand, "Geld zu verdienen und gleichzeitig Daten zu sammeln". Dies gilt sowohl für die Big - Data - Ära, die vorherige KI - Ära als auch für die aktuelle KI - Ära. Shentaos Lösung beantwortet dieses Problem sehr elegant - "Geld zu verdienen und gleichzeitig Daten zu sammeln". Denn es sammelt auf natürliche Weise die Daten aus dem menschlichen Prozess. Obwohl es auch andere Methoden gibt, sammelt er direkt den Bewusstseinsstrom aus dem menschlichen Gehirn. Dies ist ein sehr interessanter Ansatz.
Von einer anderen Perspektive, wie gerade unten diskutiert wurde, aus der biomimetischen Perspektive. Der Mensch ist eine sehr perfekte Maschine. Das gesamte Gehirn kann so viele komplexe Probleme lösen, mit nur 10 bis 20 Watt Leistung. Der gesamte menschliche Körper verbraucht nur etwas mehr als 100 Watt. Bei so sparsamer Energieverwendung kann er so komplexe Aufgaben erledigen. In der Biomimetik gibt es viele Perspektiven, die wir nutzen können, um über die Realisierung des Wertes der Künstlichen Intelligenz nachzuden