Runder Tisch: Das Jahr 2026 der Technologie "Die Minderheit ist die Welle" | 36Kr WAVES 2026 Neue Welle
„Im Jahr 2026 wogt die Welle in der Risikokapitalbranche erneut auf: Künstliche Intelligenz (KI) tritt aus dem Bereich der technischen Konzepte in die Tiefe der Industrie ein, und der Start-up-Bereich der Hard Tech hat sich von einer „Nischenbranche“ zu einem „Hauptstromkonsens“ entwickelt. Junge Unternehmerinnen und Unternehmer definieren mit Code und Händen die zukünftigen Koordinaten der chinesischen Innovation neu.
Jedes Jahr ist die von 36Kr · AnYong organisierte WAVES-Konferenz der Jahresrichtpunkt für die chinesische Risikokapitalbranche. Dieses Jahr steht die WAVES 2026 unter dem Motto „Dieser Sommer“ und findet im Liangcang Xinzao Kreativpark in Panyu, Guangzhou, statt. Innerhalb von zwei Tagen haben wir Top-Anleger, Branchenführer und aufstrebende Unternehmer zusammengebracht. Mit 14 tiefgehenden Roundtables und mehreren Dutzend Einzelvorträgen haben wir die zugrunde liegenden Logiken der Kernbranchen wie KI, Hard Tech, Auslandsmarkt und Medizin analysiert und gesehen, wie die Entschlossenheit der „Minderheit“ sich zu einer Welle der Branchenveränderung zusammenschließt.“
Im Folgenden finden Sie den Inhalt des Dialogs, der von 36Kr bearbeitet wurde:
He Sichong | Projektleiter des NEXTA Innovation Lab der Ant Group (Moderator)
Luo Xiaoheng | Chefstrategieoffizier von Pacini Perception Technology
Tang Xuanlai | CTO von Keenon Robotics
Zhu Zheng | Mitbegründer und Chefwissenschaftler von Jijia Vision
Meng Hao | Gründer und CEO von Dajie Robotics
He Sichong: Herzlich willkommen, liebe Zuschauerinnen und Zuschauer, liebe Freunde!
Willkommen zu diesem Roundtable-Dialog „Die Minderheit ist die Welle“ im Jahr 2026 der Technologie. Ich bin der Moderator dieses Roundtables, He Sichong aus dem NEXTA Innovation Lab der Ant Group.
Wer sich für den Technologiebereich interessiert, wird feststellen, dass in 2026 die technologischen Richtungen, die einst als Minderheit galten, immer näher an uns herankommen und zu einer Welle werden, die die Zukunft definiert. Ob Embodied Intelligence, Weltmodelle, Flexible Fertigung oder Tastempfindung – diese Begriffe waren vor einigen Jahren noch Laborkonzepte, aber heute verändern sie tatsächlich unsere industriellen Produktionslinien, Service-Szenarien und die Art unserer Interaktion mit Maschinen. Daher ist es uns heute eine große Ehre, vier Unternehmer zu begrüßen, die an der Spitze dieser Welle stehen. Sie kommen aus verschiedenen Branchen, aber alle tun dasselbe, nämlich diese Vision in die Realität umsetzen und sie in unserer physischen Welt Wirklichkeit werden lassen.
Lassen Sie uns zunächst die vier Gäste kennenlernen. Zunächst sitzt neben mir Luo Xiaoheng, der Chefstrategieoffizier von Pacini Perception Technology. Grüßen Sie sich mal vor.
Luo Xiaoheng: Hallo, ich bin Luo Xiaoheng von Pacini.
He Sichong: Der zweite ist Tang Xuanlai, der CTO von Keenon Robotics.
Tang Xuanlai: Hallo, ich bin Tang Xuanlai von Keenon Robotics. Vielen Dank!
He Sichong: Der dritte ist Zhu Zheng, Mitbegründer und Chefwissenschaftler von Jijia Vision.
Zhu Zheng: Hallo, ich bin Zhu Zheng von Jijia Vision. Ich freue mich, mit Ihnen zu kommunizieren.
He Sichong: Und der letzte ist Meng Hao, der Gründer von Dajie Robotics.
Meng Hao: Hallo, ich bin Meng Hao von Dajie.
He Sichong: Herzlich willkommen, liebe Vier. Wir beginnen das Roundtable mit einer konkreten Frage.
Fast ein halbes Jahr von 2026 ist bereits vergangen. Haben Sie in Ihrem jeweiligen Bereich etwas bemerkt, das Ihnen besonders ins Gedächtnis gebrannt ist? Teilen Sie es uns bitte in einer Minute mit.
Luo Xiaoheng: Wenn ich an ein Ereignis denke, gibt es tatsächlich viele. Zwei Beispiele sind die Zhangxue Motorcycles und die Börsengänge von SpaceX. Hinter beiden steckt vermutlich derselbe Geist, den unser gesamtes Startup-Team immer lernen möchte.
He Sichong: Bitte teilen Sie uns später auch die Details mit.
Tang Xuanlai: Ich möchte ein Ereignis aus unserem täglichen Produktentwicklungsprozess teilen. Ich erinnere mich, dass es ungefähr im März oder April war. Da wir Embodied Service Roboter entwickeln, werden unsere Roboter hauptsächlich in verschiedenen Lebensservice-Szenarien wie Restaurants, Hotels, Einzelhandel und Krankenhäusern eingesetzt. Damals testeten wir den gesamten Prozess, wie ein humanoider Roboter Kaffee macht. Ich war auch dabei, als sie die Einstellungen vornahmen. Tatsächlich war die einzige Aufgabe während des gesamten Trainings- und Testprozesses, Kaffee zu machen, aber der Prozess war sehr interessant. Weil der Roboter nicht gut greifen konnte, fiel der Kaffee um, der Tisch war voller Wasser und die Tasse lag umgestürzt. Als unsere Ingenieure sich bereit machten, den Test zu beenden, bemerkten wir plötzlich, dass der Roboter selbst einen anderen Reinigungsauftrag ausgelöst hatte. Der Roboter versuchte, die Tasse aufzuheben und das Papier auf dem Tisch zu greifen, um den Kaffee vom Tisch zu reinigen. In diesem Moment war ich sehr überrascht. Wir sprechen immer davon, wie Embodied Intelligence in die Gesellschaft einführen und industrialisieren und engineerisieren kann. Ich fühlte plötzlich, dass es wie ein Intelligenz-Emergenz-Phänomen war, ähnlich wie beim Menschen, der je nach Umweltänderungen flexibel handelt. Heute diskutieren wir, wie sich das Embodied Intelligence-Modell weiterentwickeln kann. Tatsächlich gibt es in vielen Trainings- und Lernprozessen eine Menge grundlegende Daten und trainierte Fertigkeiten, aber es ist selten, dass es wie beim Menschen ein Intelligenz-Emergenz-Phänomen bei plötzlichen Situationen gibt. Unsere reale Umwelt ist komplex und veränderlich. Wie können wir in solchen Situationen intelligent und flexibel reagieren? Dies ist eine echte Herausforderung.
He Sichong: Als Sie gerade sprachen, kam mir plötzlich das Wort „Emergenz“ in den Sinn. Ich hätte nicht gedacht, dass der Roboter plötzlich so etwas aufbringen würde.
Zhu Zheng: Ich stimme den beiden Gästen voll und ganz zu. In den letzten sechs Monaten, insbesondere nach dem chinesischen Neujahr, hat sich die Situation geändert. Vielleicht dachten viele vor dem chinesischen Neujahr, dass Embodied Intelligence und Roboter nach den Einschätzungen des vergangenen Jahres mindestens fünf oder sogar zehn Jahre brauchen würden. Vorher hatten viele in der Autonomisierungsschiene, insbesondere bei der L4-Autonomisierung, schwere Rückschläge erlitten. Viele dachten, dass es ungefähr zehn Jahre dauerte, dieses Problem zu lösen, und wir befinden uns immer noch in der Phase L2 oder L3. Im vergangenen Jahr dachten viele, dass Roboter, einschließlich Embodied Intelligence, möglicherweise denselben Zyklus durchlaufen müssten. Aber nach dem chinesischen Neujahr fühle ich, dass das Vertrauen vieler Menschen gestiegen ist. Insbesondere mit dem Einstrom von Kapital und Talenten glauben viele, dass sich die Entwicklung beschleunigen wird, und zwar nicht linear, sondern möglicherweise nichtlinear. Ähnlich wie beim plötzlichen Auftauchen von Sprachmodellen. Dies ist mein größter Eindruck.
Meng Hao: Ich hatte möglicherweise zu hohe Erwartungen. Ich habe in den letzten sechs Monaten auf Embodied Intelligence geachtet und mich auch über alles informiert, was in der Branche passiert. Ich habe noch keinen Moment gefunden, der mich „Wow!“ sagen lässt!
He Sichong: Basierend auf den Antworten der vorherigen Gäste möchte ich noch eine weitere Frage stellen. Einige Gäste hatten einen „Wow!“-Moment, der ihnen Vertrauen gab, andere aber waren möglicherweise nicht zufrieden. Können Sie uns noch einige Beispiele geben, was in Ihrer Branche schneller als erwartet geschah und was langsamer als erwartet war? Wir beginnen nochmal mit Herrn Luo.
Luo Xiaoheng: Ich befasse mich mit verschiedenen Bereichen, einschließlich Embodied Intelligence, humanoiden Robotern und Embodied-Daten. Ich finde, dass die Investorenbranche und auch die Regierungsbeamten eine viel schnellere Lernkurve und Akzeptanz für spezialisierte, interdisziplinäre oder cross-disziplinäre Themen haben, als ich erwartet hatte. Viele Investoren und Regierungsbeamte gehen in die Branche sehr tief ein und haben eine Voraussicht, die weit über unsere Erwartungen hinausgeht.
Was langsamer als erwartet ist, ist die Akzeptanz der Allgemeinheit. Derzeit wird alles von oben nach unten vorangetrieben. In verschiedenen Veranstaltungen gibt es immer mehr humanoider Roboter. Aber es ist unklar, wie die Öffentlichkeit auf diese Phänomene reagiert. Daher ist es sehr wichtig, dass die Öffentlichkeit die Vorteile und die einzigartigen Werte von Embodied Intelligence spürt.
He Sichong: Teilen Sie uns bitte Ihre Meinung, Herr Tang.
Tang Xuanlai: In den letzten sechs Monaten hat sich die Entwicklung von großen Modellen und AI-Agenten sehr schnell vorangetrieben. Sie sind tatsächlich zu Werkzeugen und Assistenten in unserem Arbeits- und Privatleben geworden. Dies hat sich sehr schnell verändert. Sie werden feststellen, dass in unserem heutigen Leben und Arbeitsalltag immer mehr Aufgaben von diesen Tools oder Agenten übernommen werden.
Andererseits ist die Anwendung und die industrielle Umsetzung von Embodied Intelligence noch nicht so schnell vorangekommen, wie ich erwartet hatte. Unser humanoider Roboter – ein AI + physischer Träger – muss in die realen Lebenssituationen eintreten und die alltäglichen Probleme lösen. Die Entwicklung guter Produkte und Anwendungsfälle dauert länger als erwartet.
He Sichong: Was ist bei Ihnen, Herr Dr. Zhu?
Zhu Zheng: Vielleicht sind Sie alle von unserem Unternehmen Jijia Vision am meisten wegen unserer frühen Arbeit an Weltmodellen bekannt. Wir haben uns schon Anfang 2023, kurz nach der Gründung des Unternehmens, auf diese Technologieausrichtung festgelegt.
Ich stimme Herrn Luo voll und ganz zu. Ich finde, dass der größte Fortschritt darin besteht, dass die Öffentlichkeit, einschließlich der Technologiebranche, der Industrie, der Wissenschaft und der Investoren, sich immer stärker für Weltmodelle interessiert. Im Jahr 2023 war unsere größte Aufgabe, die Investoren davon zu überzeugen, warum wir Weltmodelle entwickeln. Mehrere Investoren sagten uns damals, dass sie uns investieren würden, wenn wir Sprachmodelle oder Anwendungen von Sprachmodellen entwickeln würden. Aber sie verstanden nicht, was Weltmodelle eigentlich sind. Sie fragten ChatGPT, aber es half nicht. Deshalb konnten sie uns nicht investieren. Letztes Jahr, als Fei-Fei Li ein Startup gründete, ist dieses Thema in die Öffentlichkeit getreten. Bis Anfang dieses Jahres kamen viele Investoren zu uns und erzählten uns, was sie für Weltmodelle halten und wie wir in Zukunft vorgehen sollten. Ich finde, dass dies ein sehr schneller Wandel ist.
Was langsamer voranschreitet, ist, dass die Debatten in der Industrie und in der Wissenschaft über Embodied Intelligence immer noch auf dem Gebiet von Daten, Modellstrukturen, Trainingsmethoden und Anwendungsfällen hängen. Es gibt noch viele Störungen, und die Schwerpunkte der verschiedenen Gruppen sind unterschiedlich. Daher denke ich, dass wir noch nicht so wie bei den Sprachmodellen zu einer Konvergenz gekommen sind.
He Sichong: Herr Meng, Sie sagten, dass Sie noch keinen „Wow!“-Moment hatten. Was hat Ihre Erwartungen nicht erfüllt?
Meng Hao: Ich stimme den anderen Gästen in gewisser Weise zu. Kapital, Talente und Technologie entwickeln sich immer schneller. Aber Embodied Intelligence ist viel schwieriger als große Sprachmodelle, weil es mit der physischen Welt interagieren muss. Sobald es mit der physischen Welt in Kontakt kommt, muss es in Produktivität, Effizienz, Genauigkeit und Durchsetzungsvermögen umgesetzt werden. Im Moment sehen wir, dass alle Embodied-Startups bei der Produktentwicklung noch relativ langsam voranschreiten. Wir glauben, dass es einen Zyklus gibt. Auch bei Embodied Intelligence muss man sich auf verschiedene Nischenbranchen konzentrieren und differenzierte Produkte entwickeln, um die homogene Konkurrenz zu vermeiden.
He Sichong: Aus den Antworten der vier Gäste können wir ersehen, dass die allgemeine Wahrnehmung sich stetig verbessert, manchmal sogar über unsere Erwartungen hinaus. Aber wenn es um die Umsetzung geht, gibt es noch einige Probleme zu lösen.
Ich bin sehr neugierig, ob sich bei der Lösung dieser Probleme die Produkte, die Organisationsformen oder die Kundenbedürfnisse verändert haben. Können Sie uns bitte näher dazu erzählen?
Luo Xiaoheng: Die allgemeinen Anforderungen steigen stetig. Dies ist auch der Grund, warum die Investoren und Regierungsbeamten immer besser verstehen. Vielleicht haben Sie in den Medien oder auf sozialen Netzwerken oft gesehen, dass Roboter arbeiten und in Familien kommen sollen. Dies ist eine sehr dringende Erwartung. Aber wenn ein Intelligenzsystem mit der physischen Welt interagieren muss, ist die physische Welt voller Störungen und Unsicherheiten. Wie kann ein Roboter wie ein Mensch arbeiten und Aufgaben präzise ausführen? Dies ist nicht mehr so einfach wie das Greifen und Bewegen in einem Labor. Wir müssen in halbstrukturierte oder reale Szenarien gehen und die Aufgaben dort ausführen. Ich denke, dass dies bis Ende dieses Jahres und bis nächstes Jahr die Richtung ist, in die alle Robotermarken sich bewegen müssen.
He Sichong: Wie gehen Sie konkret vor?
Luo Xiaoheng: Derzeit hat Pacini zwei Schritte. Erstens haben wir fünf Datenakquisezentren in ganz China eingerichtet. Unsere Kernkompetenz liegt in der Eigenentwicklung, Eigenbau und Eigenkontrolle. Wir haben tatsächlich mehr als 1.000 Datenakquisemitarbeiter beschäftigt, die mit Datenakquisegloves Daten sammeln. Die gesammelten multimodalen Informationen wie Tastempfindung, Sehvermögen, Sprache, Bewegungsbahnen und Selbstwahrnehmung sind wie die Fingerspitzengefühle eines Meisters. Sie umfassen Daten aus mehr als 15 + N Szenarien wie Medizin, Gesundheitsfürsorge, Konsum und Gastronomie. Beispielsweise können die Daten des Geschirrspülens direkt aufgezeichnet werden. Dies ist wie ein Kindergarten oder eine Schule für Roboter. Diese Daten sind die Grundbewegungen der Roboter. Genau wie Kinder, die manchmal Schwierigkeiten haben, einen Stab richtig zu greifen. Wenn Kinder die Grundbewegungen nicht richtig lernen, ist es schwierig, komplexere Bewegungen zu erlernen. Dies ist die Grundlage, die wir für die Roboter legen.
Als nächstes wird Pacini mit vielen nationalen und internationalen Industriepartnern zusammenarbeiten, wie beispielsweise BYD, JD.com und TCL. Wir werden in ihre realen Szenarien gehen und die gesamte Aufgabe von der Datenakquise bis zur Implementierung schrittweise umsetzen.
He Sichong: Teilen Sie uns bitte Ihre Meinung, Herr Tang.
Tang Xuanlai: Keenon ist ein weltweit führender Anbieter von universellen und speziellen Embodied Service Robotern. Wir haben in der Servicebranche mehr als zehn Jahre gearbeitet und ständig die Implementierung von Robotern in unserem Wirtschaftsleben vorangetrieben. Viele der heute in Restaurants, Hotels, Einkaufszentren und Krankenhäusern zu sehenden Liefer- und Reinigungsroboter sind von Keenon.
In den letzten zwei Jahren habe ich von unseren Kunden die größten Anforderungen bekommen. Viele Freunde fragen mich, wie es mit unseren Robotern steht und wann sie für uns waschen, kochen und Kinder betreuen können. Unsere Kunden wie Hotels und Restaurants fragen mich oft, ob