Künstliche Intelligenz-Modelle lassen die "Geldmacht" von Robotern erwachen.
Das Jahr 2025 wird als das "Jahr der Robotikkommerzialisierung" bezeichnet, einige nennen es auch das "Jahr des Geldviehs der Robotik".
Der Begriff "Geldvieh" hat seine Gründe. Zu Beginn des Jahres 2025 hat sich auf dem Gebiet der Embodied AI in China eine Art "Geldjagd" entwickelt: Im ersten Halbjahr gab es 91 Investitionen in der chinesischen Embodied - AI - Branche, mit einem Gesamtbetrag von 11,037 Milliarden Yuan, was mehr als die Gesamtsumme des gesamten Jahres 2024 ist. Der Umsatz auf der Anwendungsseite hat sich im Vergleich zum Vorjahr um das 17 - fache erhöht und zeigt ein explosionsartiges Wachstum.
Hinter den Zahlen verbirgt sich eine Veränderung der Branchenlogik - die Robotikbranche hat die Phase des "wissenschaftlichen Fiktionskonzepts" überschritten und ist in die Phase der Einlösung von skalierbaren kommerziellen Werten eingetreten. Der Kernmotor dahinter ist, dass die Technologie - Monetarisierungs - Schleife von "Datengewinnung - Modelltraining - kommerzielle Umsetzung" sich immer schneller formt.
Das Erwachen der "Menschlichkeit"
Seit der Entstehung des Begriffs "robota" in den Werken des tschechischen Schriftstellers Karel Čapek im Jahr 1920 hat der sprunghafte Fortschritt von Large Language Models den Robotern erstmals eine "menschliche Note" verliehen. Das auf der Transformer - Architektur basierende Embodied AI - Modell hat die Genauigkeit der natürlichen Sprachverarbeitung von Robotern auf 92,3 % erhöht, was nahe am menschlichen Niveau liegt. Die Roboter vollziehen einen qualitativen Sprung von der "mechanischen Klemme" zum "Denker".
Traditionelle Industrieroboter führen vorgegebene Programme aus, um feste Aufgaben zu erfüllen. Ihre Anpassungsfähigkeit an die Umwelt und die Flexibilität bei der Aufgabenausführung sind erheblich eingeschränkt. Der aktuelle technologische Durchbruch liegt in einem auf Deep Reinforcement Learning basierenden Embodied AI - System. Durch das Training eines neuronalen Netzwerks mit einer Milliarden - Skala an Parametern haben die Roboter eine menschenähnliche Umweltverstehensfähigkeit erlangt, einschließlich der Erkennung von Kontexten, der Analyse von Beziehungen zwischen Interaktionspartnern und der Wahrnehmung von emotionalen Zuständen sowie anderen mehrdimensionalen kognitiven Funktionen. Durch die integrierte Verarbeitung von Sprach -, visuellen und Bewegungssignalen durch das multimodale Large Language Model können die Roboter Aufgaben in verschiedenen Szenarien generalisiert ausführen. Gerade dieser technologische Fortschritt beschleunigt den Übergang von der "Programmgesteuertheit" zur "Kognitiongesteuertheit" der gegenwärtigen Roboter.
Es ist zu beachten, dass der Schlüssel für dieses "Erwachen der Menschlichkeit" die Unterstützung durch hochwertige und umfangreiche Datensätze ist. Um die Welt präzise zu verstehen, benötigen die Roboter eine riesige Menge an Daten aus verschiedenen Szenarien und Situationen für das Modelltraining. Je mehr und detaillierter die Daten sind, von den alltäglichen Lebenssituationen bis hin zu den industriellen Produktionsparametern, desto genauer ist das Weltkognitionmodell, das die Roboter aufbauen. Dies kann auch als eine intelligente Entität angesehen werden, die auf der Grundlage von eingebauten Algorithmen und Wissensbanken unabhängige Entscheidungen trifft und multimodale Aufgaben ausführt.
Die Erstellung eines hochwertigen Datenmodells erfordert jedoch hohe Trainingskosten. Um sicherzustellen, dass die Daten real, genau und vollständig sind, muss viel Personal und Material in die Datensammlung in verschiedenen Szenarien investiert werden. Das Datenlabeling erfordert, dass Fachleute die gesammelten Daten detailliert kennzeichnen und dem Modell erklären, was jedes Datenelement bedeutet. Dieser Prozess ist zeit- und arbeitsaufwändig. Laut einer Untersuchung des Sice Consulting Group nehmen derzeit viele chinesische Unternehmen am Datenlabeling - Geschäft teil, darunter auch große börsennotierte Unternehmen. Neben Technologieunternehmen gehören auch einige Unternehmen aus traditionellen Branchen dazu, und es sind auch eine Reihe von Outsourcing - Unternehmen entstanden, die sich speziell auf den Datenlabeling - Service konzentrieren. Von der Maschinenindustrie, der Bildung, der Medizin, der Finanzbranche, der Literatur bis hin zu Autonomfahrtszenarien, Audio - und Videodaten usw. bieten diese Unternehmen maßgeschneiderte Datenlabeling - Services für verschiedene KI - und Robotik - Forschungsunternehmen. Man kann sagen, dass der "chinesische Datenbonus" die intelligente Iteration auf der globalen Robotikbranche beschleunigt.
Das Modell beginnt, "sich selbst zu hinterfragen"
Für eine höhere Stufe der Intelligenz von Robotern sind das Selbstlernen und die Selbstkorrektur entscheidend.
Um neue Fähigkeiten zu erlernen, mussten traditionelle Roboter in der Regel von Menschen viele Codes geschrieben und die Algorithmenstruktur neu angepasst werden. Dieser Prozess war kompliziert und ineffizient. Heute kann das Modell bei einer neuen Aufgabe auf der Grundlage seiner bisherigen Lernerfahrung die Aufgabenanforderungen schnell verstehen und versuchen, aus seiner bisherigen Fähigkeitsbibliothek Strategien für die Ausführung der neuen Aufgabe zu kombinieren und zu optimieren, um neue Fähigkeiten autonom zu erlernen. Mit der Unterstützung eines guten Modells kann der Roboter in Echtzeit die Differenz zwischen seinem Verhalten und dem Aufgabenziel überwachen. Sobald er eine Abweichung entdeckt, kann er schnell die Ursache zurückverfolgen und analysieren und sein Verhaltensstrategie autonom anpassen, um sicherzustellen, dass die Aufgabe auf dem richtigen Kurs verläuft.
Die Transparenz und Offenheit des Modells spielen in diesem Prozess die Rolle eines "Katalysators". Ein transparentes Modell ermöglicht es den Entwicklern, die interne Funktionsweise und die Entscheidungslogik des Modells klar zu verstehen, was die Fehlersuche und die Leistungsoberung erleichtert. Ein Open - Source - Modell bringt die Intelligenz von Entwicklern aus der ganzen Welt zusammen. Basierend auf demselben Open - Source - Modell verbessern und innovieren die Menschen aus verschiedenen Perspektiven, was die Iteration und Verbesserung des Modells beschleunigt. Huang Renxun von NVIDIA hat kürzlich auf der dritten China Supply Chain Expo einen Roboter gezeigt. Es wird berichtet, dass 80 % der Trainingsdaten seines GR00T - Large Language Models aus der AgiBot World stammen, und dieser Datensatz ist Ende Juli auf einer chinesischen Open - Source - Plattform verfügbar geworden. Die Offenlegung von Daten und Modellen hat die Entwicklung der Embodied AI einer breiteren Technologienutzung zugänglich gemacht.
Die Anwendung von Edge - Large Language Models ist ebenfalls von großer Bedeutung. Früher waren die Roboter auf die starke Rechenleistung in der Cloud angewiesen, um Modellberechnungen und Entscheidungsanalysen durchzuführen. Probleme wie Datenübertragungsverzögerungen und Netzwerkstabilität haben die Echtzeitreaktionsfähigkeit der Roboter und die Erweiterung ihrer Anwendungsbereiche eingeschränkt. Das Edge - Large Language Model verlagert einen Teil der wichtigen Rechenkapazität auf die lokalen Geräte der Roboter. Selbst bei schlechter Netzwerkqualität oder gar Netzwerkausfall kann der Roboter auf der Grundlage des lokalen Edge - Large Language Models schnell Entscheidungen treffen und Aufgaben in Echtzeit bearbeiten. Gleichzeitig eröffnen die ständig auftauchenden neuen Architekturen auch neue Wege für die Entwicklung der Roboter.
Der "Bankier" im Billionen - Kartenspiel
Letztes Jahr habe ich in meinem Artikel "Industriebeobachtung: Die Zukunft voraussehen, neue Geschäftsfelder treten pünktlich an" erwähnt: "Ob es sich um humanoide Roboter oder Roboterhunde und - katzen handelt, die ersten und größten Wertanwendungsszenarien werden die industrielle Produktion und der militärische Bereich sein. Dies macht es zu einem neuen Wettlaufgebiet zwischen den Großmächten." Eine kürzlich veröffentlichte Studie von Morgan Stanley geht davon aus, dass der globale Markt für humanoide Roboter im Jahr 2050 die Marke von 5 Billionen US - Dollar überschreiten wird. Aufgrund der Kostenfaktoren werden die meisten humanoiden Roboter in der Industrie und im Geschäftsleben eingesetzt werden, nur etwa 10 % der Roboter werden möglicherweise in den Haushalten eingesetzt.
Interessanterweise prognostiziert die Studie auch, dass der Marktvolumen der Robotik im Jahr 2050 fast doppelt so hoch wie die Gesamteinnahmen der 20 größten Automobilhersteller weltweit im Jahr 2024 (2,488 Billionen US - Dollar) sein wird, und letztere könnten in den nächsten 25 Jahren kontinuierlich schrumpfen. Der Ruhm der traditionellen Automobilindustrie wird von dem exponentiellen Wachstum der Robotikbranche übertroffen.
Von der technischen Validierung bis zur kommerziellen Schleife zeigt die Veränderung dieser Marktstruktur, dass der Wendepunkt der Industrialisierung der chinesischen Embodied AI erreicht ist. Marina Bill, Präsidentin der International Federation of Robotics (IFR), hat einmal gesagt, dass China nicht nur ein durchschnittliches jährliches Wachstum von 5 % - 10 % aufrechterhalten wird, sondern auch in der Branche der Dienstleistungsroboter zuerst einen Cluster - Effekt bilden wird.
Wenn die Maschinen lernen, zu denken, und die Industrie beginnt, zu etablieren, wer die kontinuierlich aktualisierten Weltmodelle beherrscht, kann im kommerziellen Roboterreich weiterhin "Bankier" bleiben.
Dieser Artikel stammt aus dem WeChat - Account "Jiong Jiong Time", Autor: Jiong Jiong Time. 36Kr hat die Veröffentlichung mit Genehmigung erhalten.