Der Wendepunkt ist erreicht: 70 % des Wertes von "Künstliche Intelligenz +" stammen aus dem Internet der Dinge. Die KI findet ihren Platz in der physischen Welt.
In der vergangenen Woche gab es zahlreiche Hotspots im Bereich Künstliche Intelligenz (KI). Am 6. August veröffentlichte Google die neueste Version des Weltmodells Genie 3. Dieses Modell hat erstmals die Echtzeitinteraktion in der Generierung von 3D-Umgebungen ermöglicht, was beeindruckende Ergebnisse erzielt hat. Kurz darauf, am 8. August, stellte OpenAI offiziell GPT-5 vor, was erneut heftige Diskussionen in der Branche auslöste.
Tatsächlich habe ich bereits vor diesen Durchbrüchen in einem Artikel vorhergesagt, dass 70 % des Industriewerts von „Künstliche Intelligenz +“ schließlich dem Internet der Dinge (IoT) zukommen würden. Damals wurde diese Einschätzung von vielen als mutig oder sogar radikal angesehen. Doch mit der Beschleunigung des KI-Industrialisierungsprozesses wird diese Ansicht von immer mehr Tatsachen bestätigt.
Im Zuge der KI-Industrialisierungstendenz wird das IoT nicht nur nicht marginalisiert, sondern wird zunehmend zur zentralen Triebkraft, die die tatsächliche Umsetzung von KI und die Bereitstellung von Wert für alle Branchen vorantreibt. Es wird geschätzt, dass bis 2025 die Anzahl der globalen IoT-Endgeräteverbindungen die Marke von 27 Milliarden überschreiten wird. Noch wichtiger ist, dass die massenhaften IoT-Endgeräte in Szenarien wie Produktion, Verkehr, Medizin und Städte 67 % bis 72 % der ursprünglichen Datenquellen für KI-Anwendungen liefern. Man kann sagen, dass das IoT die solide und weitreichende Datenbasis für die Evolution und Anwendung von KI geworden ist.
Diese Tendenz wird in den neuesten Durchbrüchen der KI-Grundmodelle bestätigt. Neue Generationen von KI-Systemen wie GPT-5 und Genie 3 wandeln sich von der reinen Abhängigkeit von virtuellen Daten wie Internettexten und Bildern hin zu einer aktiven Wahrnehmung, einem Verständnis und sogar der Manipulation der physischen Welt.
Hinter diesen technologischen Updates wird der Wert des IoT immer deutlicher. Es ist nicht nur ein Datensammler, sondern auch eine unverzichtbare Brücke für die Interaktion, das Feedback und das kontinuierliche Lernen von KI mit der realen Welt.
Sei es ein stärkeres Weltmodell oder ein intelligentes Agens, das eigenständig handeln kann, beide verlassen sich auf die großen Mengen an Echtzeit-, Multimodal- und Embodied-Daten, die von IoT-Endgeräten generiert werden. Diese Daten sind nicht nur in großer Menge vorhanden, sondern enthalten auch reichhaltige physikalische Attribute, Szenariomerkmale und Verhaltenssemantik, was der Schlüssel für KI-Modelle ist, um Halluzinationen zu überwinden und hin zu echter Intelligenz zu gelangen.
Tatsächlich werden die Grenzen der großen Modelle bereits ersichtlich. Die Intelligenz, die durch die bloße Erweiterung von Parametern und die Stapelung von Rechenleistung erreicht wird, stößt an die Grenzen der virtuellen Welt: unzureichende Inferenzfähigkeit, fehlende physikalische Allgemeinkenntnisse, Schwierigkeiten bei der Generalisierung, häufige Halluzinationen... Um diese Engpässe zu überwinden, muss KI zur realeren und komplexeren physischen Welt zurückkehren.
Der Wendepunkt ist gekommen. Bei der nächsten Intelligenzrevolution wird der Schauplatz nicht mehr die Datensammlung und der Algorithmus-Showroom in der virtuellen Welt sein, sondern die Absenkung von intelligenten Agenten, die vom IoT dominiert wird, sowie die Wahrnehmung, das Verständnis und die Handlung in der realen Welt. Das Erwachen von AIoT wird es ermöglichen, dass höhere Formen von Intelligenz in die Realität treten.
Die Grenzen der virtuellen Intelligenz vs. der Anfang der physischen Intelligenz
In den letzten Jahren wurde das Scaling Law zum Glaubensbekenntnis für den rasanten Fortschritt der Künstlichen Intelligenz. Wie in der obigen Abbildung gezeigt, folgt die Entwicklung großer Modelle seit GPT-3 fast einer einfachen Logik der „gewaltigen Ästhetik“: Je größer die Parameter, je mehr Daten und je stärker die Rechenleistung, desto näher kommt die Intelligenz an die Allgemeinintelligenz heran.
Von GPT-4, GPT-4o bis hin zum gerade veröffentlichten GPT-5 hat jede Iteration die Grenzen von Größe und Fähigkeit neu definiert. Von der Textgenerierung bis zum Multimodalverständnis haben diese Modelle tatsächlich erstaunliche Fähigkeitssteigerungen gebracht. Doch hinter größeren und stärkeren Modellen zeigen sich auch unausweichlich Grenzen und Engpässe.
Mit dem Verbrauch der Datendividende und dem exponentiellen Anstieg der Rechenleistungskosten wird die Verbesserung der Genauigkeit und der Generalisierungsfähigkeit der Modelle immer langsamer und zeigt sogar tendenziell abnehmende Grenznutzen.
Das von OpenAI hochgewartete neue Modell GPT-5 hat nach der Veröffentlichung unerwartete erste Reaktionen bekommen. Einige frühe Benutzer haben sich darüber beschwert, dass seine Leistung „tölpelhaft“ sei und sogar schlechter als die des Vorgängermodells.
Der Chef von OpenAI, Sam Altman, hat am Freitag schnell reagiert und Plus-Benutzern erlaubt, weiterhin die vorherige Version GPT-4o zu verwenden.
Was noch besorgniserregender ist, ist, dass die Halluzinationsphänomene von großen Modellen in der virtuellen Welt schwer zu bekämpfen sind. Viele Tatsachen zeigen, dass KI immer noch „reden kann, aber nicht handeln kann“. Sie sind gut darin, in vorhandenen Datenverteilungen zu füllen oder zu imitieren, aber haben Schwierigkeiten, die Sandkiste der virtuellen Welt zu verlassen und komplexe und sich ständig ändernde reale Szenarien wirklich zu verstehen und zu bewältigen.
Es hat sich bewiesen, dass es für KI schwierig ist, die Grenze der virtuellen Intelligenz zu überschreiten, indem man einfach Daten und Rechenleistung stapelt. Dies macht die sogenannte „Künstliche Intelligenz + Internet der Dinge“ nicht mehr zu einer überflüssigen Zutat, sondern zum Fundament der Agentenzeit. AIoT verbindet nicht nur alle Dinge, sondern verleiht ihnen auch Intelligenz und ist der unvermeidliche Weg für KI, ihre Grenzen zu überschreiten.
Genau in diesem Kontext werden die Daten aus der physischen Welt zur neuen Goldgrube für die Evolution von KI. Wenn der Wert von Text- und Bilddaten nahezu erschöpft ist, werden die Daten aus der realen Welt, die von IoT-Endgeräten gesammelt werden, zur „Lebensquelle“ für die Steigerung der KI-Fähigkeiten.
Wie im obigen Video gezeigt, hat die Veröffentlichung von Genie 3 es erstmals ermöglicht, dass das Weltmodell in einer 3D-physischen Umgebung in Echtzeit interagieren kann. Die Forschung und Umsetzung von Embodied Intelligence Agenten betonen ebenfalls die Fähigkeit von KI, die physische Welt aktiv zu wahrnehmen, zu manipulieren und darauf zu reagieren. Das Wesen dieser neuesten Beispiele ist die Paradigmaänderung der KI-Fähigkeiten von der virtuellen zur physischen Welt.
Nur die Daten aus der Wahrnehmung, Interaktion und Rückmeldung der physischen Welt können KI echte Generalisierungsfähigkeit und kausale Inferenzfähigkeit verleihen. Diese Art von Daten ist nicht nur in großer Menge und hoher Qualität vorhanden, sondern enthält auch reichhaltige Szenariodiversität und dynamische Veränderungen, was der Schlüssel ist, um Agenten in der Lage zu sein, sich an komplexe Umgebungen anzupassen.
Obwohl die Datensammlung, -annotierung und -generalisierung in der physischen Welt enorme technologische und Kostenschwierigkeiten mit sich bringt, übersteigt der Wert der „Szenariogeneralisierung“ weit die Datensammlung in der virtuellen Welt. Der Evolutionsweg von KI kann die tiefe Annäherung an die physische Welt nicht vermeiden.
Weltmodell × AIoT: Der Aufstieg neuer Arten von Agenten
Im Verlauf der Entwicklung von KI wurde „Big Data“ einst als universaler Schlüssel für die Intelligenzevolution angesehen. Unzählige Modelle haben durch die Stapelung von massiven Text-, Bild- und Audiodaten bisher unerreichbare Ausdrucks- und Verständnisfähigkeiten erlangt. Doch mit der Annäherung der KI-Fähigkeiten an die Grenzen der virtuellen Welt wird dieses Paradigma des „Sieges durch Quantität“ zunehmend unwirksam. Stattdessen besteht ein extremer Bedarf und Wettbewerb um „gute Daten“. In Zukunft wird es nicht mehr die absolute Größe der Daten, sondern die Qualität und Struktur von „guten Daten“ sein, die die Umsetzung und Evolution von KI vorantreiben.
In der physischen Welt ist „gute Daten“ der zentrale Engpass für die Wahrnehmung, das Verständnis und die Entscheidungsfindung von KI. Was sind „gute Daten“? Erstens muss es physikalische Authentizität aufweisen, d. h. die Daten stammen aus realen Umgebungen, realen Manipulationen und realen Rückmeldungen und können die Regeln und Dynamiken der physischen Welt genau widerspiegeln. Zweitens muss es semantische Verständlichkeit haben, nicht nur einfache Sensorsignale, sondern Daten mit klaren Labels, Strukturen und semantischen Informationen, die für die kognitive Ebene des Modells nützlich sind. Noch wichtiger ist die Szenariogeneralisierung, d. h. die Daten müssen verschiedene Szenarien, komplexe Umgebungsveränderungen und Randbedingungen abdecken, um sicherzustellen, dass das Modell Transfer- und Generalisierungsfähigkeiten besitzt.
In der Agentenzeit sind „gute Daten“ der wahre Treibstoff für die Evolution von KI und die Grundlage für alle technologischen Durchbrüche. Denn das Erwachen von Agenten erfordert Embodied Intelligence und Weltmodelle als Stützpunkte und die kooperative Evolution über das AIoT-Agentennetzwerk.
Viele Menschen denken fälschlicherweise, dass Embodied Intelligence gleichbedeutend mit humanoiden Robotern sei. Tatsächlich ist das Wesen von Embodied Intelligence die Fähigkeit von KI, die Umwelt aktiv zu wahrnehmen, physisch zu interagieren und sich selbst zu lernen. AIoT-Agenten sind der beste Träger für diese Fähigkeiten. Ob in der Fabrikautomatisierung, in intelligenten Städten, bei der automatischen Zustellung oder in der Smart Home-Lösung, AIoT-Agenten dringen auf verteilte und vernetzte Weise stumm in jeden Winkel der physischen Welt vor.
Die Entwicklung des Weltmodells bringt KI von der Fähigkeit, „zu reden“, zur Fähigkeit, „zu handeln“, und entwickelt aus der Fähigkeit zur Verarbeitung von „Pixeln/Texten“ die Fähigkeit zur physischen Kausalität und abstrakten Inferenz. Nehmen wir das von dem Computervissenschaftler Yann LeCun befürwortete neue Weltmodell als Beispiel. KI ist nicht mehr nur darauf beschränkt, Daten passiv zu rekonstruieren, sondern kann die Umweltentwicklung aktiv vorhersagen, die Konsequenzen ihrer eigenen Handlungen ableiten und Gegenfaktische Inferenz und Null-Sample-Planung durchführen.
Das Wesen dieser Fähigkeit ist das tiefe Verständnis und die generalisierte Anwendung der Regeln der physischen Welt. Und all dies ist nicht möglich ohne die aktive Wahrnehmung, verteilte Entscheidungsfindung und Echtzeitrückmeldung, die von dem AIoT-Agentennetzwerk unterstützt werden. Jeder Embodied Intelligence Agent ist wie ein „Auge“ und eine „Hand“ in der physischen Welt und bildet über das IoT-Netzwerk ein kooperatives, gemeinsames und evolvierendes Superintelligent-Agentenökosystem.
Letztendlich muss die Generalisierungsfähigkeit und die Anpassungsfähigkeit von Agenten auf einem physischen Welt-Closed-Loop des AIoT basieren. Das Weltmodell ist das Fundament der Kognition, und AIoT ist das Skelett der Handlung. Nur die Zusammenarbeit beider kann das Erwachen von Agenten in der physischen Welt ermöglichen.
Von der Hundred-Model-Wars zur Agentenökonomie
Mit der raschen Entwicklung der KI-Technologie steht die Branchenlandschaft vor einem beispiellosen Wendepunkt.
In den letzten zwei Jahren hat sich die KI in der „Hundred-Model-Wars“ rapide entwickelt. Unzählige große Modelle, Anwendungen und Plattformen sind aufgetaucht und versuchen, sich in Bezug auf Algorithmen und Größe voranzubringen. Doch die Fenster für die Technologie- und Traffic-Dividende schließen sich. Der eigentliche Wettbewerbsschwerpunkt verschiebt sich von der Bewertung der Modellfähigkeiten hin zur Kontrolle von Plattformisierung, Hardware-Software-Integration und Daten-Closed-Loop. Große Modelle sind bereits Infrastruktur. Wer in breiteren Industrieszenarien „Agenten = Ökosystem“ realisieren kann, hat die Chance, die nächste Intelligenzrevolution zu leiten.
Die Verschiebung des Schwerpunkts von KI markiert die tiefe Evolution des KI-Geschäftsmodells von „Modell als Dienstleistung“ zu „Agenten als Ökosystem“. In komplexen Szenarien der physischen Welt wie Fabriken, Städten, Logistik und Medizin kann eine einzelne KI-Modell-API nicht mehr die Anforderungen des gesamten Prozesses von der Wahrnehmung über die Entscheidungsfindung bis zur Ausführung erfüllen. Unternehmen und städtische Kunden wünschen sich lieber integrierte Hardware-Software-Plattformen, um end-to-end Daten-Closed-Loop und kontinuierliche Evolution zu erreichen.
Nehmen wir die automatisierte Fabrik als Beispiel. Nur wenn man die gesamte Kette von Geräten, Sensoren, KI-Entscheidungsfindung und Roboterausführung verbindet, kann man ein selbstlernendes, selbstoptimierendes und selbstverwaltendes intelligentes Produktionssystem schaffen. Die Anforderungen an die aktive Zusammenarbeit und die dynamische Planung von Agenten in der Logistikbranche machen auch die Unersetzlichkeit von Platt