StartseiteArtikel

AI-Sprachgroßmodell in Kraftfahrzeuge integriert

36氪的朋友们2026-01-09 10:15
Die CES konzentriert sich auf intelligente Fahrgastzellen. Große Sprachmodelle werden beschleunigt in Autos integriert. 2026 könnte die Massenproduktion von Agenten anbrechen.

Mit der Intelligenz-Welle, die die Automobilbranche erobert, wählen immer mehr Automobilhersteller die CES, das technologische Leuchtfeuer, um ihre technologischen Ambitionen und Innovationserfolge zu präsentieren. Dies hat dazu geführt, dass die CES auch als "zweitgrößte Automesse in den USA" bezeichnet wird.

Der Reporter hat bemerkt, dass Technologieunternehmen wie NVIDIA, LG Electronics und Bosch auf der CES Plattformen wie Automobil-Großmodelle und KI-Kabinen präsentiert haben. NVIDIA hat beispielsweise das Denk- und Inferenzmodell Alpamayo vorgestellt, das erstmals im Mercedes-Benz CLA 2025 eingesetzt werden wird. BMW hat hingegen angekündigt, sich auf eine neue Generation von Automobilplattformen zu konzentrieren, insbesondere auf intelligente persönliche Assistenten und die aufgerüstete sechste Generation der eDrive-Technologie.

Das Geely Galaxy M9, das mit der Step-Audio2-End-to-End-Sprach-Großmodell-Fähigkeit ausgestattet ist, ist auf der CES vorgestellt worden. Der englische KI-Assistent in der Kabine ist das erste interaktive System in der Branche, das ein End-to-End-Sprach-Großmodell nutzt, und hat die Besucher dazu gebracht, in einer Schlange zu stehen, um es auszuprobieren.

Auf der Geely-Bühne stehen Besucher in einer Schlange, um das Geely Galaxy M9 auszuprobieren.

Li Jing, Vizepräsident von Step-Audio, hat dem Reporter der "Science and Technology Innovation Daily" mitgeteilt, dass, wenn 2025 das Jahr des Einstiegs von Großmodellen in Autos war, 2026 hoffentlich mehr intelligente Kabinen-Lösungskonzepte realisiert werden und möglicherweise sogar die massenhafte Produktion und Anwendung von Einstiegs-Agenten (Intelligenzagenten) in Automobilkabinen beginnt.

End-to-End-Sprach-Großmodelle in Autos: Der Wendepunkt für intelligente Kabinen naht

Li Xiang, Gründer von Li Auto, hat einmal öffentlich gesagt: "KI bedeutet die gesamte Zukunft von Li Auto." Heute hat sich der Wettbewerb auf dem Automarkt vollständig hin zur Intelligenz verschoben. Die Automobiltechnologie im Jahr 2026 wird sich auf die intelligente Neuausrichtung des "dritten Raums" konzentrieren. Autos sind nicht mehr nur Fortbewegungsmittel, sondern mobile Büros, Unterhaltungszentren und Erweiterungen von Smart Homes.

Intelligente Kabinen mit Großmodellen werden als die nächste Produktgeneration angesehen. Spitzenautomobilhersteller und Anbieter von Basismodellen sind die beiden zentralen Treiber. Großmodell-Unternehmen wie ByteDance und Step-Audio sind alle aktiv in der Erforschung dieser Technologie.

Das ByteDance Doubao-Großmodell hat bereits Partnerschaften mit vielen Automarken wie Mercedes-Benz, SAIC Audi, SAIC Roewe, Changan Mazda und Dongfeng Yipai eingegangen.

Das im Rahmen der CES vorgestellte Kooperationsmodell von Step-Audio und Geely, das Geely Galaxy M9, ist bereits in Serie produziert worden und hat seit seiner Markteinführung vor vier Monaten 40.000 Exemplare verkauft.

Li Jing, Vizepräsident von Step-Audio, hat erklärt, dass mit der zunehmenden Reife der Fahrerassistenzsysteme die intelligente Kabine immer wichtiger wird. Laut ihm unterscheidet sich das End-to-End-Sprach-Großmodell von Step-Audio von den bisherigen Fahrzeugspracherkennungssystemen. Es versteht die Emotionen der Menschen, hat Emotionalintelligenz und Gedächtnis, kann die Stimme jederzeit ändern und kann wie ein kompetenter Reiseleiter von Südkorea bis nach Las Vegas sprechen.

Ausländische Besucher auf der CES testen die Interaktion in der intelligenten Kabine des Geely Galaxy M9.

"Seit 2025 beeinflussen Großmodelle die Fahrerfahrerfahrung im Auto mit hoher Geschwindigkeit. Intelligente Assistenten können jetzt relativ offen Befehle entgegennehmen, haben Gedächtnis und unterstützen mehrere Sprachen. Sie können sogar Emotionswerte bieten und je nach Zustand des Benutzers emotional reagieren. Sie haben sich von den früher starren Sprachassistenten zu Begleitassistenten im Auto entwickelt. Als dritter Lebensraum hat die Kabine derzeit noch ein enormes unerschlossenes Potenzial. Sie ist ein naturgemäß geeignetes Terminal für Super-Assistenten-Agentenprodukte."

2026 wird eine systematische KI-Fähigkeit sichtbar werden

Das Jahr 2025 gilt als das Jahr des Einstiegs von Großmodellen in Autos. Nach einem Jahr schneller Iteration hat sich die Anwendung von Großmodellen durch die Automobilhersteller von einer anfänglichen hastigen Erprobung zu einer Phase der tiefgreifenden Integration gewandelt.

Im Jahr 2026 wird die Rolle des Autos klarer werden. Die intelligente Kabine wird die kombinierten Funktionen von Unterhaltung, Arbeit und Sozialität übernehmen, und die natürliche Sprachinteraktion wird die traditionelle Mensch-Maschine-Schnittstelle ersetzen.

"2025 war eher die Zeit für die Darstellung atomarer Fähigkeiten. Im Jahr 2026 werden wahrscheinlich mehr Gesamtlösungen für intelligente Kabinen entstehen, wie beispielsweise Einstiegs-Agenten. Es ist sehr wahrscheinlich, dass diese in diesem Jahr auftauchen. Von der persönlichen Erinnerung, der aktiven Ausführung bis hin zur Inhalts-Service-Erfahrung und hin zu einem Agenten, der den Benutzer versteht - dieses gesamte Lösungskonzept wird in Serienfahrzeugen in der Kabine eingesetzt werden. Der Implementierungsfortschritt könnte schneller sein als bei anderen Terminals wie Mobiltelefonen." sagte Li Jing dem Reporter.

Du Fang, Produktmanager von PATEO, ist auch der Meinung, dass KI eine native Fähigkeit des Betriebssystems werden wird.

"Derzeit hängt die KI-Funktion in der Kabine hauptsächlich von der Rechenleistung in der Cloud ab. Die End-Cloud-Kooperation ist jedoch der zukünftige Kernbereich der Entwicklung. Die tiefe Integration der KI-Fähigkeit in die unterste Ebene des Betriebssystems ist sowohl die zentrale Grundlage für die Fahrzeugintelligenz als auch der Rechenkern für die Integration der Erfahrungen in der Kabine, bei der Fahrerassistenz und im Fahrwerk. Genauer gesagt muss es sich nach unten bis zur untersten Architektur des Betriebssystems erstrecken und nach oben bis zur Ebene der Cloud-Agent-Ökosysteme erweitern, einschließlich offline-Sprache-KI, Endgeräte-VLM, Endgeräte-Gedächtnis, Endgeräte-Agenten sowie Cloud-Zentralen, Cloud-Gedächtnis und Cloud-Agenten."

Herausforderungen wie End-Cloud-Kooperation müssen noch überwunden werden

Allerdings ist die Erfahrung mit Großmodellen immer noch stark differenziert. Die Branchenressourcen sind hauptsächlich auf das Gebiet der Fahrerassistenz konzentriert. Die Automobilhersteller haben die Szenarien und Funktionen von Kabinen-Großmodellen noch nicht ausreichend ausgebaut.

Li Jing ist der Meinung, dass die Verbesserung der Erfahrung in der intelligenten Kabine eine umfassende Umgestaltung des bestehenden Systems erfordert. "Für jeden Automobilhersteller ist dies eine sehr vorsichtige Entscheidung. Der Übergang vom traditionellen Modell zum von Großmodellen angetriebenen Modell erfordert nicht nur eine gute Erfahrung, sondern auch die Nachweisbarkeit der Zuverlässigkeit der Fähigkeiten."

Zweitens ist die End-Cloud-Kooperation zum Hauptschlachtfeld in der Entwicklung der intelligenten Kabine geworden. Endgeräte-Großmodelle können die Einschränkungen von Cloud-Lösungen in Bezug auf Kosten, Netzwerkabhängigkeit und Datenschutz ausgleichen. "Derzeit laufen die meisten Modelle noch in der Cloud. Die gute Gestaltung der End-Cloud-Kooperation ist eine große Herausforderung. Insbesondere die Rechenleistung des Endgeräte-Chips bestimmt direkt die Modellgröße und die Szenarien-Anpassung." sagte Li Jing.

Darüber hinaus ist es auch entscheidend, ob Großmodelle in der Lage sind, mehr relevante Anbieter zu gewinnen, um die Anwendungsökosysteme in der Automobilbranche neu zu gestalten.

"Das Auftauchen der Agenten-Interaktion wird die Dienstleistungsform stark verändern und sogar die Benutzererfahrung und das Geschäftsmodell neu gestalten. Die Art der Dienstleistungsverteilung wird sich ändern. Sobald die Agenten zu Assistenten werden, die den Benutzer besser verstehen, wird die Empfehlung von Dienstleistungen, wie beispielsweise die Auswahl eines Fluges und der Preisbereich, an die Agenten übergeben werden." sagte Li Jing.

Früher hat die Multitouch-Interaktion und das APP-Anwendungsökosystem des iPhone die Benutzererfahrung neu definiert, das Smartphone auf den Weg zur Intelligenz gebracht und die umfassende Entwicklung der Mobilfunk-Internet-Industrie vorangetrieben. In Zukunft muss auch das von Großmodellen angetriebene Agentensystem und sein Betriebssystem ein reifes Verteilungsnetzwerk aufbauen, um die Intelligenzrevolution im Automobilbereich voranzutreiben und neue Geschäftsmodelle zu schaffen.

Dieser Artikel stammt aus dem WeChat-Account "Kechuang Ribao". Autor: Huang Xinyi. Veröffentlicht von 36Kr mit Genehmigung.