StartseiteArtikel

Die WAIC wurde zu einem Karneval, und die Künstliche Intelligenz wird immer praktischer.

窄播2025-07-31 08:22
Der Markt ist das Prüfgelände.

Im Vergleich zu humanoiden Robotern, deren Vorführungen stark auf Lauf-, Sprung- und Hüpfunktionen basieren, beginnt KI in einigen Bereichen bereits, echte komplexe und reale Probleme zu lösen.

Die diesjährige WAIC (World Artificial Intelligence Conference) war besonders lebhaft. Innerhalb der vier Tage der Ausstellung strömten 350.000 Besucher ein, die Ausstellungsfläche betrug über 70.000 Quadratmeter und es gab über 3.000 Ausstellungsstücke. Gegen 17 Uhr, wenn die Ausstellung endete, waren viele Besucher immer noch ungesättigt und verließen die Halle erst nach mehrmaligem Drängen der Sicherheitsleute.

Die beeindruckende Atmosphäre dieser Ausstellung ist ein Spiegelbild der beschleunigten Integration von KI in das reale gesellschaftliche Leben. Anfang des Jahres löste DeepSeek eine KI-Welle aus und prägte damit das Thema der diesjährigen KI-Entwicklung: die Umsetzung in der Praxis. Man kann beobachten, dass auf Douyin immer mehr KI-Videos auftauchen, Agenten anfangen, komplexe Aufgaben wie Bildbearbeitung und Webseitenentwicklung für Benutzer zu übernehmen, und Browser, Tabellenkalkulationen, Brillen, Spielzeuge und Autos werden alle mit KI-Funktionen ausgestattet...

Der Bericht "Symbiotische Partner: Die zehn größten Trends in der Künstlichen Intelligenz 2025", gemeinsam veröffentlicht von der Tencent Research Institute, dem Tencent YouTu Laboratory und Tencent Technology, weist darauf hin, dass die KI einen entscheidenden Sprung von der "Inferenz" zur "Aktion" macht. Ihre Rolle wird sich von der eines "digitalen Außenhirns", das den Menschen unterstützt, zu einem "symbiotischen Partner" entwickeln, der mit dem Menschen zusammenarbeitet.

Der rasante Fortschritt der KI in der Anwendungsdomäne hat die WAIC von einer technischen Ausstellung für B2B-Brancheneinsteiger zu einem KI-Carnival für eine breite Masse von Endverbrauchern (C2C) gewandelt. Die Besucher sahen Roboterboxkampfmeisterschaften, Brillen, die Texterkennung und Übersetzung ermöglichen, interaktive Spielzeuge, experimentierten mit der KI-gestützten Video- und Musikproduktion, saßen in Fahrerhäusern, die von Agenten gesteuert werden, und probierten Cocktails, die von großen Modellen kreiert wurden.

Hinter all diesem hat sich zu diesem Zeitpunkt eine sich gegenseitig fördernde symbiotische Beziehung zwischen Technologie und Markt etabliert. Einerseits entwickelt sich die Technologie der großen Modelle kontinuierlich in Richtung Multimodalität, starker Inferenzfähigkeit und niedrigen Kosten, was die Umsetzung von KI in mehr Bereichen ermöglicht. Ye Jieping, Vizepräsident von Alibaba Cloud, meint, dass die großen Modelle im Jahr 2025 einen "wöchentlichen Iterationssprung" erlebt haben.

Andererseits wird die kontinuierliche Vertiefung der Anwendungen die KI-Technologie in die Lage versetzen, ihren wahren Wert zu entfalten. Wang Jian, Gründer von Alibaba Cloud, sagte, dass eine Technologie nie reif werden kann, wenn sie nicht in den Markt gebracht wird. Erst wenn sie in den Markt eingesetzt und validiert wird, kann eine echte wertvolle Technologie geschaffen werden. "Viele Projekte werden vielleicht in fünf bis zehn Jahren verschwinden, aber sie treiben die Exploration voran, und das an sich hat schon Wert."

Auf der WAIC 2025 können wir sehen, dass die KI in Bereichen wie Agenten, Video, Spielzeugen/Brillen und Autos eine schnellere Umsetzung in der Praxis ermöglicht. Im Vergleich zu humanoiden Robotern, deren Vorführungen stark auf Lauf-, Sprung- und Hüpfunktionen basieren, beginnt die KI in diesen Bereichen bereits, echte komplexe und reale Probleme zu lösen.

Agenten machen den Menschen zu einem Superindividuum

Die Veranstaltungen von Alibaba und Tencent während der WAIC 2025 standen alle im Zeichen der Agenten. Alibaba zeigte das neueste Tongyi-Großmodell und stellte den ersten Cloud-Computer "Wuying Agent Bay" für KI-Agenten vor, der grundlegende Aufgaben wie Codeausführung, Webbrowsing, Datenanalyse, Programmierung und Tabellenkalkulation ausführen kann und außerdem über mehrere KI-Fähigkeiten wie visuelle Verständnis, natürliche Sprachsteuerung und Aufgabenanalyse verfügt.

Auf dem "Forum für die Anwendungsökosystem von Alibaba Cloud Agent: Open Source und Offenheit" sagte Ye Jieping, Vizepräsident von Alibaba Cloud, wir stehen am Anfang der "Agenten-Prioritätszeit", deren Kern die Fähigkeit der Agenten ist, komplexe Aufgaben autonom zu erledigen und sich kontinuierlich aus der Interaktion zu entwickeln. "Wenn die L3-Intelligenzagenten die Branchenbasis bilden, werden wir eine exponentielle Produktivitätsrevolution erleben, die von emergenter Intelligenz und ökosystemarer Selbstorganisation angetrieben wird."

Tencent hat dagegen die Plattform für die Entwicklung von Intelligenzagenten für die B2B-Branche und das Tencent Yuanqi für Endverbraucher (C2C) aktualisiert. Die erste Plattform ermöglicht es, mehrere Intelligenzagenten ohne Programmierkenntnisse zu erstellen und ihre Kooperation zu gewährleisten, während die zweite es ermöglicht, mit einem Klick Matrix-Accounts zu autorisieren und Wissensdatenbanken von öffentlichen Accounts abzurufen. Wu Yunsheng, Vizepräsident von Tencent Cloud und Leiter des Tencent Cloud Intelligence und des Tencent YouTu Laboratory, meint, dass die Agenten eine sehr wichtige Form sein werden, um die Technologie der großen Modelle in der Branche umzusetzen und Wert zu schaffen.

Wu Yunsheng sagte, was an den Agenten so aufregend ist, dass es sich um ein Gruppenverhalten handelt. "Vielleicht kann eine kleine Anwendung, wenn jemand seinen Bereich perfekt versteht, auch sehr gut funktionieren. Da die Nachfrageseite unendlich segmentiert ist, gibt es immer verschiedene Chancen, und dieses Ökosystem wird sich ständig weiterentwickeln."

Die Konzernen bieten immer mehr Modelle, Werkzeuge und Plattformen für die Entwicklung von Agentenfähigkeiten an, damit mehr Branchenunternehmen darauf aufbauen können, um umfangreiche Branchenanwendungen zu entwickeln. Autoren von öffentlichen Accounts können mit der Yuanqi-Plattform einen Agenten für ihren Account erstellen, um anstelle des Autors mit den Fans zu interagieren. Das Business Research Multi-Agent System atypica.AI von Tezign kann basierend auf den Benutzerforschungserfordernissen autonom Agenten erstellen und interaktive Inhalte generieren.

Im Bereich der Personalrekrutierung kann die Zhaopin auf Basis eines Multi-Agenten-Frameworks die KI so trainieren, dass sie versteht, dass "Fachkenntnisse in MFC (Microsoft C++ Development Framework)" in einem Lebenslauf bedeutet, dass der Kandidat die Programmiersprache C beherrscht. Im Büroalltag ermöglicht der Agent von WPS es den Benutzern, Dokumente und Präsentationen über natürliche Sprachgespräche zu erstellen. Im Marketingbereich kann der Agent von Titanium Tech in allen Phasen der internationalen Marketingkette, wie Kreativität, Werbeplatzierung und Datenanalyse, eingesetzt werden.

Um es mit den Worten von Chen Zhibo, CTO des Agent-Designprodukts Lovart, zu sagen: "Die generative KI macht uns immer mehr zu Superindividuen." Die KI erweitert die Fähigkeiten jedes Einzelnen, sodass auch normale Leute Aufgaben wie Design, Programmierung und Videogenerierung erledigen können. Die Agenten setzen diese Fähigkeiten in konkreten Szenarien um, senken die Schwelle für die Nutzung der KI durch normale Menschen und erhöhen die Vorhersagbarkeit der KI-Ergebnisse.

Die KI transformiert die Videoproduktionskette

Die Videoproduktion ist ein wichtiges Szenario, das von der KI verändert wird.

Gai Kun, Vizepräsident von Kuaishou und Leiter des Keling AI Business Units und der Community Science Line, sagte auf dem Keling AI Ökosystem-Forum der 2025 WAIC, dass das Jahr 2025 sicherlich ein Schlüsseljahr für die tiefgreifende Anwendung der generativen KI-Technologie sein wird. Kuaishou glaubt, dass die Videogenerierungsmodelle früher einen Durchbruch erleben werden als die allgemeine künstliche Intelligenz (AGI), und die Reife und die Entwicklungsgeschwindigkeit der Anwendungen werden ebenfalls schneller sein.

Derzeit bietet Keling bereits API-Services für über 20.000 Unternehmenskunden an und hat insgesamt über 400 Millionen Bilder und 200 Millionen Videos generiert. Zhao Jie, Geschäftsführer und Produzent der neuen Fernsehserie der Peking-Branche von Huace Film and TV, sagte, dass Huace bereits im Jahr 2024 mit der Verwendung von KI-generierten Szenen in der Kurzfilmerstellung experimentiert hat. Pan Fei, CEO von BlueFocus, gab bekannt, dass BlueFocus durchschnittlich zwei- bis dreitausend Videos in Filmqualität pro Monat mit Keling AI erstellt.

Im Vergleich zur Generierung von Videomaterial mit Modellen ist die Umgestaltung der industriellen Produktionsbeziehungen durch die Anpassung von KI-Werkzeugen das tiefere Ziel der KI-Transformation in der Videoproduktion. Keling hat auf der WAIC ein neues Videokreativ-Arbeitsplatz-Tool namens "Lingdonghuabu" vorgestellt. Dies ist ein Werkzeug, das den Videoproduktionsgewohnheiten der KI-Zeit entspricht und den gesamten Produktionsprozess von der Materialgenerierung über die Zusammenarbeit bis zur Fertigstellung eines Videos abdeckt.

Neben Keling arbeiten auch Vidu, MiniMax und das Vizual Effects-Unternehmen Digital Kingdom daran, den KI-Videoproduktionsprozess zu optimieren. Vidu Q1 erspart die Storyboard-Erstellungsphase und kann ein Video direkt aus Referenzbildern von Personen, Gegenständen und Szenen generieren. Der Conch Video Agent von MiniMax plant, schrittweise von der professionellen Vorlagen-basierten Produktion über die halb-konfigurierbare Bearbeitung bis zur vollständigen End-to-End-Agentenfunktion zu evolvieren.

Digital Kingdom hat zuvor eine künstliche-intelligenz-gesteuerte Videoproduktionslösung namens "Hamburg" entwickelt und diese in der kommerziellen Werbung von Alibaba Cloud und MediaTek eingesetzt. Auf der WAIC hat Digital Kingdom eine einheitliche Videoproduktionsplattform namens "AI DOMAIN" vorgestellt, die sieben Kernfunktionen wie Text-zu-Bild, Bild-zu-Video, lokale Neuzeichnung, Stilübertragung, Bildvergrößerung, Videoaufwertung und virtuelle Personenerstellung bietet.

Gai Kun meint, dass sich mit der Zeit die Generierungsergebnisse der Modelle sicherlich verbessern werden, und dass die Kontrollierbarkeit der Videogenerierung ständig verbessert wird. Dies wird der industriellen Anwendungsseite mehr Möglichkeiten und Chancen bieten und die gesamte Branche neu gestalten.

Spielzeuge und Brillen werden von der KI neu gestaltet

Am Standort der WAIC waren neben den Roboterexponaten auch die Stände für KI-Spielzeuge und KI-Brillen immer voll von Menschen. Der Stand von SenseTime zeigte verschiedene KI-Spielzeuge, darunter Plüschtierchen von Luobo Intelligence, eine Basis, die ein Puppenfigur lebendig macht, und Puppen, mit denen man Freunde knüpfen kann, indem man an der Kopfantenne tippt. In anderen Ausstellungsbereichen gab es auch verschiedene Produkte im Zusammenhang mit KI-Spielzeugen, wie Plüschtierchen, elektronische Taschenuhren und elektronische Haustieruhren.

Wir glauben, dass KI-Spielzeuge oder KI-Begleitprodukte in zwei Richtungen entwickelt werden: Funktionswert und Emotionswert. In Bezug auf den Funktionswert möchten die Produzenten sich auf das Wachstum von Kindern konzentrieren. Neben der Bildungsmöglichkeit sollen die KI-Spielzeuge auch als Vermittler zwischen Kindern und Eltern dienen, um den Eltern zu helfen, die Interessen und Emotionen ihrer Kinder zu verstehen und mit ihnen auf eine gleichberechtigte und effektive Weise zu kommunizieren.

In Bezug auf den Emotionswert richten sich diese Produkte in der Regel zunächst an junge Frauen. Daher legen diese Produkte mehr Wert auf das Schaffen einer niedlichen Optik und einer interaktiven Bedienung. Beispielsweise haben Plüschtierchen ein niedliches Äußeres, lebendige Augen, eine zarte Stimme und verschiedene Persönlichkeiten. Einige Produkte geben keine Antworten in Form von Gesprächen, sondern reagieren auf die Benutzer über Augenbewegungen, Stimmen und Vibrationen.

Im Wesentlichen sind die Produkte in Bezug auf den Emotionswert eher wie Haustiere konzipiert. Auf der WAIC sahen wir nicht nur physische KI-Spielzeuge, sondern auch virtuelle Haustiere oder Partnerprodukte. Das multimodale KI-Begleitprodukt "Zooo Dongdong Animal Circle" von Zhipu ermöglicht es den Benutzern, Bilder von Spielzeugen oder Personen hochzuladen, um interaktive Partner zu generieren.

Im Bereich der KI-Brillen waren die Stände von Rokid, XREAL und Halliday die "Hotspots" für Schlange stehen. Ich musste eine Stunde an den Ständen von Rokid und Halliday warten, um die Produkte ausprobieren zu können. Im Vergleich zur Wellenleiter-Einzelgrün-Anzeigelösung von Rokid ist die Lösung von Halliday, bei der ein kleiner Bildschirm in den Brillenrahmen integriert ist, eher an die Erfahrung mit herkömmlichen Brillen angelehnt. Der Text wird nicht auf der Linse angezeigt, sondern der Benutzer muss seinen Blick leicht nach oben richten, um auf den kleinen Bildschirm oben rechts auf der Brille zu schauen.

Natürlich haben wir nur die KI-Brillen von Quark gesehen. Vielleicht können wir erst Ende des Jahres erleben, wie es ist, die C2C-Fähigkeiten von Alibaba in eine Brille zu integrieren.

Insgesamt haben wir festgestellt, dass die KI-Brillen eine starke Konkurrenz zu herkömmlichen Brillen sein können, wenn die Probleme mit der Akkulaufzeit, der Anpassung an Sehfehler und der Tragekomfort gelöst werden und die Preise gesenkt werden.

Das intelligente Fahrerhaus wird aktiver

Das Auto ist ebenfalls ein Bereich, in dem wir glauben, dass die KI schneller eingesetzt werden wird. Mit der Unterstützung von Großmodellen wird das