Der Kampf um die Modelle ist noch nicht beendet, aber das Geld fließt schon woanders hin: Die Kapitalwahrheit hinter einer abgesperrten Sitzung von CEOs von 100-Personen-AI-Unternehmen
Schauen Sie nicht nur auf die großen Modelle. Die Unternehmen, die in der Lage sind, AI-Produkte zu entwickeln, verdienen Geld.
Am 1. November veranstaltete das Jinqiu-Fonds in Peking ein Treffen mit fast hundert Gründern aus dem Bereich Künstliche Intelligenz. Sie sprachen über die Branchentrends, diskutierten über technologische Veränderungen und teilten ihre scharfen Einsichten in ihren jeweiligen Bereich.
Der Jinqiu-Fonds wurde 2022 gegründet und ist ein US-Dollar-Fonds mit einer Laufzeit von 12 Jahren. Er konzentriert sich auf Investitionen in Künstliche Intelligenz, Embodied Intelligence und deren Kernindustriechains. Im vergangenen Jahr hat er in über 50 Projekte investiert. "Nach unseren Erkenntnissen gehört er in der gesamten Branche zu den Top 2", sagte Zang Tianyu, Partner des Jinqiu-Fonds.
Deshalb ist die Investitionsstrategie des Jinqiu-Fonds im Bereich Künstliche Intelligenz auch ein wichtiger Referenzpunkt für die Beobachtung der Branchentrends.
● Investitionslandschaft
Aus der von Zang Tianyu vorgestellten Investitionslandschaft des Jinqiu-Fonds geht hervor, dass 56 % ihrer Investitionen auf die Anwendungsebene konzentriert sind, 25 % auf Embodied Intelligence gesetzt werden, 10 % in die Rechenleistungsinfrastruktur fließen und fast 8 % in intelligente Hardware gehen. Diese Verteilung ist kein Zufall. Hinter ihr steckt die feste Überzeugung des Jinqiu-Fonds von zwei makroökonomischen Trends: der kontinuierlichen Verbesserung der Intelligenz und der kontinuierlichen Senkung der Kosten für den Zugang zu Intelligenz.
Außerdem stellten die Teilnehmer fest, nachdem sie sich an der Veranstaltung die Beiträge mehrerer von Jinqiu geförderter Gründer und Investoren angehört hatten, dass in der rasch wogenden AI-Welle viele der bisherigen Unsicherheiten allmählich Richtung angenommen haben: Der Wert von Künstlicher Intelligenz bricht aus der Modellschicht heraus und strömt in die konkreten Produkte, Szenarien und Lösungen.
Im Folgenden einige der Hauptaussagen der Veranstaltung:
Modelle sind "Commodity", der Wert fließt schließlich zu Produkten und Vertrauen
Yang Jie (Gründungsmitglied des Jinqiu-Fonds)
Yang Jie hat das gegenwärtige AI-Gefechtshaushalt klar in drei Bereiche unterteilt: Anwendungen, Chips und Roboter. Und sie hat eine zentrale These aufgestellt: "Wir im Jinqiu-Fonds sind fest davon überzeugt, dass Modelle Commodity sind und der Wert den Produkten weichen wird."
Diese Einschätzung basiert auf einem sichtbaren Trend: Die Fähigkeiten der Modelle steigen rasant an, während die Kosten für den Zugang zu Intelligenz stark sinken. "Modelle sind Commodity (Allgemeingüter), aber die auf der Grundlage von Modellen entwickelten Produkte nicht, insbesondere Produkte, die die Nutzer besser verstehen, sind noch immer rar."
Außerdem ist sie der Meinung, dass in der gegenwärtigen Zeit, in der die Modelle noch nicht perfekt sind, die Nutzer bleiben und mit denen wachsen werden, denen sie vertrauen. Deshalb wird "Vertrauen" eine wichtigeres Schutzwehr sein als die Technologie. Der Markt will nicht "Ich kann es auch", sondern "Nur ich kann es".
Nach Ansicht von Yang Jie wird der Chipmarkt ein weiterer riesiger Markt sein. Die Nachfrage nach Inferenz-Chips steigt stark an, und die Token-Aufrufrate wächst beschleunigt. Deshalb sehen sie drei Chancen: "Die erste Chance ist, dass das Fenster für Inferenz-Chips gerade geöffnet hat; die zweite ist die positive Rückkopplungsschleife zwischen Chip-Software und Algorithmen; die dritte ist, dass es verschiedene Ansätze gibt, und viele innovative Teams versuchen, mit unterschiedlichen Technologielösungen Probleme zu lösen."
Was den Bereich der Roboter angeht, ist ihre Einschätzung, dass "die Roboterunternehmen ihren ChatGPT-Moment erleben." Drei Wendepunkte - Daten, Kapital und Kosten - treten gleichzeitig auf. Im Jahr 2025 betrug das globale Finanzierungsvolumen bereits das Fünffache des Jahres 2023. Die Welle ist da.
●
Das Intelligenzparadigma wandelt sich, "Erfahrung" und "Kosten" bestimmen die Zukunft der Anwendungen
Zang Tianyu (Partner des Jinqiu-Fonds)
Zang Tianyu ist der Ansicht, dass die Entwicklung der Künstlichen Intelligenz von der auf Rechenleistung und Datenmenge angewiesenen Vorhersagephase in die auf Verstärkungslernen und Erfahrung basierende Nachbearbeitungsphase eintritt. Und dies ist auch der Grund für das Motto dieser Konferenz: "Experience with AI".
"Die Branche tritt in eine Ära der Nachbearbeitung mit Verstärkungslernen ein und entwickelt weiter die Vorstellung, dass Künstliche Intelligenz aus direkten Erfahrungen lernen kann." Zang Tianyu denkt, dass diese Veränderung direkt zu einer qualitativen Veränderung der Fähigkeiten von KI in der Inferenz, Codierung und Werkzeugnutzung führt und die gegenwärtige Agent-Startup-Welle auslöst.
Zang Tianyu sprach auch über die Kommerzialisierung der Intelligenz. Er verglich die Verbreitungseffekte, die durch die Senkung der Kosten für Internet-Breitbandverbindungen Ende des letzten Jahrhunderts verursacht wurden, und wies darauf hin, dass "in der Ära der Künstlichen Intelligenz ein ähnlicher Trend auftreten wird, nur dass die Bandbreite hier die Intelligenzbandbreite ist." Dies bedeutet, dass die Erlangung von Modellfähigkeiten so einfach wie das Einkaufen im Supermarkt werden wird. Dies ist eine große Chance für Anwendungsunternehmen, die sich vollständig auf die Lösung der konkreten Probleme der Nutzer konzentrieren können.
Was die neuesten Entwicklungen in der Embodied Intelligence angeht, ist seine Meinung, dass die Kernkompetenz in den Daten liegt, insbesondere in den Videos von der ersten Personensicht und dem Aufbau eines Daten-Closed-Loops in realen Szenarien. "Unterbewerten Sie nicht die Schwierigkeit und den Wert der Hardware. Stellen Sie zunächst die Hardware in die Nähe der Nutzer und in die realen Szenarien."
Das nächste Paradigma der Videogenerierung ist "Referenz-basierte Videogenerierung"
Luo Yihang (CEO von Shengshu Technology)
Als der Schöpfer des ersten chinesischen großen Videomodells "Vidu", das Sora folgt, ist Luo Yihang der Meinung, dass die derzeit beliebten Verfahren der Text-zu-Video- und Bild-zu-Video-Generierung nur Übergangslösungen sind.
"Die Text-zu-Video-Generierung kann keine zusammenhängenden Geschichten erzählen, und die Bild-zu-Video-Generierung schränkt die Ausdrucksfähigkeit der KI ein." Er ist der Ansicht, dass das zukünftige Minimalismus-Paradigma der Videogenerierung die von Shengshu Technology erstmals entwickelte "Referenz-basierte Videogenerierung" ist. Dieses Verfahren ermöglicht es den Autoren, beliebige Subjekte (Personen, Gegenstände, Effekte usw.) hochzuladen und dann durch Sprachbefehle zu bewirken, dass diese Subjekte im Video kontinuierlich agieren. Die Konsistenz kann bis zu 5 Minuten aufrechterhalten werden.
● Luo Yihang
"Wir möchten den realen Filmaufzeichnungsprozess im Offline-Bereich wiederholen. Sobald wir die Subjekte festgelegt haben, können wir die kreative Ausdrucksfähigkeit praktisch unbegrenzt erweitern." Luo Yihang erklärte, dass bei den Aufrufen von "Vidu" über 60 % von der Referenz-basierten Videogenerierung stammen. Dies beweist, dass es zum bevorzugten Verfahren für professionelle Autoren wird und das gesamte Inhaltsgeschäft von der Werbung bis zum Filmindustrie möglicherweise revolutionieren wird.
Das Weltmodell: Das "Endgehirn" der Embodied Intelligence
Wu Wei (CEO von Manifold Space)
Wu Wei ist der Ansicht, dass das Weltmodell nicht nur ein Werkzeug zur Generierung von realistischen Videos ist, sondern auch das "Gehirn" der Embodied Intelligence, das in der Lage ist, zu inferieren und Entscheidungen zu treffen. "Das Weltmodell hat hauptsächlich zwei große Anwendungen: Erstens können wir durch Online-Simulation und -Analyse bessere Entscheidungen treffen; zweitens kann es als Umgebungsmodell dienen, um Agenten durch Offline-Verstärkungslernen zu trainieren." Dies bedeutet, dass Roboter in der virtuellen Welt "phantasieren" und "Fehler testen" können und somit lernen, komplexe Aufgaben in der realen Welt auszuführen.
Genau wie Zang Tianyu stimmt Wu Wei zu, dass die Videodaten aus der ersten Personensicht (EGO sense) ein exponentiell wertvolles Asset sind und der Schlüssel für das Training von Physical AI sind.
● Wu Wei
Die Robotikindustrie wartet auf ihren "Windows-Moment"
Lai Jie (CEO von Stardust Intelligence)
Nach Ansicht von Lai Jie befindet sich die aktuelle Robotikindustrie an einem ähnlichen Schlüsselmoment wie die frühe Entwicklung der persönlichen Computer. "Die meisten Forscher, die sich derzeit mit Robotern befassen, sind reine KI-Forscher. Sie streben nach hoher Intelligenz, aber vernachlässigen die Zwischenschicht der Interaktion." Er verglich die Geschichte der PCs: "Steve Jobs definierte den Apple Computer, aber damals konnten nur Programmierer ihn benutzen.Until Macintosh erschien, gab es ein Betriebssystem, das jeder benutzen konnte."
Diese Beobachtung zeigt direkt auf die Kernschwierigkeit der Branche: Zwischen