Offline + Gedächtnis, der Wendepunkt in der Evolution von Sprachmodellen
Dieses Jahr war die WAIC wieder sehr beliebt.
Die schwüle Luft in Shanghai, die überfüllten Ausstellungsstände und die vielen großen KI-Modelle – all das ist seit Jahren bei der WAIC normal. Aber dieses Jahr gab es einige Veränderungen.
Ein deutliches Indiz auf dieser Jahre WAIC war, dass sowohl die ausstellenden Unternehmen als auch die Besucher die Vorstellung von großen Modellen entzaubert haben. Stattdessen fragt jeder: "Gibt es bereits Anwendungsfälle?"
Nach drei Jahren Marktbildung sind die Nutzer langsam müde geworden von den ständigen "Model-Rankings". Vor allem seit Anfang 2025, seitdem DeepSeek aufgetaucht ist, sind viele "Star-Projekte" in der KI-Branche gescheitert. Die Gründer sind besorgt, und auch die Investoren machen sich Sorgen.
Gibt es jemanden, der sich nicht sorgen muss? Ja, es gibt tatsächlich.
Laut 36 Kr ist eine auf Shanghai gegründete KI-Startup-Firma schon "still und leise" damit beschäftigt, ihre Modelltechnologie auf der ganzen Welt zu verkaufen. Ihre Produkte sind in Afrika, im Nahen Osten, in Europa, Amerika, Südostasien und Russland erhältlich.
Ihr Schwerpunkt liegt auf "Offline-Intelligenz". Sie hat die Grenze für die Offline-Bereitstellung großer Modelle bis auf die Preisklasse von "Tausend-Yuan-Smartphones" gesenkt. Dadurch können auch nicht-Flaggschiffsmodelle, sogar Einsteiger-AIPC-Geräte, Smartphones, Drohnen und Roboter Offline-Echtzeit-KI-Berechnungen durchführen – in Regionen wie Europa, Afrika, Russland und im Nahen Osten, wo das Internet oft instabil ist, ist dies fast eine "Notwendigkeit unter den Notwendigkeiten".
Diese Firma ist in Sachen Öffentlichkeitsarbeit sehr zurückhaltend. Sie macht selten PR-Aktivitäten und keine großen Werbekampagnen. Innerhalb des Teams gab es einmal einen Witz: "Wir wollen nicht 'hochgeblasen' erscheinen, sondern 'Huaqiangbei erobern'."
Für normale Leute klingt das wie Selbstverleugnung, aber für Leute aus der Branche ist es beängstigend – Was ist Huaqiangbei in Shenzhen? Es ist der Ort mit der höchsten Konzentration an Technologie und Elektronikprodukten in China und weltweit. Es ist der Ort, an dem Wunder wie "Einen Tag für das Formen, drei Tage für die Massenproduktion" möglich sind. Es ist der Ausgangspunkt für Produkte, die die Welt erobern wollen, aber auch ein Schlachtfeld mit harten Konkurrenzkämpfen, wo viele "Unterwasser-Einhörner" in der Elektronik- und Technologiebranche entstanden sind.
Diese Startup-Firma heißt RockAI (Shanghai Yanxin Digital Intelligence). Während der WAIC 2025 hatten wir endlich die Gelegenheit, uns ausführlich mit ihr zu unterhalten.
01. Das geheime "Unterwasser-Einhorn"
RockAI wurde im Juni 2023 gegründet und ist eine Tochtergesellschaft der an der A-Liste notierten Firma Yanshan Technology. Ihr Kernprodukt ist die erste in China entwickelte universelle große Modellreihe mit Yan-Architektur, die auf Basis eines nicht-Attention-Mechanismus arbeitet. Dadurch können die sogenannten "Rechenleistungskolosse" der großen KI-Modelle offline auf Geräten mit geringem Energieverbrauch installiert werden und Echtzeit-Berechnungen durchführen, ohne dass eine Internetverbindung erforderlich ist.
Die von RockAI erreichte Offline-Intelligenz ist nicht einfach eine Vereinfachung oder Reduzierung eines "großen Modells" zu einem "kleinen Modell". Stattdessen hat sie von der Grundarchitektur an umfassend innoviert und einen anderen Weg eingeschlagen als OpenAI, Meta, DeepSeek und alle anderen großen Modellunternehmen.
Während der diesjährigen WAIC hat RockAI auch das neueste Yan 2.0 Preview-Großmodell vorgestellt. Es erweitert die Multimodalität auf den Videobereich und führt eine auf künstlichen neuronalen Netzwerken basierende Gedächtniseinheit ein, sodass das Modell in der Lage ist, autonom zu lernen.
Niedriger Energieverbrauch, hohe Leistung, Offline-Intelligenz und Nicht-Transformer-Architektur – diese Merkmale sind die auffälligsten Kennzeichen von RockAI und der Grund, warum die Kunden schließlich für RockAI entscheiden.
02. Offline-Intelligenz
Während der MWC (Mobile World Congress) in Barcelona im März dieses Jahres wurde ein AIPC-Produkt mit installiertem RockAI-Großmodell in der Ausstellungsfläche des Herstellers gezeigt. Die Reaktion vor Ort war "explosiv" – Händler aus Europa, Amerika, Afrika und Russland haben fast sofort Verkaufsabsichten bekundet. Mitbewerber aus benachbarten Ausstellungsflächen haben neugierig herein geschaut und geheimnisvoll gefragt: "Kann man das tatsächlich offline bei diesem Preis machen?"
Tatsächlich besteht im Ausland ein sehr hoher Bedarf an Offline-Fähigkeiten für AIPC-Geräte.
Zum Beispiel ist eine der beliebtesten Funktionen der RockAI-Produkte für ausländische Nutzer der intelligente Meeting-Assistent. Er kann während Online-Meetings für die Nutzer Echtzeit-Transkription, Übersetzung, Protokollführung und Zusammenfassungen nach dem Meeting übernehmen.
Das klingt wie der Alltag von "Bürotiere" in China, aber viele ausländische Unternehmen haben sehr strenge Datenschutzregeln. Die Daten von geschäftlichen Meetings dürfen nicht in die Cloud übertragen werden.
In solchen Fällen ist der Offline-Meeting-Assistent wie ein "Retter".
Außerdem ist die Stabilität der Netzwerkeinfrastruktur auch ein tägliches Problem für ausländische Nutzer. Geräte, die an das schnelle 5G-Internet in China gewöhnt sind, funktionieren oft nicht gut im Ausland. Das Internet ist teuer und instabil, es gibt oft Verbindungsabbrüche. Und wenn man 10 Minuten lang auf das Laden eines Bildschirms wartet und am Ende eine Netzwerkfehlermeldung bekommt, ist das wirklich frustrierend.
Selbst in China besteht bei vielen Markenherstellern und ODM-Herstellern ein starker Bedarf an der Lokalisierung von Großmodellen und der differenzierten Verbesserung ihrer Produkte.
Früher waren KI-Fähigkeiten wie Gesichtserkennung, Spracherkennung und OCR-Bilderkennung exklusive Funktionen von Flaggschiffsprodukten. Aber dank Innovationen in der gesamten Wertschöpfungskette, wie Algorithmen, Chips, Mikrofonen und Kamera-Modulen, sind diese Funktionen heute Standard in "Tausend-Yuan-Smartphones". Viele KI-Funktionen wurden sogar auf Offline-Lampen, Kühlschränke, Waschmaschinen und Reiskocher übertragen, wodurch die Grenzen der Geräteintelligenz weiter erweitert wurden.
Dies ist der unvermeidliche Weg für alle fortschrittlichen Technologien, und Großmodelle sind keine Ausnahme.
Der Ausstoß von Geräten mit installiertem RockAI-Modell hat bereits eine gewisse Größe erreicht. Ihre Kunden sind nicht nur die oben genannten Hersteller von Konsumelektronikprodukten, ODM-Hersteller, Smartphone-, Roboter- und Fahrzeugchip-Hersteller, sondern auch viele Hersteller von Haushaltsgeräten und XR-Brillen, die höhere Anforderungen an Energieverbrauch und Leistung haben, suchen nach einer Zusammenarbeit – viele dieser aufmerksamen Hersteller kommen aus Huaqiangbei.
Verschiedene "KI-Invasionen in Huaqiangbei" in den Sozialen Medien
03. Das Gedächtnis von Großmodellen
Heute, als der "Kampf der Hundert Modelle" fast vollständig vorbei ist und viele Star-Projekte in der KI-Branche in Panik geraten, in der Branche Umstrukturierungen, Reduzierungen und Entlassungen stattfinden, hat RockAI seine Großmodelle bereits auf der ganzen Welt verkauft. Seine umfangreichen technologischen Ressourcen und Erfahrungen in der Umsetzung reichen aus, um die Konkurrenz hinter sich zu lassen. RockAI ist das stillste, aber auch das nicht zu vernachlässigende "Unterwasser-Einhorn" in der Branche der Großmodelle.
Die wirkliche Ambition von RockAI geht weit über die Intelligenz eines Computers, eines Smartphones oder eines Haushaltsgeräts hinaus.
Was sie will, ist das, wonach alle KI-Forscher traumen – die allgemeine Künstliche Intelligenz (AGI). Das Gedächtnis ist der Kern des Yan 2.0 Preview-Modells. Der gezeigte Roboterhund zeigt lebendig, was die "Gedächtnis"-Fähigkeit eines Großmodells ist.
In traditionellen Großmodellen hängt das Wissen oft von externen Aufrufen (z. B. RAG) ab. Der Roboterhund mit installiertem Yan 2.0 Preview-Modell hat jedoch das Gedächtnis tief in die Modellparameter integriert und dadurch eine echte "Langzeitgedächtnis"-Fähigkeit und individuelles Verständnis erreicht. Dieses Gedächtnis ist keine temporäre Speicherung, sondern eine intelligente Akkumulation, die sich mit der Interaktion mit dem Nutzer entwickelt. Dadurch kann das Gerät "den Nutzer verstehen" und wird eine Erweiterung des Nutzergeistes, nicht nur ein Werkzeug.
Das Wichtigste ist, dass die Bereitstellung auf der Geräteebene alles lokal auf dem Endgerät passiert, was die Privatsphäre schützt und gleichzeitig die Reaktionsgeschwindigkeit und die Datensicherheit verbessert. Zukünftige Geräte werden nicht mehr bloße Maschinen sein, die Befehle ausführen, sondern "digitale Gehirne" mit Wahrnehmungs-, Gedächtnis- und Lernfähigkeiten.
Die Entwicklung der menschlichen Intelligenz beruht darauf, dass wir Erfahrungen sammeln und unser Gedächtnis entwickelt. Ohne Gedächtnis gibt es kein Lernen, Verstehen und keine individuelle Perspektive. Ebenso muss ein Großmodell eine menschenähnliche Gedächtnis-Fähigkeit haben, um von einem "starken Werkzeug" zu einem "Intelligenzagenten" zu werden. Nur wenn ein Modell die Vorlieben, den Kontext und die früheren Interaktionen des Nutzers speichern kann, kann es kontinuierlich verbesserte Dienstleistungen anbieten und echte individuelle Begleitung und Entscheidungsunterstützung bieten, wodurch es der Maschine eine menschenähnliche Denkweise und Wachstumspotenzial verleiht.
RockAI glaubt, dass wenn jedes Gerät über Gedächtnis- und Lernfähigkeiten verfügt, sie nicht mehr isolierte Knotenpunkte sind, sondern intelligente Agenten, die miteinander kooperieren und Erfahrungen teilen können. Ein solches verteiltes Intelligenznetzwerk wird "Gruppenintelligenz" hervorbringen, die die Leistung des gesamten Systems weit über die Summe der einzelnen Geräte hinaus bringt und eine sozialähnliche Lernmechanik bildet. Sie glauben, dass dies ein wichtiger Schritt in Richtung allgemeiner Künstlicher Intelligenz ist.
Schlusswort: Der Wendepunkt für Großmodelle
Zwar ist es noch zu früh, über AGI zu sprechen, aber wenn wir uns auf heute konzentrieren, haben Großmodelle einen Wendepunkt in der Branche erreicht. Einerseits ist der "Kampf der Hundert Modelle" fast vorbei, viele Star-Projekte befinden sich in Panik, es gibt Umstrukturierungen, Reduzierungen und Entlassungen in der Branche.
Andererseits besteht jedoch ein großer echter Bedarf bei Herstellern, Marken und Nutzern an KI-Großmodellen und viele noch nicht erfüllte Anwendungsfälle.
Werden Sie sich noch daran erinnern, dass 2017 Huawei, Apple und Samsung nacheinander ihre ersten Smartphone-KI-Chips auf den Markt brachten und dadurch den aufregenden Kampf um die Künstliche Intelligenz von der Cloud-Ebene auf die Offline-Ebene verlagerten und so die fast 10-jährige KI-Boomphase für die breite Öffentlichkeit begann.
Heute, im Jahr 2025, in einer Zeit der Panik in der Branche, "wächst RockAI gegen die Strömung". Vielleicht zeigt es, wohin die Strömung geht.