StartseiteArtikel

Kapital setzt auf die "vollständige Industrie- und Wertschöpfungskette" der KI. Zhejiang Xin Siwei Technology Co., Ltd. erhält eine Seed-Runde Finanzierung.

晓曦2025-10-14 10:34
Shifang Ronghai hat eine strategische Investition in Zhexin Siwei getätigt und mit ihr zusammen an der Entwicklung von AI-Hardwareprodukten gearbeitet, wobei der Fokus auf intelligenten Haushaltsgeräten, Sport und der Embodied Domain liegt.

In jüngster Zeit hat Shenzhen Shifang Ronghai Technology Co., Ltd. die strategische Investition in Zhexin Siwei Intelligent Technology (Hangzhou) Co., Ltd. abgeschlossen, und beide Seiten haben offiziell eine tiefe strategische Partnerschaft eingegangen.

Tan Xue, der Geschäftsführer von Zhexin Siwei, hat darauf hingewiesen, dass die Zusammenarbeit zwischen Shifang Ronghai und Zhexin Siwei eine vollständige Industriekette von der Systemebene bis zum Hardware-Endgerät bildet und ein enormes Entwicklungspotenzial hat. Dies könnte wertvoller sein als die Investition in eine Firma, die sich nur auf eine einzelne Technologie oder ein einzelnes Produkt konzentriert. Du Jun, der Marktmanager von Xiaozhi AI bei Shifang Ronghai, hat ebenfalls erklärt, dass die Zusammenarbeit beider Seiten nicht auf einer einzelnen Fähigkeit basiert, sondern auf der komplementären Gesamtstärke, die durch jahrelange Branchenerfahrung entstanden ist.

Diese Runde der Finanzierung hat die Aufmerksamkeit mehrerer Investmentgesellschaften auf sich gezogen, die sich bereits in führenden Bereichen wie Rechenleistung, Großen Modellen und Robotik engagiert haben. Dies spricht für die Zusage des Kapitals für die Richtung der Sprachinteraktion. Gleichzeitig spiegelt dieses Investitionsevent einen neuen Trend im Bereich der Künstlichen Intelligenz wider: Das Kapital neigt immer mehr zu "szenenbasierten" Unternehmen, die eine starke Synergie mit ihrem eigenen Geschäft bilden können.

Wie entsteht ein "Killerprodukt" in der AI-Hardware?

Shifang Ronghai wurde Anfang 2016 gegründet. Das Unternehmen hat drei strategische Upgrades durchlaufen und hat sich von einer Wissensplattform zu einem auf KI zentrierten Technologieunternehmen entwickelt, das sich auf die Umsetzung von KI konzentriert.

Nach Ansicht von Du Jun müssen sowohl AI-Hardware als auch AI-Anwendungen drei Merkmale erfüllen, um "Killerprodukte" zu werden:

  • Es müssen reale Bedürfnisse der Benutzer lösen können, sei es praktische Probleme oder emotionale Bedürfnisse. Sie müssen eine starke szenenbezogene Eigenschaft haben.
  • Die Benutzererfahrung sollte unmerklich sein. Die Optimierung hat das Ziel, die Interaktionsschwierigkeit für die Benutzer zu verringern. Beispielsweise hat der Wechsel von der traditionellen physischen Tasteninteraktion zur Sprachinteraktion das Ziel, die Benutzererfahrung unmerklicher zu gestalten. In Zukunft wird die KI möglicherweise sogar aus einem Blick oder einer Geste des Benutzers die Bedürfnisse verstehen können. Die ultimative Benutzererfahrung ist gerade "unmerklich".
  • Es muss menschliche Fürsorge haben, deren Kern die emotionale Intelligenz ist. Menschen achten immer mehr auf ihre inneren Bedürfnisse. In Zukunft müssen Produkte nicht unbedingt leistungsstark sein, aber gute Produkte müssen die Fähigkeit zur menschlichen Fürsorge haben, was zu einer grundlegenden Eigenschaft der Produkte werden wird und die Benutzererfahrung angenehmer macht.

Du Jun meint, dass nicht alle Geräte stark anthropomorphisiert sein müssen, aber alle Geräte müssen in bestimmten Phasen eine starke Fähigkeit zur menschlichen und emotionalen Fürsorge haben. In diesem Fall sind die Benutzer eher bereit, für das Produkt zu bezahlen, aber nicht einfach nur für den emotionalen Wert.

Erster Eindruck: Ein hardwareintegriertes Interaktionssystem

Während die Softwareanwendungen von Großen Modellen breiter Beachtung finden, sieht Shifang Ronghai das Potenzial für die Verbesserung der Hardware durch die Integration von KI in Endgeräte. In der Praxis hat Shifang Ronghai im vergangenen August das Projekt Xiaozhi AI gestartet, indem es seine Stärken in der Softwareentwicklung nutzt und auf der Basis von Erfahrungen in Echtzeit-Sprachinteraktion, Emotionserkennung und Großen Modellen aus seiner früheren Bildungsarbeit aufbaut.

Xiaozhi AI unterscheidet sich grundlegend von den gängigen Großen Modellen wie der GPT-Serie und der Qwen-Serie auf dem Markt.

Erstens ist Xiaozhi AI ein hardwareintegriertes Interaktionssystem, das sich auf die Intelligenz von Hardware-Endgeräten konzentriert. Von der untersten Architektur bis zur Funktionsentwicklung wird alles darauf ausgerichtet, wie der Große Modell in der Hardwareumgebung besser funktioniert und besser mit dem Produkt integriert werden kann. Heute erreicht Xiaozhi AI eine schnelle Reaktionszeit von durchschnittlich 500 Millisekunden, eine anthropomorphe Interaktion basierend auf Emotionserkennung und unterstützt die Funktionserweiterung über das MCP-Protokoll. Das gesamte System wird in der Cloud bereitgestellt, was die Konfigurationsanforderungen an das Endgerät effektiv verringert.

Zweitens legt Xiaozhi AI mehr Wert auf die Anwendbarkeit und die Wirkung des Großen Modells in der Mensch-Maschine-Interaktion. Bei der Sprachinteraktion verwendet Xiaozhi AI eine dreiteilige Architektur: ASR (Sprache in Text umwandeln), LLM (Großer Sprachmodell), TTS (Text in Sprache ausgeben). Es ist erwähnenswert, dass Xiaozhi AI auch Drittanbieter-Modelle wie Tongyi und DeepSeek unterstützt.

Das Team hat die Benutzererfahrung bei der C-End-Interaktion stark optimiert, insbesondere bei der Emotions- und Stimmungserkennung. Das Team hat den gesamten Prozess systematisch optimiert, um die Echtheit und die Sympathie der Mensch-Maschine-Interaktion zu verbessern:

  • Beim Modell werden aus den gesamten Benutzerdialogen 1.024-dimensionale persönliche digitale Merkmale extrahiert, durch Clusterung und Induktion auf 26-dimensionale Schlüsselmerkmale reduziert und in den Dialogtrainingssatz eingebettet. So kann die Benutzerpersönlichkeit bei der Interaktion erkannt werden.
  • Beim ASR-Schritt hat das Team ein optimiertes Modell selbst entwickelt. Neben der Spracherkennung kann es auch Stimmungen und Tonhöhen erkennen. Das System erkennt Schlüsselwörter, um die potenzielle Stimmung zu schätzen und übermittelt diese Informationen an den Großen Modell, damit der generierte Inhalt sowohl die objektive Semantik als auch die subjektive Emotion berücksichtigt.
  • Beim TTS-Schritt wird die traditionelle "Stimmimitation" in "Personenimitation" verbessert. Die KI integriert die Emotionsstimmung bei der Sprachausgabe, um die Aussage natürlicher und wärmer zu machen.

Was die wichtige Kontextfähigkeit für die Bereitstellung von emotionalem Wert betrifft, unterstützt Xiaozhi AI derzeit die Kurzzeitgedächtnisfunktion. Die Langzeitgedächtnisfunktion befindet sich in der internen Testphase und wird voraussichtlich in Kürze online gehen. Du Jun sagt, dass das "Gedächtnis" oft zu einem philosophischen Problem werden kann. Je tiefer man darüber nachdenkt, desto subjektiver und abstrakter wird es. Die Schwierigkeit besteht darin, ständig neu zu verstehen, was Gedächtnis ist, wann es abgerufen werden soll und in welcher Form es existiert. Daher wird die Langzeitgedächtnisfunktion kontinuierlich verbessert.

Dennoch gesteht Du Jun ein, dass die Branche noch in der frühen Phase ist. Shifang Ronghai ist eines der ersten Unternehmen in China, das die Fähigkeit des emotionalen Großen Modells in Endgeräte integriert hat, und hat bisher erst ein Jahr damit gearbeitet. Trotzdem gibt es in verschiedenen Branchen bereits gute Anwendungen, aber es wird noch Zeit brauchen, bis diese marktfähig und kommerziell erfolgreich werden. Es gibt noch viel Raum für die Exploration.

Das "geistige Gehirn" findet seinen "Körper"

Für Shifang Ronghai ist die Kernposition von Xiaozhi AI ein gesamtes Interaktionssystem für die Hardware. Sein Wert kann nur durch die Hardwareprodukte entfaltet werden. Das heißt, das "geistige Gehirn" von Xiaozhi AI braucht unbedingt den "Körper" der Hardware. Daher ist die Kombination von Software und Hardware der Schlüssel für Shifang Ronghai, um das System zu optimieren und das Produkt auf den Verbrauchermarkt zu bringen.

Die Kernpunkte der Zusammenarbeit mit Zhexin Siwei liegen hier. Beide Seiten nutzen ihre Stärken: Xiaozhi AI ist verantwortlich für die Optimierung des Systems, während Zhexin Siwei seine langjährige Erfahrung in der Hardware- und Produktentwicklung nutzt. Beide Seiten erkunden gemeinsam die Herstellung von modernen KI-Produkten.

"Wir freuen uns sehr, mit einem Team wie Zhexin Siwei zusammenzuarbeiten, das sowohl technische Voraussicht als auch praktische Arbeitsweise hat. Ihre Vertiefung in der Anwendungen des multimodalen emotionalen Großen Modells auf der Endgeräteseite stimmt gut mit unserer Einschätzung der zukünftigen Entwicklungstrends der KI-Technologie überein. Wir glauben, dass diese strategische Investition die Iteration der "Xiaozhi AI"-Technologie und die Erweiterung der Anwendungsbereiche beschleunigen wird und gemeinsam eine neue Ära der intelligenten Interaktion eröffnen wird." sagte Huang Guan, der Vorsitzende von Shifang Ronghai und der Gründer von Xiaozhi AI.

Tatsächlich hat Xiaozhi AI in der internen Testphase gute Ergebnisse in der Interaktionserfahrung, der Anthropomorphie und der Reaktionsgeschwindigkeit erzielt. Aber das Team hatte damals noch keine bestimmte Anwendungsrichtung festgelegt und hat beschlossen, zunächst eine Community-Ökosystem aufzubauen, um gemeinsam mit der Community zu erkunden.

Derzeit hat die Community mehr als 60.000 Entwickler. Viele Entwickler haben in der Community Zweitentwicklung oder Produktinnovation vorgenommen und viele gute Ideen entwickelt. Die Zusammenarbeit zwischen Shifang Ronghai und Zhexin Siwei hat auch damals begonnen.

Zhexin Siwei ist ein KI-Innovationsunternehmen, das von einem Team von Doktoren gegründet wurde, die von der Zhejiang-Universität und der Singapore Management University gemeinsam ausgebildet wurden. Es konzentriert sich auf die Software- und Hardwareanwendungen des multimodalen emotionalen Großen Modells. Die Smart Home-Branche ist der Kernbereich von Zhexin Siwei. Der Gründer Qin Bing hat mehr als 20 Jahre Erfahrung in der Smart Home-Industrie und hat jeweils eine Fertigungsfabrik in Zhejiang und Sichuan. Viele führende Unternehmen in der Smart Home-Branche sind seine Kunden. Daher kann Zhexin Siwei schnell die neuen Bedürfnisse und Szenarien der führenden Kunden berücksichtigen und Xiaozhi AI besser in die Hardwareprodukte integrieren.

Die Entwicklungsgeschwindigkeit, -effizienz und -ergebnisse von Xiaozhi AI gehören bereits zu den Kernfähigkeiten von Zhexin Siwei. Zhexin Siwei ist der Meinung, dass die nächste Generation von Smart Home-Produkten unweigerlich tief mit KI integriert werden wird und die Sprachinteraktion als Infrastruktur nutzen wird. Es ist erwähnenswert, dass beide Seiten in den letzten sechs Monaten einige verschiedene Geräte von führenden Haushaltsgeräte-Marken miteinander verbunden haben.

"Der Embodied Bereich repräsentiert die Zukunft", und dies ist auch die Richtung, auf die Zhexin Siwei besonders achtet. Derzeit konzentriert sich der Embodied Bereich hauptsächlich auf die Entwicklung von Robotik-Körpern und -Gehirnen. Zhexin Siwei ist der Meinung, dass die nächste Richtung die Kombination von "Intelligentes Gehirn + Sprachinteraktion" ist, um den menschlichenoid-Robotik-Körper zu bedienen und sogar mit dem "Kleinhirn" des Embodied Roboters zusammenzuarbeiten. Die Benutzer werden nicht nur mit der Werkzeugeigenschaft der Produkte zufrieden sein, und jetzt ist der richtige Zeitpunkt für die Investition.

Ein weiterer wichtiger Bereich ist die Sportbranche, was auch eine gewisse emotionale Bindung hat. Viele Mitglieder des Gründerteams sind seit Jahren Marathon-Liebhaber und haben fast 100 Marathonläufe weltweit absolviert. Der Sport ist in ihr tägliches Leben integriert. Mit einem tiefen Verständnis der Sportbranche hat das Team von Zhexin Siwei schnell in den Sportsektor eingestiegen und erstmals einen KI-Kommentator-Agenten entwickelt.

Die industrielle Anlage von Zhexin Siwei konzentriert sich derzeit auf diese drei Bereiche, aber es wird sich in Zukunft nicht darauf beschränken.

Es ist bekannt, dass Zhexin Siwei derzeit die Strategie wählt, sich an die B-End-Kunden zu richten, um die Infrastruktur für die Sprachinteraktion aufzubauen. Tan Xue sagt, dass der Schlüssel für die kontinuierliche Entwicklung der Sprachinteraktion die Dichte der Sprachnutzung und die Qualität der Sprachkenntnisse ist. Zhexin Siwei richtet zunächst die Dichte der Sprachnutzung ein - durch eine große Anzahl von Smart Home-Geräten erhöht es die Anzahl der Benutzer, die Anzahl der Interaktionspersonen und die Anzahl der Interaktionsgeräte. Die zugehörigen Daten und Rückmeldungen werden auch die Iteration von "Xiaozhi AI" unterstützen.

Aber Zhexin Siwei wird in Zukunft sowohl die B-End- als auch die C-End-Kunden ansprechen, aber es ist noch nicht der richtige Zeitpunkt, dass der Große Modell direkt an die C-End-Kunden geht und schnell expandiert. Zhexin Siwei hat auch das entsprechende Personal. Tan Xue hat fast 20 Jahre Erfahrung in der To C-Branche und hat sich mit Geschäften im Zusammenhang mit emotionalem und menschlichem Wert befasst. Sie hat angedeutet, dass die Betreuung von Senioren möglicherweise eine zukünftige Richtung für die Erkundung sein könnte.

Eine kollektive Aufrüstung der Industriekette

"Die Entwicklung des Marktes hat uns Schritt für Schritt die Richtung für die Hardwareentwicklung klar gemacht." sagte Du Jun.

Tatsächlich haben beide Seiten bereits im vergangenen August, als Xiaozhi AI gerade vorgestellt wurde, intensive Gespräche geführt und viele Produkte entwickelt. Beispielsweise hat Zhexin Siwei in weniger als sechs Monaten in der Sportbranche eine tiefe Zweitentwicklung auf der Basis von Xiaozhi AI vorgenommen und erstmals in China einen KI-Kommentator-Agenten entwickelt, der für die Kommentierung der Zhejiang BA-Spiele verwendet wurde und weite Beachtung im Netz erhalten hat. Zweitens hat Zhexin Siwei dank seiner langjährigen Erfahrung in der Entwicklung und Herstellung von Smart Home-Produkten Xiaozhi AI, das durch Zweitentwicklung trainiert wurde, auch in diesem Bereich eingesetzt und hat mit einigen führenden Haushaltsgeräteherstellern Kooperationen eingegangen und Bestellungen erhalten. Darüber hinaus hat Zhexin Siwei auf der Basis von Xiaozhi AI auch die Steuerung der Körperbewegungen und die Sprachinteraktion mit mehreren Embodied Robotern realisiert. Beide Seiten entwickeln auch andere Produkte, die in Zukunft nacheinander online gehen werden.

Während der Zusammenarbeit haben die beiden Teams eng zusammengearbeitet und die Kommunikation war nahezu reibungslos. Zhexin Siwei reagiert sofort, wenn die Kunden Anforderungen stellen oder es Probleme mit der Hardware gibt, lokalisiert schnell die Ursache und gibt innovative Verbesserungsv