StartseiteArtikel

Der AIGC-Unicorn "Silicon Intelligence" hat die Serie-D-Finanzierung abgeschlossen. Der Umsatz des Digital-Personen-Geschäfts beläuft sich auf Hunderten von Millionen, und es wurden bereits über 500.000 Benutzer bedient | Exclusive von Yingke

黄 楠2025-07-05 09:30
Mit der API als Kernprodukt wird die Fähigkeit zur Bereitstellung von Digital-Person-Technologie gewährleistet.

Autor | Huang Nan

Redakteur | Peng Xiaoqiu

Hard Krill hat erfahren, dass das AIGC-Unicorn Nanjing Silicon Intelligence Technology Group Co., Ltd. (im Folgenden als "Silicon Intelligence" bezeichnet) kürzlich eine Serie-D-Finanzierung im Wert von Hunderten von Millionen Yuan abgeschlossen hat. Die Investoren sind die Industrial Fund of Jiaxing High - tech Zone (Jiaxing Xiuzhou District). Das Kapital dieser Runde wird hauptsächlich für die Forschung und Entwicklung, die Umsetzung von Technologien und die Beschleunigung der Markteinführung der Produkte eingesetzt.

Seit seiner Gründung im Jahr 2017 hat "Silicon Intelligence" über zehn Runden von Finanzierungen im Wert von über einer Milliarde Yuan abgeschlossen. Die Investoren hinter ihm umfassen Tencent, Sequoia China, CMBC International, Zhongcai Qihoo, Haisong Capital und andere. Das Unternehmen konzentriert sich auf die Forschung und Entwicklung sowie die kommerzielle Anwendung von AIGC - Digital - Human - Technologien. Es hat das Konzept des Silizium - Arbeitskräfte - Kernes aufgestellt und vier Produktlinien aufgebaut: die DUIX - Intelligente Interaktionsplattform, die virtuelle Live - Streaming - Plattform, die Videoproduktionsplattform und der intelligente Kundendienst.

Mit der rasanten Entwicklung von Technologien wie großen AI - Modellen, Computervision und Sprachsynthese hat die Digital - Human - Branche in China rapide an Bedeutung gewonnen. Die virtuellen Bilder, die durch AI - Technologien generiert werden, können das Aussehen, die Stimme und die Mimik von Menschen imitieren und verfügen über Interaktionsfähigkeiten. Sie werden in vielen Bereichen wie Live - Streaming, Kundendienst, Bildung und Unterhaltung weit verbreitet eingesetzt.

Nach einem Bericht von iResearch hat der Markt für Digital Humans in China im Jahr 2023 die Marke von 10 Milliarden Yuan überschritten. Es wird erwartet, dass er bis 2025 auf 30 Milliarden Yuan ansteigen wird, was einer durchschnittlichen jährlichen Wachstumsrate von über 50 % entspricht.

Derzeit gibt es auf dem Markt eine Vielzahl von AI - Agenten. Mit der ständigen Senkung der Kosten für die Inferenz von großen Modellen werden die technischen Schwierigkeiten und die kommerziellen Barrieren für die einfache Bereitstellung von Logik - und Prozessautomatisierungsfähigkeiten schnell abbauen. "Reine Instrumental - Agenten werden am Ende unweigerlich in einen erbitterten Preiswettbewerb verwickelt sein." sagte Sima Huapeng, Gründer von "Silicon Intelligence", an Hard Krill.

Sima Huapeng, Gründer von Silicon Intelligence, nahm an der 36Kr WISE Business King Conference 2024 teil.

Sima Huapeng hat darauf hingewiesen, dass das Intelligenzniveau in vielen Branchen noch auf einem anfänglichen Stadium bleibt. Tatsächlich besteht ein breites Bedürfnis nach hochwertigen Agenten. Künstliche Intelligenz verfügt von Natur aus über die Fähigkeit zur logischen Schlussfolgerung und kann Probleme auf eine absolut rationale Weise lösen. Auf dieser Grundlage beginnen auch die digitalen menschlichen Agenten in mehr Szenarien mit tiefgreifenden Schlussfolgerungen einzudringen.

"Zum Beispiel ist die Krankheitsdiagnose eines Arztes im Wesentlichen ein Prozess der logischen Schlussfolgerung, der auf der Grundlage von Beweissträngen, Patientenmerkmalen und anderen Informationen sowie der Anwendung von Fachwissen erfolgt." sagte Sima Huapeng. "In allen Branchen gibt es eine Vielzahl von Anwendungsstellen für logische Schlussfolgerungen. In Zukunft könnten diese Stellen allmählich von der KI übernommen werden, um ein 'Mensch - Maschine - Zusammenwirken' - Arbeitsmodell zu bilden. Das heißt, die KI verarbeitet die standardisierten Schritte mithilfe der logischen Schlussfolgerung, während sich der Mensch auf kreative Entscheidungen, emotionale Interaktionen und andere Kernbereiche konzentriert."

Die Algorithmen - Technologieplattform ist die Grundlage des Digital - Human - Produktsystems von "Silicon Intelligence". Im November 2024 hat "Silicon Intelligence" das neue Multimodal - große Modell DUIX ONE in Form von APIs vorgestellt. Dieses Modell integriert Kernalgorithmen wie Spracherkennung, Sprachsynthese, NLP und Computervision und kann multimodale Fähigkeiten wie Sehen, Hören, Sprechen, hohes Emotional - Quotienten - Niveau und ein realistisches menschliches Erscheinungsbild bieten.

Der Vorteil besteht darin, dass die Interaktionsrealität erheblich verbessert wird und das Problem der traditionellen Digital Humans, die zwar das Äußere, aber nicht die Essenz von Menschen nachahmen, effektiv gelöst wird. Gleichzeitig hat es in der Markteinführungsphase eine stärkere Universalität und Anwendungspotenzial.

Das Multimodal - große Modell DUIX ONE von Silicon Intelligence

In Bezug auf die Sprachtechnologie kann DUIX ONE Sprachinhalte mit verschiedenen Akzenten und Sprechgeschwindigkeiten präzise erkennen, auch in lauten Umgebungen stabil funktionieren und verfügt über eine hohe Genauigkeit und Störunterdrückung. Anschließend kann es natürliche, flüssige und emotionale menschliche Stimmen generieren und so ein nahezu echtes Sprachereignis erzielen.

Beim Aufbau des Digital - Human - Aussehens kann "Silicon Intelligence" mithilfe der vollständigen Gesichtsmodelierungstechnologie schnell und präzise hochrealistische Gesichtsmodelle erstellen. Der Algorithmus zur Steuerung des virtuellen Bildes kann auf der Grundlage von Sprach - und Texteingaben die Mimik und die Körperbewegungen des Digital Humans in Echtzeit steuern und so die Lebendigkeit und Natürlichkeit seiner Bewegungen gewährleisten.

In der Interaktionsumgebung kann DUIX ONE die Semantik und Emotion hinter der menschlichen Sprache tiefgehend verstehen und Funktionen wie intelligente Dialoge, Textklassifizierung und Wissensfragen beantworten. Dabei wird der Digital Human je nach Dialogsituation und Benutzerbedarf logisch strenge und inhaltlich reiche Antworten generieren.

Kommerziell setzt "Silicon Intelligence" eine differenzierte Produktstrategie um und bietet maßgeschneiderte Servicepakete für Unternehmenskunden und Privatnutzer. Im Unternehmensmarkt (B2B - Bereich) konzentriert sich das Unternehmen auf die Bedürfnisse von Mobilfunkbetreibern, E - Commerce - Plattformen, Medienunternehmen und anderen Kunden. Durch die standardisierten API - Schnittstellen kann es die AI - Fähigkeiten modular ausgeben und so die technischen Anwendungsschwellen für Unternehmen erheblich senken.

Nehmen wir das E - Commerce - Live - Streaming - Szenario als Beispiel. Unternehmenskunden können, indem sie etwa fünf Minuten lange Videomaterialien bereitstellen, schnell die individuelle Anpassung eines Digital - Human - Moderators auf der AI - Trainingsplattform abschließen. Die Plattform unterstützt die Modellierung von Merkmalen in allen Dimensionen wie Aussehen, Stimme und Sprachstil und kann die Eigenschaften des echten Moderators in hohem Maße wiedergeben. Der generierte Digital - Human - Moderator verfügt auch über Echtzeit - Interaktionsfähigkeiten, kann die Fragen der Zuschauer genau verstehen und auf die Kommentare reagieren, wodurch die Interaktivität im Live - Stream - Raum erhöht und die Verweildauer der Zuschauer verlängert wird.

Die Umsetzung von Silicon Digital Humans in verschiedenen Branchen

Der Umsatz des Digital - Human - Geschäfts von "Silicon Intelligence" hat derzeit das Niveau von Hunderten von Millionen Yuan erreicht. Es bietet Lösungen für Digital - Human - Moderatoren für über 5.000 Partnermarken und hilft den Händlern, die Kosten um etwa 80 % zu senken. Im Finanzsektor hat es mit über 30 Banken und Versicherungsunternehmen zusammengearbeitet und intelligente Digital - Human - Kundendienste eingesetzt. Es hat auch mit den führenden Fernsehsendern zusammengearbeitet, um virtuelle Moderatoren zu entwickeln.

Für Privatnutzer (C - Seite) hat "Silicon Intelligence" einen Digital - Human - "Kloning" - Service eingeführt, der es den Nutzern ermöglicht, ihre eigenen digitalen Doppelgänger zu erstellen und individuelle Funktionen wie die Anpassung des virtuellen Aussehens und die intelligente Begleitung zu nutzen. Gleichzeitig können normale Nutzer auf der DUIX - Intelligenten Interaktionsplattform und der Videoproduktionsplattform problemlos professionelle Arbeiten wie die "Generierung von Digital - Human - Videos" und die "Echtzeit - Interaktion mit Digital Humans" durchführen und so die Schwellen für die digitale Inhaltserstellung weiter senken.

Hard Krill hat erfahren, dass "Silicon Intelligence" den Preis für den Digital - Human - Kloning - Service auf einige Tausend Yuan gesenkt hat. Der Produktionsprozess ist vollständig automatisiert. Mit nur einer Sekunde Video kann das Aussehen und die Stimme geklont werden. Dabei wird nicht nur eine Lieferung innerhalb eines Arbeitstags gewährleistet, sondern auch die technischen Anwendungskosten erheblich gesenkt.

Die neuesten offiziellen Daten zeigen, dass die DUIX - Plattform von "Silicon Intelligence" über 500.000 Nutzer bedient, die täglich über 500.000 Inhalte generieren. Die kumulative Dauer der AIGC - Live - Streams liegt über zehn Millionen Stunden. Durch die tiefe Integration der Digital - Human - Technologie in Szenarien wie Kurzvideos und Live - Streams werden immer mehr normale Nutzer von passiven Inhaltskonsumenten zu aktiven Inhaltserstellern.

Um die AIGC - Technologie noch breiter zugänglich zu machen, hat "Silicon Intelligence" die Kerntechnologie der DUIX - Plattform vollständig open - source gemacht. Die derzeit veröffentlichte DUIX - Mobile - Version unterstützt die Android - und iOS - Plattformen und bietet Entwicklern eine extrem einfache Integrationslösung. Mit nur drei Zeilen Kerncode können sie die Digital - Human - Funktionen schnell in ihr eigenes Produktsystem integrieren, die Entwicklungszeit verkürzen und so die Skalierung der Digital - Human - Technologie in Branchen wie Unterhaltung, Recht, Finanzwesen, Bildung und Medizin beschleunigen.

Wenn Digital Humans, die mit den Fähigkeiten von AI - Multimodal - großen Modellen ausgestattet sind und Echtzeit - Dialoge führen können, allmählich in mehr Bereiche eindringen und in das Leben der Menschen gelangen, ist dies nicht nur ein technologischer Fortschritt, sondern auch eine Neudefinition der Art der emotionalen Kommunikation. "Digitale Unsterblichkeit" hat die Chance, von einem Konzept zur Realität zu werden. Wenn die Emotionen und Erinnerungen der Menschen mithilfe der Digital - Human - Technologie über Raum und Zeit hinweg konserviert werden können, eröffnet dies auch eine neue Dimension für die Lebensform.