In den zwei Jahren seit Wang Huiwen's Abgang hat dieser Unternehmer den ersten Zug von Liang Wenfeng erwischt.
Der Startup-Boom im Bereich Künstlicher Intelligenz (KI) ist in vollem Gange. In den letzten zwei Jahren hat der Unternehmer Yuan Jinhui zwei faszinierende Phasen erlebt.
Die erste Phase war im März 2023, als Wang Huiwen, Mitbegründer von Meituan, Yuan Jinhuis erstes Startup-Projekt OneFlow erwarb. OneFlow ist ein Deep-Learning-Framework, das die Effizienz des Trainings von großen Modellen beschleunigen kann. Wang Huiwen schätzte Yuan Jinhuis technische Fähigkeiten.
Damit wechselte Yuan Jinhui mit seinem Team in die von Wang Huiwen gegründete Guangnian Zhiwai. Im Juni 2023 kündigte Wang Huiwen seinen Rücktritt aus gesundheitlichen Gründen an. Sein alter Freund Wang Xing übernahm das Unternehmen, und Guangnian Zhiwai wurde von Meituan erworben. Yuan Jinhui trat daraufhin in das Meituan-System ein.
Die zweite Phase begann im August 2023, als Yuan Jinhui beschloss, Meituan zu verlassen und erneut ein eigenes Unternehmen zu gründen: Guiji Liudong. Er setzt auf den Bereich KI-Infrastruktur (AI Infra), eine Zwischenschicht zwischen Chips und großen Modellen sowie Anwendungen, die es ermöglicht, Modelle stabil und effizient aufzurufen.
Am 20. Januar dieses Jahres veröffentlichte und öffnete DeepSeek das R1-Inferenzmodell, das sofort ein Riesenhit wurde. Im Februar arbeitete Yuan Jinhui mit seinem Team Tag und Nacht, auch über den chinesischen Neujahr feiertag hinweg. Guiji Liudong deployte zusammen mit Huawei Cloud das R1-Modell. Dadurch stieg der Traffic auf der Website von Guiji Liudong um das 40-fache und übertraf sogar Tencent Cloud und Alibaba Cloud.
Yuan Jinhui und Liang Wenfeng, Gründer von DeepSeek, haben eine besondere Verbindung.
Nach seinem Weggang aus Meituan suchte Yuan Jinhui überall nach Finanzierung. Liang Wenfeng zeigte Interesse an einer Investition, aber die beiden waren sich nicht einig über die Frage, ob das Modell offen zugänglich sein sollte. Liang Wenfeng war fest davon überzeugt, dass das Inferenz-Deployment-Engine-Modell open source sein müsse, ansonsten sei es kein Erfolg. Yuan Jinhui war jedoch noch nicht von seiner vorherigen Startup-Erfahrung mit OneFlow weggekommen - das Projekt war aufgrund mangelnder Kommerzialisierung mehrmals in Zahlungsengpässen geraten.
„Wir haben zuvor das Open-Source-Deep-Learning-Framework OneFlow entwickelt. Offenheit garantiert nicht den Erfolg. Man muss die Geschäftslogik gut durchdenken.“ sagte Yuan Jinhui gegenüber „China Entrepreneur Magazine“.
Die Investition kam also nicht zustande, aber die beiden Unternehmen hatten weiterhin geschäftliche Kontakte. Jedes Mal, wenn DeepSeek seine großen Modelle aktualisierte, deployte Yuan Jinhuis Team es zuerst auf den Servern von Guiji Liudong, einschließlich des V2-Modells im Mai 2024 und des V2.5 im September. Für eine gewisse Zeit war Guiji Liudong der einzige Drittanbieter, der DeepSeek-V2 und V2.5 deployte.
Seit seinem ersten Startup in 2016 bis zu seinem zweiten in 2023 fasst Yuan Jinhui seine Startup-Erfahrung zusammen: „Heute ist das Gründen eines Unternehmens wie das Durchqueren einer Wüste. Man trägt etwas Wasser mit sich, aber wenn man keine Oase findet, geht das Wasser möglicherweise aus, und man kann die Wüste nicht überqueren. Aber jetzt haben wir eine Oase gefunden. Wenn sie groß genug ist, bleibe ich hier. Oder ich tanke hier auf und gehe dann weiter.“
Das Auffüllen des Wassertanks heißt, Geld von Investoren zu bekommen. Die Oase ist die Kommerzialisierungschance, die durch den Ruhm von DeepSeek entstanden ist, und die es Guiji Liudong ermöglicht, Cashflow zu generieren und das Geschäft kontinuierlich zu erweitern.
Die neueste Finanzierungsrunde von Guiji Liudong wurde im Juni dieses Jahres abgeschlossen. Alibaba Cloud führte die Runde an, und die Summe belief sich auf mehrere Hundert Millionen Yuan. Alte Aktionäre wie Innovation Works und andere Investoren haben überschüssig mitinvestiert. Frühere Investoren waren auch Meituan (Strategieinvestition), Yaotu Capital und MiraclePlus.
Dies ist der Rhythmus eines kontinuierlichen Unternehmers in der KI-Zeit. In der schnell sich entwickelnden Technologie gibt es keine dauerhaften Barrieren. Man muss sich an die technologische Entwicklung anpassen, bis man die große Oase in der Wüste findet.
Der Kampf um die parallele Verarbeitung von Experten auf großem Maßstab
Vor der Veröffentlichung des V3-Modells von DeepSeek im Dezember 2024 fragte Liang Wenfeng Yuan Jinhuis Team, ob es es vorab deployen möchte. Yuan Jinhui berechnete, dass es möglicherweise nicht genug Geld für die Serververmietung geben würde. Damals machten die Leute Witze und sagten, man solle schnell finanzieren lassen, damit die Investoren das Geld überweisen.
Es gibt zwei Schwierigkeiten bei der Bereitstellung des V3-Modells. Erstens ist die optimale Bereitstellungsstruktur die parallele Verarbeitung von Experten auf großem Maßstab. Ohne diese Technik ist die Produktivität sehr gering, und es ist schwierig, die Kosten zu decken. Um die parallele Verarbeitung von Experten auf großem Maßstab zu reproduzieren, ist ein großer Forschungs- und Entwicklungsaufwand erforderlich.
Zweitens erfordert die parallele Verarbeitung von Experten auf großem Maßstab mehrere Dutzend oder sogar Hunderte von Grafikkarten. Die monatlichen Mietkosten für diese Server betragen etwa 70.000 bis 80.000 Yuan. Wenn man mehrere Dutzend Server mieten möchte, ist dies für ein Startup eine erhebliche Kostenposition.
Im Januar 2025 wurde das R1-Modell auf Basis der V3-Modellarchitektur veröffentlicht. Der resultierende Trafficsturm ließ die APP und die Webseite von DeepSeek zusammenbrechen. Der Chatbot konnte pro Tag nur eine Frage beantworten. In der ersten Woche wurden 6 Millionen Mal die DeepSeek-APP heruntergeladen. In der zweiten Woche stieg diese Zahl auf 20 Millionen. Die Popularität von DeepSeek, kombiniert mit den Menschenströmen während des chinesischen Neujahrs, machte DeepSeek zu einem heiß diskutierten Thema.
Quelle: KI-generiert
Zu dieser Zeit fiel das chinesische Neujahr. Yuan Jinhui musste sein gesamtes Team motivieren, auch während des Feiertags und an Wochenenden zu arbeiten. Dieser Zustand dauerte bis April an. Außer der offiziellen Seite von DeepSeek hat keine andere Firma in kurzer Zeit die Technologie der parallelen Verarbeitung von Experten auf großem Maßstab überwunden. Alle mussten „den Motor eines fliegenden Flugzeugs austauschen“, indem sie zunächst Ressourcen anhäuften, um den Traffic aufzunehmen, und dann die Architektur des Inferenz-Engines aktualisierten und die alte Architektur allmählich ersetzten. Dieser Prozess dauerte etwa zwei Monate.
Die Nutzung des Trafficvorteils hat Guiji Liudong im Februar berühmt gemacht. Über Nacht wurde es zu einer C-End-Anwendung. Die C-End-Nutzer, die hauptsächlich aus Neugier gekommen sind, bleiben jedoch nicht lange. Wenn die C-End-Produkte der großen Unternehmen später DeepSeek deployen, wechseln sie zu diesen Produkten. Beispielsweise stieg die monatliche Zahl der aktiven Nutzer von Tencent Yuanbao im ersten Quartal von mehreren Millionen auf 40 Millionen.
Dieser Kampf um den Traffic hat die „Markenbekanntheit“ von Guiji Liudong geschaffen. In den API-Aufruf-Fenstern einiger KI-Anbieter ist neben Tencent Cloud, Volcengine und Alibaba Cloud auch „Guiji Liudong“ eine Option.
Wenn man diesen plötzlich ausgebrochenen Kampf zurückblickt, kann man sagen, dass Yuan Jinhui einige Erfolge erzielt hat: Erstens hat er die parallele Verarbeitung von Experten auf großem Maßstab optimiert, sodass es von „funktionsfähig“ zu „gut nutzbar“ geworden ist. Zweitens hat er einen großen Kampf gewonnen, den Markt erschlossen, das Team trainiert und die Markenbekanntheit erhöht.
Kommerzialisierung in der Zeit der großen Modelle
MaaS (Model as a Service) ist ein Geschäftsmodell, das in der Zeit der großen Modelle entstanden ist. Für die Nutzer bedeutet es, dass sie für die Anzahl der Tokens, die sie nutzen, bezahlen müssen. Aber einige Unternehmer halten sich von diesem Modell distanziert.
Yuan Jinhui sagte gegenüber „China Entrepreneur Magazine“, ob man mit MaaS-Diensten Geld verdienen kann, hängt von der Fähigkeit des Unternehmens ab. Beispielsweise muss man in technischer Hinsicht in der Lage sein, mit derselben Rechenleistung eine höhere Effizienz zu erzielen.
Nachdem die parallele Verarbeitung von Experten auf großem Maßstab im April erreicht wurde, ist die Token-Ausgabeeffizienz um ein Vielfaches höher als ohne diese Technik. Es besteht also Raum für Gewinn.
Um den Unternehmen die Bereitstellung von DeepSeek-Modellen zu erleichtern, hat DeepSeek eine „Open-Source-Woche“ organisiert und entsprechende Forschungsarbeiten veröffentlicht. DeepSeek hat erwähnt, dass das Optimierungsziel des V3/R1-Inferenzsystems ist, eine höhere Durchsatzleistung und eine geringere Latenz zu erreichen. Um diese Ziele zu erreichen, wird die parallele Verarbeitung von Experten auf großem Maßstab eingesetzt.
Yuan Jinhui gibt ein Beispiel: Angenommen, ich habe 40 Server. Die monatlichen Mietkosten betragen etwa drei bis vier Millionen Yuan. Wenn sie voll ausgelastet sind, kann man pro Monat einen Umsatz von über zehn Millionen Token erzielen. „Der Schlüssel ist die volle Auslastung.“ Dies betrifft Fragen der Kundenakquise und des Betriebseffizienz, wie die zeitliche Staffelung des Serverbetriebs.
Yuan Jinhui sagt: „Als Anbieter hängt es davon ab, ob man in der Lage ist, dieses Systemprojekt zu meistern, ob man MaaS erfolgreich betreiben kann. Für Unternehmen, die sich auf die Infrastruktur konzentrieren, ist es ihre Aufgabe, die Probleme der Nutzer oder der Branche zu lösen.“
Als einige Startups die Bereitstellung von DeepSeek und die Erbringung von MaaS-Diensten aufgaben, hat Yuan Jinhui diese Chance ergriffen.
Um die Nutzer anzuziehen, hat Guiji Liudong kurz nach der Einführung der MaaS-Plattform eine Marketing-Strategie implementiert: „Registrieren Sie sich und erhalten Sie 14 Yuan Guthaben. Wenn Sie Freunde einladen und sie sich erfolgreich registrieren, erhalten Sie ebenfalls 14 Yuan Guthaben.“ Yuan Jinhui hat gescherzt, dass dieser Ruhm fast seinen Cashflow zusammenbrechen ließ.
Aber Yuan Jinhui bereut es nicht. Er sagt, dass jede Entscheidung Risiken birgt. „Wenn man nicht riskiert, kann man nur auf die nächste Chance warten. In dieser Chance hat man zumindest keine Chance mehr. Man muss sich dann auf die Softwareverkauf oder die Verkauf von All-in-One-Systemen konzentrieren. Eigentlich will jeder das beste Geschäft machen, und das beste Geschäft ist der KI-Cloud-Service.“
Yuan Jinhui sagt: „Während des Startup-Prozesses sollte man sich nicht darum sorgen, dass die Probleme zu herausfordernd sind, sondern darum, dass es keine Herausforderungen gibt. Wenn man immer nur einfache Probleme hat, macht es keinen Sinn.“
Im Jahr 2025 glaubt Yuan Jinhui, dass das wichtigste Problem, das die gesamte KI-Branche zu lösen hat, die Kommerzialisierung ist.
Er sagt: „Früher hat man sich nur um technische Probleme gekümmert. Aber jetzt denkt die gesamte Branche darüber nach, welche Produkte man entwickeln soll und wie man das geschäftliche Kreislaufsystem schließen kann.“
Unternehmen in der KI-Zeit - „Angst“
Für Guiji Liudong ist das Schlüsselwort für das Jahr 2025 das hohe Wachstum.
Yuan Jinhui sagt: „Wir müssen uns überlegen, wie wir unseren Marktanteil erhöhen können, sei es bei kleinen und mittleren B-Kunden oder großen B-Kunden, sei es im öffentlichen Cloud-Bereich oder bei privaten Bereitstellungen. Wir können auch den Auslandsmarkt ansteuern und ihn in eine Oase verwandeln.“
Um die „Wüste“ zu durchqueren, muss man nicht nur Wasser mit sich führen, sondern auch ständig nach Oasen suchen.
Yuan Jinhui sagt, dass der Startup-Prozess möglicherweise nicht in einem Schritt abgeschlossen werden kann. ByteDance hat auch nicht von Anfang an Douyin entwickelt. Es gab mehrere Sprünge in der Entwicklung. „Man muss die vorhandenen Geschäftschancen nutzen, die Produkte standardisieren und den Marktanteil so weit wie möglich erhöhen, um ein sicheres Hafen für die Zukunft zu schaffen. Dann kann man in der Zukunft bessere Chancen nutzen und bessere Produkte entwickeln.“
Das Gründen eines Unternehmens im Bereich KI-Infrastruktur bedeutet im Wesentlichen, die Lücken zwischen den großen Unternehmen zu finden und die Gräben zwischen den dichten Feuerstößen zu nutzen. Aber die Haltbarkeit seiner Produkte ist länger als die von reinen C-End-Produkten, und die Barrieren sind höher.
Einer der Vorteile von Guiji Liudong ist seine „Neutralität“. Im Gegensatz zu den Modellanbietern, die ihre eigenen Modelle bei der Vermarktung von Cloud-Diensten für große Modelle priorisieren.
Yuan Jinhui sagt, dass die KI noch in der Phase des wilden Wachstums ist. Die Kanonen der großen Unternehmen reichen nicht überall hin. In dieser Zeit ist es am wichtigsten, nicht zu viel nachzudenken, sondern einfach loszulegen.
Genau wie die Fähigkeiten von Modellen haben auch die Technologien der KI-Infrastruktur ihre Grenzen. Es ist unmöglich, dauerhaft weit vor den Konkurrenten zu sein. Der Schlüssel ist die Optimierung der Details und die Konzentration auf das Engineering.
„Angst ist ein Merkmal von KI-Unternehmen in der gegenwärtigen Phase. Jeder hat seine Stunde der Herrlichkeit, aber man darf nicht stehenbleiben.“ fasst Yuan Jinhui zusammen.
Yuan Jinhui will sich erneut herausfordern. „Was die Spannung betrifft, muss man nicht nur die Technologie gut machen, sondern auch das Produkt und das Geschäft. Es ist wie beim Spielen eines Computerspiels. Man muss von einer Stufe zur nächsten gehen. Wenn man immer die gleiche Stufe wiederholt, wird man schnell gelangweilt und verliert das Interesse.“
Dieser Artikel stammt aus dem WeChat-Account „China Entrepreneur Magazine“ (ID: iceo-com-cn). Autor: Yan Junwen, Redakteur: Zhang Xiaodi. 36Kr hat die Veröffentlichung mit Genehmigung vorgenommen.