StartseiteArtikel

400-Milliarden-Yuan-DeepSeek: Wie lassen sich die eingesammelten 50 Milliarden Yuan ausgeben?

36氪的朋友们2026-07-01 13:16
Talente, Infrastruktur und KAGI

Am Abend des 29. Juni kündigte DeepSeek an, dass die offizielle Version V4 Mitte Juli offiziell online gehen wird.

Die Ankündigung erklärt: Um die Ressourcen rationeller zu verteilen und die Stabilität des Dienstes zu verbessern, wird nach der Veröffentlichung der offiziellen Version die API-Preisstrategie synchron angepasst und ein Spitzen- und Tiefzeit-Preise-System eingeführt.

In den letzten zwei Wochen gab es noch zwei weitere wichtige Ereignisse im Zusammenhang mit DeepSeek:

Erstens absolvierte DeepSeek am 16. Juni die erste externe Finanzierung seit seiner Gründung. Der Gesamtbetrag der Kapitalbeschaffung belief sich auf 51 Milliarden Yuan, und der Unternehmenswert lag bei fast 400 Milliarden Yuan. Damit wurde das Prinzip des Gründers Liang Wenfeng, "keine Finanzierung, keine Börsennotierung, keine Kommerzialisierung", gebrochen.

Zweitens, nur zehn Tage nach der Finanzierung, am 27. Juni, veröffentlichte das DeepSeek-Team in Zusammenarbeit mit Peking-Universität die Studie "DSpark: Confidence-Scheduled Speculative Decoding with Semi-Autoregressive Generation". Der Gründer Liang Wenfeng ist auf der Liste der Autoren der Studie aufgeführt.

Wenn die Aufgabe der ersten Phase von DeepSeek darin bestand, zu beweisen, dass es in der Lage ist, ein Weltklasse-Großmodell zu entwickeln, so muss DeepSeek in der zweiten Phase, wenn "Kapital" und "Technologie" zusammenkommen, mit dem finanzierten Geld der Welt beweisen, dass es ein ehrlicherweise kommerzielles Unternehmen ist.

Nach 50 Milliarden Yuan beginnt DeepSeek, Personal zu rekrutieren

Seit der Finanzierung hat der neue Leiter des DeepSeek Harness-Teams, Cui Tianyi, nicht einmal eine Minute lang ruhen können.

Am Abend des 25. Juni veröffentlichte DeepSeek auf sozialen Plattformen umfangreiche Stellenausschreibungen, die sieben Kategorien, darunter Algorithmen, Forschung und Entwicklung, Betrieb und Wartung, Produkte, Dateningenieure und Funktionsbereiche, insgesamt 33 Stellen abdecken. Die Arbeitsorte umfassen Peking und Hangzhou, und alle Stellen akzeptieren Praktikanten.

Auf verschiedenen sozialen Plattformen wie der offiziellen Website und dem offiziellen Account von DeepSeek, Boss Zhipin, X und Xiaohongshu kann man den Leiter, der ein ehemaliger Kommilitone von Liang Wenfeng an der Zhejiang-Universität ist und im März dieses Jahres dem Team beigetreten ist, beim Rekrutieren von Personal sehen. Gelegentlich nimmt er auch die Zeit, "Rumors zu widerlegen".

Bild: Cui Tianyi antwortet auf Kommentare auf Xiaohongshu, die behaupten, dass DeepSeek bei der Personalrekrutierung die Abschlüsse von Tsinghua-Universität und die Erfahrung mit Doubao fordert.

Bisher war DeepSeek eher wie ein stiller, bescheidener und fleißiger Techniker, der auf die quantitative Hedgefonds "Magic Square Quant" gründete, die von Liang Wenfeng gegründet wurde. Magic Square Quant hatte 2025 eine jährliche Rendite von 56,55 % und ein verwaltetes Vermögen von über 70 Milliarden Yuan, sodass DeepSeek nicht auf externes Kapital angewiesen war.

Außenstehenden scheint DeepSeek "kein Geld zu fehlen".

Der potenzielle Grund, warum Liang Wenfeng seine Einstellung zur Finanzierung geändert hat, könnte der Verlust von Schlüsselpersonen und der beschleunigte Wettlauf um Talente von außen sein.

Als Referenz: Das bereits an der Börse notierte "Erste Aktie im Bereich der Großmodelle", Zhipu, hatte bis zum 30. Juni einen Gesamtmarktwert von fast einer Billion Hongkong-Dollar, und der Marktwert von MiniMax lag ebenfalls über 130 Milliarden Hongkong-Dollar.

Im Gegensatz dazu ist die Optionenkarte der Mitarbeiter von DeepSeek noch weiß. Das Unternehmen hat keine Finanzierung, keine Börsennotierung und keine externe Unternehmenswertschätzung.

"Ohne Finanzierung steigt der Unternehmenswert nicht. Selbst wenn die Mitarbeiter Optionen haben, werden diese nicht an Wert gewinnen. Im Vergleich zu Zhipu, MiniMax und einigen anderen Großmodell-Teams, deren Unternehmenswerte entweder sprunghaft gestiegen sind oder nach der Börsennotierung stark angestiegen sind, können die Mitarbeiter von DeepSeek sicherlich nicht gehalten werden." Ein erfahrener Fachmann in der Nähe von DeepSeek sagte, als er die Gründe für die Finanzierung zu diesem Zeitpunkt erläuterte.

Die Kosten für die Bindung von Talenten sind auch keine Kleinigkeit.

2025 lag der größte Wettbewerbsvorteil von DeepSeek in einem Team von über hundert hochqualifizierten "Genies". Dutzende Spitzenforscher und ein Gründer mit einem starken technischen Idealismus, Liang Wenfeng, haben DeepSeek-R1 geschaffen.

Dieses Jahr rekrutieren die großen Internet-Unternehmen weiterhin Spitzen-AI-Forscher mit hohen Gehältern, und gleichzeitig steigt die Nachfrage nach AI-Talenten auf dem Markt stark an. Offizielle Daten zeigen, dass der Median des monatlichen Gehalts für Algorithmen-Stellen allgemein über 24.000 Yuan liegt, und das monatliche Gehalt von Spitzen-Talenten über 50.000 Yuan beträgt. Die Prämie für AI-Talente nimmt stetig zu.

Unter den Stellen in dieser umfangreichen Stellenausschreibung sind es nicht nur die Stellen für Full-Stack-Entwicklung/Algorithmen, AI-Kernsystementwicklung, Betrieb und Wartung, Produkte, sondern auch die Funktionsbereiche wie Personalwesen, Rechtsabteilung, Finanzen, Beschaffung und Verwaltung, die Personal aufnehmen.

Das Signal, das durch die umfassende "Erweiterung" gesendet wird, ist, dass DeepSeek noch die organisatorischen Fähigkeiten eines Technologieunternehmens aufbauen muss.

Der Übergang von "Produktgetrieben" zu "Organisationsgetrieben" ist auch der unvermeidliche Weg für viele Technologieunternehmen. Erst nachdem die Organisation allmählich reife, die Plattform ständig verbessert und das Personal-Motivierungssystem etabliert ist, beginnt der große Produktgewinn zu fließen.

Die Finanzierung von 50 Milliarden Yuan dient einerseits der Bindung von Mitarbeitern und andererseits als Grundlage für die Vervollständigung der Organisationsstruktur. Aber in diesem Prozess kann DeepSeek "leichtgängig umdrehen" und nach der Personalaufnahme weiterhin die Effizienz und Flexibilität einer "kleinen Teamarbeit" und einer agilen Entscheidungsbahn aufrechterhalten? Dies ist die erste Frage, die DeepSeek in der "zweiten Phase" beantworten muss.

DeepSeek geht in die Schwervermögen-Branche

Unter den 33 Stellen in der Stellenausschreibung vom 25. Juni gibt es einige Stellen, die bemerkenswert sind, nämlich das Team für das IDC (Internet Data Center), das sich mit der Infrastrukturentwicklung befasst.

Schon Mitte April veröffentlichte DeepSeek in Ulanqab, Innerer Mongolei, die ersten Stellen für das Datencenter, darunter einen leitenden Betriebsingenieur für das Datencenter und einen leitenden Lieferungsmanager für das Datencenter. Im Juni hat DeepSeek dann noch die Stelle "Ingenieur für die Planung und Gestaltung des IDC" hinzugefügt.

Seit diesem Jahr hat sich die Personalplanung von DeepSeek von den Modellen auf die Infrastrukturentwicklung für die Rechenleistung ausgeweitet, von der Betriebs- und Lieferung des Datencenters bis hin zur Planung und Gestaltung.

Bild: Informationen zu den Stellenausschreibungen für das IDC-Datencenter-Team von DeepSeek

Mit dem Eintritt der Großmodelle in die Phase der massiven Training und Inference wird der Wettbewerb zwischen AI-Modellunternehmen in eine "Hardware-Rennen" der "Infrastruktur" übergehen und muss es auch. Dies zwingt DeepSeek, wie die Spitzen-Großmodellunternehmen an der Silicon Valley, an dem "geldverschwendenden" Spiel der Eigenbau von Rechenleistungskluster teilzunehmen.

Offizielle Daten zeigen, dass die amerikanischen Technologiegiganten Alphabet, Amazon, Meta und Microsoft voraussichtlich insgesamt etwa 650 Milliarden US-Dollar in die Erweiterung der Infrastruktur für Künstliche Intelligenz investieren werden. Anthropic und OpenAI haben auch mehrmals in ihren veröffentlichten Finanzberichten betont, dass sie die Investitionen in die Infrastruktur für die Rechenleistung kontinuierlich erhöhen werden.

Beispielsweise wird Anthropic voraussichtlich nur für die Miete der Datencenterkapazität monatlich etwa 1,25 Milliarden US-Dollar an SpaceX zahlen, was im Jahr 15 Milliarden US-Dollar entspricht, ohne die Anschaffung von GPUs, Netzwerke und Betrieb und Wartung zu berücksichtigen.

Pan Helin, Mitglied des Expertenausschusses für Informations- und Kommunikationsökonomie der Ministerium für Industrie und Informationstechnologie, hat in einem früheren Interview darauf hingewiesen, dass die Finanzierung von Großmodellunternehmen unter der gegenwärtigen Investitionswelle in der AI eine unumgängliche Tendenz ist. "Nicht nur DeepSeek, auch Google hat 80 Milliarden US-Dollar finanziert. Die Branche ist in die Phase des Schwerkapitals eingetreten."

Um nicht bei der Infrastrukturentwicklung für die Rechenleistung zurückzuliegen, muss DeepSeek auf der Finanzseite "Neue Quellen erschließen", Finanzierung erhalten und dann in die Infrastrukturentwicklung für die Rechenleistung und Datencenters investieren.

Es ist bemerkenswert, dass DeepSeek die Infrastruktur für die Rechenleistung unter der Einschränkung des Ausports fortschrittlicher Rechenleistung aus dem Ausland baut. Dies bedeutet, dass die oben genannte Rechenleistung von chinesischen Chips angetrieben wird. Bei der Veröffentlichung von DeepSeek V4 hat DeepSeek in seiner offiziellen Seite und dem technischen Bericht die Erforschung der chinesischen Rechenleistung erwähnt.

Ende Mai hat Huawei das "Tao (τ)-Gesetz" vorgeschlagen, um die Engpässe, die durch die Verlangsamung des Moore-Gesetzes verursacht werden, durch die ganzheitliche Optimierung von Bauteilen, Chips und Systemen zu überwinden. Die chinesischen Großmodelle passen sich auch beschleunigt der chinesischen Rechenleistung an. Das Ziel der Erforschung der chinesischen Rechenleistung ist "eine eigenständige und kontrollierbare AI-Infrastruktur".

Vor der Stunde der AGI

Für ein Grundmodellunternehmen wie DeepSeek reichen Kapital und Organisation nicht aus, um langfristig führend zu bleiben. Der Schlüssel liegt in der kontinuierlichen Entwicklung von Originaltechnologien.

Ein erfahrener Fachmann in der Rechenleistung hat ebenfalls betont, dass die umfangreiche Finanzierung von DeepSeek in dieser Runde dazu dient, das Team zu motivieren und die Schlüsselpersonen zu binden. "Nur mit genügender Finanzierung kann man ein gutes Modell trainieren und die Spitzenposition festigen."

Die Studien sind ein wichtiges Abbild von DeepSeek bei der Erforschung neuer Technologien.

Laut unvollständigen Statistiken hat DeepSeek in den letzten zwei Jahren etwa 27 Kerntechnikstudien veröffentlicht. Die Forschungsrichtungen umfassen MoE (Mixture of Experts), Verstärkendes Lernen, Code-Großmodelle, mathematische Inferenz, Multimodalität und so weiter, die fast jedem ihrer Kernmodelle und wichtigen technischen Durchbrüche entsprechen.

Am 27. Juni hat DeepSeek auf GitHub stillschweigend eine Studie über die neue Technologie "DSpark" aktualisiert.

In der Studie hat DeepSeek einen neuen Inference-Beschleunigungsrahmen "DSpark" vorgeschlagen, der die Inference-Geschwindigkeit und die Systemdurchsatzleistung von Großmodellen erheblich verbessert, ohne die Fähigkeiten des Modells zu ändern.

Im Gegensatz zu früheren Studien ist diese Studie keine Iteration eines neuen Modells, sondern fügt ein Spekulatives Decoding-Modul auf der Grundlage von DeepSeek-V4-Pro und DeepSeek-V4-Flash hinzu. Der Schwerpunkt liegt auf der Optimierung auf der Ebene der Projektumsetzung.

DeepSeek beabsichtigt, DSpark in das Online-Service-System von DeepSeek-V4 zu integrieren, um die Verschwendung von Rechenleistung durch ineffiziente Prüfungen zu reduzieren, wenn es echten Benutzerverkehr verarbeitet.

In der Studie wird erwähnt, dass "die Generierungsgeschwindigkeit um 60 - 85 % erhöht wird, ohne die zugrunde liegende Modellarchitektur zu ändern." Für AI-Unternehmen, die täglich eine riesige Anzahl von API-Anfragen verarbeiten müssen, bedeutet jede Reduzierung der Rechenleistungskosten eine Erhöhung des Gewinnraums.

Laut einer Mitteilung von VentureBeat im Februar dieses Jahres werden die Kosten für das Modelltraining immer höher. Der CEO von Anthropic, Dario Amodei, prognostiziert, dass die Trainingskosten für die nächste Generation von Spitzenmodellen zwischen 5 und 10 Milliarden US-Dollar liegen werden.

Der oben genannte erfahrene Fachmann in der Rechenleistung sagte, dass DeepSeek ebenfalls in die "geldverschwendende" Phase des Modelltrainings eintreten wird.

Um das Modelltraining und die Iteration von DeepSeek zu unterstützen, ist die Finanzierung früher oder später unvermeidlich.

Viele Medien interpretieren, dass DeepSeek, indem es nur zehn Tage nach der Finanzierung eine neue Studie veröffentlicht, scheint zu beweisen, dass der Kernrhythmus des Unternehmens sich nicht geändert hat und das Forschungsteam weiterhin eine hohe Produktivität aufrechterhält.

Ob es sich um die Veröffentlichung eines neuen Modells, die Entwicklung eines Datencenters oder den Übergang von einem "Genies-Labor" zu einem kommerziell betriebenen AI-Unternehmen handelt, das Ziel der Evolution von DeepSeek ist die AGI.

Im Jahr 2024 hat Liang Wenfeng in einem Interview mit "AnYong Waves" klar gemacht: "Wir arbeiten an der AGI (Allgemeine Künstliche Intelligenz). Große Sprachmodelle sind möglicherweise der unvermeidliche Weg zur AGI."

In der kostenlosen Phase können Benutzer Probleme wie fehlende Antworten, Unterbrechungen im Dialog und API-Beschränkungen noch tolerieren. Sobald die offizielle Version von DeepSeek V4 im Juli online geht, wird die Anforderung der Benutzer an die Stabilität ebenfalls steigen. Wenn die Probleme weiterhin bestehen, wird dies direkt darauf auswirken, ob die Benutzer DeepSeek in ihren echten Arbeitsabläufen und Geschäftssystemen einsetzen möchten.

Im Bereich der