DeepSeek V4 ist endlich veröffentlicht, aber die fünf subjektiven Fragen, die es hinterlassen hat, haben noch keine Antworten.
Text | Zhou Xinyu
Datenkompilierung | Zhong Chudi
Redaktion | Su Jianxun, Yang Xuan
Die Ankündigung ist endlich gefallen.
Das DeepSeek V4, das fast drei Monate lang mit dem Spottnamen "Next Week" umzingelt wurde, hat endlich sein wahres Gesicht gezeigt.
Eine maximale Parameteranzahl von 1,6 T, ein Kontextfenster von 1 M, eine Leistungsoptimierung für Agenten sowie die Reduzierung der Rechen- und Speicherbedarfe auf der Grundlage des MoE (Mixture of Experts-Modell) und des sparsen Attentionsmechanismus DSA – all diese Parameter und Leistungsmerkmale, die von außen spekuliert wurden, sind mit der offiziellen Ankündigung des V4 endgültig festgelegt.
Ergebnisse der Leistungsbewertung von DeepSeek V4.
Der Grund für die Verspätung hängt mit der Migration des Trainingsframeworks von NVIDIA auf die Huawei Ascend-Plattform zusammen und auch mit internen Entscheidungsänderungen bei DeepSeek. Wir haben erfahren, dass Mitte 2025 DeepSeek einen schwerwiegenden Trainingsfehler erlitten hat.
"Damals stand DeepSeek vor dem Problem, die Chips neu anzupassen", sagte ein Kenner. "Auch die internen Meinungen über die Trainingsrichtung waren nicht einheitlich. Liang Wenfeng stellte einige eigene Anforderungen, aber es war schwierig, auf der Implementierungsebene einen Kompromiss zu finden."
Im Gegensatz zu den externen Spekulationen über die Unterstützung von multimodaler Generierung und Verständnis durch das neue Modell ist das V4 immer noch ein Sprachmodell. Die Entscheidung, die multimodale Generierungstrainingsstrategie zu verzögern, beruht hauptsächlich auf den Einschränkungen bei der Rechenleistung und den verfügbaren Geldern.
Mehrere Kenner haben der Zeitschrift "Intelligent Emergence" mitgeteilt, dass das externe Finanzierungsfenster von DeepSeek Mitte April 2026 geöffnet wurde. Der interne Auslöser war, dass DeepSeek mehr Kapital benötigte, um Modelle mit größerer Parameteranzahl zu trainieren und gleichzeitig mehr Spitzentalente zu halten und zu rekrutieren.
"Im Vergleich zu den Modellen von Top-Anbietern wie OpenAI und Anthropic hat die Parameteranzahl von 1,6 T keine absolute Wettbewerbsfähigkeit", sagte uns ein Branchenmitarbeiter. Bald werden auch in China Modellhersteller Modelle mit einer Parameteranzahl von 3 T veröffentlichen.
Seit Talente wie Guo Daya (Hauptautor von DeepSeek R1) und Wang Bingxuan (Hauptautor von DeepSeek LLM) von großen Unternehmen wie ByteDance und Tencent abgeworben wurden, benötigt DeepSeek eine große Finanzierung, um die Mannschaft zu stabilisieren und neue Kräfte zu rekrutieren.
Mehrere Branchenmitglieder vermuten, dass der externe Auslöser für die Entscheidung, sich für offene Finanzierungen zu entscheiden, mit der Investitionshaltung von Tencent zusammenhängt. Vor der Finanzierungsinitiative hatten Liang Wenfeng und Ma Huateng mehrere Gespräche über eine exklusive Investition geführt. Zwei betroffene Personen haben jedoch angegeben, dass Liang Wenfeng die Bedingung, Tencent 20 % der Anteile zu geben, nicht akzeptiert hat.
Seit der Veröffentlichung von R1 hat sich DeepSeek deutlich verändert: DeepSeek hat sich von einem eher non-profit orientierten, idealistischen technologischen Utopia schnell in ein pragmatisches Unternehmen gewandelt, das auf Produkte und kommerzielle Erfolge setzt.
Am 8. April 2026 wurde die DeepSeek App überarbeitet und die " Expertenmodus " für komplexe Schlussfolgerungen und der " Schnellmodus " für einfache Aufgaben eingeführt. Mit der Veröffentlichung des V4 haben wir auch erfahren, dass das V4-pro mit 1,6 T Parametern für den "Expertenmodus" zuständig ist, während das V4-flash mit 284 B Parametern den "Schnellmodus" unterstützt.
Die beiden Modi der DeepSeek App.
Ein Kenner hat gesagt, dass Liang Wenfeng seit Ende 2025 vermehrt auf die Verbesserung der Produkte geachtet hat. Mehrere Produktmanager von großen Unternehmen haben der Zeitschrift "Intelligent Emergence" mitgeteilt, dass DeepSeek Ende 2025 eine "offene Rekrutierung" für Produktmanager durchgeführt hat und sie mehrmals von DeepSeek HR kontaktiert wurden.
Ein Branchenmitarbeiter hat der Zeitschrift "Intelligent Emergence" auch angegeben, dass DeepSeek intern mehrere innovative Produktteams aufgebaut hat, um Agenten und andere C-End-Produktformen zu erforschen.
Beim Vergleich der aktualisierten Versionen ist die Verbesserung der Textverarbeitungskapazität von DeepSeek deutlich zu erkennen. In den letzten 12 Monaten haben wir von mehreren HR-Spezialisten und Headern aus der KI-Branche gehört, dass DeepSeek HR-Mitarbeiter nicht nur einmal in den Studentenwohnheimen der Peking-Universität mit Studenten Kontakt aufgenommen haben.
Das Ziel, Studenten der Sinologie zu rekrutieren, ist die Datenerfassung und die Einrichtung von Bewertungsstandards im humanistischen Bereich. Dies wird als Signal für die Wertschätzung der humanistischen Aspekte des Modells von DeepSeek gewertet.
Obwohl "Gemeinnützigkeit" und "Offenheit" sowie ein einfaches Chat-Interface das öffentliche Image von DeepSeek ausmachen, haben wir erfahren, dass DeepSeek 2025 ständig an der Erforschung von Produkten und kommerziellen Geschäftsmöglichkeiten gearbeitet hat. Derzeit hat sich DeepSeek ein Produktteam von mehreren Dutzend Personen zusammengetrommelt, um Agenten und andere Produktformen zu erforschen.
Bereits 2024, bevor DeepSeek berühmt wurde, hat man über Werbeaktionen nachgedacht, aber Liang Wenfeng hat diese Idee schnell abgelehnt.
Die jährliche Aktualisierung von DeepSeek ist endlich hier, wie das fallende Schwert des Damokles, das die Herzen der chinesischen und globalen Modellhersteller beruhigt.
Seit 2026 ist die jährliche Aktualisierung von DeepSeek zu einer Art "Wolf, Wolf!"-Geschichte in der KI-Welt geworden. Die Vermeidung von DeepSeek ist in den letzten Monaten zur Standardtaktik der Modellhersteller geworden.
Zwei neu gegründete KI-Unternehmen, Zhipu und MiniMax, haben vor dem chinesischen Neujahr ihre neuen Modelle GLM 5 und M 2.5 veröffentlicht.
Ein Mitarbeiter von Zhipu hat der Zeitschrift "Intelligent Emergence" mitgeteilt, dass sobald das Gerücht um die Veröffentlichung eines Modells von DeepSeek während des chinesischen Neujahrs kursierte, das Algorithmus-Team eine Sitzung abgehalten und die Veröffentlichung von GLM 5 "so bald wie möglich" gefordert hat.
Ein Mitarbeiter von MiniMax hat ebenfalls gesagt, dass Mitte Januar, noch während der Hangover nach dem Feierabend für den Börsengang, das Algorithmus-Team freiwillig frühzeitig zurück in die Büros gekommen ist.
Das "Vermeiden der Konkurrenz" ist für diese beiden Börsennotierten KI-Unternehmen besonders wichtig. "Wenn wir später als DeepSeek veröffentlichen und unsere Leistung schlechter ist, wird dies den Aktienkurs beeinträchtigen. Aber wenn wir nicht veröffentlichen, wird dies ebenfalls den Aktienkurs beeinträchtigen", sagte der oben genannte Mitarbeiter. "Die beste Möglichkeit, die Auswirkungen zu minimieren, ist es, frühzeitig zu veröffentlichen."
Die Finanzierungsaktivitäten der Modellhersteller müssen ebenfalls vor der Aktualisierung von DeepSeek erfolgen.
Das Unternehmen Jieyue Xingchen, das Ende Januar eine B+-Runde finanziert hat, möchte dringend diese Finanzierungsrunde vor dem chinesischen Neujahr abschließen. Ein Kenner hat uns mitgeteilt, dass die Kommunikation mit Investoren sehr schwierig wäre, wenn DeepSeek erneut überraschend handeln würde.
In den Augen der Branchenmitarbeiter gibt es immer zwei "DeepSeek" – eines, das Angst vor Übernahme auslöst, und das andere, das als Vorbild dient. In den letzten zwei Jahren, in denen die Modellhersteller eher träge agiert haben, braucht die Branche einen solchen "Unsicherheitsfaktor", um die Hersteller zur Reflexion und zum Handeln zu bringen.
Ein Mitarbeiter von MiniMax hat sich an die Worte seines Gründers und CEO Yan Junjie in einer internen E-Mail und einer Unternehmensversammlung erinnert: "DeepSeek hat uns auf einen Weg gebracht, den ich gehen wollte."
Obwohl die chinesischen KI-Branchenmitarbeiter komplexe Gefühle gegenüber DeepSeek haben, geben sie zu, dass DeepSeek viele Regeln der chinesischen KI-Branche verändert hat.
Veränderungen bedeuten oft das Umstürzen und Neuerrichten, was sicherlich kein angenehmer Prozess ist. Wie ein Investor aus der "Sechs-Kleinen-Tiger"-Gruppe uns sagte: "DeepSeek hat die Organisationskultur und die Forschungsschwerpunkte der chinesischen KI-Branche in den letzten 12 Monaten geprägt. Danach wird es zwar der Ausgangspunkt für die chinesische KI auf dem Weg in die Weltspitze sein, aber nicht das Ende."
DeepSeek hat die Wettbewerbssituation in der chinesischen KI-Branche in eine relativ stabile Phase gebracht. Aber in der frühen Phase der Modelltechnologie hat DeepSeek nicht immer Konsens in der Branche geschaffen. Mit zunehmendem kommerziellem Druck und Wettbewerb gehen die Hersteller verschiedene Wege in Bezug auf Themen wie Open Source, Kommerzialisierung und Wachstum.
Vor der Veröffentlichung von DeepSeek V4 haben wir mit über einem Dutzend KI-Branchenmitarbeitern über die Frage "Was hat DeepSeek an der chinesischen KI-Branche verändert?" gesprochen.
Im Folgenden sind fünf neue Themen des "Nach-DeepSeek-Zeitalters" zusammengefasst.
Thema 1: Die Kosteneffizienz von Open Source neu bewerten
Vor einem Jahr, nachdem DeepSeek R1 seinen technischen Bericht veröffentlicht hatte, war die Einschätzung eines KI-Investors, dass die Rückkehr zur Grundmodellforschung und die Schaffung eines technologischen Rufs durch Open Source und Offenheit für Modellhersteller das Wichtigste seien.
Aber jetzt hat er uns gesagt, dass diese Einschätzung überprüft werden muss.
Nach einem Jahr des Followings von DeepSeek steht die Frage im Raum, ob die Ära der starken Unterstützung von Open Source und Forschungsökosystemen durch die Hersteller zu Ende gehen soll. Diese zentrale Frage wurde mit der Kündigung von Lin Junyang, dem Leiter der Technologie des Alibaba Qianwen-Modells, in den Vordergrund gerückt.
In gewisser Weise repräsentiert das von Lin Junyang geleitete Qwen die Interessen des Open-Source-Ökosystems. Aber jetzt besteht ein scharfer Widerspruch zwischen diesem und der Gewinnorientierung von Alibaba als kommerzielles Unternehmen.
"Die goldene Ära des Non-Profits ist vorbei." So hat ein Qwen-Mitarbeiter uns in Bezug auf dieses Ereignis kommentiert.
Das, was die Hersteller unsicher macht, ist, dass die beiden Modellhersteller mit den höchsten Einnahmen derzeit den Closed-Source-Ansatz verfolgen – OpenAI hat einjährliche Einnahmen von über 25 Milliarden US-Dollar, und Anthropic hat einjährliche Einnahmen von über 19 Milliarden US-Dollar (gemäß einer Meldung von The Information, Datenstand Ende Februar 2026).
Was die Einnahmen der chinesischen Hersteller betrifft, zeigt der kürzlich veröffentlichte Jahresbericht von 2025, dass MiniMax im gesamten Jahr 2025 Einnahmen von 79,038 Millionen US-Dollar erzielt hat, und Zhipu hat Einnahmen von 724 Millionen Yuan (etwa 105 Millionen US-Dollar) erzielt. Im Vergleich zu OpenAI und Anthropic besteht noch ein großer Abstand.
△ Die einjährigen Einnahmen von OpenAI und Anthropic seit 2023. Quelle: The Information
Auf der AGI Next-Konferenz im Januar 2026 hat Tang Jie, der Gründer von Zhipu, auch gewarnt: "Wir spielen vielleicht nur in einem 'Open-Source-Spielplatz', während die Closed-Source-Modelle in den USA bereits in eine neue Ära eingetreten sind."
Es ist unbestritten, dass das von DeepSeek initierte Open-Source-Ökosystem es den chinesischen Modellen ermöglicht hat, 2025 schnell internationale Bekanntheit und technischen Ruf zu erlangen.
Aber die harte Realität ist, dass die Phase des schnellen "Cold Starts" und der Schaffung eines technologischen Rufs durch Open Source vorbei ist. In einer Zeit, in der die Grundmodellforschung weiterhin viel Geld verbraucht, ist es wichtiger, den Ruf in echtes Geld umzuwandeln, um am Markt zu überleben.
Der Wert von Open Source muss neu bewertet werden.
Thema 2: Die Werbekampagnen pausieren, die gezielte Werbung beginnt
Wie kann man das Erfolgsstory von DeepSeek "0 Werbung, über 100 Millionen Nutzer innerhalb von 7 Tagen nach der App-Veröffentlichung" interpretieren?
Vor einem Jahr hätte die Branche automatisch auf die "0 Werbung" geachtet. Diese Geschichte des Durchbruchs hat viele Hersteller bei ihren Überzeugungen über das Wachstumspfad hinterfragt und die falsche Blüte der damaligen Modellprodukte aufgedeckt.
Alarmiert und reaktiv haben viele Unternehmen Anfang 2025 radikale Reflexionen angestellt, ähnlich wie bei den massiven Werbekampagnen.
Ein typisches Beispiel ist das Unternehmen Yuezhi Anmian, das die Werbekampagnen ausgelöst hat.
Die Zeitschrift "Intelligent Emergence" hat berichtet, dass auf einer strategischen Sitzung, die im Februar 2025 fünf oder sechs Stunden dauerte, Zhang Yutong, der Mitgründer von Yuezhi Anmian, angekündigt hat, dass die Werbung für Kimi auf Android-Kanälen sofort eingestellt werden würde und dass das Werbebudget auf iOS-Kanälen von ursprünglich