DeepSeek V4 endlich veröffentlicht: Fünf ungelöste subjektive Fragen

DeepSeek ist der Ausgangspunkt für die chinesische KI, um sich auf der globalen Bühne zu etablieren, aber kein Ende.

Text | Zhou Xinyu → Text | Zhou Xinyu

Data compilation | Zhong Chudi → Data compilation | Zhong Chudi

Editor | Su Jianxun, Yang Xuan → Editor | Su Jianxun, Yang Xuan

Die Ankündigung ist endlich gefallen.

DeepSeek V4, das fast drei Monate lang mit dem Spottnamen "Next Week" umzingelt wurde, hat endlich sein wahres Gesicht gezeigt.

Eine maximale Parameteranzahl von 1,6 T, ein Kontextfenster von 1 M, eine Performance-Optimierung für Agenten sowie die Reduzierung der Rechen- und Speicherbedarfe auf der Grundlage von MoE (Mixture of Experts-Modell) und dem sparsamen Attention-Mechanismus DSA – diese Parameter und Leistungen, die von außen spekuliert wurden, sind mit der Offizielle Ankündigung von V4 endgültig festgelegt.

Ergebnisse der Performance-Evaluation von DeepSeek V4.

Der Grund für die späte Veröffentlichung hängt mit der Migration des Trainingsframeworks von NVIDIA auf Huawei Ascend zusammen und auch mit internen Entscheidungsänderungen bei DeepSeek. Wir haben erfahren, dass Mitte 2025 DeepSeek einen relativ schwerwiegenden Trainingsfehler erlitten hat.

"Damals hatte DeepSeek das Problem, die Chips neu anzupassen", sagte ein Insider. "Auch die internen Meinungen über die Trainingsrichtung waren nicht völlig einheitlich. Liang Wenfeng stellte einige eigene Anforderungen, aber es war schwierig, Kompromisse auf der Implementierungsebene zu finden."

Im Gegensatz zu den externen Spekulationen über die Unterstützung von multimodaler Generierung und Verständnis durch das neue Modell ist V4 immer noch ein Sprachmodell. Die Entscheidung, die multimodale Generierungstrainingsstrategie zu verschieben, beruht hauptsächlich auf Engpässen bei Rechenleistung und Geldmittel.

Mehrere Insider haben uns in "Intelligent Emergence" mitgeteilt, dass das externe Finanzierungsfenster von DeepSeek Mitte April 2026 geöffnet wurde. Der interne Auslöser war, dass DeepSeek mehr Finanzmittel benötigte, um Modelle mit größerer Parameteranzahl zu trainieren und gleichzeitig mehr Spitzentalente zu halten und anzuwerben.

"Eine Parameteranzahl von 1,6 T hat im Vergleich zu den Modellen von Top-Anbietern wie OpenAI und Anthropic keine absolute Wettbewerbsfähigkeit", sagte uns ein Branchenmitarbeiter. Bald werden auch in China Modellhersteller Modelle mit einer Parameteranzahl von 3 T veröffentlichen.

Seit Talente wie Guo Daya (Hauptautor von DeepSeek R1) und Wang Bingxuan (Hauptautor von DeepSeek LLM) von großen Unternehmen wie ByteDance und Tencent abgeworben wurden, benötigt DeepSeek eine große Finanzierung, um das Team zu stabilisieren und neue Kräfte anzuziehen.

Mehrere Branchenmitglieder vermuten, dass der externe Auslöser für die Entscheidung, sich für offene Finanzierungen zu entscheiden, mit der Investitionshaltung eines großen Unternehmens zusammenhängt. Vor der Finanzierungsinitiative hatten Liang Wenfeng und der Chef des Unternehmens über eine exklusive Investition mehrere Gespräche geführt. Zwei Personen mit Kenntnis der Angelegenheit haben jedoch angegeben, dass Liang Wenfeng die Bedingung, 20 % der Anteile abzugeben, nicht akzeptiert hat.

Seit der Veröffentlichung von R1 hat sich DeepSeek deutlich verändert: DeepSeek hat sich von einem eher gemeinnützigen, idealistischen technologischen Utopia zwangsläufig und schnell in ein pragmatisches Unternehmen gewandelt, das auf Produkte und Kommerzialisierung setzt.

Am 8. April 2026 wurde die DeepSeek App überarbeitet und die "Expertenmodus", der komplexe Schlussfolgerungen unterstützt, sowie der "Schnellmodus", der einfache Aufgaben bearbeitet, eingeführt. Mit der Veröffentlichung von V4 haben wir auch erfahren, dass V4-pro mit einer Parameteranzahl von 1,6 T für den "Expertenmodus" zuständig ist, während V4-flash mit 284 B den "Schnellmodus" unterstützt.

Die beiden Modi der DeepSeek App.

Ein Insider hat früher gesagt, dass Liang Wenfeng seit der zweiten Hälfte von 2025 die Verbesserung der Produkte betont hat. Mehrere Produktmanager von großen Unternehmen haben uns in "Intelligent Emergence" mitgeteilt, dass Ende 2025 DeepSeek eine "Offensive Rekrutierung" von Produktstrategen/Managern durchgeführt hat und sie mehrmals von DeepSeek HR kontaktiert wurden.

Ein Branchenmitarbeiter hat uns auch in "Intelligent Emergence" angegeben, dass DeepSeek intern mehrere innovative Produktteams aufgebaut hat, um Agenten und andere C-End-Produktformen zu erforschen.

Beim Vergleich der aktualisierten Versionen ist festzustellen, dass die Textfähigkeiten von DeepSeek deutlich verbessert wurden. Im vergangenen Jahr haben wir von mehreren HR-Mitarbeitern und Headhuntern aus der KI-Branche gehört, dass DeepSeek HR-Mitarbeiter nicht nur einmal in den Studentenwohnheimen der Peking-Universität Studenten per WeChat kontaktiert haben.

Das Ziel, Studenten der Sinologie zu rekrutieren, ist die Datenerfassung und die Erstellung von Bewertungsstandards im humanistischen Bereich. Dies wird als Signal für die Wertschätzung der Humanität des Modells von DeepSeek angesehen.

Obwohl "Allgemeinverfügbarkeit" und "Offenheit" sowie ein einfaches Produkt mit nur einer Chat-Oberfläche das öffentliche Image von DeepSeek darstellen, haben wir erfahren, dass DeepSeek 2025 kontinuierlich an der Erforschung von Produkten und Kommerzialisierung gearbeitet hat – derzeit hat es intern ein Produktteam von mehreren Dutzend Personen aufgebaut, um Produktformen wie Agenten zu erforschen.

Schon früher, 2024, bevor DeepSeek berühmt wurde, hat man auch über Werbeaktionen nachgedacht, aber Liang Wenfeng hat dies schnell abgelehnt.

Die jährliche Aktualisierung von DeepSeek ist endlich hier, wie das fallende Schwert des Damokles, das die Herzen der chinesischen und globalen Modellhersteller beruhigt.

Seit 2026 ist die jährliche Aktualisierung von DeepSeek zu einer Art "Wolf kommt" -Geschichte in der KI-Welt geworden. Die Vermeidung von DeepSeek ist in den letzten Monaten zur Standardaktion der Modellhersteller geworden.

Zwei neu gegründete Modellhersteller, Zhipu und MiniMax, haben vor dem chinesischen Neujahr ihre neuen Modelle GLM 5 und M 2.5 veröffentlicht.

Ein Mitarbeiter von Zhipu hat uns in "Intelligent Emergence" mitgeteilt, dass sobald die Gerüchte über die Veröffentlichung eines Modells von DeepSeek während des chinesischen Neujahrs kursierten, das Algorithmus-Team sofort eine Sitzung abhielt und die Veröffentlichung von GLM 5 "so bald wie möglich" forderte.

Ein Mitarbeiter von MiniMax hat ebenfalls angegeben, dass Mitte Januar, noch während der Hangovers von der Feier zur Börsengang noch nicht abgeklungen waren, das Algorithmus-Team schon frühzeitig an seinen Arbeitsplätzen war.

Das "Vermeiden der Konkurrenz" ist für diese beiden Börsennotierten Modellstartups besonders wichtig. "Wenn wir später als DeepSeek veröffentlichen und unsere Leistung schlechter ist, wird dies den Aktienkurs beeinträchtigen. Aber wenn wir nicht veröffentlichen, wird dies ebenfalls den Aktienkurs beeinträchtigen", sagte der oben genannte Mitarbeiter. "Die beste Lösung ist, frühzeitig zu veröffentlichen."

Die Finanzierungsaktionen der Modellunternehmen müssen auch vor der Aktualisierung von DeepSeek erfolgen.

Jieyue Xingchen, das Ende Januar die B+-Runde der Finanzierung angekündigt hat, möchte dringend diese Finanzierungsrunde vor dem chinesischen Neujahr abschließen. Ein Insider hat uns mitgeteilt, dass die Kommunikationskosten mit den Investoren sehr hoch sein würden, wenn DeepSeek erneut unerwartete Aktionen unternehmen würde.

In den Augen der Branchenmitarbeiter gibt es immer zwei "DeepSeek" - eine, die Angst vor Übernahme verbreitet, und die andere, die als Paradigmenführer fungiert. In den letzten zwei Jahren, in denen die Modellhersteller eher träge agierten, braucht die Branche solch einen "Unsicherheitsfaktor", um die Hersteller zum Nachdenken und zum Weiterstreben anzuregen.

Ein Mitarbeiter von MiniMax hat sich an die Worte des Gründers und CEO Yan Junjie in einem internen Brief und einer Mitarbeiterversammlung erinnert: "DeepSeek hat uns auf einen Weg gebracht, den ich gehen wollte."

Obwohl die chinesischen KI-Branchenmitarbeiter komplexe Gefühle gegenüber DeepSeek haben, geben sie zu, dass DeepSeek viele Regeln der chinesischen KI-Branche verändert hat.

Veränderungen bedeuten oft Abbau und Neubau, was sicherlich kein angenehmer Prozess ist. Wie ein Investor aus der "Sechs-Kleinen-Tiger" -Gruppe uns sagte: DeepSeek hat in den letzten Monaten die Organisationskultur und die Forschungsschwerpunkte der chinesischen Großmodelle festgelegt. Danach ist es "der Anfang, aber nicht das Ende, für die chinesische KI, sich auf der Welt Bühne zu behaupten".

DeepSeek hat das Wettbewerbsumfeld der chinesischen KI-Branche in eine relativ stabile Phase gebracht. Aber in der frühen Phase der Modelltechnologie hat DeepSeek nicht immer Konsens in der Branche geschaffen. Mit zunehmendem Kommerzialisierungs- und Wettbewerbsdruck gehen die Hersteller verschiedene Wege in Bezug auf Themen wie Open Source, Kommerzialisierung und Wachstum.

Vor der Veröffentlichung von DeepSeek V4 haben wir mit mehr als zehn KI-Branchenmitarbeitern über die Frage "Was hat DeepSeek an der chinesischen KI-Branche verändert?" gesprochen.

Im Folgenden sind fünf neue Themen im "Zeitalter nach DeepSeek", die wir daraus extrahiert haben.

Thema 1: Die Kosteneffizienz von Open Source neu bewerten

Vor einem Jahr, nachdem DeepSeek R1 seinen technischen Bericht veröffentlicht hatte, war die Einschätzung eines KI-Investors, dass die Rückkehr zur Grundmodellforschung und die Etablierung einer technologischen Marke durch Open Source und Offenheit für Modellhersteller am wichtigsten seien.

Aber jetzt hat er uns gesagt, dass diese Einschätzung noch einmal überprüft werden muss.

Nach einem Jahr der Nachfolge von DeepSeek stellt sich die Frage, ob die Ära, in der die Hersteller Open Source und Forschungsökosysteme stark unterstützt haben, zu Ende gehen soll. Diese entscheidende Frage wurde in den Vordergrund gerückt, als kürzlich Lin Junyang, der Technologieleiter des Alibaba Qianwen-Großmodells, seinen Job verlassen hat.

In gewissem Sinne repräsentiert Qwen, das von Lin Junyang geleitet wird, die Interessen des Open-Source-Ökosystems. Aber jetzt besteht ein scharfer Widerspruch zwischen diesem und der Gewinnorientierung von Alibaba als kommerzielles Unternehmen.

"Die goldene Ära des Nichtgewinnorientierten ist vorbei." So hat ein Qwen-Mitarbeiter diese Angelegenheit beurteilt.

Was die Hersteller zweifeln lässt, ist, dass die beiden Modellhersteller mit den höchsten Einnahmen derzeit den Closed-Source-Ansatz verfolgen - OpenAI hat ein Jahresumsatz von über 25 Milliarden US-Dollar, und Anthropic hat einen Jahresumsatz von über 19 Milliarden US-Dollar (gemäß einer Meldung von The Information, Datenstand Ende Februar 2026).

Was die Einnahmen der chinesischen Hersteller betrifft, zeigt der kürzlich veröffentlichte Jahresbericht von 2025, dass MiniMax im ganzen Jahr einen Gesamtumsatz von 79,038 Millionen US-Dollar erzielt hat, und Zhipu hat einen Umsatz von 724 Millionen Yuan (etwa 105 Millionen US-Dollar) erreicht. Im Vergleich zu OpenAI und Anthropic besteht immer noch ein großer Abstand.

△ Die Jahresumsätze von OpenAI und Anthropic seit 2023. Quelle: The Information

Auf der AGI Next-Konferenz im Januar 2026 hat Tang Jie, der Gründer von Zhipu, auch eine Warnung ausgesprochen: "Wir spielen vielleicht nur im 'Open-Source-Spielplatz', während die Closed-Source-Modelle in den USA bereits in die nächste Ära eingetreten sind."

Es ist unbestritten, dass das von DeepSeek initierte Open-Source-Ökosystem es den chinesischen Modellen ermöglicht hat, sich 2025 schnell auf der Welt Bühne einen Namen und ein gutes technisches Ansehen zu machen.

Aber eine harte Realität ist, dass die Phase, in der man sich schnell über Open Source "kalt starten" und ein technisches Ansehen aufbauen konnte, vorbei ist. In einer Zeit, in der die Grundmodellforschung immer noch sehr teuer ist, ist es wichtiger, das Ansehen in echte Geldmittel umzuwandeln, um am Markt überleben zu können.

Der Wert von Open Source muss jetzt neu bewertet werden.

Thema 2: Die Werbekampagnen pausieren, die gezielte Werbung einsetzen

Wie lässt sich das Erfolgsstory von DeepSeek "0 Werbung, über 100 Millionen Nutzer in 7 Tagen nach App-Release" interpretieren?

Vor einem Jahr hätten die Augen der Branche unweigerlich auf die "0 Werbung" gerichtet gewesen. Diese Story hat viele Hersteller von ihrem überzeugten Wachstumspfad abgebracht und die falsche Blüte der damaligen Modellprodukte aufgedeckt.

Alarm und Reaktion. Anfang 2025 haben viele Unternehmen ebenso radikale Überlegungen angestellt wie bei der massiven Werbung.

Ein typisches Beispiel ist Yuezhianmian, das den Start der Werbekampagnen markierte.

In "Intelligent Emergence" wurde berichtet, dass auf einer strategischen Sitzung, die im Februar 2025 fünf oder sechs Stunden dauerte, Zhang Yutong, der Mitbegründer von Yuezhianmian, erklärte, dass die Werbung von Kimi im Android

Dieser Artikel wurde ursprünglich von「阿菜cabbage」produziert， Für Nachdruck oder Inhaltszusammenarbeit klicken Sie bitte auf Hinweise zum Nachdruck ；Bei unbefugtem Nachdruck wird strafrechtlich verfolgt.

DeepSeek V4 ist endlich veröffentlicht, aber die fünf subjektiven Fragen, die es hinterlassen hat, haben noch keine Antworten.

Thema 1: Die Kosteneffizienz von Open Source neu bewerten

Thema 2: Die Werbekampagnen pausieren, die gezielte Werbung einsetzen