StartseiteArtikel

Liang Wenfeng spannt den Bogen, und Jensen Huang wird unruhig.

盒饭财经2026-04-02 12:06
Der "Pfeil" ist bereits auf der Sehne, aber es wird lange nicht abgefeuert.

Ohne ein Wort zu sagen, wird es ständig von der ganzen Welt beobachtet.

Von Abend des 29. März bis Morgen des 30. März erlebte DeepSeek einen massiven Serviceausfall. Laut Global Times war ab 22 Uhr am 29. März die Webseite und die App komplett verlangsamt, und es erschien häufig die Meldung „Server ist ausgelastet“, und die relevanten Funktionen konnten nicht normal genutzt werden. Bis zum Morgen des 30. März gab es immer noch Benutzer, die meldeten, dass sie die App nicht normal nutzen konnten.

Anschließend stieg das Thema „DeepSeek ist ausgefallen“ schnell in die Top 10 der Hotlists auf mehreren Plattformen wie Baidu, Weibo und Toutiao. Auch die internationale Tech-Szene beobachtet es. Neben Medienberichten haben viele Fachnutzer auch eigene Tests durchgeführt und die Ergebnisse der gleichen Aufgabe vor und nach dem Ausfall verglichen.

Im Gegensatz zur hohen Aufmerksamkeit und Spekulation der Außenwelt hat DeepSeek weder Fortschrittsberichte noch Erklärungen veröffentlicht. Am Vormittag des 30. März veröffentlichte die offizielle Website eine Ankündigung: [Gelöst] Leistungsprobleme bei DeepSeek Web/APP, der Service-Status zeigt „Normal“ an.

Anfang bis Mitte März löste ein mysteriöses Modell namens Hunter Alpha auf OpenRouter Spekulationen aus. Damals glaubten viele Entwickler, dass es sich möglicherweise um eine versteckte Testversion von V4 handeln könnte. Später wurde jedoch bewiesen, dass das mysteriöse Modell nicht V4 war, sondern eine interne Testversion des Xiaomi-Flaggschiffmodells MiMo-V2-Pro. DeepSeek hat sich zu diesen Spekulationen nicht geäußert.

Die subtilen Spannungen zwischen Bewegung und Stille kommen von Liang Wenfeng: Der „Bogen“ ist gespannt, aber der Pfeil wird noch nicht losgelassen.

Ende 2024 veröffentlichte DeepSeek V3, und Anfang 2025 folgte R1. Dadurch erreichte DeepSeek plötzlich die Spitze und erreichte die Spitzenplätze in den App Stores in China und den USA. Neben der Produkttechnik verursachte der äußerst niedrige Rechenleistungskosten die starke Schwingung des US-amerikanischen Halbleiterbausektors. Jetzt wartet die Branche mit Spannung auf Liang Wenfengs nächstes Trumpf - DeepSeek V4. Allerdings wurde die ursprünglich von der Branche erwartete Veröffentlichung von V4 im ersten Quartal dieses Jahres immer wieder verschoben.

Im Februar, um das chinesische Neujahr herum, Anfang März und frühestens im April rückte die Spekulation über das Veröffentlichungsdatum von DeepSeek V4 immer weiter nach hinten. Darüber hinaus werden auch die Positionierung, Architektur, Leistung, Kontextfenster, Preise und Lieferkette von V4 stark beobachtet, und es gibt ständig Gerüchte.

Einer der Berichte über die Lieferkette hat außerhalb der Technik auch verschiedene Spekulationen ausgelöst. Laut Reuters haben zwei informierte Quellen angegeben, dass DeepSeek vor der bevorstehenden großen Modellaktualisierung seinem amerikanischen Chiphersteller nicht sein kommendes Flaggschiffmodell gezeigt hat, was von der Branchenpraxis abweicht.

Mit nur wenigen Zeilen wird ein „strategischer Angriff“ enthüllt.

Nvidia kann seinen Billionen-Marktwert nicht nur mit seiner GPU-Hardware aufbauen, sondern auch mit seiner über ein Jahrzehnt hinweg entwickelten CUDA-Software-Ökosystem. CUDA ist wie ein Weg für globale AI-Entwickler, und wenn man ihm folgt, kann man immer „Wunder“ erzielen. Wenn es jedoch so ist, wie es der obige Bericht andeutet, dann wird DeepSeek einen „Umweg um CUDA“ bauen.

Was noch dramatischer ist, ist, dass aus den von DeepSeek seit Dezember 2025 veröffentlichten Papieren und Open-Source-Projekten zu entnehmen ist, dass diese Spekulationen nicht aus dem Nichts kommen.

1

Mit einer Lupe nach Veränderungen suchen

Am Abend des 29. März (örtliche Zeit) veröffentlichte ein Nutzer namens „AiBattle“ auf der X-Plattform einen Tweet.

Das auf der WEB/APP angebotene DeepSeek-Modell wurde möglicherweise erneut aktualisiert.

Das Modell scheint sich jetzt ständig als V3 zu identifizieren.

Die Null-Vorschlags-Coding-Ausgaben, die ich jetzt erhalte, scheinen auch im Stil von denen zu differieren, die ich vor ein paar Tagen erhalten habe.

Es bedarf weiterer Tests, um sicher zu sein.

Übersetzt heißt das ungefähr: Das DeepSeek-Modell auf der Webseite und in der App wurde möglicherweise erneut aktualisiert. Jetzt scheint das Modell sich immer als Version V3 zu identifizieren. Nach einigen Tests stellte ich fest, dass die Null-Vorschlagsfähigkeit stark gestiegen ist und der Stil der Ausgabe sich von dem vor ein paar Tagen unterscheidet. Es sind jedoch noch weitere Tests erforderlich, um die Schlussfolgerung vollständig zu bestätigen.

Das Bild zeigt einen Vergleich von zwei Bildern eines Pelikans, der Fahrrad fährt.

Aus diesem Vergleichsbild ist deutlich zu sehen, dass die Fähigkeiten in Bezug auf Raum und Grafikcode stark verbessert wurden. In Bezug auf die Bildkomposition, die Farbgestaltung und die logische Struktur der Elemente übertrifft es mit bloßem Auge die Version von vor einer Woche. Bis 18:47 Uhr am 31. März hatte dieser Tweet insgesamt 162.8K Ansichten.

Das Zeichnen eines fahrradfahrenden Pelikans mit SVG (Skalierbare Vektorgrafiken) wird oft als Grenztest für die Raum- und Renderingfähigkeiten von Large Language Models angesehen.

Dieser Test stammt von Simon Willison, einem weltweit bekannten Open-Source-Entwickler und Mitbegründer des Django-Frameworks. Er meint, dass die Daten der Large Language Models, die in den Ranglisten erscheinen, zu viel Wasser im Wein haben, und dass SVG im Wesentlichen aus unzähligen Koordinaten, Kurvenformeln und Farbcodes besteht. Dass ein „reines Text-AI“ ohne echte Sinne mit Code die biologischen Merkmale eines „Pelikans“ und die mechanische Struktur eines „Fahrrads“ genau beschreibt, kann direkt die Raumvorstellungsfähigkeit und die Code-Logikfähigkeit des Large Language Models aufdecken.

Einen Tag später veröffentlichte der Nutzer die Ergebnisse von „weiteren Tests“.

„AiBattle“ sagte, dass DeepSeek möglicherweise das Modell erneut geändert habe, nachdem es sieben Stunden lang ausgefallen war. Vor dem Ausfall nannte sich das Modell Version V3. Jetzt nennt es sich wieder „neueste Version“. Die Qualität von SVG scheint auch schlechter geworden zu sein und ist wieder auf den früheren Zustand zurückgekehrt.

Entwickler wie „AiBattle“ sind nicht die Minderheit. Die AI-Szene ist wie von DeepSeek „abgeschnitten“, und sie suchen mit einer Lupe nach Spuren, um zu beweisen, dass V4 bald erscheinen wird.

Beispielsweise haben sie festgestellt, dass das Datum der Wissensbasis möglicherweise rückverschoben wurde. Ein Nutzer hat festgestellt, dass DeepSeek ohne Internet-Suche das Ergebnis der US-Wahlen 2025 kennt, aber nichts über die großen Ereignisse im Februar 2026 weiß. Dies lässt die Außenwelt vermuten, dass das Wissensdatum der neuen Version möglicherweise Januar 2026 ist.

Beispielsweise in Bezug auf die Kontext-Tokens. Am 11. Februar hat DeepSeek die Kontextfenster des vorhandenen Modells von 128K auf 1M Tokens erweitert und das Wissensdatum auf Mai 2025 aktualisiert. Viele in der Community verstehen dies als Test der Infrastruktur im Zusammenhang mit V4 vor der Veröffentlichung.

Unterlying-Technologie-Papiere sind oft die Voranzeige und das Handbuch für die nächste Generation von Large Language Models.

Im Vergleich zu den Spekulationen der Außenwelt und den Tests in der Community ist sicherer, dass seit Ende 2025 DeepSeek Papiere und Open-Source-Projekte veröffentlicht hat.

Am 31. Dezember 2025 hat Liang Wenfeng ein Papier namens „mHC: Manifold-Constrained Hyper-Connections“ hochgeladen und veröffentlicht.