Liang Wenfeng und das Billionen-Dollar-Spielbrett von DeepSeek: Ein Blick in die Welt der KI-Entwicklung

Es war nie die Brandung auf der Seeoberfläche, sondern die Meeresströmung selbst.

DeepSeek nutzt Open-Source, Preissenkungen und Innovationen in der unteren Architektur, um die Kostenkurve der AI-Hardware-Ökosysteme neu zu zeichnen und zielt auf eine Branche im Wert von Billionen von US-Dollar und das Weltall der AGI ab.

DeepSeek hat kürzlich häufige Aktivitäten gezeigt.

Zunächst meldete die Bloomberg am 22. Mai, dass sie eine Finanzierung von 70 Milliarden Yuan vorantreiben und der Vor-Finanzierungs-Wert auf 45 Milliarden US-Dollar geschätzt wird.

Am gleichen Tag kündigte DeepSeek an, dass der Preis für die V4-Pro API dauerhaft um 75 % gesenkt wird – der Sonderpreis wird direkt zum regulären Preis.

Einerseits bittet es die Investoren um Geld, andererseits gibt es den Entwicklern Rabatte. Diese Vorgehensweise lässt einen etwas verwirrt.

Also stellt sich die Frage: Worauf will DeepSeek eigentlich verdienen, und viel, viel Geld verdienen?

Schließlich kann man die AGI nicht einfach mit Worten erreichen.

Dies ist genau das, was der x-Blogger @bookwormengr kürzlich untersucht hat.

In seinem ausführlichen Artikel "DeepSeek's 10 trillion USD grand strategy" stellt er eine sehr kühne Einschätzung auf: Das wahre Weltall von DeepSeek könnte nicht die Vermarktung von Programmierpaketen oder Sprachassistenten sein, sondern die Gestaltung eines AI-Hardware-Ökosystems im Wert von Billionen von US-Dollar und der Versuch, einen Marktwert von Billionen von US-Dollar zu erreichen.

Wenn Sie den ausführlichen Artikel von @bookwormengr sorgfältig lesen, werden Sie feststellen: Liang Wenfeng ist kein Verrückter, sondern ein Schachspieler.

Und ein guter Schachspieler, der ein Schachspiel im Wert von Billionen von US-Dollar spielt.

Die Reise des Helden

Eine technologische Odyssee gegen die Konsensmeinung

Wenn man sich die Entwicklung von DeepSeek anschaut, lässt sich diese durch die "Reise des Helden" gut beschreiben.

Während alle andere Dense-Modelle bauen und sich um die Anzahl der Parameter bemühen, widmet sich DeepSeek dem schwierigsten zu trainierenden MoE (Mixture of Experts-Modell) und erzielt höhere Intelligenz mit weniger Rechenleistung.

Während andere PPO für die Verstärkungslernen verwenden, haben sie aus den ersten Prinzipien heraus einen günstigeren GRPO-Algorithmus entwickelt.

Während andere noch über die Grenzen von RLHF diskutieren, haben sie RLVR (Verstärkungslernen auf der Grundlage von verifizierbaren Belohnungen) erfolgreich umgesetzt und die Inferenzfähigkeit auf ein neues Niveau gebracht.

MLA, DSA (Entkoppelte sparse Attention), mHC (Manifold-constrained Hyper-Connectivity), CSA und HCA – all dies sind keine leeren Theorien in den Papieren, sondern beantworten alle dieselbe Frage: Wie kann man unter begrenzten Hardwarebedingungen die maximale AI-Rechenleistung erzielen?

Ein Held weiß nie von Anfang an, was seine Mission ist. Er kämpft auf dem Weg und entdeckt schließlich sein Schicksal.

Das Schicksal von DeepSeek war nie die Vermarktung von API-Paketen.

Eine interessante Mathematikaufgabe

Das Geheimnis des KV-Caches

Lassen Sie uns mit einer konkreten Zahl beginnen, um diese Geschichte zu erzählen.

Öffnen Sie den Online-Rechner auf kvcache.ai und geben Sie 1 Million Token-Kontext, 8-Bit KV-Präzision und 16-Bit-Indexpräzision ein. Sie werden eine erstaunliche Gegenüberstellung sehen: DeepSeek V4 benötigt nur 5,48 GB HBM.

Im Vergleich dazu benötigen andere Spitzen-Open-Source-Modelle leicht 60 GB HBM.

Beachten Sie, dass DeepSeek V4 ein Modell mit 1,6 Billionen Parametern ist, das deutlich größer als andere Open-Source-Modelle ist, aber den KV-Cache nur zu einem Bruchteil ihres Bedarfs benötigt.

Dies bedeutet, dass DeepSeek den Preis für Cache-Treffer auf ein erstaunlich niedriges Niveau festlegen kann – der Preis für Cache-Treffer von V4-Pro beträgt nur 0,025 Yuan pro Million Token, weniger als 3 % des vergleichbaren Preises von Claude Sonnet 4.6, und der Cache kann für mehrere Stunden aufrechterhalten werden.

Nach der dauerhaften Preissenkung beträgt der Preis für nicht getroffene Eingangscaches 3 Yuan pro Million Token und der Ausgangspreis 6 Yuan pro Million Token, jeweils ein Viertel des ursprünglichen Preises.

Liang Wenfeng hat vor zwei Jahren bereits über die Preispolitik von DeepSeek gesprochen: Unsere Prinzipien sind, keine Subventionen zu geben und auch keine exorbitanten Gewinne zu erzielen.

Jetzt scheint es, dass er die Wahrheit sagt – Wenn Ihr KV-Cache nur ein Zehntel des anderer ist, sind Ihre Kosten nur ein Bruchteil.

Aber die tiefere Frage ist: Wohin fließt dieser Bonus?

Das Schachbrett im Wert von Billionen von US-Dollar

Die Umgestaltung der Hardware-Ökosysteme

Die Antwort verbirgt sich in drei Abkürzungen: SSD, LPDDR, HBM.

Erste Ebene: SSD und NAND-Flash-Speicher. Nachdem der KV-Cache auf ein Minimum komprimiert wurde, kann er effizient auf die SSD ausgelagert werden und bei Bedarf schnell in den HBM geladen werden.

DeepSeek hat in der Dual-Path-Publikation auch speziell die Geschwindigkeit der KV-Cache-Ladung von der SSD optimiert. Dies reduziert direkt die Abhängigkeit von dem teuren HBM.

Wer sind die großen Spieler in der SSD- und NAND-Flash-Branche? Jedes Mal, wenn DeepSeek den KV-Cache komprimiert, schafft es einen riesigen neuen Markt für NAND und SSD.

Zweite Ebene: LPDDR-Speicher. Die von der SGLang-Team veröffentlichte Studie zeigt, dass LPDDR vollständig als "Gewichtsspeicherbereich" dienen kann – die Modellgewichte werden zunächst im LPDDR gespeichert und bei Bedarf in den HBM übertragen, was den Kapazitätsbedarf des HBM erheblich reduziert.

Die MoE-Architektur von DeepSeek ist natürlich für dieses Konzept geeignet: Die Anzahl der Experten ist groß, die Gewichte können auf 4 Bit quantisiert werden, und der streamingbasierte Ladevorgang ist sehr effizient.

Wer entwickelt LPDDR? Die chinesischen Hersteller liegen nur eine halbe Generation hinter in der Geschwindigkeit und eine Generation hinter in der Dichte. Der Abstand wird immer kleiner.

Dritte Ebene: Entlastung von GPU/ASIC. Das Engram-Modul ersetzt die Vorwärtsberechnung des Transformers durch eine Hash-Tabelle im LPDDR. Im Wesentlichen wird die "Speicherauslesung" mit sehr niedrigen Kosten pro Bit anstelle der "GPU-Berechnung" mit sehr hohen Kosten pro Bit verwendet.

Dies ist von großer Bedeutung für die chinesischen AI-Chips – Aufgrund der Einschränkungen bei der EUV-Lithographie liegen die chinesischen GPUs in den ursprünglichen FLOPs hinter. Aber wenn man mehr billigen Speicher anstelle von weniger teurer Rechenleistung verwenden kann, wird diese "Umkehrung des Wettbewerbs" sinnvoll.

Zusätzlich gibt es TileLang – ein von DeepSeek investiertes Framework für die Übersetzung von Quellcode für verschiedene Hardware-Kerne, das es ermöglicht, dass ein Computercode auf verschiedenen Hardwareplattformen ausgeführt werden kann, was im Wesentlichen die "CUDA-Schutzmauer" umgeht. Chinesische Chiphersteller haben dadurch möglicherweise die Chance, einen Durchbruch auf der Ökosystemebene zu erzielen.

Verstehen Sie jetzt? Jede technologische Innovation von DeepSeek zielt in die gleiche Richtung: Die Abhängigkeit von Spitzenhardware zu verringern und das bestehende chinesische Speicher-, Chip- und Netzwerk-Ökosystem ausreichend und effizient zu machen.

@bookwormengr hat eine große Rechnung gemacht: Der Gesamtmarktwert der globalen AI-verwandten Aktien übersteigt bereits Billionen von US-Dollar.

Wenn DeepSeek China dabei helfen kann, ein AI-Hardware-Ökosystem von gleicher Größenordnung aufzubauen, ist es völlig logisch, dass es selbst in diesem Spiel einen Marktwert von Billionen von US-Dollar erreicht.

Die Logik hinter der Nichtverfolgung von Schnellgewinnen

Wenn man sich alle "Nicht-Tun" von DeepSeek anschaut – keine Multimodalität (erst in V4.1 werden Bilder und Audio getestet), keine Sprachmodelle, keine Videomodelle, ständige Preissenkungen der API – wird es verständlich.

Es ist nicht, dass es "nicht weiß, wie man Geld verdient", sondern "es hat vorerst keine Lust, an solchen Dingen Geld zu verdienen".

@bookwormengr hat eine ausgezeichnete Analogie vorgeschlagen: OpenAI hat Anteile an AMD und Cerebras erworben und kann bei Erreichen von Rechenleistungsmilestones Aktien zu einem niedrigen Preis kaufen. Dies ist im Wesentlichen "Geschäft mit Versprechungen und Anteilen" – Du hilfst mir, Chips herzustellen, ich gebe dir Aufträge, und wir vergrößern zusammen den Kuchen.

DeepSeek könnte dieses Modell vollkommen kopieren.

Nur steht es nicht vor AMD und Cerebras, sondern vor der gesamten chinesischen AI-Hardware-Industrie.

Liang Wenfeng kommt aus der Quant-Fonds-Branche und wird als "treuer Fan von Jim Simmon" bezeichnet. Ein solcher Mensch kann nicht unbedarft sein, wenn es um die Feinheiten der Kapitalverwaltung geht.

Tatsächlich hat er bereits im April 2026 eine entscheidende Anpassung der Anteile vorgenommen – er kontrolliert etwa 84,29 % der Anteile des Unternehmens direkt und indirekt und hat 100 % der Stimmrechte.

Ningde Times investiert in DeepSeek – es möchte zukünftige Speicheraufträge für AI-Datenzentren sichern.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。