Kollektive Preiserhöhung: Große Modelle beginnen, dich um "Geld" zu bitten.
In den letzten 30 Tagen hat die Kommerzialisierung von Large Language Models (LLMs) ein dramatischstes und spaltendstes Szenario erlebt.
Einerseits hat Doubao, ein Produkt von ByteDance, mit einer kostenpflichtigen Version begonnen. Sofort stieg der Hashtag „Doubao ist dumm und lässt sich bezahlen“ in die Trending-Liste auf Weibo, und die Benutzer haben es heftig kritisiert. Andererseits hat DeepSeek-V4-Pro den API-Preis um 75% reduziert und den Preis für die Eingabe-Cache-Treffer auf 1/10 des ursprünglichen Preises gesenkt.
Am 22. Mai kündigte DeepSeek an, dass der aktuelle Sonderpreis ab dem 1. Juni der reguläre Preis werden würde und nicht mehr auf den ursprünglichen Preis erhöht werden würde. Daher wird Liang Wenfeng in der Entwicklergemeinschaft als „Heiliger Liang“ gefeiert.
▲ Weibo-Trends (links) und beliebte Posts auf Xiaohongshu (rechts) über die Preiserhöhung von LLMs
Zur gleichen Zeit spielt sich das Schauspiel von „Kritik und Konkurrenz“ ab.
Luo Fuli, die Leiterin des Xiaomi MiMo LLMs, hat zunächst die Preiswettbewerbe in der Branche kritisiert. Kurz darauf erreichte Xiaomi MiMo dank des „100 Billionen Token Gratis-Programms“ den ersten Platz in der globalen Aufrufliste von Hermes.
▲ Auszug aus Luo Fulis Beitrag auf X (Quelle: X)
Der Preisunterschied zwischen China und dem Ausland ist erheblich: Bei gleicher Aufruflast ist der Preis für die langfristige Kontextversion von GPT-5.5, einem ausländischen Marktführer, mehr als 40 Mal höher als der von DeepSeek-V4-Pro aus China.
In gewissem Sinne können wir die „helpless choice“ der chinesischen LLMs-Hersteller vorhersagen: Alle wissen, dass KI sehr kostspielig ist. Aber an diesem Punkt stellt sich die Frage: Soll man den Preis erhöhen, um die Kosten zu decken, oder den Preis senken, um an Marktanteilen zu gewinnen?
Um diese „KI-Rechnung“ zu klären, haben wir die Abonnementpläne, API-Aufrufe und Videogenerierungspreise von mehreren Dutzend führenden LLMs-Herstellern in China und aus dem Ausland sorgfältig untersucht und verglichen.
Es ist offensichtlich, dass die LLMs-Hersteller von der großzügigen Subvention abrücken. Die Zeit, in der man einfach LLMs nutzen konnte, neigt sich dem Ende zu.
01.
Umstrukturierung der Abonnementmodelle: Ende des „unbegrenzten Zugangs“
Das kostenlose Mittagessen für LLMs wird allmählich abgeschafft
Im Vergleich zur unausgereiften Phase Anfang 2024, als ein ChatGPT Plus-Abonnement alles abdeckte, hat sich das Preissystem der chinesischen LLMs grundlegend verändert.
Der Kernpunkt ist: Die Hersteller übernehmen nicht mehr die Kosten für unkontrollierten Rechenleistungsverbrauch. Das reine „unbegrenzte Zugangsmodell“ ist fast vollständig verschwunden. Stattdessen gibt es ein komplexes Messsystem mit Credits, Tokens, Agent-Brennstoffwerten usw.
▲ Vergleich der Abonnementpreise chinesischer LLMs (Tabelle von Zhidx, Datenstand: 21.05.2026)
Wir können deutlich sehen, dass das Abonnementsystem der chinesischen Plattformen in drei klare „Preisbereiche“ gegliedert ist:
Die erste Stufe kann als Anreizpreis betrachtet werden. Die meisten Plattformen setzen die Einstiegsschwelle auf weniger als 50 Yuan.
Die Einstiegsabonnements von MiniMax, Xiaomi, Kimi, Zhipu und ByteDance kosten etwa 40 Yuan. Das Standard-Abonnement des Alibaba Token Plan beginnt jedoch bei 198 Yuan pro Monat. Der höhere Preis könnte mit dem größeren Token-Quota und der Unterstützung von Multimodalität zusammenhängen.
Die zweite Stufe liegt zwischen 80 und 200 Yuan und ist derzeit der am stärksten umkämpfte Preisbereich.
Alibaba, Baidu, Jieyue Xingchen, MiniMax, Xiaomi, Tencent, Zhipu und ByteDance setzen mindestens acht Plattformen ein Kern-Abonnement in diesen Bereich.
Darüber hinaus beginnt der Bereich für intensive Produktivität.
Die Premium-Abonnements mehrerer Plattformen überschreiten 500 Yuan pro Monat. Die höchsten Stufen von ByteDance und Alibaba erreichen bereits die 1.000-Yuan-Marke. Das Premium-Abonnement des Alibaba Token Plan kostet bis zu 1.398 Yuan pro Monat.
Ausländisch ist die Situation noch extremer.
▲ Vergleich der Abonnementpreise ausländischer LLMs (Tabelle von Zhidx, Datenstand: 21.05.2026)
Die niedrigsten Abonnements kosten im Durchschnitt etwa 8 US-Dollar (etwa 54,3 Yuan), die Hauptabonnements liegen bei etwa 20 US-Dollar (etwa 136 Yuan).
Zur gleichen Zeit rücken die „Big Three“ ausländischer Anbieter schnell in Richtung Premium-Abonnements mit Kosten von 100 US-Dollar oder sogar 250 US-Dollar und mehr vor. Nach der Google I/O 2026 im Mai dieses Jahres hat Google den Preis für Gemini Ultra von 249,99 US-Dollar pro Monat auf 199,99 US-Dollar pro Monat (etwa 1.359,9 Yuan) gesenkt und eine neue Stufe für 99,99 US-Dollar eingeführt.
Im Vergleich zum chinesischen Preissystem entspricht die monatliche Gebühr für ein Gemini Ultra (Premium-Version) fast der jährlichen Gebühr in China. Die 100-US-Dollar-Stufe von Gemini Ultra (Basiskonfiguration), ChatGPT Pro und Claude Max ist etwa 3 bis 5 Mal höher als die chinesischen Mittel- und High-End-Abonnements.
02.
Preiskampf für API-Schnittstellen:
Ausländische Marktführer halten an hohen Preisen fest, chinesische Anbieter kämpfen um Marktanteile
Während die Abonnementmodelle für normale Benutzer eher auf die Akquise von neuen Kunden abzielen, zeigt der API-Preis für Entwickler und Agent-Ekosysteme den Unterschied zwischen der chinesischen und der ausländischen Geschäftsstrategie.
Der Vergleich der API-Preise ist erstaunlich.
Am Beispiel von DeepSeek-V4-Pro: Der kombinierte API-Eingabe- und -Ausgabe-Preis ist auf etwa 9 Yuan pro Million Tokens gesunken.
▲ Vergleich der API-Preise der neuesten chinesischen Flaggschiff-LLMs (Tabelle von Zhidx, Datenstand: 21.05.2026. Hinweis: Der API-Preis von DeepSeek-V4-Pro wurde auf den aktuellen Sonderpreis festgelegt und wird nicht mehr auf den ursprünglichen Preis erhöht.)
Ausländisch sieht es anders aus: Der Gesamtpreis für Gemini 3.1 Pro Preview in langfristigen Kontextszenarien beträgt 149,6 Yuan; Claude Opus 4.7 kostet 204 Yuan; die langfristige Kontextversion von GPT-5.5 erreicht sogar 374 Yuan.
▲ Vergleich der API-Preise der neuesten ausländischen Flaggschiff-LLMs (Tabelle von Zhidx, Datenstand: 21.05.2026)
Hinter den Zahlen verbirgt sich eine unterschiedliche Strategie.
Die ausländischen „Big Three“ OpenAI, Google und Anthropic versuchen, hohe Margen und einen hohen ARPU (Average Revenue Per User) zu erzielen und decken die hohen Rechenleistungskosten mit Premium-Kunden. Chinesische Anbieter hingegen senken die Preise drastisch, um in der kurzen Zeitfenster den Agent-Ekosystem und den Entwicklermarkt zu erobern.
03.
Preiserhöhung für Videogenerierung um fast das 8-fache:
Die teuerste KI-Funktion kann die Kosten nicht mehr tragen
Unter allen KI-Funktionen ist die Videogenerierung der größte Ressourcenfresser und der Bereich mit der stärksten Preiserhöhung.
Derzeit haben sich mehrere führende Anbieter in der chinesischen Videogenerierung etabliert, wie ByteDance Seedance 2.0, Kuaishou Keling, MiniMax Conch und Alibaba HappyHorse. Auch hier hat sich das Preissystem von der einfachen „Abonnementbasierte“ Methode hin zu einem „Cloud-GPU-Mietmodell“ entwickelt.
▲ Vergleich der Preise der führenden chinesischen Videogenerierungs-LLMs (Tabelle von Zhidx, Datenstand: 21.05.2026)
Auflösung, Dauer, Ton, Referenzvideo und Beschleunigung der Warteschlange beeinflussen direkt den Preis.
Am Beispiel des phänomenalen Modells Seedance 2.0 von ByteDance: Innerhalb von weniger als einem Monat wurden die Preise dreimal angepasst. Die Kosten für eine 15-sekündige Videogenerierung sind von etwa 0,65 Yuan auf etwa 5 Yuan gestiegen, eine Erhöhung von fast 6,7 Mal.
Während der Spitzenzeiten am Abend müssen Benutzer entweder in einer langen Warteschlange warten oder mit teuren „VIP-Punkten“ die Vorrangstellung für die Rechenleistung kaufen.
04.
DeepSeek senkt die Preise:
Warum wagt Liang Wenfeng es, die Preise so stark zu senken?
Im gesamten Preiskampf ist DeepSeek der speziellste Spieler.
Während die gesamte Branche langsam die Subventionen reduziert, hat DeepSeek Ende April zweimal drastische Preis senkungen vorgenommen. Derzeit ist der Preis für die Eingabe-Cache-Treffer von DeepSeek-V4-Pro auf erstaunliche 0,025 Yuan pro Million Tokens gesunken.
▲ Quelle: DeepSeek offiziell
Warum wagt DeepSeek es, weiterhin die Preise zu senken, wenn es noch nicht vollständig eigenständig wirtschaftlich ist?
Einerseits liegt die Antwort in der finanziellen Unterstützung: Es wird von einem potenziellen Finanzierungsbedarf von 50 Milliarden Yuan berichtet. Der wichtigste Faktor ist jedoch die tiefgreifende Umstrukturierung der Hardware und des Rechenleistungssystems.
Das neueste Flaggschiff DeepSeek-V4 hat nicht nur die Effizienz bei der Verarbeitung langer Kontexte verbessert, sondern auch die Kompatibilität mit chinesischen Chips von Huawei und Cambricon verbessert.
Durch die Kombination von hochwertiger chinesischer Hardware und Algorithmenoptimierung hat sich die Rechenleistung pro Token und der KV-Cache-Verbrauch in der Million-Token-Szene drastisch reduziert. Im Vergleich zu DeepSeek-V3.2 sind die Rechenkosten pro Million Tokens um 73% gesunken.
Einfach ausgedrückt, erreicht DeepSeek eine Kostenreduktion und Preissenkung durch die Verbesserung der Technologie.
Wenn die Huawei Ascend 950 Supernodes in größerem Maßstab eingesetzt werden und die Kosten für chinesische Rechenleistung weiter sinken, könnte diese extreme Preisstrategie in Zukunft das gesamte KI-Preissystem