StartseiteArtikel

Xiaomi senkt den Preis für sein Modell um 99% dauerhaft, auch wenn die Gewinne halbiert werden müssen, und Lei Jun plant, weitere 60 Milliarden Yuan in die KI zu investieren.

AI前线2026-05-27 16:05
Heute hat Xiaomi angekündigt, dass es das gesamte Preissystem für Modelle dauerhaft überarbeitet.

Heute hat Xiaomi angekündigt, dass es das gesamte Preissystem für seine Modelle dauerhaft überarbeitet. In der Preisanpassungsankündigung heißt es, dass die API der MiMo-V2.5-Serie dauerhaft preisgesenkt wird, mit einem maximalen Preisverfall von bis zu 99%. Die Änderung tritt am 27. Mai um 0:00 Uhr Beijing-Zeit weltweit in Kraft.

Nach DeepSeek ist Xiaomi ein weiterer Anbieter von Large Language Models, der eine dauerhafte Preisreduktion für seine API angekündigt hat. Gleichzeitig zeigt die kürzlich veröffentlichte Quartalsbilanz von Xiaomi für das erste Quartal 2026 einen halbierten Gewinn und einen Rückgang des Umsatzes.

Unpräzedenzielle Preisreduktion, keine Beschränkung des Kontexts, Token-Kontingent vervielfacht sich um das 8-fache

Die Preisanpassung betrifft die Versionen MiMo-V2.5 und MiMo-V2.5 Pro. Im Vergleich zum ursprünglichen API-Preis kann der neue Preis um bis zu 99% reduziert werden, und es wird nicht mehr nach der Eingabelänge unterschieden.

Genauer betrachtet: Der Preis für die Eingabe mit Cache-Treffer bei MiMo-V2.5 Pro sinkt auf 0,025 Yuan pro Million Tokens, was einem Preisverfall von 98% gegenüber dem ursprünglichen Preis von 1,40 Yuan für die ≤256k-Spezifikation und von 99% gegenüber 2,80 Yuan für die 256k - 1M-Spezifikation entspricht. Der Preis für die Eingabe ohne Cache-Treffer beträgt 3,000 Yuan pro Million Tokens, was einen Rückgang von 57% gegenüber dem ursprünglichen Preis von 7,00 Yuan und von 79% gegenüber dem ursprünglichen Preis von 14,00 Yuan für das lange Fenster bedeutet. Der Ausgabe-Preis liegt bei 6 Yuan pro Million Tokens, was einen Rückgang von 71% bzw. 86% gegenüber den ursprünglichen Preisen von 21 Yuan und 42 Yuan darstellt.

Der Preis für die Eingabe mit Cache-Treffer bei MiMo-V2.5 sinkt auf 0,02 Yuan pro Million Tokens, was einem Preisverfall von 96% gegenüber dem ursprünglichen Preis von 0,56 Yuan für ≤256k und von 98% gegenüber 1,12 Yuan für 256k - 1M entspricht. Der Preis für die Eingabe ohne Cache-Treffer beträgt 1,000 Yuan pro Million Tokens, was einen Rückgang von 64% gegenüber dem ursprünglichen Preis von 2,80 Yuan und von 82% gegenüber dem ursprünglichen Preis von 5,60 Yuan für das lange Fenster bedeutet. Der Ausgabe-Preis liegt bei 2 Yuan pro Million Tokens, was einen Rückgang von 86% bzw. 93% gegenüber den ursprünglichen Preisen von 14 Yuan und 28 Yuan darstellt.

Neben der Reduzierung der API-Preise wird auch das Token-Plan-Billing-System von MiMo erheblich optimiert: Die Menge wird erhöht, ohne dass der Preis steigt, und der Verbrauch steigt auf das 5- bis 8-fache des ursprünglichen Werts. In der Ankündigung hat Xiaomi die detaillierten Abrechnungsregeln nach der Anpassung aufgeführt, wie folgt:

Darüber hinaus wird unabhängig vom aktuellen Verbrauch der Punktesaldo aller Benutzer, die ein Token-Plan-Abonnement haben und sich noch im Gültigkeitszeitraum befinden (einschließlich der Benutzer, die am Quadrillion-Token-Ersteller-Anreizprogramm teilgenommen haben und ein Token-Plan-Abonnement erhalten haben, sowie der Benutzer, die die exklusiven Vorteile der Apache Software Foundation nutzen), um 0:00 Uhr Beijing-Zeit am 27. Mai vollständig zurückgesetzt und gemäß den neuen Abrechnungsregeln angewendet. Für die ehemaligen bezahlenden Benutzer, deren Token-Plan abgelaufen ist, hat Xiaomi eine Überraschung vorbereitet, die in der nächsten Woche bekannt gegeben wird.

Es ist zu beachten, dass sich diese Preisanpassung hauptsächlich auf die Kernserie MiMo-V2.5 konzentriert. Die MiMo-V2.5-TTS-Serie behält weiterhin die zeitlich begrenzte kostenlose Zugangspolitik bei. Die API-Preise der beiden hochwertigen Modelle MiMo-V2-Pro und MiMo-V2-Omni bleiben unverändert, und ihr Token-Plan-Paket wird nicht mehr angepasst und wird bald eingestellt, um die Entwickler zur kostengünstigeren V2.5-Serie zu migrieren.

Es ist bekannt, dass die Weiterentwicklung der MiMo-V2.5-Serie von Luo Fuli, einem 95er AI-Technologietalent, das zuvor bei DeepSeek arbeitete, übernommen wird. In der gesamten Produktmatrix des MiMo Large Language Models ist MiMo-V2.5-Pro auf hochleistungsfähige komplexe Inferenz ausgerichtet und eignet sich für die Entwicklung von Unternehmens-Agenten und die tiefe Geschäftsanalyse in hochwertigen kommerziellen Szenarien. MiMo-V2.5 konzentriert sich auf leichte, allgemeine Anforderungen und ist für die tägliche Nutzung von kleinen und mittleren Entwicklern und die Implementierung von leichten Anwendungen gedacht. MiMo-V2.5-TTS zielt auf den Sprachsynthese-Sektor ab und nutzt eine kostenlose Strategie, um den Zugang zur Audio-Ökosystem zu erobern.

Umsatz und Gewinn fallen, Lei Jun: Es müssen noch 6 Milliarden Yuan in AI investiert werden

Als Grund für die Preisanpassung hat Xiaomi angegeben, dass es sich um die kontinuierliche Optimierung des Inferenzsystems durch sein Technikteam handelt. "Wir unterstützen vollständig die SWA (Sliding Window Attention) basierend auf SGLang HiCache, reduzieren den Datenverkehr zwischen mehrstufigen Speichern wie GPU-Speicher, CPU-Speicher und SSD auf fast ein Siebtel des Werts vor der Optimierung und erhöhen die Anzahl der zwischenspeicherbaren Tokens auf fast das 5-fache des Werts vor der Optimierung. Dadurch wird die Cache-Trefferquote und die Inferenzeffizienz deutlich verbessert. Gleichzeitig verbessern wir durch die Optimierung des Expert-Parallel-Schemas und der Eingabelängen-Bucketing-Strategie die Eingabe-Throughput-Kapazität des Clusters, senken kontinuierlich die Servicekosten pro Token und sichern gleichzeitig die Servicequalität."

In der Ankündigung betont Xiaomi auch: "Der Wert der Technologie liegt schließlich in ihrer breiten Nutzung. Es ist die unerschütterliche Mission von MiMo, dass mehr Menschen bessere Modelle nutzen können."

Es ist bekannt, dass Xiaomi derzeit enorme Investitionen in die Grundlagenforschung und -entwicklung auf dem Gebiet der Künstlichen Intelligenz tätigt. Am Abend des 26. Mai (Beijing-Zeit) hat Xiaomi seine Quartalsbilanz für das erste Quartal 2026 (bis März 2026) veröffentlicht. Im Bereich der Technologieinnovation belief sich die Forschungs- und Entwicklungsausgaben in diesem Quartal auf 9 Milliarden Yuan, was einem Anstieg von 33,4% gegenüber dem Vorjahr entspricht. Die Größe des Forschungs- und Entwicklungsteams hat sich auf 26.048 Personen erweitert. Im Vergleich zu den Forschungs- und Entwicklungsausgaben von 9,6 Milliarden Yuan im vierten Quartal 2025 hat sich die Ausgaben in diesem Quartal um 6,7% verringert. Xiaomi hat angegeben, dass dies "hauptsächlich auf den Fortschritt der Forschungs- und Entwicklungsprojekte im Bereich Handy xAIoT zurückzuführen ist".

Aber aus den gesamten Bilanzdaten geht hervor, dass Umsatz, Bruttomarge, Betriebsgewinn und bereinigter Gewinn von Xiaomi in diesem Quartal sowohl im Vergleich zum Vorjahr als auch im Vergleich zum Vorquartal in unterschiedlichem Maße gesunken sind. Der Gesamtumsatz von Xiaomi im ersten Quartal betrug 99,14 Milliarden Yuan, was einem Rückgang von 10,9% gegenüber dem Vorjahr entspricht. Der bereinigte Nettogewinn ist von 10,68 Milliarden Yuan auf 6,07 Milliarden Yuan gefallen, was einem Rückgang von 43,1% entspricht. Die Bruttomarge betrug 21,81 Milliarden Yuan, was einem Rückgang von 14,2% gegenüber dem Vorjahr entspricht. Der Betriebsgewinn war stärker betroffen und ist von 13,13 Milliarden Yuan im Vorjahr um 59,5% auf 5,31 Milliarden Yuan gefallen.

Trotzdem plant Xiaomi, die Investitionen im Bereich der Künstlichen Intelligenz weiterhin zu erhöhen. Gestern hat Lei Jun, der Gründer von Xiaomi, erklärt: "Xiaomi MiMo-V2.5-Pro hat sich auf der Artificial Analysis-Liste in Bezug auf den synthetischen Intelligenzindex und den Agentenindex unter den globalen Open-Source-Modellen auf den ersten Platz gesetzt. Xiaomi wird in diesem Jahr mindestens 16 Milliarden Yuan in AI investieren und in den nächsten drei Jahren 60 Milliarden Yuan im Bereich der Künstlichen Intelligenz planen."

Divergenz der AI-Preise in China und im Ausland, ausländische Netizens: Verwirrt, aber "ich wähle das chinesische Modell"

Kurz bevor Xiaomi die Preisreduktion ankündigte, hatte DeepSeek, ein weiteres führendes chinesisches Unternehmen im Bereich der Large Language Models, bereits eine "dauerhafte Preisreduktion" eingeleitet. Das Unternehmen hat angekündigt, dass der API-Preis des DeepSeek-V4-Pro-Modells nach dem Ende des 2,5-fachen Rabatts am 31. Mai dauerhaft auf ein Viertel des ursprünglichen Preises gesenkt wird. Nach der Preisanpassung beträgt der Preis für die Eingabe mit Cache-Treffer 0,025 Yuan pro Million Tokens, der Preis für die Eingabe ohne Cache-Treffer 3 Yuan pro Million Tokens und der Ausgabe-Preis 6 Yuan pro Million Tokens, was einem Preisverfall von 75% gegenüber dem ursprünglichen Preis entspricht.

Tatsächlich hat der ursprüngliche Preis des DeepSeek V4-Pro-Modells nur zwei Tage gehalten, nachdem es am 24. April online gegangen und gleichzeitig Open-Source veröffentlicht wurde. Am 26. April hat DeepSeek einen zeitlich begrenzten 2,5-fachen Rabatt angekündigt, der bis zum 5. Mai gültig war. Am 28. April hat das Unternehmen dann angekündigt, dass der Rabatt bis zum 31. Mai verlängert wird. Jetzt ist der Preis direkt auf ein Viertel des ursprünglichen Preises gesunken. Jetzt ist der Aufrufpreis von DeepSeek V4-Pro so niedrig, dass er fast "absurd" ist und 34 Mal billiger als GPT-5.5 ist.

Ein ausländischer Netizen hat gesagt: "Ich kann es kaum erwarten, einen Large Language Model-Cluster aufzubauen und hunderte von DeepSeek- und Mimo-Modellen zusammenlaufen zu lassen. Wir leben in einer Zeit des technologischen Aufbruchs." Die Netizens haben auch gesagt: "Auf der manuellen Bewertungsliste liegt Xiaomi MiMo nur drei Punkte hinter Opus, ist aber mehr als hundert Mal billiger, und der Leistungsunterschied ist minimal. Selbst DeepSeek V4 Flash (nicht die Pro-Version), wenn es auf die Hochleistungsstufe eingestellt wird, ist im Wesentlichen mit Claude Opus 4.7 vergleichbar, hat eine extrem schnelle Reaktionsgeschwindigkeit und ist sehr kostengünstig. Bei stundenlangem kontinuierlichen Gespräch kosten die Kosten nur ein paar Cent."

Einige haben auch darauf hingewiesen: "Außer Deepseek und Xiaomi täuschen viele AI-Labore Sie mit Cache-Lesevorgängen an. Wenn Sie viel Geld für Cache-Lesevorgänge ausgegeben haben, zahlen Sie in Wirklichkeit einen hohen Preis für wenige Sekunden Grafikspeicherzeit. Die Natur der autoregressiven Sprachmodellierung besteht darin, dass jedes ausgegebene Token den Cache 'liest'. Prinzipiell ist die Preisuntergrenze für Cache-Treffer die feste Kosten für ein ausgegebenes Token. Aber in der Praxis kann es noch mehr sein, weil Sie den Grafikspeicher mit dem Cache belegt haben und andere Benutzer gezwungen werden, ihn zu verlassen."

"Alle amerikanischen Unternehmen (OpenAI, Anthropic, Google, MS Copilot) haben kürzlich die Preise erhöht, während die chinesischen Unternehmen die Preise senken. Die Frage ist, wie sie das schaffen? Normalerweise sollten sie aufgrund der Chipsanktionen schwieriger Stellung sein. Zweitens, warum genau jetzt? Ursprünglich wurde auch angenommen, dass die amerikanischen Unternehmen durch Subventionen ihre Wettbewerbsfähigkeit aufrechterhalten würden, aber jetzt können sie nicht mithalten. Alle wenden sich dem Nutzen-basierten Abrechnungssystem zu, was für sie scheinbar nicht nachhaltig ist. Immerhin haben sie auch genügend Kapital. Wenn es tatsächlich einen Hardware-Breakthrough gibt, der den Rechenleistungsbedarf senken kann, ist das für die ganze Welt sicherlich ein gutes Ding." Ein ausländischer Netizen hat diese Fragen gestellt.

Es ist bekannt, dass neben Xiaomi und DeepSeek auch andere chinesische Large Language Models wie Tongyi Qianwen von Alibaba Cloud und Doubao von ByteDance die API-Aufrufpreise gesenkt haben.

Seit Anfang dieses Jahres haben chinesische Large Language Models auf der globalen Online-AI-Hosting-Plattform OpenRouter ständig die Spitzenplätze belegt, darunter Xiaomi MiMo, Step 3.5 Flash von Jieyue Xingchen, MiniMax, DeepSeek, Kimi usw. Die Logik hinter dem "Besteigen der Spitze" auf OpenRouter ist einfach: Wenn die API ausreicht, desto niedriger die Aufrufkosten, desto höher die Rangfolge der Gesamtaufrufe.

"Mit den chinesischen Modellen kann jeder kostengünstige AI-Services nutzen." Ein Netizen hat gesagt: "Derzeit haben die amerikanischen AI-Unternehmen fast keine Chance, auch nur einen kleinen Teil ihres Werts zurückzuerlangen."

Dieser Artikel stammt aus dem WeChat-Account "AI Frontline", Autor: Hua Wei. Veröffentlicht von 36Kr mit Genehmigung.