Xiaomi folgt DeepSeek: Dauerhafte Reduzierung der API - Preise für Large Language Model um bis zu 99%

Diesmal hat Xiaomi die Methode aufgegeben, die Länge des Kontextfensters in der traditionellen Preisgestaltung zu unterscheiden, und das Abrechnungssystem des Token Plans optimiert.

Bildquelle: Jiemian-Bildergalerie

Am 27. Mai gab Xiaomi Technology eine Ankündigung heraus, dass die MiMo-V2.5-Serie von APIs dauerhaft preisgesenkt wird, mit einer maximalen Preisreduktion von bis zu 99%. Dies ist nach DeepSeek eine weitere Großmodellfirma, die eine dauerhafte Preisreduktion für ihre APIs ankündigt.

Die Preisreduktion von Xiaomi tritt ab heute in Kraft. Sie hebt nicht nur die traditionelle Preisgestaltung auf, die die Länge des Kontextfensters berücksichtigt, sondern optimiert auch das Token-Plan-Abrechnungssystem: Bei gleicher Bezahlung kann der Token-Verbrauch auf das 5- bis 8-fache des ursprünglichen Betrags gesteigert werden, was kostengünstiger ist.

Betrachtet man die konkreten Preise und die Details der Preisreduktion, so beträgt der Preis für die Eingabe mit Cache-Treffer nach der Preisanpassung der MiMo-V2.5-Pro nur 0,025 Yuan pro Million Tokens, was einer Preisreduktion von 98% gegenüber dem ursprünglichen Preis von 1,40 Yuan für die ≤256k-Spezifikation entspricht. Im Vergleich zum ursprünglichen Preis von 2,80 Yuan für die 256k-1M-Spezifikation beträgt die Preisreduktion sogar 99%. Der Preis für die Eingabe ohne Cache-Treffer liegt bei 3,000 Yuan pro Million Tokens, was einen Rückgang von 57% gegenüber dem ursprünglichen Preis von 7,00 Yuan darstellt. Im Vergleich zum ursprünglichen Preis von 14,00 Yuan für das lange Fenster beträgt die Preisreduktion 79%. Der Ausgabe-Preis beträgt 6 Yuan pro Million Tokens, was eine Reduktion von 71% bzw. 86% gegenüber den ursprünglichen Preisen von 21 Yuan und 42 Yuan darstellt.

Die Preisreduktion für die Standardversion MiMo-V2.5 ist ebenfalls beachtlich. Der Preis für die Eingabe mit Cache-Treffer nach der Preisanpassung beträgt 0,020 Yuan pro Million Tokens, was einer Preisreduktion von 96% gegenüber dem ursprünglichen Preis von 0,56 Yuan für ≤256k und 98% gegenüber dem ursprünglichen Preis von 1,12 Yuan für 256k-1M entspricht. Der Preis für die Eingabe ohne Cache-Treffer liegt bei 1,000 Yuan pro Million Tokens, was eine Reduktion von 64% gegenüber dem ursprünglichen Preis von 2,80 Yuan und 82% gegenüber dem ursprünglichen Preis von 5,60 Yuan für das lange Fenster darstellt. Der Ausgabe-Preis beträgt 2 Yuan pro Million Tokens, was eine Reduktion von 86% bzw. 93% gegenüber den ursprünglichen Preisen von 14 Yuan und 28 Yuan darstellt.

Es ist zu beachten, dass diese Preisanpassung hauptsächlich auf die MiMo-V2.5-Kernserie abzielt. Die MiMo-V2.5-TTS-Serie behält weiterhin die zeitlich begrenzte kostenlose Zugangspolitik bei. Die Preise der APIs der beiden hochwertigen Modelle MiMo-V2-Pro und MiMo-V2-Omni bleiben unverändert, und das Token-Plan-Paket wird nicht mehr angepasst und wird bald eingestellt, um die Entwickler zur kostengünstigeren V2.5-Serie zu migrieren.

Die Iteration der MiMo-V2.5-Serie wird von Luo Fuli, der führenden Perspektive in Xiaomi's KI, geleitet. Im November 2025 trat Luo Fuli, ein 95er KI-Technologietalent, das zuvor bei DeepSeek arbeitete, offiziell Xiaomi bei und übernahm die Leitung des MiMo-Großmodells. Er gründete ein Entwicklerteam mit einem Durchschnittsalter von 25 Jahren, bei dem über 60% der Mitglieder aus Tsinghua oder Peking University stammen. Es gibt Meldungen, dass Lei Jun Luo Fuli mit einem Jahresgehalt von zehn Millionen Yuan zu Xiaomi eingeladen hat.

Unter Luo Fulis Leitung hat Xiaomi's MiMo-Großmodell mehrere Generationen schnell iteriert. Im März dieses Jahres wurden offiziell die drei Grundmodelle MiMo-V2-Pro, MiMo-V2-Omni und MiMo-V2-TTS eingeführt. Anschließend wurde die V2.5-Fortschrittsvariante entwickelt, die die Fähigkeiten für Hochleistungsinferenz, lichtgewichtige universelle Interaktion und Sprachsynthese in allen Szenarien ergänzt und somit das Hauptprodukt in Xiaomi's Großmodell-Array für den kommerziellen Massenmarkt wird.

Xiaomi hat derzeit eine relativ vollständige Produktmatrix für das MiMo-Großmodell aufgebaut. Genauer gesagt, richtet sich das MiMo-V2.5-Pro auf Hochleistungs-Komplexinferenz und ist für die Entwicklung von Unternehmensintelligenzagenten und die tiefe Geschäftsanalyse in hochwertigen kommerziellen Szenarien geeignet. Das MiMo-V2.5 konzentriert sich auf die lichtgewichtigen universellen Anforderungen und zielt auf die tägliche Nutzung durch kleine und mittlere Entwickler und die Implementierung von lichtgewichtigen Anwendungen ab. Das MiMo-V2.5-TTS richtet sich hauptsächlich auf den Sprachsynthese-Sektor und nutzt eine kostenlose Strategie, um den Zugang zur Audiookonomie zu erobern. Darüber hinaus ist das MiMo-V2-Pro als Flaggschiff-Basismodell auf die Leistungssteigerung der Billionen-Parameter-MoE-Architektur ausgerichtet, während sich das MiMo-V2-Omni auf die ganzheitliche Modalitätsfusion konzentriert.

Gestern erklärte Lei Jun, der Gründer von Xiaomi: "Das Xiaomi MiMo-V2.5-Pro hat sich in der Artificial Analysis-Liste auf der globalen Open-Source-Liste der synthetischen Intelligenzindizes und Agentenindizes auf den ersten Platz gesetzt. In den nächsten drei Jahren plant Xiaomi, 60 Milliarden Yuan in den KI-Bereich zu investieren."

Bevor Xiaomi die Preisreduktion ankündigte, hatte die andere führende Großmodellfirma in China, DeepSeek, bereits eine "dauerhafte Preisreduktion" eingeleitet, hauptsächlich für das DeepSeek-V4-Pro-Modell. Nach dem Ende der zeitlich begrenzten Sonderangebote am 31. Mai wurde der entsprechende API-Preis auf ein Viertel des ursprünglichen Preises gesenkt. Nach der Preisanpassung betragen die Preise für die Eingabe mit Cache-Treffer 0,025 Yuan pro Million Tokens, für die Eingabe ohne Cache-Treffer 3 Yuan pro Million Tokens und für die Ausgabe 6 Yuan pro Million Tokens, was einer Preisreduktion von 75% gegenüber dem ursprünglichen Preis entspricht.

Das DeepSeek-V4 wurde Ende April dieses Jahres veröffentlicht. Es verfügt über einen Million-Wort-Superlängskontext und hat in Bezug auf die Agentenfähigkeit, die Weltwissen und die Inferenzleistung sowohl im Inland als auch im Open-Source-Bereich Spitzenleistungen erreicht. Es umfasst hauptsächlich zwei Modelle: DeepSeek-V4-Flash und DeepSeek-V4-Pro. Die Nutzungskosten des DeepSeek-V4-Pro sind weit niedriger als die der internationalen Mainstream-Modelle wie GPT-4o und Claude, was es ihm ermöglicht, schnell die Entwickler und Unternehmensbenutzer zu gewinnen und somit ein Marktbeispiel für Hersteller wie Xiaomi bei der Preisreduktion zu bieten.

Außer Xiaomi und DeepSeek zeigt der chinesische Großmodellmarkt auch deutliche K-förmige Differenzierungseigenschaften. Allgemeine Großmodelle wie Tongyi Qianwen von Alibaba Cloud und Doubao von ByteDance haben die API-Nutzungspreise nacheinander gesenkt, während Modelle wie Zhipu GLM und Tencent Hunyuan, die auf kundenspezifische Unternehmensdienste abzielen, die Preise stabil gehalten oder sogar leicht erhöht haben, was ein neues Muster von "Preisreduktion für allgemeine Modelle zur Volumensteigerung und Prämienbewahrung für hochwertige Modelle" geschaffen hat.

Hinter diesem Phänomen verbirgt sich der Übergang der Branche von einem ungeordneten Preiswettbewerb zum Wettbewerb um technische Effizienz. Die Preisreduktion ist nicht mehr nur ein reines Marketingmittel, sondern das unvermeidliche Ergebnis der Optimierung des zugrunde liegenden Algorithmus, der Verbesserung der Inferenztechnologie und der Abnahme der Rechenleistungskosten.

Der Bericht über die KI-API-Infrastruktur von 2026, der von der KI-Aggregationsplattform AI.cc veröffentlicht wurde, zeigt, dass die Token-Nutzungskosten für Unternehmensgroßmodelle im vergangenen Jahr um 67% gegenüber dem Vorjahr gesunken sind. Open-Source-Modelle haben bereits 38% des Unternehmens-Token-Nutzungsvolumens erobert, und die Kosteneffizienz ist zum Kernkonkurrenzfaktor auf dem Markt geworden.

Dieser Artikel stammt aus dem WeChat-Account "Jiemian News". Autor: Song Jianan. Veröffentlicht von 36Kr mit Genehmigung.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Xiaomi hat sich DeepSeek unmittelbar angeschlossen und angekündigt, die API-Preise für sein Large Language Model dauerhaft zu senken, mit einer maximalen Reduzierung von 99%.