StartseiteArtikel

Bis zu 99% Rabatt! Die API des Xiaomi Großen Modells wird dauerhaft zu niedrigeren Preisen angeboten.

36氪的朋友们2026-05-27 09:55
Dieses Mal hat Xiaomi die Methode aufgegeben, die Länge des Kontextfensters bei der traditionellen Preisgestaltung zu unterscheiden, und das Abrechnungssystem von Token Plan optimiert.

Am 27. Mai gab Xiaomi Technology eine Ankündigung heraus, dass die API der MiMo-V2.5-Serie dauerhaft preisgesenkt wird, mit einem maximalen Preisverfall von bis zu 99 %. Dies ist nach DeepSeek ein weiterer Großmodell-Anbieter, der eine dauerhafte Preissenkung seiner API ankündigt.

Die Preisreduktion von Xiaomi tritt ab heute in Kraft. Dabei hebt das Unternehmen nicht nur die traditionelle Preisbildung, die die Länge des Kontextfensters berücksichtigt, auf, sondern optimiert auch das Token-Plan-Abrechnungssystem: Bei gleicher Bezahlung kann der Token-Verbrauch auf das 5- bis 8-fache des ursprünglichen Betrags gesteigert werden, was noch kostengünstiger ist.

Betrachtet man die konkreten Preise und die Umfang der Preisreduktionen, so beträgt nach der Preisanpassung der Preis für die Eingabe mit Cache-Treffer bei MiMo-V2.5-Pro nur 0,025 Yuan pro Million Tokens. Im Vergleich zum ursprünglichen Preis von 1,40 Yuan für die ≤256k-Spezifikation entspricht dies einem Preisverfall von 98 %, und im Vergleich zum 256k-1M-Spezifikationspreis von 2,80 Yuan sogar von 99 %. Der Preis für die Eingabe ohne Cache-Treffer liegt bei 3,000 Yuan pro Million Tokens, was im Vergleich zum ursprünglichen Preis von 7,00 Yuan einem Rückgang von 57 % entspricht, und im Vergleich zum ursprünglichen Preis für das lange Fenster von 14,00 Yuan sogar von 79 %. Der Ausgabe-Preis beträgt 6 Yuan pro Million Tokens, was im Vergleich zu den ursprünglichen Preisen von 21 Yuan und 42 Yuan einem Rückgang von 71 % bzw. 86 % entspricht.

Die Preisreduktion für die Standardversion MiMo-V2.5 ist ebenfalls beachtlich. Der Preis für die Eingabe mit Cache-Treffer liegt nach der Preisanpassung bei 0,020 Yuan pro Million Tokens, was im Vergleich zum ursprünglichen Preis von 0,56 Yuan für ≤256k einem Preisverfall von 96 % entspricht, und im Vergleich zum ursprünglichen Preis von 1,12 Yuan für 256k-1M sogar von 98 %. Der Preis für die Eingabe ohne Cache-Treffer beträgt 1,000 Yuan pro Million Tokens, was im Vergleich zum ursprünglichen Preis von 2,80 Yuan einem Rückgang von 64 % entspricht, und im Vergleich zum ursprünglichen Preis für das lange Fenster von 5,60 Yuan sogar von 82 %. Der Ausgabe-Preis beträgt 2 Yuan pro Million Tokens, was im Vergleich zu den ursprünglichen Preisen von 14 Yuan und 28 Yuan einem Rückgang von 86 % bzw. 93 % entspricht.

Es ist zu beachten, dass diese Preisanpassung hauptsächlich auf die Kernserie MiMo-V2.5 abzielt. Die MiMo-V2.5-TTS-Serie behält weiterhin die zeitlich begrenzte kostenlose Zugangsmöglichkeit bei. Die API-Preise der beiden hochwertigen Modelle MiMo-V2-Pro und MiMo-V2-Omni bleiben unverändert, und das Token-Plan-Paket wird nicht mehr angepasst und wird bald eingestellt, um die Entwickler zur kostengünstigeren V2.5-Serie zu veranlassen.

Die Weiterentwicklung der MiMo-V2.5-Serie wird von Luo Fuli, der führenden Perspektive in Xiaomi's KI-Bereich, geleitet. Im November 2025 trat die 95er KI-Technologiestar Luo Fuli, die zuvor bei DeepSeek arbeitete, offiziell bei Xiaomi ein und übernahm die Leitung des MiMo-Großmodells. Sie gründete ein Entwicklerteam mit einem Durchschnittsalter von 25 Jahren, bei dem über 60 % der Mitglieder von Tsinghua oder Peking Universität stammen. Es gibt Gerüchte, dass Lei Jun Luo Fuli mit einem Jahresgehalt von zehn Millionen Yuan zu Xiaomi gewann.

Unter Luo Fulis Leitung hat Xiaomi's MiMo-Großmodell mehrere Generationen schnell weiterentwickelt. Im März dieses Jahres wurden offiziell die drei Basis-Modelle MiMo-V2-Pro, MiMo-V2-Omni und MiMo-V2-TTS eingeführt. Später wurde die V2.5-Fortschrittliche Version entwickelt, die die Fähigkeiten für Hochleistungs-Inferenz, leichte universelle Interaktion und Sprachsynthese in allen Szenarien ergänzt und somit das Hauptprodukt in Xiaomi's Großmodell-Reihe für den kommerziellen Massenmarkt geworden ist.

Xiaomi hat derzeit eine relativ vollständige Produktmatrix für das MiMo-Großmodell aufgebaut. Genauer gesagt, zielt MiMo-V2.5-Pro auf Hochleistungs-Komplex-Inferenz ab und ist für die Entwicklung von Unternehmens-Intelligent-Agenten und die tiefe Geschäftsanalyse in hochwertigen kommerziellen Szenarien geeignet. MiMo-V2.5 konzentriert sich auf die Bedürfnisse für leichte universelle Anwendungen und zielt auf die tägliche Nutzung durch kleine und mittlere Entwickler und die Implementierung von leichten Anwendungen ab. MiMo-V2.5-TTS richtet sich hauptsächlich auf den Sprachsynthese-Sektor und nutzt die kostenlose Strategie, um den Zugang zur Audio-Ökosystem zu erobern. Darüber hinaus ist MiMo-V2-Pro als das Flaggschiff-Basismodell auf die Leistungserhöhung mit einer Architektur von Billionen von Parametern MoE ausgerichtet, während MiMo-V2-Omni sich auf die Fusion aller Modalitäten konzentriert.

Gestern erklärte Lei Jun, der Gründer von Xiaomi: "Xiaomi MiMo-V2.5-Pro hat sich in der Artificial Analysis-Liste auf der globalen Open-Source-Liste der synthetischen Intelligenz-Index und des Agenten-Index gemeinsam auf den ersten Platz gesetzt. In den nächsten drei Jahren plant Xiaomi, 60 Milliarden Yuan in den KI-Bereich zu investieren."

Bevor Xiaomi die Preissenkung ankündigte, hatte bereits ein anderer führender chinesischer Großmodell-Anbieter, DeepSeek, eine "dauerhafte Preissenkung" eingeleitet, hauptsächlich für das DeepSeek-V4-Pro-Modell. Nach dem Ende der zeitlich begrenzten Sonderangebote am 31. Mai wurde der Gesamtpreis auf ein Viertel des ursprünglichen Preises angepasst. Nach der Preisanpassung betragen die Preise für die Eingabe mit Cache-Treffer 0,025 Yuan pro Million Tokens, für die Eingabe ohne Cache-Treffer 3 Yuan pro Million Tokens und für die Ausgabe 6 Yuan pro Million Tokens, was im Vergleich zu den ursprünglichen Preisen einem Preisverfall von 75 % entspricht.

DeepSeek-V4 wurde Ende April dieses Jahres veröffentlicht. Es verfügt über einen Million-Wort-Überlangen-Kontext und hat in Bezug auf die Agenten-Fähigkeiten, die Weltwissen und die Inferenzleistung sowohl im Inland als auch im Open-Source-Bereich Spitzenleistungen erzielt. Es umfasst hauptsächlich die beiden Modelle DeepSeek-V4-Flash und DeepSeek-V4-Pro. Die Kosten für den Aufruf von DeepSeek-V4-Pro sind weit niedriger als die von internationalen Mainstream-Modellen wie GPT-4o und Claude, was es ermöglicht, schnell die Entwickler und Unternehmensbenutzer zu gewinnen und auch ein Marktbeispiel für Hersteller wie Xiaomi bei der Preisreduktion zu bieten.

Abgesehen von Xiaomi und DeepSeek zeigt der chinesische Großmodell-Markt auch deutliche K-förmige Differenzierungsmerkmale. Allgemeine Großmodelle wie Tongyi Qianwen von Alibaba Cloud und Doubao von ByteDance haben nacheinander die API-Aufrufpreise gesenkt, während Modelle wie Zhipu GLM und Tencent Hunyuan, die auf die Unternehmens-Sonderanfertigungsdienste abzielen, die Preise stabil gehalten oder sogar leicht erhöht haben, was ein neues Muster von "Preissenkung und Volumensteigerung für allgemeine Modelle, Prämien und Wertbewahrung für hochwertige Modelle" geschaffen hat.

Hinter diesem Phänomen verbirgt sich der Übergang der Branche von einem ungeordneten Preiswettbewerb zu einem Wettbewerb um technische Effizienz. Die Preissenkung ist nicht mehr nur ein reines Marketingmittel, sondern das unvermeidliche Ergebnis der Optimierung des zugrunde liegenden Algorithmus, der Verbesserung der Inferenztechnologie und der Abnahme der Rechenleistungskosten.

Der Bericht über die KI-API-Infrastruktur von 2026, der von der KI-Aggregationsplattform AI.cc veröffentlicht wurde, zeigt, dass die Kosten für den Unternehmens-Großmodell-Token-Aufruf im vergangenen Jahr um 67 % gegenüber dem Vorjahr gesunken sind. Open-Source-Modelle haben bereits 38 % des Unternehmens-Token-Aufrufvolumens eingenommen, und die Kosteneffizienz ist zum Kernkonkurrenzfaktor auf dem Markt geworden.

Dieser Artikel stammt aus dem WeChat-Account "Jiemian News". Autor: Song Jianan. Veröffentlicht von 36Kr mit Genehmigung.