StartseiteArtikel

Selbst Microsoft kann die Kosten für Token nicht mehr stemmen – es ist Zeit für DeepSeek, die Führung zu übernehmen.

爱范儿2026-06-22 08:45
Die kostenlose und unbegrenzte Honigphase der künstlichen Intelligenz neigt sich dem Ende zu

Der Microsoft-Manager Charles Ramaner, der für den Copilot-Business zuständig ist, hat kürzlich der Medienmitteilung gemäß erklärt, dass Copilot Cowork das Angebot eines "unbeschränkten Nutzungs"-Pakets nicht mehr anbieten kann. Der Grund klingt etwas nach "Versailles": Es ist einfach zu beliebt.

Im Ende April hat Microsoft bekannt gegeben, dass die Anzahl der bezahlten Microsoft 365 Copilot-Plätze die 20 Millionen Mark überschritten hat, mit einem Nettozuwachs von 5 Millionen Plätzen in einem Quartal. Allein Accenture hat 740.000 Plätze abgeschlossen, und über 90 % der Fortune 500-Unternehmen nutzen Copilot in irgendeiner Form.

Als ein "umhülltes" Produkt nutzt Copilot die ökologische Vorteile der Microsoft-Office-Suite und realisiert eine "gebundene Vermarktung", und es ist derjenige mit der höchsten Installationsmenge im Bereich der Unternehmensbereitstellung.

Der Preis dafür ist jedoch ein hoher Kostenfaktor. Einige Benutzer lassen Cowork in einer Woche hunderte von Aufgaben ausführen, was eine erstaunliche Effizienz bedeutet. Deshalb hat Microsoft beschlossen, dass Copilot Cowork künftig auf eine nutzungsbasierte Abrechnung umgestellt wird: Je mehr man nutzt, desto mehr muss man bezahlen.

Zur gleichen Zeit sucht es still und leise nach einem günstigeren "Motor", einem von Microsoft verwalteten und feingestimmten Open-Source-Modell. Einer der Kandidaten ist DeepSeek V4.

Das Problem eines "zu leistungsstarken" Produkts

Der früheste Copilot war, wie man es von der Stereotype her erwartet, in Word, Excel, PowerPoint, Outlook und Teams integriert und absolvierte Aufgaben innerhalb der jeweiligen Applikation: Schreiben von Dokumenten, Erstellen von Tabellen, Zusammenfassen von E-Mails und Generieren von Protokollen. Im Wesentlichen handelte es sich um eine "Frage-Antwort"-Funktion und die Möglichkeit, in der aktuellen App zu helfen. Es war keine echte Quertoolautomatisierung.

Copilot Cowork hat nun die Transformation zu einem Agenten abgeschlossen und ist von einem Chatbot zu einem AI-Assistenten geworden, der eine Reihe von Aufgaben ausführen kann. Der Anwendungsbereich umfasst nicht nur die Office-Dreiergruppe, sondern die gesamte M365-Ökosystem (Word / Excel / PPT / Outlook / Teams / SharePoint). Es kann auch über Connectors an externe Quellen wie Gmail, Google Drive und OneDrive angeschlossen werden. Mit Work IQ + Microsoft Graph wird die globale Kontextspeicherung und -abfrage ermöglicht, sodass Cowork alle in der Arbeit verstreuten Informationen lesen kann.

Es ist wirklich leistungsstark, aber es kostet auch wirklich viel Geld. Je öfter der Agent ein Modell aufruft, je mehr Kontext er liest und je mehr Werkzeuge er nutzt, desto mehr Zeilen gibt es auf der Rechnung.

In der Vergangenheit hat Microsofts Copilot hauptsächlich auf die Spitzenmodelle von OpenAI und Anthropic gestützt. Diese Modelle sind zwar intelligent, aber auch teuer. Wenn Cowork für Tausende von Unternehmensbenutzern arbeiten muss und Tag und Nacht nicht aufhört, wird die Kostenzahl, wenn man jede Aufrufe mit der riesigen Nutzungsmenge multipliziert, erschreckend hoch.

Deshalb überlegt Microsoft, ob es möglich ist, für die alltäglichen Aufgaben, die nicht so geistig anspruchsvoll sind, einen günstigeren Motor zu verwenden.

Im April dieses Jahres hat DeepSeek zwei Open-Source-Modelle, V4-Pro und V4-Flash, veröffentlicht. Beide unterstützen einen ultralangen Kontext von einer Million Tokens. Die Pro-Version hat 16 Billionen Parameter und ist eines der größten Modelle mit offenen Gewichten. Seine Leistung wird als nahe an die Spitzen-Closed-Source-Modelle von OpenAI und Anthropic heranreichend angesehen, und es nutzt die am freigebigsten gestaltete MIT-Open-Source-Lizenz.

Die überragende Leistung und der günstige Preis machen DeepSeek zum "Abschlagsgrenze" unter den Basismodellen: Modelle, die stärker sind, sind teurer; Modelle, die billiger sind, sind schwächer.

DeepSeek nutzt eine "Mixture of Experts"-Architektur. Obwohl das Modell insgesamt eine riesige Anzahl von Parametern hat, werden nur ein kleiner Teil der Parameter für die Verarbeitung einer Aufgabe aktiviert. Dadurch wird der Aufwand für eine einzelne Inferenz stark reduziert. Dies trifft genau auf das Problem von Microsoft zu. Bei der Arbeit von Cowork, die Tag und Nacht Modelle aufruft, ist man am stärksten vor teuren Einzelaufrufen gefürchtet, und Modelle wie DeepSeek sind von Natur aus darauf ausgelegt, "kostengünstig zu laufen".

Ein Modell, das die Leistung nahe an die Spitze bringt, den Preis auf den Boden drückt und sogar Open-Source zur Verfügung stellt, hat für ein auf Rechnungen stolperndes Konzern eine offensichtliche Attraktivität.

DeepSeek: Unser Ziel ist das Universum

Interessanterweise hat DeepSeek in der gleichen Woche, in der Microsoft die Verwendung von DeepSeek ankündigte, auch selbst Schlagzeilen gemacht.

Am 16. dieses Monats hat dieses Unternehmen, das sich jahrelang gegen externe Investitionen entschieden hatte, seine erste externe Finanzierung rund gemacht. Es hat über 7,4 Milliarden US-Dollar eingeworben, und der Unternehmenswert nach der Investition hat die Marke von 50 Milliarden US-Dollar überschritten. Dies ist eine der größten Einzelinvestitionen in der chinesischen Startup-Geschichte.

DeepSeek hat bei dieser Finanzierung eine besondere Struktur vorgeschlagen. Der Gründer Liang Wenfeng ist der größte Investor. Er hat nicht die Gelegenheit genutzt, um seine Aktien zu verkaufen, sondern hat stattdessen sein eigenes Unternehmen mit echten Geldern gestärkt. Es gibt weniger als zehn Investoren in dieser Runde, darunter Industriekonzerne wie Tencent und CATL. Die Fonds müssen rein in chinesischen Yuan investieren. Liang Wenfeng hat auch erklärt, dass das Unternehmen weiterhin den Open-Source-Weg gehen und die allgemeine Künstliche Intelligenz anstreben wird, anstatt sich in Eile zu monetarisieren.

Die einzigartige Finanzierungsstruktur zeigt, dass es nicht Liang Wenfeng, der die Fonds braucht, sondern die Fonds, die Liang Wenfeng brauchen. Das Geld, das DeepSeek gerade bekommen hat, ist in gewisser Weise eine Vertrauensbestätigung des Marktes für diese Strategie. Da es nicht von der Verkaufe von Tokens große Gewinne macht, kann es den Preis auf den Boden drücken und das Modell kostenlos zur Verfügung stellen. Und es ist genau diese Zuversicht, die es in diesem Kostenkampf in eine beneidenswerte Position bringt.

Das Geschäftsmodell in der "Mehr-Modell"-Ära

Microsoft betont, dass selbst wenn DeepSeek eingeführt wird, die Version auf seiner eigenen Azure-Cloud verwaltet wird, die Daten nicht außerhalb des Microsoft-Systems gehen und es Maßnahmen zur Einhaltung der Vorschriften und zur Reduzierung von Vorurteilen getroffen hat. Die Einführung von DeepSeek bedeutet, dass Microsoft ein weiteres Ei in seinen Korb legt und nicht alles auf ein einzelnes Modell setzt. Es hält eine Reihe von Modellen in der Hand. Vor ein paar Jahren stritt man noch darüber, welches Modell das stärkste sei. Jetzt hat Microsoft mit seiner Handlung die Antwort gegeben: Modelle sind da, um Arbeit zu verrichten, nicht um sich für eine Seite zu entscheiden.

Für Hersteller werden Modelle von einer Art von Glauben zu einem Bauteil, was auch die Produktentwicklungsmethodik verändert.

GitHub Copilot ist derzeit das am besten abschneidende kollaborative Produkt. Es hat 4,7 Millionen bezahlte Abonnenten, eine jährliche Zunahme von 75 % und wird von 90 % der Fortune 100-Unternehmen eingesetzt.

In GitHub Copilot haben Entwickler ein Modellmenü, in dem neben jedem Modell die Kosten angegeben sind. Teurere Modelle sind stärker, billigere Modelle sparen Kosten. Man kann sich selbst entscheiden. Es gibt auch eine Stufe namens "Auto", in der das System automatisch auswählt und für den Benutzer ein ausreichend starkes und kostengünstiges Modell wählt. Der Preis wird reduziert, was bedeutet, dass man durch die Kostenanreize dazu gebracht wird, nicht immer das teuerste Modell zu wählen.

Perplexity, das ursprünglich als Suchmaschine begann, geht auch diesen Weg. Es lässt die Benutzer aus einer Reihe von Modellen auswählen und hat sogar eine Funktion entwickelt, bei der drei Modelle gleichzeitig antworten und ein weiteres Modell die Antworten zusammenfasst. Die Hoffnung ist, dass die gegenseitige Überprüfung mehrerer Modelle die Lücken in den Antworten reduziert und die Qualität der Antworten verbessert.

Notion ist ein weiteres Beispiel. Als ein "anfängerfreundliches" Produkt zeichnet es sich dadurch aus, dass man das zugrunde liegende Modell jederzeit wechseln kann, ohne den Kontext zu verlieren. Es konzentriert sich auf die Verbindung mit den Arbeitsbereichsdaten und überlässt die Modellauswahl den Benutzern. Gleichzeitig ist es auch eines der Unternehmen, die am engsten mit Anthropic zusammenarbeiten. Am Tag der Veröffentlichung von Fable hat es dieses Spitzenmodell in seiner eigenen Produktliste angeboten.

Eine Möglichkeit ist, die Modelle offen zu machen. Eine andere Möglichkeit ist, das Basismodell zu verstecken. Cursor lässt standardmäßig das System automatisch auswählen. Alltägliche Aufgaben werden von einem kostengünstigen, selbst trainierten Modell übernommen, das fast unbegrenzt nutzbar ist. Erst wenn man manuell das neueste Modell anfordert, werden die Kosten von den Guthaben abgezogen. Mit dem eigenen kostengünstigen Modell werden die meisten Aufrufe bewältigt, und das teure Modell wird nur für die Fälle reserviert, in denen es wirklich benötigt wird.

Als die Künstliche Intelligenz vor ein paar Jahren in Mode kam, hat Sam Altman einen berühmten Satz gesagt: In Zukunft wird die Intelligenz "so billig sein, dass man sie nicht mehr messen muss". Damals ging es darum, wer großzügiger war. Man gab so viele kostenlose Guthaben wie möglich und markierte die monatlichen Abonnements gern mit dem Wort "unbegrenzt", als wäre die Intelligenz unerschöpflich.

Tatsächlich hat die Rechenleistung Kosten, man muss Strom bezahlen und Chips kaufen. Selbst ein so reiches Unternehmen wie Microsoft muss lernen, sparsam zu sein. Die kostenlose und unbegrenzte Honeymoon-Phase der Künstlichen Intelligenz neigt sich dem Ende zu.

Dieser Artikel stammt aus dem WeChat-Account "APPSO". Der Autor ist APPSO, der zukünftige Produkte entdeckt. 36Kr hat die Veröffentlichung mit Genehmigung durchgeführt.