Microsoft setzt Vibe Coding auf Pause: Das Verbrennen von Tokens ist jetzt teurer als die Beschäftigung von Mitarbeitern
Am 14. Mai 2026 hat Microsoft angefangen, die interne Claude Code-Lizenz für die meisten Mitarbeiter zu widerrufen. Die Frist ist der 30. Juni - auch der letzte Tag des Microsoft-Geschäftsjahres.
Nur sechs Monate zuvor hat Microsoft genau das Gegenteil getan - im Dezember 2025 hat es Claude Code für Tausende von Mitarbeitern, darunter Ingenieure, Produktmanager und Designer, freigegeben und alle ermutigt, den Workflow mit "vibe coding" neu zu gestalten. Die Mitarbeiter mochten das Tool sehr, vielleicht sogar zu sehr.
Aber sechs Monate später hat Microsoft es zurückgenommen.
Fast in derselben Woche hat Tom Blomfield, Partner von YC, in einem Batch-Talk gesagt: "Wenn Ihre API-Rechnung Sie nicht schmerzt, bedeutet das, dass Sie nicht genug Geld ausgeben."
In demselben Frühjahr gibt das Silicon Valley zwei völlig gegensätzliche Antworten auf dieselbe Frage - ist die Verwendung von KI teurer als die Beschäftigung von Menschen?
01
Das Scheitern von "vibe coding"
Microsoft hebt nicht das Claude-Modell auf. Das Modell von Anthropic wird weiterhin über die Copilot CLI für Microsoft-Mitarbeiter zur Verfügung gestellt. Es hebt die Produkt-Eingabe von Claude Code selbst auf.
Am stärksten betroffen ist die Abteilung "Experiences + Devices" - das sind die Ingenieurteams hinter Windows, Microsoft 365, Outlook, Teams und Surface. EVP Rajesh Jha hat diese Entscheidung in einer internen Notiz als "Toolchain-Vereinheitlichung" (toolchain unification) verkauft, aber die internen Microsoft-Informationen, auf die The Verge Bezug nimmt, sind direkter: Die Mitarbeiter sind sich einig, dass Claude Code besser funktioniert als die Copilot CLI. Die Popularität von Anthropic bei Microsoft hat sogar dazu geführt, dass die eigene Copilot CLI von Microsoft "ignoriert" wurde.
Mit anderen Worten, Microsoft hat Claude Code nicht abgeschafft, weil es nicht funktioniert, sondern weil es zu gut funktioniert.
Das Datum des 30. Juni ist kein Zufall - es ist der letzte Tag des Microsoft-Geschäftsjahres. Ein von den Mitarbeitern bevorzugtes Tool zu kürzen, ein eigenes Produkt zurückzunehmen und den Zeitpunkt auf das Geschäftsjahr abzustimmen - wie viel davon Produktentscheidungen und wie viel davon finanzielle Überlegungen sind, wissen alle.
Bildquelle: Visual China
Microsoft ist kein Einzelfall.
Vor einem Monat hat Praveen Neppalli Naga, CTO von Uber, der The Information gegenüber gesagt: Das AI-Programmier-Tool-Budget des Unternehmens für das gesamte Jahr 2026 war in den ersten vier Monaten aufgebraucht. Uber hatte zuvor sogar eine interne Rangliste erstellt, um die Mitarbeiter zu motivieren, mehr AI zu verwenden - das Ergebnis war ein Budgetkollaps.
Direkter noch ist der Satz von Bryan Catanzaro, Vizepräsident für angewandte Deep Learning bei Nvidia , in einem Interview mit Axios: "Für mein Team ist die Kosten für Rechenleistung weit höher als die Kosten für Mitarbeiter." Dies kommt von einem Manager einer Hardwarefirma - deren Kernprodukt die Vermarktung von Rechenleistung ist.
Fortune hat diese Hinweise zusammengefasst und dem Artikel einen sehr "Fortune"-typischen Titel gegeben: "Microsofts Bericht enthüllt das echte Kostenproblem der KI - die Verwendung dieser Sache ist teurer als die Beschäftigung von Mitarbeitern."
Wenn man nur bis zu diesem Punkt liest, ist die Schlussfolgerung einfach: "vibe coding" ist gescheitert, die Geschichte der KI als Ersatz für Menschen kann beendet werden.
Aber diese Schlussfolgerung ist zu früh gezogen.
02
Der "Copilot-Modus" hat "die Wand" erreicht
Um Microsofts Rückzug zu erklären, muss man zuerst verstehen, was "vibe coding" ist.
Dieser Begriff wurde Anfang 2025 von Andrej Karpathy geprägt - er beschrieb eine neue Art des Programmierens: Entwickler schreiben nicht mehr Zeile für Zeile Code, sondern beschreiben ihre Absichten in natürlicher Sprache und lassen den LLM den Code generieren. Entwickler lesen den Code gar nicht, sondern schauen nur auf das Ergebnis - wenn es funktioniert, akzeptieren sie es, wenn nicht, lassen sie die KI es noch einmal ändern.
Dies ist ein der verlockendsten Versprechen der Produktivität in der KI-Zeit. Es bedeutet: Ein Ingenieur, der nicht in Rust programmieren kann, kann die KI bitten, Rust-Code zu schreiben; ein Produktmanager kann die KI bitten, ein Prototyp zu erstellen; ein Designer kann die KI bitten, ausführbaren Code zu schreiben. Die Zielgruppe von Microsofts Freigabe von Claude Code im Dezember 2025 - Ingenieure, PMs und Designer - sind genau diese drei Typen von Personen. Dies ist kein Zufall, sondern die klassische Umsetzung von "vibe coding".
Aber wenn "vibe coding" in großen Unternehmen umgesetzt wird, wird es strukturell sehr unangenehm.
Nehmen wir an, Microsoft hat einen Ingenieur mit einem Jahresgehalt von 300.000 US-Dollar. Nachdem Microsoft ihm Claude Code zur Verfügung gestellt hat, steigt seine Leistung um 20% - dies ist der ideale Zustand von "vibe coding". Aber gleichzeitig kostet der Verbrauch von Tokens pro Monat 200 US-Dollar, 500 US-Dollar oder 2.000 US-Dollar? Diese Zahl steigt monoton, je stärker er von der KI abhängt.
Noch schwieriger ist, dass er nicht entlassen wird, weil er "KI verwendet" - sein Jahresgehalt von 300.000 US-Dollar bleibt, seine Sozialleistungen bleiben, sein Arbeitsplatz bleibt.
Das heißt, Microsofts Gesamtkostenstruktur ist "das ursprüngliche Gehalt der Mitarbeiter + die zusätzlichen Token-Rechnungen". Diese Formel hat nur eine Richtung - die Kosten steigen stark.
Und spiegelt sich die "Steigerung der Mitarbeiterleistung um 20%" finanziell in einer "Steigerung des Umsatzes um 20%" wider? Nein. Es ist eher "der Umsatz bleibt gleich, aber in der Kostenstruktur gibt es eine zusätzliche KI-Rechnung" - weil die Leistung der meisten Mitarbeiter nicht direkt mit zusätzlichem Umsatz verbunden ist. Wenn er schneller schreibt, bedeutet das nicht, dass das Unternehmen mehr verkauft.
Dies ist die wahre Bedeutung von Catanzaros Satz "Rechenleistung ist teurer als Mitarbeiter". Es heißt nicht, dass die KI dumm ist, sondern dass es unmöglich ist, die Zahlen zu stemmen, wenn man die KI auf die bestehenden Mitarbeiter anwendet.
Dieser Logik liegen auch Daten zugrunde.
In einer jüngsten Prognose von Gartner heißt es: Bis 2030 wird die Inferenzkosten von Modellen mit einer Billion Parametern um fast 90% im Vergleich zu 2025 sinken. Es scheint, als würde die KI immer günstiger werden, aber Gartners eigentliche Schlussfolgerung ist: Dies wird die Gesamtkosten der Unternehmen für KI nicht senken. Will Sommer, Senior Director Analyst bei Gartner, hat einmal gesagt - "CPOs sollten nicht 'die Deflation von commodity-Tokens' mit 'der Einfachheit des Zugangs zu fortschrittlichen Inferenzfähigkeiten' verwechseln."
Die Prognose von Goldman Sachs ist noch direkter: Bis 2030 wird der Agentic AI den Token-Verbrauch um das 24-fache steigern und auf 120 Billionen pro Monat ansteigen. Ein Preisverfall der Tokens um 90% und ein Verbrauchszuwachs um das 24-fache - das Ergebnis ist, dass die Gesamtkosten immer noch steigen.
Jensen Huang hat eine noch radikalere Version. Er hat vor einigen Monaten in öffentlichen Statements gesagt, dass in Zukunft jeder Nvidia-Mitarbeiter mit 100 KI-Agenten zusammenarbeiten wird.
Das klingt schön. Aber wenn Sie CFO sind, was hören Sie? 100 Token-Brenner, die 24 Stunden am Tag brennen.
Das Problem ist nicht, dass die KI zu teuer ist. Das Problem ist die Annahme, "jedem Mitarbeiter einen KI-Co-Pilot zu geben".
Diese Vorgehensweise hat in der Tech-Szene einen beliebten Namen - "Copilot-Modus". Ihre Kernannahme ist: Der Mensch bleibt am Steuer, die KI gibt ihm im Beifahrersitz Ratschläge. Sie ersetzt ihn nicht, sondern macht ihn nur schneller.
Diese Annahme ist auf Worteebene sehr sanft - "Die KI wird Ihnen Ihren Job nicht wegnehmen, sie hilft Ihnen nur". Aber auf finanzieller Ebene bedeutet sie: Das gesamte ursprüngliche Gehalt bleibt gleich, aber es gibt eine zusätzliche Token-Gebühr.
Und die Token-Gebühr ist keine Fixgebühr, sondern wird nach Verbrauch berechnet. Je mehr die Mitarbeiter verwenden, desto mehr muss das Unternehmen zahlen - genau diese Kostenstruktur ist das, was Unternehmen am wenigsten wollen: variabel, unbegrenzt und in umgekehrter Richtung zur Kapazität ansteigend.
Als Microsoft im Dezember 2025 Claude Code freigegeben hat, hat es vielleicht nicht ganz verstanden, was es damit anstellt. Es wollte einfach, dass die Mitarbeiter es ausprobieren und sehen, wie viel die Arbeitsleistung durch die KI gesteigert werden kann. Aber sechs Monate später waren die Mitarbeiter wirklich süchtig geworden, Claude Code war bei Microsoft extrem beliebt - das Ergebnis war, dass die Token-Rechnungen weit über den Erwartungen lagen und die Leistung, die Microsoft aus dieser Popularität zurückerhalten konnte, überstiegen.
Microsoft hat zurückgetreten. Aber es hat nicht die KI zurückgenommen - es hat die Struktur "der Mitarbeiter bleibt am Steuer, die KI sitzt im Beifahrersitz" zurückgenommen.
Dies ist ein strukturelles Scheitern. Es wird nicht verschwinden, wenn das Modell günstiger wird oder die Mitarbeiter sich mit der KI vertrauter machen - es wird schlimmer, je vertrauter die Mitarbeiter mit der KI werden.
03
Der Token-Verbrauch ist der Ersatz für die Personalkosten
Fast in derselben Woche wie Microsofts Rückzug hat Tom Blomfield in einem YC-Batch-Talk eine völlig andere Perspektive vorgestellt. Er hat nicht darüber gesprochen, "wie man KI verwenden sollte" - er hat darüber gesprochen, "wie ein Unternehmen in der KI-Zeit aussehen sollte".
Blomfields Urteil ist direkt: Die meisten Unternehmen heute haben noch immer eine "Römische Legion"-Struktur - Informationen werden schrittweise nach oben weitergeleitet, Befehle werden schrittweise nach unten verteilt, und der Mensch ist das Zentrum der Koordination. Wenn man KI in diese Struktur integriert, ist das wie das Ausrüsten von römischen Infanteristen mit Feuerwaffen - sie werden sie intensiver nutzen, aber die Taktik bleibt dieselbe.
Ein echter AI-native-Unternehmen sollte anders aussehen.
Blomfield hat eine sehr konkrete Beschreibung verwendet: Jede Aktion sollte ein aufzeichnbares, aufrufbares Produkt erzeugen, damit alles für die KI klar lesbar ist (legible to AI); das Unternehmen sollte als "selbstverbessernder KI-Zyklus" gestaltet werden, bei dem das System die Umgebung wahrnehmen, Entscheidungen treffen, Tools aufrufen, Feedback erhalten und sich selbst korrigieren kann.
Im Menschen gibt es in einem solchen Unternehmen nur noch zwei Rollen. Einerseits sind es die persönlichen Beitragenden - jeder, unabhängig von der Abteilung, ist ein Builder und Operator, der bei Meetings Prototypen mitbringt, nicht nur Ideen; andererseits sind es die DRI (Direkte Verantwortliche) - für jede Leistung gibt es einen eindeutigen Verantwortlichen, der "nicht hinter der KI verstecken kann".
Dann hat Blomfield diesen berühmten Satz gesagt: "Wenn Ihre API-Rechnung Sie nicht schmerzt, bedeutet das, dass Sie nicht genug Geld ausgeben."
Dieser Satz würde in Microsofts CFO-Büro als Witz gelten; aber vor einer Gruppe von Gründern von Start-ups in YC wird niemand ihn für verrückt halten.
Warum?
Diana Hu, eine andere Partnerin von YC, hat im Mai auf der Startup School die Antwort gegeben. Sie hat gesagt - "Maximieren Sie nicht die Anzahl der Mitarbeiter, sondern den Token-Verbrauch". Sie hat auch eine noch direktere Version: "Ein Mensch mit KI-Tools ist gleichbedeutend mit einem großen Ingenieurteam in der Vergangenheit."
Achten Sie auf das Schlüsselwort hier: "gleichbedeutend". Nicht "entspricht", nicht "ähnelt" - sondern "ersetzt".
In der P26 2026 Frühjahr-Batch von YC gibt es bereits viele Unternehmen, die mit 5 oder 6 Personen das tun, was früher 20 oder 30 Personen brauchten. Ihre Token-Rechnungen sind natürlich hoch, aber ihre Personalausgaben sind extrem niedrig - insgesamt gesehen machen sie einen Gewinn.
Ein noch radikaleres Beispiel ist Block. Jack Dorseys Finanztechnologieunternehmen hat kürzlich 40% seiner Mitarbeiter entlassen. Dies ist nicht die traditionelle "Kostenreduktion und Effizienzsteigerung" - Block hat gleichzeitig die interne Investition in KI-Tools erhöht, und die neue Struktur ist die, die Diana Hu beschrieben hat: IC + DRI + AI-Agent.
Der Token-Verbrauch im YC-Kontext ist keine Ausgabe, sondern ein Ersatz. Er ersetzt nicht die Kosten außerhalb der KI, sondern die Personalausgaben. Die Zahlen stimmen, weil das Unternehmen gleichzeitig die Stellen entfernt hat, die sonst Gehälter kosten würden.
Dies ist der grundlegende Grund, warum Microsoft und YC bei derselben Sache entgegengesetzte Antworten geben - sie verbrauchen überhaupt nicht die gleichen Tokens. Microsofts Tokens werden verwendet, um den Co-Piloten der bestehenden Mitarbeiter zu tanken, während YCs Tokens die ursprünglichen Fahrer ersetzen.
04
Das echte Vermögen wird neu definiert
Tom Blomfield hat in einem Gespräch noch einen anderen spannenderen Satz gesagt - "Der Mensch ist vergänglich, die Kontextdokumente sind wichtig."
Dies ist eine Entscheidung auf Rechnungsebene.
Wie sieht die Bilanz eines traditionellen Unternehmens aus? Links stehen die Anlagevermögen, Forderungen, Goodwill und das geistige Eigentum, rechts die Verbindlichkeiten und das Eigenkapital. Die Mitarbeiter stehen nicht auf der Seite des Vermögens - sie sind Kosten. Aber jedes Unternehmen weiß im Grunde, dass die Mitarbeiter eigentlich das echte Vermögen sind: Die Kundenbeziehungen sind im Kopf der