Kann man in China nicht von OpenRouter, einem Unternehmen mit einem Marktwert von 1,3 Milliarden US-Dollar, lernen?
Sie schreiben täglich Code mit Cursor und erstellen Schnittstellen mit ChatGPT. Vielleicht wissen Sie jedoch nicht, dass hinter diesen Aufrufen eine Art Plattform heimlich Provisionen einnimmt. Diese Plattformen entwickeln keine eigenen Modelle, sondern bündeln einfach die Schnittstellen der großen Modelle verschiedener Anbieter und ermöglichen es Entwicklern, über eine einzige Schnittstelle global auf die großen Modelle zuzugreifen. Dies ist der AI-Zwischenstation, auch API-Aggregationsplattform genannt.
Seit Mai 2026 hat sich dieser Geschäftszweig rasant entwickelt.
Die weltweit größte API-Zwischenstation OpenRouter hat kürzlich angekündigt, eine Serie-B-Finanzierung in Höhe von 113 Millionen US-Dollar abgeschlossen zu haben. Die Finanzierung wurde von CapitalG, dem Wachstumsfonds der Muttergesellschaft Alphabet von Google, geleitet, und bekannte Risikokapitalgeber wie Nvidia NVentures haben mitinvestiert. Die bestehenden Aktionäre a16z und Menlo Ventures haben ebenfalls ihre Unterstützung verstärkt. Nach der Finanzierung hat sich der Schätzwert von OpenRouter auf 1,3 Milliarden US-Dollar skyrocketed, mehr als verdoppelt gegenüber den 547 Millionen US-Dollar vor einem Jahr. Im Hinblick auf die Geschäftsentwicklung verarbeitet OpenRouter derzeit wöchentlich 25 Billionen Tokens, was auf etwa 100 Billionen Tokens pro Monat entspricht. Dies ist ein Fünffacher-Anstieg gegenüber vor sechs Monaten. Die Anzahl der globalen Benutzer hat ebenfalls 8 Millionen überschritten.
Auch in China haben einige Personen begonnen, sich auf diesen Geschäftszweig zu konzentrieren. Fu Sheng, CEO von Cheetah Mobile, hat die EasyRouter-Plattform angelaufen, und NetEase Youdao hat die große Modell-Aggregationsplattform ThinkFlow offiziell vorgestellt.
Es ist jedoch nicht einfach, den Geschäftsmodel von OpenRouter in China zu replizieren. Man muss nicht nur stabile Schnittstellendienste aufbauen und verschiedene große Modellformate kompatibel machen, sondern auch einer Realität gegenüberstehen: Viele ausländische Mainstream-Modelle haben für chinesische Benutzer beim Registrieren, Bezahlen und Aufrufen Hindernisse errichtet.
Was es noch komplizierter macht, ist, dass aufgrund des fehlenden klaren Regulierungssystems für AI-Zwischenstationen oft keine klaren Grenzen zwischen dem, was erlaubt ist, und dem, was die Grenzen überschreitet, existieren. Die Teilnehmer sind sehr heterogen, was zu einer Reihe von Unregelmäßigkeiten geführt hat.
Die chinesischen OpenRouter-Äquivalente suchen noch nach Antworten.
01. Wie verdient man mit einer AI-Zwischenstation?
Der Kern des Geschäftsmodells einer AI-Zwischenstation liegt in der Provisionierung, und das Wachstum der Einnahmen ist erstaunlich. Nehmen wir OpenRouter, die führende Plattform in der Branche, als Beispiel. Ihre Jahreseinnahmen sind von etwa 10 Millionen US-Dollar im Oktober letzten Jahres auf über 50 Millionen US-Dollar im April 2026 gestiegen. KKdream, ein Anbieter von AI-Zwischenstationen, sagte gegenüber "AIX Finance", dass dies für ein Unternehmen, das erst seit weniger als drei Jahren besteht, ein bemerkenswerter Erfolg sei.
Dies hängt mit der zunehmenden Nachfrage nach AI von Benutzern zusammen.
In den letzten zwei Jahren ist die Anzahl der verfügbaren globalen Mainstream-Großmodelle von ein paar Dutzend auf Hunderttausende explodiert: OpenAI, Anthropic, Meta, Mistral, Google... Jeder Anbieter hat unterschiedliche Schnittstellenspezifikationen, Abrechnungsverfahren und Stabilitäten.
Für Entwickler bedeutet es, dass wenn sie heute Claude ausprobieren möchten, morgen zu Llama wechseln möchten und übermorgen ein Modell ausfällt und automatisch gewechselt werden muss, sie jedes Mal neuen Code schreiben müssen, um die Schnittstelle herzustellen. Die Wertschöpfung von OpenRouter liegt darin, dass es einen "universellen Schlüssel" bietet, der die API-Schnittstellen aller Modelle in ein einheitliches Format "übersetzt", um die Entwicklungsprozesse zu erleichtern.
Ihr Betriebsmechanismus ist im Wesentlichen eine intelligente Scheduling-Schwarzbox.
Nachdem ein Entwickler eine Anfrage gestellt hat, beginnt das zentrale Schedulingsystem der Plattform zu arbeiten und trifft in Echtzeit Entscheidungen basierend auf vordefinierten Regeln wie der Art der Aufgabe, der Kosten und der Leistung. OpenRouter erhebt nach jedem Aufruf eine Provision von etwa 5 % bis 5,5 %.
Quelle: OpenRouter
Mehrere Branchenmitglieder sind der Meinung, dass die Einnahmen von OpenRouter weiter steigen werden.
Einerseits werden AI-Programmierwerkzeuge wie Cursor und ClaudeCode immer beliebter und tragen einen Großteil der API-Aufrufe bei. Die intelligente Codierung verändert das Arbeitsmuster von Entwicklern. Andererseits hat sich noch kein Monopol in der Markt der Großmodelle gebildet. Entwickler müssen zwischen verschiedenen Modellen flexibel wechseln können. Eine AI-Zwischenstation mit der Funktion der Aggregation von Großmodellen hat daher einen natürlichen Mehrwert.
Branchenmitglieder glauben, dass wenn es immer mehr AI-Modelle gibt und die Benutzerverwendung steigt, die Auswahl zwischen den Modellen noch wichtiger werden wird. Die Rolle von OpenRouter als "Zwischenschicht" wird dann noch deutlicher.
Außer den Einnahmen gibt es noch einen weiteren Aspekt, der für diesen Geschäftszweig interessant ist: Die von der Plattform gesammelten Daten über die Anzahl der Aufrufe können die tatsächliche Marktstellung der verschiedenen Großmodelle widerspiegeln. Je mehr Benutzer und je häufiger die Aufrufe, desto stärker ist die Bewertungslogik der Plattform. Dies ist auch der Grund, warum OpenRouter mit Jahreseinnahmen von 50 Millionen US-Dollar einen Schätzwert von 1,3 Milliarden US-Dollar erreichen kann. Das Kapital setzt auf die zukünftigen Datenassets und die Ökosystem-Schnittstelle.
Dieser Geschäftszweig ist jedoch nicht so lukrativ wie es scheint.
Nach Ansicht von KKdream bedeutet es nicht, dass man einfach Geld verdienen kann, wenn man keine Ressourcen in die Entwicklung von Großmodellen investiert. Die Kosten einer API-Zwischenstation lassen sich grob in vier Teile aufteilen.
Der größte Anteil der Kosten entfällt auf die Kosten für den Zugriff auf die upstream-Modelle, d. h. die Token-Gebühren, die an Anbieter wie OpenAI, Anthropic und Google gezahlt werden. Mit der zunehmenden Verbreitung von langen Kontexten und Multimodalität wird die Datenmenge, die für eine einzelne Anfrage verbraucht wird, immer größer, und diese Kosten steigen kontinuierlich.
Als nächstes kommen die Netzwerk- und Bandbreitenkosten. Eine AI-Zwischenstation ist im Wesentlichen ein Echtzeit-Streaming-System, das Streaming und WebSocket verarbeiten muss. Insbesondere nach der Einführung von Multimodalität ist der Daten-Durchsatz deutlich höher als bei herkömmlichen API-Diensten.
Es gibt auch Infrastrukturkosten, wie globale Proxy-Knoten, Lastenausgleich, Hochkonkurrenz-Gateways, Caching, Datenbanken und Log-Monitoring-Systeme. Um die Stabilität zu gewährleisten, werden in der Regel auch Multi-Region-Deployment und Notfallvorsorge implementiert.
Der letzte, oft übersehene Kostenfaktor ist die Stabilitätskosten. Da verschiedene Modell-Anbieter Limitationen, Ausfälle oder Schnittstellenänderungen haben können, muss die Zwischenstation die Fallback-Routing, die Modell-Health-Check und die dynamische Traffic-Scheduling kontinuierlich warten. Wenn die Plattform beginnt, Unternehmenskunden zu bedienen, werden auch die Entwicklung und Wartung von Unternehmensfunktionen wie Berechtigungsverwaltung, Sicherheitskonformität, API-Verwaltung und Prompt-Logging erhöht.
KKdream sagte, dass eine AI-Zwischenstation im Vergleich zu einem Großmodell-Unternehmen keine riesigen Mittel in die Modellentwicklung investieren muss. Das eigentliche Problem besteht darin, in einer Umgebung mit hoher Konkurrenz und komplexen Modellen einen langfristig stabilen, niedrig-latenzigen und kostengünstigen Servicebetrieb zu gewährleisten.
Wenn OpenRouter sich nur auf die einfache Vermittlung von API-Schnittstellen beschränkt, werden die Gewinne schnell durch die Traffic-Kosten verdünnt, und es wird schließlich zu einem Wettbewerb mit niedrigen Margen kommen. Nach Ansicht von KKdream ist dies nur eine "Hantierarbeit". Der wahre Wert muss aus einer intelligenteren Scheduling, einem stabileren Service und einer tieferen Bindung an die Entwicklungs-Szenarien kommen.