StartseiteArtikel

In einem Jahr stieg der Unternehmenswert um über 50 Milliarden Yuan. Das von Jensen Huang empfohlene KI-Start-up hat 3,5 Milliarden Yuan Kapital beschafft und plant einen Börsengang.

智东西2026-02-06 08:35
ElevenLabs ist nicht nur ein Unternehmen, das Audio-Modelle entwickelt.

Im Bereich der KI-Audio ist ein Unicorn mit einem Wert von 10 Milliarden US-Dollar aufgetaucht!

Nach einer Meldung von Zhidx am 5. Februar meldete gestern das britische KI-Audio-Unicorn ElevenLabs, dass es eine Serie-D-Finanzierung in Höhe von 500 Millionen US-Dollar (etwa 3,47 Milliarden Yuan) abgeschlossen habe. Der Unternehmenswert beläuft sich nun auf 11 Milliarden US-Dollar (etwa 76,35 Milliarden Yuan). Im Vergleich zu den 3,3 Milliarden US-Dollar Anfang des vergangenen Jahres hat sich der Unternehmenswert um über 230 % sprunghaft erhöht. Mati Staniszewski, Mitbegründer und CEO von ElevenLabs, gab außerdem bekannt, dass das Unternehmen bereits über die Durchführung eines Börsengangs nachdenke.

Die aktuelle Finanzierungsrunde wurde von Sequoia Capital angeführt. Die Investoren a16z und ICONIQ, die bereits an mehreren Finanzierungsrunden von ElevenLabs beteiligt waren, haben ihre Investitionen vervierfacht bzw. verdreifacht. Dies bedeutet, dass beide Investmentgesellschaften ihren Anteil an ElevenLabs erhöht haben.

Mati Staniszewski kündigte die Finanzierung an (Quelle: X-Plattform)

ElevenLabs wurde 2022 in London, Großbritannien, gegründet. Ursprünglich konzentrierte es sich hauptsächlich auf die Entwicklung von Text-zu-Sprache-Modellen. Später hat es auch Modelle für die Sprache-zu-Text-Umwandlung, KI-Klangmodelle, KI-Stimmenmodellierung und KI-Musikmodelle entwickelt.

Das Unternehmen bietet Unternehmen Sprach-API-Services an, stellt Schaffenden und Marken die Audio-Generierungsplattform ElevenCreative zur Verfügung und bietet über die Plattform ElevenAgents Unternehmen auch KI-Sprechassistenten-Services. Man kann sogar in dem bekannten Spiel "Fortnite" Audio-Inhalte finden, die von ElevenLabs generiert wurden. Ende 2025 lag der ARR (Annual Recurring Revenue) von ElevenLabs bei über 330 Millionen US-Dollar (etwa 2,29 Milliarden Yuan).

Seit seiner Gründung hat ElevenLabs fünf Finanzierungsrunden abgeschlossen, wobei die Gesamtinvestitionen 781 Millionen US-Dollar (etwa 5,42 Milliarden Yuan) betragen. NVIDIA war zuvor an der Serie-C-Finanzierung von ElevenLabs beteiligt. Huang Renxun, Gründer und CEO von NVIDIA, sagte, dass ElevenLabs die besten Sprach-KI-Produkte der Welt entwickelt habe, und empfahl ElevenLabs aktiv seinem Team. Heute verwendet Huang Renxun die Tools von ElevenLabs, um seine eigene Stimme zu reproduzieren, wenn er auf verschiedenen Konferenzen in Form eines virtuellen Avatar erscheint.

Huang Renxun und Mati Staniszewski (Quelle: NVIDIA)

Von der Finanzierungsgröße, dem Umsatzwachstum bis hin zur Kapitalstruktur gehört ElevenLabs fest in die Spitze der globalen KI-Audio-Branche. Ein Unternehmen, das weniger als vier Jahre alt ist und sich in der wettbewerbsintensiven Sprach-KI-Branche so schnell vornwegsetzen konnte, hat offensichtlich nicht nur Glück gehabt. Der Gründungspunkt, die Schlüsselentscheidungen und die Sichtweise auf Produkte und Märkte von ElevenLabs lohnen sich einer eingehenden Analyse.

01. Über eine Million Nutzer binnen sechs Monaten und explosive Wachstumsrate dank Social Media

Die beiden Mitbegründer von ElevenLabs, Mati Staniszewski und Piotr Dabkowski, stammen beide aus Polen. Inspiriert von den schlecht synchronisierten amerikanischen Filmen, die sie in ihrer Kindheit gesehen hatten, beschlossen sie, ein KI-Tool zu entwickeln, um dieses Problem zu lösen.

Vor der Gründung von ElevenLabs arbeitete Mati Staniszewski bei der Browserfirma Opera, dem Investment- und Technologieanbieter BlackRock und der börsennotierten Datenintelligenzgesellschaft Palantir. Piotr Dabkowski arbeitete seit seinem Abschluss als Softwareingenieur bei Google, bis er 2022 gemeinsam mit Mati Staniszewski gründete.

Was kann das junge Unternehmen ElevenLabs der Branche eigentlich bieten? Bei der Investition in ElevenLabs im Jahr 2023 erläuterte Bryan Kim, ein Investor von a16z, seine Einschätzung des Potenzials von ElevenLabs.

Bryan Kim ist der Meinung, dass die Sprache-zu-Text-Technologie zwar seit Jahrzehnten existiert, aber ihr Potential bisher nicht voll ausgeschöpft wurde. Die meisten synthetischen Stimmen fehlen ansprechende Tonlage und Aussprache sowie Perspektivität. Obwohl es auch hochwertige professionelle Sprachaufnahmen gibt, sind die langen Produktionsprozesse und die hohen Kosten, die damit verbunden sind, für die meisten Echtzeit- und Interaktionsszenarien ungeeignet.

ElevenLabs will diese Lücke schließen und die Nachfrage nach hochwertigen Sprachausgaben decken.

Im Januar 2023 brachte ElevenLabs erstmals Sprachdesign- und Klonprodukte auf den Markt und verbesserte signifikant die bestehenden Text-zu-Sprache-Modelle. Danach wurden weitere Text-zu-Sprache-Modelle entwickelt, die Mehrsprachigkeit erweitert und sogar die Rechte auf die Stimmen einiger verstorbener berühmter Schauspieler erworben, um diese zu klonen und kommerziell anzubieten.

Sechs Monate nach der Markteinführung hatte ElevenLabs bereits über eine Million registrierte Nutzer und Inhalte mit einer Gesamtlaufzeit von über zehn Jahren produziert. Im November 2024 lag die Nutzerzahl bereits bei über 33 Millionen. Im Jahr 2025 überschritt der ARR erstmals die Marke von 100 Millionen US-Dollar.

Bei einem Interview im Juni 2025 gab Luke Harries, der Leiter für Wachstum bei ElevenLabs, bekannt, dass es zwei Haupttreiber hinter dem rapiden Wachstum des Unternehmens gebe.

Einerseits wird die Leistung des Basis-Modells von ElevenLabs ständig verbessert, was sich in einer zunehmenden Expressivität und Realismus widerspiegelt. ElevenLabs ist der Ansicht, dass bei Sprachmodellen die Größe und die Datenmenge keine entscheidenden Faktoren sind. Vielmehr spielt die Modellarchitektur eine entscheidende Rolle.

Der Mitbegründer Piotr Dabkowski, der die Forschungsarbeit bei ElevenLabs leitet, hat dank seines Einflusses mehrere Weltklasse-Forscher für die Sprach-KI rekrutiert. Das Unternehmen hat einige Fortschritte in der Modellarchitektur erzielt. Da es sich jedoch um ein geschlossenes Modell handelt, ist die Öffentlichkeit nicht über die genauen Verbesserungen informiert.

Mati Staniszewski (links) und Piotr Dabkowski (rechts)

Andererseits ist ElevenLabs auch sehr gut in Sachen Marketing. Das Unternehmen weiß, wie man die Macht von Social Media nutzt, und hat auch durch Hackathons und andere Demo-Projekte eine breite Öffentlichkeit erreicht und so ein explosionsartiges Wachstum erzielt.

Was die Unternehmenskunden betrifft, ist ElevenLabs der Ansicht, dass man auf dem Unternehmensmarkt von unten nach oben vorgehen sollte. Das heißt, man beginnt bei Verbrauchern und Entwicklern und baut so einen Ruf und Vertrauen auf, bevor die großen Kunden kommen.

02. Schwerpunkt verschoben auf Sprachassistenten, Gründer sieht wenig Zukunft für Audio-Modelle

ElevenLabs will sich jedoch nicht auf den engen Bereich der Audio-Modelle beschränken, sondern hat sein Ziel auf einen größeren Markt gerichtet.

In einem Podcast, der mit TechCrunch aufgenommen wurde, sagte Mati Staniszewski, dass das grundlegende Problem, das ElevenLabs lösen will, die Interaktion zwischen Menschen und Technologieprodukten sei. Dies sei die Grundlage für die Produktentwicklung des Unternehmens.

Zunächst hat ElevenLabs Text-zu-Sprache-Modelle entwickelt, um die Sprachausgabe von Technologieprodukten natürlicher klingen zu lassen. Um ein wirklich ausgezeichnetes Erlebnis zu bieten, reicht es jedoch nicht aus, nur realistische Stimmen zu generieren. Die KI muss auch in der Lage sein, Klänge und Musik zu generieren und Sprache zu verstehen. Mati Staniszewski ist der Meinung, dass dies der Schwerpunkt des Unternehmens von seiner Gründung bis Anfang 2025 war.

Tatsächlich sieht Mati Staniszewski jedoch wenig Zukunft für die Audio-Modell-Branche: "Dieser Bereich wird vielleicht in den nächsten ein bis zwei Jahren noch bestehen, aber in ein paar Jahren wird diese Technologie vollständig kommodifiziert sein."

ElevenLabs entwickelt derzeit immer noch Modelle, weil dies auf kurze Sicht immer noch die beste Möglichkeit ist, die Qualität von KI-Audio-Produkten zu verbessern. Mit der zunehmenden Reife und Zugänglichkeit dieser Technologie, die zu einem "Standardprodukt" werden wird, könnte das Audio-Modell eher eine grundlegende Fähigkeit als ein Kernkompetenz werden.

Deshalb führte Mati Staniszewski im zweiten Halbjahr 2025 eine wichtige strategische Umstellung bei ElevenLabs durch. Heute ist die Hauptaufgabe von ElevenLabs es, Unternehmen bei der Implementierung von Dialog-Assistenten zu helfen, die auf neue Weise mit Nutzern und Kunden interagieren können.

Mati Staniszewski geht davon aus, dass mit der Entstehung von Agenten, Dialog-Assistenten und Sprachassistenten die Nutzer nun mit Geräten sprechen können. Um diesen Agenten echter Wert zu verleihen, müssen jedoch große Mengen an Informationen und Wissensbeständen in die Agenten integriert werden, damit sie mit bestehenden Systemen kompatibel sind.

Nach der Integration müssen diese Produkte auch testbar, bewertbar und überwachbar sein, um das Vertrauen von Unternehmenskunden zu gewinnen.

Die Hauptanwendungsgebiete dieser Agenten sind eigentlich KI-Sprechassistenten. Die Agenten von ElevenLabs sind multimodal und können mündliche oder schriftliche Eingaben verstehen, wie ein Mensch zuhören, lesen und mit Kunden interagieren. Unternehmen können diese Agenten auch anpassen und in den von ElevenLabs bereitgestellten visuellen Tools Dialogabläufe erstellen, um genau zu definieren, wie diese Agenten mit Kunden interagieren sollen.

Die Agentenprodukte von ElevenLabs (Quelle: ElevenLabs-Website)

Durch diese Strategie konnte ElevenLabs auf dem Unternehmensmarkt weitere Gewinne erzielen. Heute zählen unter ihren großen Kunden im Bereich der Sprachassistenten Cisco, Meta, Salesforce und andere. Im Bereich der Audioerstellung nutzen Disney, Epic und andere Filmin- und Spieleproduktionsunternehmen die Produkte von ElevenLabs.

Der ARR von ElevenLabs hat seit der strategischen Wende deutlich zugenommen. Anfang 2025 dauerte es 20 Monate, bis ElevenLabs einen ARR von 100 Millionen US-Dollar erreichte. Es brauchte nur noch 10 Monate, um die Marke von 200 Millionen US-Dollar zu überschreiten.

Anfang 2026, als ElevenLabs kündigte, dass es einen ARR von 330 Millionen US-Dollar erreicht habe, waren es nur noch fünf Monate, seitdem die Marke von 200 Millionen US-Dollar überschritten wurde.

03. Fokus auf KI-Modelle und Produkte, keine Überbeanspruchung von Rechenleistung und Daten

Im Bereich der Sprach-KI fehlen nicht an guten Modellen. Chinesische Unternehmen wie MiniMax und Alibaba sowie ausländische Unternehmen wie Google und OpenAI haben alle gute Sprachprodukte entwickelt. Wo liegt nun der Unterschied von ElevenLabs?

Genau wie die Kombination von Software und Hardware die Magie von Apple ausmacht, ist Mati Staniszewski der Meinung, dass die Kombination von KI-Modellen und Produkten den größten Wert schafft.

ElevenLabs forscht zwar auch an einigen Themen, wie der Kombination von Open-Source-Video- und Sprachmodellen, legt aber immer mehr Wert auf die Entwicklung von besseren Produkten. Es trainiert nicht wie seine Konkurrenten rechen- und datenintensive Modelle.

Zusätzlich ist Mati Staniszewski der Ansicht, dass ElevenLabs eine höhere Konzentration aufweist. Es konzentriert sich direkt auf die Lösung des Problems der Sprachinteraktion zwischen Menschen und Computern. Die Vision des Unternehmens steht unabhängig von den Aktivitäten seiner Konkurrenten.

Nach der neuen Finanzierung will ElevenLabs vor allem die Entwicklung seiner Agentenprodukte vorantreiben. In den nächsten Tagen wird es ein neues Dialogmodell für die Agentenplattform einführen, das Emotionen schneller und genauer verstehen und ausdrücken kann.

Heute ist ElevenLabs ein Unternehmen mit 400 Mitarbeitern. Im Vergleich zu anderen KI-Start-ups mit ähnlichem Unternehmenswert kann man es fast als großes Unternehmen bezeichnen.

ElevenLabs expandiert international in Städten wie London, New York, San Francisco, Warschau, Dublin, Tokio, Seoul, Singapur, Bangalore, Sydney, São Paulo, Berlin, Paris und Mexiko-Stadt und hat eine lokalisierte Marketinggruppe. Dies ist besonders wichtig für seine Sprach-KI-Geschäftsfelder.

04. Fazit: Modelle dienen den Produkten - Ein erfolgreiches Konzept für ElevenLabs

Wenn man sich den Wachstumsweg von ElevenLabs anschaut, hat es nicht den traditionellen Weg von Modellunternehmen beschritten, der auf der Akkumulation von Parametern und Rechenleistung basiert. Stattdessen hat es sich immer um die grundlegende Frage bemüht, wie Sprache und Audio in der realen Welt eingesetzt werden können. Auf strategischer Ebene hat es auch klug erkannt, dass "Audio-Modelle irgendwann kommodifiziert werden" und hat seinen Schwerpunkt auf Dialog-Assistenten und Unternehmensszenarien verschoben.

Dieser Ansatz, "Produkte zuerst, Modelle dienen den Produkten", gibt ElevenLabs eine einzigartige Position in der wettbewerbsintensiven Sprach-KI-Branche. Dies könnte auch der Grund sein, warum Top-Unternehmen und führende Risikokapitalgeber bereit sind, viel Geld in ElevenLabs zu investieren.

Dieser Artikel stammt aus dem WeChat-Account