StartseiteArtikel

Ein Unicorn im Wert von 210 Milliarden wird bald geboren werden und wird gleichzeitig von NVIDIA, Google und xAI angesehen.

智东西2025-08-26 20:46
Das Unternehmen hat seit fünf Jahren aufeinanderfolgend positive Cashflows und ein Jahresumsatzwachstum von 360%.

Zhidx berichtete am 26. August, dass kürzlich die Kapitalanlageabteilung CapitalG des Mutterunternehmens Alphabet von Google und Nvidia über die Investition in den israelischen Anbieter von KI-Infrastruktur VAST Data verhandeln. Das Finanzierungsvolumen könnte bis zu einigen Milliarden US-Dollar betragen und würde damit möglicherweise die größte Finanzierung in der Geschichte israelischer Technologieunternehmen werden. Nach Abschluss der Finanzierung würde der Schätzwert dieses Start-ups auf 30 Milliarden US-Dollar (etwa 214,8 Milliarden Yuan) steigen.

Was ist die Herkunft dieses Start-ups, das von Google und Nvidia umworben wird?

Das 2016 gegründete VAST Data ist zu einem beliebten Anbieter für viele Unternehmen im Bereich großer Modelle geworden. Der Kerngrund dafür ist, dass die herkömmliche Daten-Speicherarchitektur die neuen Anforderungen an das Training und die Inferenz von großen Modellen nicht erfüllen kann. VAST Data hat für die KI-Zeit eine einheitliche Datenplattform entwickelt, die strukturierte und unstrukturierte Daten integriert, um die Datenverarbeitung durch KI effizienter und kostengünstiger zu machen.

Viele weltweit bekannte Unternehmen wie das Start-up xAI von Elon Musk im Bereich großer Modelle, CoreWeave, das von Nvidia mit 3,96 Milliarden US-Dollar investiert wurde, das weltweit führende Animationsunternehmen Disney und seine Tochtergesellschaft Pixar, das US-amerikanische Telekommunikationsunternehmen Verizon und die Videokonferenzplattform Zoom befinden sich auf der Kundenliste dieses Start-ups.

Es ist erwähnenswert, dass es mit vielen Kunden Laufzeiten von 5 bis 7 Jahren vereinbart hat, was zu einem sprunghaften Anstieg des Jahresumsatzes geführt hat. Laut den öffentlichen Daten auf der offiziellen Website von VAST Data stieg der Umsatz von VAST Data im Geschäftsjahr bis zum 31. Januar 2025 um das 3,6-fache gegenüber dem Vorjahr. Diese Umsatzwachstumsrate übertraf sogar die von Nvidia und OpenAI. Der Umsatz von Nvidia stieg im Geschäftsjahr 2025 um 114 % gegenüber dem Vorjahr. Kürzlich berichtete Bloomberg, dass OpenAI voraussichtlich im Jahr 2025 einen Umsatz von 12,7 Milliarden US-Dollar (etwa 90,9 Milliarden Yuan) erzielen wird, was einem Dreifachen des Vorjahresumsatzes entspricht.

Laut Medienberichten, die sich auf anonyme Quellen stützen, die mit der Finanzlage vertraut sind, hat Renen Hallak, Mitbegründer und CEO von VAST Data, erwähnt, dass das Unternehmen seit fünf Jahren einen positiven freien Cashflow erzielt hat. Bis Januar 2025 betrug der ARR (Annual Recurring Revenue) des Unternehmens 200 Millionen US-Dollar (etwa 1,43 Milliarden Yuan), und es wird erwartet, dass er im nächsten Jahr auf 600 Millionen US-Dollar (etwa 4,3 Milliarden Yuan) steigen wird.

Zugleich hat dieses Start-up auch enge Beziehungen zu den beiden „Geldgebern“ mit den neuen Finanzierungsplänen. VAST Data hat seine Softwareplattform in Google Cloud integriert. Jensen Huang, Gründer und CEO von Nvidia, hat VAST Data auf internationalen Konferenzen wie der GTC und der COMPUTEX mehrfach gelobt und es als einen Schlüsselfaktor für die Implementierung von großen KI-Modellen bezeichnet.

Im Venture-Capital-Sektor steht dieses Start-up bereits im Rampenlicht der Investoren. Es hat bisher fünf Runden von Finanzierungen durchgeführt, mit einem Gesamtbetrag von 381 Millionen US-Dollar (etwa 2,73 Milliarden Yuan). Der damalige Schätzwert betrug 9,1 Milliarden US-Dollar (etwa 65,2 Milliarden Yuan). Dabei haben Dell und Nvidia in mehreren Runden investiert.

▲Finanzierungssituation von VAST Data

Die von KI angetriebene Datenwachstum in bisher unerreichter Größe stellt höhere Anforderungen an die Infrastruktur für die Datenverarbeitung, was VAST Data, das sich auf die Erstellung von KI-Infrastruktur für die Datenverarbeitung konzentriert, Chancen für die Entwicklung bietet.

01. Mit Auftragswerten von 1 Milliarde US-Dollar, xAI, CoreWeave und Disney sind Kunden

Die vier Mitbegründer von VAST Data haben alle eine reiche Erfahrung im Speicherbereich.

CEO Renen Hallak, CTO Shachar Finblit, Vertriebsvizepräsident Jeff Denworth und CTO Alon Horev haben das Unternehmen gemeinsam im Jahr 2016 gegründet.

▲Die Mitbegründer von VAST Data: Jeff Denworth (links), Shachar Finblit (mitte), CEO Renen Hallak (rechts zweiter)

Hallak war zuvor als Vizepräsident für die Forschung und Entwicklung im Bereich des ganz-flash-basierten Unternehmensspeicherarrays XtremIO von Dell EMC tätig und hat von der Projektbeginn bis zum Erreichen eines Umsatzes von über 1 Milliarde US-Dollar beigetragen. Sowohl Finblit als auch Horev haben zuvor in Unternehmen wie IBM gearbeitet, und Denworth hat über 20 Jahre Erfahrung in der fortschrittlichen Computation und der skalierbaren Big-Data- und Cloud-Speicherung.

Damals hat Hallak in XtremIO die Herausforderungen bei der Datenspeicherung für die Massenanalyse mit KI erlebt, aber in der Abteilung von Dell keine ausreichenden Chancen gehabt, um seine Fähigkeiten auszuschöpfen. Daher hat er beschlossen, eine neue Architektur von Grund auf aufzubauen. Später haben er und die anderen drei Mitbegründer schnell eine Übereinstimmung erreicht.

Mit einem Satz zusammengefasst, ist das Geschäftsmodell von VAST Data, die Speicher-, Datenbank- und containerisierte Computation-Engine-Services in einer einzigen, skalierbaren VAST Data-Softwareplattform zu integrieren. Diese Plattform wurde von Anfang an für die KI- und GPU-accelerierten Tools in modernen Rechenzentren und in der Cloud konzipiert.

Konkret kann es die Echtzeitzugang zu unstrukturierten Daten wie E-Mails, Logs, PDF-Dateien und Multimedia-Inhalten ermöglichen. Indem es nicht-kritische Daten auf kostengünstigere Flash-Speicher verschiebt und schnellere und teurere Flash-Speicher für die GPU nutzt, kann die GPU während des Modelltrainings schnell auf eine große Menge von Daten zugreifen.

Dank des zunehmenden Bedarfs an KI haben viele Unternehmen im Bereich großer Modelle und führende Unternehmen in anderen Branchen VAST Data Angebote gemacht. Neben den im Anfang erwähnten beliebten Unternehmen wie xAI und CoreWeave im Bereich großer Modelle sind auch das von Nvidia investierte Cloud-Computing-Infrastrukturunternehmen Lambda und die Tochtergesellschaft Core42 der arabischen KI-Unternehmen G42, sowie NASA, das US-amerikanische Energieministerium, das Boston Children's Hospital und das Reiseunternehmen Booking Holdings Kunden von VAST Data.

▲Teil der Kundenliste von VAST Data

Im Gegensatz zu vielen Softwareunternehmen, die auf kurzfristige Verträge angewiesen sind, schließt VAST Data mit seinen Kunden Verträge mit einer Laufzeit von 5 bis 7 Jahren ab. Dies führt zu einer sehr geringen Kundenabwanderungsrate und einer akkumulierten Softwarebuchung von über 1 Milliarde US-Dollar (etwa 71,6 Milliarden Yuan).

Finanziell gesehen hat VAST Data bisher insgesamt über 381 Millionen US-Dollar an Kapital beschafft und hat einen Schätzwert von 9 Milliarden US-Dollar. Top-Investitionsinstitute wie Tiger Global und Goldman Sachs sowie führende Unternehmen wie Nvidia und Dell befinden sich auf der Liste seiner Investoren. Es ist erwähnenswert, dass diesmal das unabhängige Wachstumsfonds CapitalG von Alphabet an dieser Runde der Finanzierung beteiligt ist. Das Ziel dieses Fonds ist die Gewinnmaximierung, nicht die strategische Investition. Dies zeigt auch in gewissem Maße die Anerkennung der Rentabilität von VAST Data durch die Investoren.

Was ist also so Besonderes an den Produkten von VAST Data?

02. Speziell für die KI-Anforderungen entwickelt, eigenständige verteilte Systemarchitektur

Die effiziente Datenverarbeitung mit niedrigen Kosten ist eines der Schlüsselfaktoren für die Entwicklung von KI.

Die herkömmliche Datenspeicherung basiert auf der Hierarchie, wobei kostengünstige Speicherlösungen für die Langzeitspeicherung von Daten und hochwertige Lösungen für die häufiger genutzten Daten eingesetzt werden.

Aber die Schwierigkeiten bei der Datenverwaltung liegen darin, dass es in der herkömmlichen Architektur immer schwieriger wird, Daten im PB- oder sogar EB-Maßstab über globale Rechenzentren zu übertragen; die herkömmliche Datenarchitektur ist nicht für die heutigen Anforderungen von KI an riesige, vielfältige Datensätze und hohe Leistung bei zufälligen I/O-Vorgängen konzipiert; die gegenwärtigen Lösungen sind zu teuer, und Unternehmen müssen bei der Verwaltung und Aktivierung von Daten Kompromisse zwischen Leistung, Skalierbarkeit, Flexibilität und Kosten eingehen.

Daher ist es erforderlich, eine speziell für KI entwickelte Datenverarbeitungsarchitektur zu erstellen.

VAST Data hat die Hierarchie der herkömmlichen Speicherung beseitigt und strukturierte, halbstrukturierte und unstrukturierte Daten an einem Ort gespeichert, um die Datenabfrage zu beschleunigen und die Kosten für das Modelltraining und die Inferenz zu senken. Sein größter Vorteil besteht darin, dass die Tausende oder sogar Zehntausende von GPUs, die von xAI und CoreWeave eingesetzt werden, nicht aufgrund der Wartezeit auf die Speicherung inaktiv bleiben.

Wie haben sie dies erreicht?

Das Unternehmen hat die erste verteilte Systemarchitektur DASE (Disaggregated Shared-Everything) entwickelt. Als proprietäres Framework, das speziell für die KI-Anforderungen entwickelt wurde, integriert es die Speicher-, Computation- und Datenbankebenen in ein einziges, global konsistentes System. Im Gegensatz zu Anbietern von öffentlichen Clouds, die verschiedene Tools stapeln, beseitigt das KI-Betriebssystem von VAST Kompromisse bei der Leistung und unterstützt Echtzeitanalysen, rekursive Berechnungen und nahtlose Hybrid-Cloud-Betrieb.

Konkret ermöglicht die Entkopplung (Disaggregated) von DASE die Trennung von Datenspeicher und Computation-Ressourcen, so dass jede Komponente unabhängig und flexibel skaliert werden kann; das Konzept von „Shared-Everything“ bedeutet, dass Daten zwischen allen Speicherknoten zugänglich sind und gleichzeitig eine einheitliche Datenansicht für alle Knoten bereitgestellt wird.

Das auf dieser Architektur basierende VAST Data Platform kann ein Cluster von 10.000 GPUs unterstützen und pro Sekunde Daten im TB-Maßstab verarbeiten.

Das Betriebssystem VAST Data Platform besteht aus vielen Komponenten:

VAST DataSpace ermöglicht den Zugang, die Transaktion und den Schutz von Daten von der Edge bis zur Cloud und über Hunderte von Standorten hinweg, ähnlich wie ein globaler Ressourcenmanager eines Betriebssystems; VAST DataStore ist eine universelle Speicherplattform, vergleichbar mit dem Dateisystem eines Betriebssystems; VAST DataBase ist für die Indizierungsfunktion verantwortlich und kann verschiedene Funktionen wie Echtzeitabfragen und Datenanalysen bieten. VAST DataEngine spielt die Rolle einer dynamischen Computation- und Ausführungsebene, und VAST InsightEngine ist ein internes Datenaufbereitungstool, das mit KI-Einbettungsmodellen unstrukturierte Rohdaten in kontextbezogene Daten umwandelt und als RAG (Retrieval Augmented Generation)-Tool verwendet.

▲Die Architektur des KI-Betriebssystems von VAST Data

Im zweiten Halbjahr dieses Jahres wird VAST Data die letzte Komponente des Kernservices für das KI-Betriebssystem für die Datenverarbeitung hinzufügen: das AI-Agent-Bereitstellungs- und -Orchestrierungssystem VAST AgentEngine. Dies bedeutet, dass die Plattform von VAST Data nun die Fähigkeit hat, den gesamten Prozess von der Datenaufnahme, der Echtzeitspeicherung und der Datenbereitstellung für die Agenten, die Informationen suchen, zu integrieren.

Betrachtet man die konkreten Kooperationspartner, so hat xAI im Februar dieses Jahres die Supercomputer-Cluster Colossus mit über 200.000 Nvidia-GPUs angekündigt, deren Datenplattform von VAST Data entwickelt wurde. Dadurch wurde die Gesamtbetriebskosten (TCO) der KI-Arbeitslast von Colossus um 50 % gesenkt. Im September 2023 haben VAST Data und CoreWeave eine strategische Partnerschaft vereinbart. CoreWeave hat auf der Grundlage der Plattform von VAST Data die weltweit erste Nvidia-accelerierte Computation-Cloud aufgebaut, die in der Lage ist, die großen Mengen an Daten zu verwalten und zu schützen, die für generative KI, Hochleistungsrechnen (HPC) und visuelle Effekte (VFX) benötigt werden.

Das von VAST Data von Grund auf für die KI entwickelte System integriert die Speicher-, Datenbank- und virtualisierte Computation-Engine-Services. Dies zeigt auch, dass VAST Data angesichts der neuen Chancen in der KI-Branche seine ursprüngliche Position als Speicherunternehmen erweitert und sich