Cathay Capital leitet 1,03-Milliarden-US-Dollar-Seed-Runde von AMI Labs an

AI die Fähigkeit verleihen, die reale Welt zu verstehen

Am 10. März hat AMI Labs offiziell die Abschluss einer Seed-Runde von rund 1,03 Milliarden US-Dollar angekündigt, was die größte Seed-Runde in der Geschichte Europas ist. Diese Finanzierungsrunde wurde gemeinsam von der Cathay Innovation Fund des Cathay Capital, Greycroft, Hiro Capital, HV Capital und Jeff Bezos Expeditions geleitet. Darüber hinaus beteiligten sich Temasek, NVIDIA, Toyota Ventures, Samsung, die digitale Risikokapitalabteilung Bpifrance Digital Venture der französischen staatlichen Investitionsbank, Eric Schmidt, Tim Berners-Lee und andere an der Investition.

Cai Mingpo, Gründer und Vorsitzender des Cathay Capital, sagte: „Cathay Capital hat immer daran geglaubt, dass Technologien, die wirklich die Konjunktur überstehen können, schließlich in die reale Welt, in die Industrie und in die echten Bedürfnisse der Menschen zurückkehren müssen. Heute hat KI bereits in der Informationsverarbeitung und im Wissensarbeitsbereich ein enormes Potenzial gezeigt. Die größeren Chancen der Zukunft liegen jedoch darin, wie sie in komplexere und realistischere Systeme eindringen kann. Die Richtung, die AMI Labs erkundet, lässt uns sehen, dass KI von der ‚Fähigkeit zur Expression‘ zur ‚Fähigkeit zum Verständnis‘ und von der digitalen Welt in die reale Welt übergeht. Für Cathay Capital geht es nicht nur um die Fortgeschrittenheit der Technologie selbst, sondern auch darum, ob sie langfristig mit der Industrie und realen Szenarien kombiniert werden kann, um letztendlich nachhaltigen Wert zu schaffen. AMI Labs ist ein Team mit wissenschaftlichem Ideal, Ingenieurkompetenz und globalem Blickwinkel. Wir freuen uns, sie auf diesem längeren, schwierigeren, aber auch sinnvolleren Weg begleiten zu können.“

Was macht AMI Labs eigentlich?

Die KI hat in den letzten zehn Jahren bemerkenswerte Fortschritte erzielt. Vorhersage- und Generierungssysteme haben weltweit die Art und Weise verändert, wie wir Informationen analysieren, Wissen erwerben und Inhalte erstellen. Heute, wenn KI aus dem Bildschirm hinaus tritt, hört die Intelligenz nicht mehr einfach bei der Generierung von Ergebnissen auf. Sie muss die Situation verstehen, den Kontext behalten, die Ergebnisse vorhersagen und im Laufe der Zeit zuverlässigere Handlungen ausführen können.

Um dieses Ziel zu erreichen, wird AMI eine neue Generation von KI-Systemen entwickeln, die die Welt verstehen, ein langfristiges Gedächtnis haben, echte Schlussfolgerungen ziehen und Pläne erstellen können und end-to-end sicher und kontrollierbar sind.

AMI definiert sich als eine führende KI-Firma, die sich auf grundlegende Weltmodelle (foundational world models) konzentriert. Ihr Kernziel ist es, eine neue Art von Intelligenzsystemen zu entwickeln, die die Umgebung verstehen, den Kontext behalten, Schlussfolgerungen ziehen und Pläne erstellen können und in komplexen Einschränkungen stabil funktionieren.

Im technischen Ansatz ist die Richtung, die AMI verfolgt, mit der von Yann LeCun langfristig vertretenen JEPA (Joint Embedding Predictive Architecture) verwandt. Im Gegensatz zu großen Sprachmodellen, die auf der „Vorhersage des nächsten Tokens“ basieren, legt JEPA mehr Wert darauf, dass das System abstrakte Repräsentationen der realen Welt lernt und Zustandsänderungen und Ergebnisse im latenten Raum vorhersagt.

Wenn man sagt, dass große Sprachmodelle hauptsächlich mit bereits ausgedrückten Informationen - Texten, Bildern, Code und Sprache - umgehen, dann geht es bei AMI darum, wie KI eine interne Repräsentation der realen Welt bilden kann. Denn die reale Welt ist kein statischer Informationssammelpunkt, sondern ein dynamisches System, das ständig ändert, voller Rauschen und Rückkopplungen ist. Für solche Systeme ist die Schlüsselfrage nicht nur die „Generierung von Ergebnissen“, sondern auch das „Verständnis, wie sich der Zustand ändert, welche Konsequenzen Aktionen haben und wie man unter unsicheren Bedingungen kontinuierlich Entscheidungen trifft“.

Das ist genau der Sinn der Weltmodell-Richtung. AMI versucht, dass das Modell die abstrakte Struktur der realen Welt lernt, auf dieser Grundlage Kausalbeziehungen modelliert, die Systementwicklung vorhersagt und auf dieser Grundlage qualitativ höhere Planung und Durchführung unterstützt. Daher entspricht es nicht nur einem einzigen Verbrauchsgenerierungsszenario, sondern komplexen Anwendungsbereichen, die höhere Anforderungen an Zuverlässigkeit, Kontrollierbarkeit und Sicherheit stellen, wie z. B. industrielle Automatisierung, Robotik, Medizin und tragbare Geräte.

Warum hat AMI Labs plötzlich eine Sensation gemacht?

Der Grund, warum AMI Labs so schnell die weltweite Aufmerksamkeit erregt hat, liegt nicht nur darin, dass es „die größte Seed-Runde in Europa“ ist. Der tiefere Grund ist, dass es gleichzeitig drei Dinge trifft: Personen von hoher Bedeutung, eine sehr wichtige Richtung und sehr klare zeitgemäße Probleme.

1. Hinter dieser Firma stehen Personen, die selbst in der Lage sind, die Branchenrichtung zu bestimmen.

Das Gründerteam von AMI Labs kennt das Cathay Capital seit Jahren.

AMI Labs wurde von Yann LeCun, Preisträger des Turing-Awards und ehemaliger Chef-KI-Wissenschaftler von Meta, gegründet. Seit langem ist er einer der repräsentativsten Denker in Bezug auf die zentrale Frage, ob große Sprachmodelle ausreichen, um echte Intelligenz zu erreichen. In gewisser Weise ist AMI die technische Einschätzung, der Yann LeCun über Jahre hinweg treu geblieben ist, und dies ist das erste Mal, dass sie in Form einer Firma, eines Ingenieurprojekts und einer Kapitalisierung in den Vordergrund tritt.

Zugleich ist das Kernteam von AMI kein Einzelfall, sondern ein sehr kompaktes Team: Xie Saining, ein Top-Experte in der Grundlagenforschung der KI und alter Freund und Kollege von Yann LeCun an der Universität, hat sich offiziell als Chief Science Officer bei AMI angestellt;

Xie Saining ist ein absoluter Experte in der visuellen Repräsentationslernen und Mitautor des diffusion transformers (DiT). Die Einführung der DiT-Architektur hat es ermöglicht, dass visuelle Modelle wie große Sprachmodelle vom Skalierungsgesetz profitieren können. Durch die Ersetzung des seit zehn Jahren verwendeten U-Nets durch die Transformer-Hauptstruktur haben die Arbeiten von Xie Saining und anderen die Simulation von komplexen, hochauflösenden Bildern/Videos ermöglicht und die Grundlage für die Einführung von Spitzenvisuellen Generierungsmodellen und -tools wie Sora und SeedDance gelegt.

Der CEO von AMI ist Alexandre LeBrun. Er ist Absolvent der École Polytechnique und ein bekannter Serialunternehmer. Die von ihm gegründeten Unternehmen konzentrieren sich darauf, die Distanz zwischen „Grundlagenforschung und realer Welt“ zu verringern. LeBruns erstes Unternehmen, VirtuOz, war ein Unternehmensdialogroboter, das um 2002 gegründet wurde, als das Wort „KI“ noch weit davon entfernt war, ein beliebtes Schlagwort zu werden. Das Unternehmen wurde später von Nuance übernommen (Nuance wurde später in Microsoft integriert). Dann folgte Wit.ai, ein Unternehmen für natürliche Sprachverstehen, das 2015 von Facebook übernommen wurde. Anschließend trat LeBrun in Meta ein und leitete die Ingenieurarbeiten in FAIR Paris. Nach seinem Austritt gründete er Nabla (ein von Cathay Capital investiertes Unternehmen), das AI-Medizinassistenten entwickelt und eine beträchtliche Anzahl von Krankenhauskunden gewonnen hat.

Michael Rabbat, der für die Weltmodellforschung zuständig ist, wird das Büro von AMI in Montreal leiten. Rabbat ist einer der Gründungsmitglieder des ehemaligen FAIR Montreal Labs. Nach mehr als zehn Jahren Lehre an der McGill University trat er vollzeitlich bei Meta ein, wo er die Entwicklung der drei Weltmodellreihen I-JEPA, V-JEPA und V-JEPA 2 leitete. V-JEPA 2 ist die am weitesten verbreitete: Durch die selbstüberwachte Videotraining kann man mit weniger als 62 Stunden Roboterbedienungsdaten einen Roboterarm in einer völlig fremden Laborumgebung nullprobenmäßig steuern, um eine Greifaufgabe auszuführen. Die Kernlogik dieser Methode ist direkt mit der technischen Richtung des gesamten Unternehmens AMI verbunden.

Die CRIO (Chief Research and Innovation Officer) von AMI ist die bekannte chinesische Informatikwissenschaftlerin Feng Yan (Pascale Fung), Fellow von Top-Akademien wie AAAI, IEEE und ACL und Lehrstuhlinhaberin an der Hong Kong University of Science and Technology. Sie wurde in Shanghai geboren und hat an der Kyoto University, am französischen Nationalen Forschungsinstitut und an der Columbia University studiert. Ihre späten Arbeiten bei Meta FAIR befassen sich mit Embodied AI und visuell-sprachlichen Weltmodellen, deren Hauptanwendungsbereich intelligente Brillen sind.

Vor seinem Eintritt bei AMI hat Laurent Solly lange Zeit bei Meta für die Geschäfte in Frankreich, Südwesteuropa und Europa verantwortlich gewesen und hat auch bei der TF1-Gruppe und im französischen öffentlichen Sektor gearbeitet. Daher verfügt er über selten anzutreffende Erfahrungen in der Organisation, im grenzüberschreitenden Betrieb und in der Verbindung zwischen der europäischen Industrie und der öffentlichen Ökosystem.

Die Seltenheit dieses Teams liegt darin, dass es zum ersten Mal Spitzenforschung, Systemingenieurwesen und globale Organisationsfähigkeiten in einem einzigen Rahmen vereint. Dies ist auch der Unterschied zwischen AMI und vielen anderen Spitzenprojekten, die zwar stark in der Forschung sind, aber noch weit von der realen Umsetzung entfernt sind.

2. Es beobachtet eine stattfindende Fähigkeitswanderung.

In den letzten zwei Jahren haben große Modelle bewiesen, dass Maschinen die Effizienz der Informationsverarbeitung enorm verbessern können: Schreiben, Zusammenfassen, Fragen und Antworten, Programmieren, Suchen, Schaffen … alle diese Aufgaben finden im Wesentlichen in der digitalen Welt statt. Aber wenn KI in Bereiche wie Robotik, Fertigung, Experimentierprozesse, industrielle Systeme und Infrastruktur eindringen soll, ändert sich die Situation grundlegend.

Das System darf nicht nur „antworten“ können, sondern auch Zustände beurteilen, den Kontext behalten, Folgen ableiten, mehrschrittige Aktionen planen und in einer umgebung mit Rauschen und Einschränkungen kontinuierlich funktionieren. Mit anderen Worten, um in die reale Welt einzudringen, muss KI von der „Fähigkeit zur Generierung“ zur „Fähigkeit zum Verständnis, zur Ableitung und zur Handlung“ übergehen.

Die Weltmodell-Richtung von AMI ist wichtig, weil sie diese Frage direkt adressiert. Es geht nicht darum, die Sprachfähigkeiten weiter zu verbessern, sondern darum, wie Maschinen eine interne Erkenntnisstruktur der realen Welt bilden können.

3. AMI bringt eine Richtung, die lange Zeit nur in der akademischen Diskussion stand, erstmals ernsthaft auf den Markt.

Dies ist auch der Unterschied zwischen AMI und vielen anderen KI-Unternehmen, die „erst das Konzept, dann die Realität“ verfolgen. AMI zeigt dem Markt auf sehr konkrete Weise, dass diese Richtung langfristige Forschung, globale Talente, ein aufwändiges Ingenieurwesen und geduldiges Kapital erfordert.

Seit seiner Gründung hat es in Paris, New York, Montreal und Singapur gleichzeitig Standorte geschaffen; die Liste der Investoren umfasst auch Finanzkapital, Industriekapital und wichtige Persönlichkeiten aus der Technologiebranche. Die Zusammensetzung, einschließlich des Cathay Capital, ist selbst ein Signal: Der Markt unterstützt nicht nur ein „interessantes neues Konzept“, sondern eine Richtung, die die grundlegenden Fähigkeiten der nächsten Generation von KI möglicherweise beeinflussen kann.

Was ist nach den großen Modellen näher an der realen Intelligenz?

Was AMI jedoch in der Fachwelt wirklich zu Diskussionen anregt, ist die grundlegende Frage dahinter: Was ist nach den großen Modellen die Richtung, die näher an der „realen Intelligenz“ liegt?

Die Antwort, die Yann LeCun und AMI repräsentieren, ist sehr klar: Echte Intelligenz beginnt nicht mit der Sprache, sondern mit der Welt. Auf der offiziellen Website von AMI steht sogar direkt: „Real intelligence does not start in language. It starts in the world.“

Dies bedeutet nicht, dass Sprache unwichtig ist, sondern dass Sprache im Wesentlichen nur ein Abbild der Welt ist. Wenn Maschinen nur lernen, mit dem Abbild umzugehen, ohne die Welt selbst zu verstehen, werden ihre Fähigkeitsgrenzen in der realen Umgebung schnell sichtbar.

Mit anderen Worten, große Sprachmodelle haben die KI in eine Zeit der Massennutzbarkeit gebracht; die Weltmodelle hingegen bringen die KI von der „Fähigkeit zur Expression“ zur „Fähigkeit zum Verständnis, zur Ableitung und zur

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Cathay Capital führt die 1,03 Milliarden US-Dollar große Seed-Runde von AMI Labs an.