Lisa Su investiert in künstliche Intelligenz-Unicorn, das nur AMD-Rechenleistung verkauft

Der Unternehmenswert beträgt mindestens 34,1 Milliarden Yuan.

Nachrichten von Xin Dongxi vom 20. Mai. Laut einer Berichterstattung von Forbes gestern führt der amerikanische Entwickler von KI-Modellen, Zyphra, eine neue Runde von Finanzierungen über 500 Millionen US-Dollar (etwa 3,4 Milliarden Yuan) durch. Der amerikanische Chipriese AMD beteiligt sich ebenfalls an der Investition. Laut Insiderquellen wird der Unternehmenswert von Zyphra mindestens 5 Milliarden US-Dollar (etwa 34,1 Milliarden Yuan) betragen.

Zyphra wurde 2020 gegründet und entwickelt fortschrittliche Open-Source-KI-Modelle sowie bietet Cloud-Infrastrukturdienste. Die meisten KI-Labore verwenden standardmäßig Nvidia-Chips, während Zyphra sich vollständig auf die AMD-Sparte konzentriert. Die Modelltraining und -inferenz von Zyphra laufen auf AMD-Hardware, was nicht nur die Kosten senkt, sondern auch Vorteile in der Lieferkette mit sich bringt.

Zyphra Cloud ist eine neue Full-Stack-Cloudplattform, die von AMD technologisch unterstützt wird und speziell für KI-native Start-ups, Unternehmen und Spitzen-KI-Rechenzentren mit Supermasse entwickelt wurde.

Die Plattform basiert ursprünglich auf der AMD MI355X GPU und unterstützt die serverlose Inferenz von führenden Open-Source-Modellen. Sie wurde inzwischen auf die Bare-Metal-AMD-Infrastruktur erweitert und bietet zwei Hauptbereitstellungsmodi: Bare-Metal-GPU-Cluster, die nach Bedarf bereitgestellt werden und für flexible Workloads geeignet sind; sowie maßgeschneiderte Supermasse-AMD-Infrastrukturen, die für die Massenausführung von Training und Inferenz geeignet sind.

Derzeit ist die 15-Megawatt-Kapazität der MI355 in Betrieb.

In Zyphra Cloud bietet Zyphra Inference, die Inferenz-Cloud, produktionsreife Modellservices, die speziell für große MoE-Modelle und langlaufende Agenten-Workloads mit langer Kontextlänge sowie großen KV- und Prefix-Caches entwickelt wurden. Sie wird von der MI355X GPU in Zusammenarbeit mit TensorWave unterstützt und kann fortschrittliche Open-Source-Modelle wie Kimi-K2.6, DeepSeek-V3.2 und GLM-5.1 verarbeiten. Die Preise für die Modellservices lauten wie folgt:

Gestern gab Zyphra den Erscheinungstermin der ersten End-to-End-Benchmark-Ergebnisse für die auf der MI355X basierende Inferenz bekannt und erklärte, dass die Inferenzoptimierung deutlich besser als die AMD-Baseline sei und die Leistungslücke zwischen MI355X und B200 bei der Ausführung von Modellen wie Kimi K2.6, GLM-5.1 und DeepSeek-V3.2 verringert habe.

Die Optimierungen umfassen:

Baum-Attention: Eine balancierte baumartige Vereinfachung für die Langkontext-Attention

TSP: Beibehaltung der Modellparallelen Gruppen auf internen Knotenverbindungen

Optimierung über Kernel, HIP-Graph und RCCL

EAGLE-Spekulative Decodierung, die auf ROCm angepasst wurde

Eine längere Kontextzeit ermöglicht es, die Vorteile besser auszunutzen. Mit zunehmender Kontextzeit können TSP und die Baum-Attention-Mechanismen eine größere Leistungssteigerung erzielen und so die Lücke zu B200 verringern. Bei der Einzelanforderungs-Decodierung und TTFT führt B200 derzeit immer noch das Zyphra-Technologie-Stack und die AMD-Baseline voran, aber Zyphra sieht Wege, diese Lücke zu verringern.

Zyphra erklärt, warum es sich für die MI355X entschieden hat: Jede GPU ist mit 288 GB HBM3E ausgestattet, während die B200 nur 180 GB hat. Dies bedeutet mehr residente KV- und Prefix-Caches, größere Modelle, längere Kontexte, niedrigere Latenzzeiten und höhere Durchsatzraten.

Im Vergleich zur B200 hat die MI355X ein etwa doppelt so großes HBM-Speicherbudget pro Knoten bei Modellen wie GLM 5.1, DeepSeek-V3.2 und DeepSeek-V4-Pro (sofort bevorstehend).

Als nächstes plant Zyphra, DeepSeek-V4-Pro zu unterstützen, sich auf 1,6 T Parameter und 1 M Kontext zu erweitern, die Quantifizierung von Trainingsinformationen, Spekulatoren auf Diffusionsbasis sowie die Arbeit an Service-Engines voranzutreiben.

Das Unternehmen plant auch, die Unterstützung auf die nächste Generation von AMD-Plattformen zu erweitern, einschließlich der MI450-Serie und nachfolgender Produkte.

Dieser Artikel stammt aus dem WeChat-Account „Xin Dongxi“, geschrieben von ZeR0 und mit Genehmigung von 36 Kr publiziert.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Lisa Su hat in ein künstliche Intelligenz-Unicorn investiert, das ausschließlich AMD-Rechenleistung verkauft.