StartseiteArtikel

Nvidia-CEO Jensen Huang: Nvidia baut jedes Jahr neue "KI-Fabriken", KI-Leistung steigt jährlich um das 2- bis 3-fache | Frontline

田哲2024-10-16 19:46
Der Grund für die Verdoppelung der Leistung ist der Aufbau eines gesamten Rechenzentrums und einer KI-Fabrik von Anfang bis Ende sowie die Entwicklung von Software.

Text | Tian Zhe

Bearbeitung | Su Jianxun

Am 16. Oktober veranstaltete Lenovo in Seattle, USA, die „Lenovo Tech World“, auf der eine Reihe neuer Produkttechnologien und Kooperationsdynamiken angekündigt wurden.

Unter anderem gab Lenovo bekannt, dass die Zusammenarbeit mit NVIDIA ausgeweitet und der Hybrid-AI-Suite sowie der flüssigkeitsgekühlte AI-Server GB200 – ThinkSystem SC777 – gemeinsam vorgestellt wurden.

Der CEO der Lenovo Group, Yang Yuanqing, erklärte, dass die Hybrid-AI-Suite eine End-to-End-AI-Plattform sei, die Unternehmen bei der Umsetzung von AI voranbringen, Prozesse optimieren, bessere Entscheidungen treffen und die Produktivität steigern könne.

Er erklärte weiter, dass das ThinkSystem SC777 mit dem NVIDIA Grace Blackwell GB200 ausgestattet sei, das zu 100 % auf Wasserkühlung setze und somit ohne Lüfter oder Rechenzentrums-Klimaanlage auskomme. Das System kann in Standard-Racks installiert und mit Standard-Stromversorgungen betrieben werden, sodass Kunden nur ein Tray kaufen müssen.

Auf der Veranstaltung führten Yang Yuanqing und der NVIDIA-CEO Jensen Huang ein Gespräch. Huang meinte, intelligente AI-Agenten könnten überall unterwegs sein, um Benutzern bei verschiedenen Aufgaben zu helfen, und er hoffe, jedes Jahr Milliarden solcher AI-Agenten herzustellen.

Er erwartet, dass jedes Unternehmen in der Lage sein wird, große Sprachmodelle einzuführen und sie in seine eigenen Agenten umzuwandeln, um spezifische Aufgaben auszuführen. Um diesem Kundenbedürfnis gerecht zu werden, könne NVIDIA bei jährlich zunehmender AI-Leistung die Kosten, die Arbeitslast und den Energieverbrauch von AI senken und gleichzeitig die Einkommensmöglichkeiten von AI verbessern.

Der Grund dafür ist, dass NVIDIA in der Lage ist, ein gesamtes Rechenzentrum und eine AI-Fabrik von Ende zu Ende zu bauen und Software von Grund auf zu entwickeln, wodurch jedes Jahr neue AI-Fabriken gebaut werden können, um die Leistung zu verdoppeln, die Kosten zu senken und die Entwicklung von AI zu beschleunigen und zu demokratisieren.

Huang bezeichnet die von ihm erwähnte AI-Fabrik als neuartige Rechenzentren. Laut der offiziellen Website von NVIDIA arbeiten an mehreren Standorten Unternehmen mit NVIDIA zusammen, um traditionelle Rechenzentren in beschleunigte Computerressourcen umzuwandeln und AI-Fabriken für die Entwicklung von künstlicher Intelligenz zu errichten.

Im Folgenden finden Sie das Gespräch zwischen Yang Yuanqing und Jensen Huang, bearbeitet von 36Kr:

Yang Yuanqing: Guten Nachmittag! Vielen Dank an alle für Ihr anhaltendes Interesse und Ihre Unterstützung unserer unternehmerischen AI-Lösungen. Lassen Sie uns kurz zurückblicken: Heute haben wir unser Verständnis der Zukunft von Hybrid-AI geteilt, unsere Innovationen im Personal- und Unternehmens-AI-Bereich demonstriert und vor allem unsere Vision von „Smarter AI for All“ bekräftigt. Und das alles wäre ohne einen sehr wichtigen Partner nicht möglich. Begrüßen wir NVIDIAs CEO Jensen Huang! 

Jensen Huang: Danke, Yuanqing! Ich freue mich, hier zu sein.

Yang Yuanqing: Auf der letztjährigen Tech World haben wir über Hybrid-AI gesprochen und seitdem haben beide Seiten große Fortschritte gemacht. Das Publikum würde sicherlich gerne deine Meinung dazu hören. Was denkst du, was der nächste Schritt für Hybrid-AI ist? Wie sieht es mit der Kundenadoption aus? 

Jensen Huang: Zunächst einmal, es ist eine Freude, wieder hier zu sein und gemeinsam mit unserem Partner Lenovo einige wichtige neue Initiativen anzukündigen. Yuanqing und ich kennen uns schon lange, wir sind praktisch von klein auf Freunde. Wir haben gemeinsam mehrere Computerrevolutionen erlebt; zuerst die PC-Revolution, dann die Internet-Revolution und später die Mobile-Cloud-Revolution. Und jetzt sind wir dabei, die gesamte Computerarchitektur in einem nie dagewesenen Umfang neu zu gestalten. 

Was früher „Programmierung“ genannt wurde, ist nun „maschinelles Lernen“ geworden. Programmierung wurde auf CPU-Ebene durchgeführt, während maschinelles Lernen auf GPU-Ebene geschieht. Das Unglaubliche daran ist, dass Programmierung Software hervorgebracht hat, die eine riesige Branche befeuert hat, und jetzt schafft maschinelles Lernen künstliche Intelligenz, die die größte industrielle Revolution unserer Zeit sein wird. In den letzten 12 Monaten haben wir in allen Branchen bemerkenswerte Fortschritte gesehen, und jedes Unternehmen, jede Branche und jedes Land erkennt, dass ihre digitale Intelligenz und Daten in die Datenintelligenz ihres Unternehmens, ihrer Branche oder ihres Landes umgewandelt werden können. 

Natürlich ist ein großes Ereignis, das kürzlich stattfand, das große Modell Llama 3, das von Mark Zuckerberg erwähnt wurde. Es hat das Spiel wirklich verändert. Durch Llama 3 hat jetzt jedes Unternehmen die Möglichkeit, auf AI zuzugreifen, solange sie die notwendige Infrastruktur und Architektur besitzen. Mit AI-Computern, AI-Infrastruktur und einer sehr entscheidenden Software-Stack können wir große Modelle in künstliche Intelligenz umwandeln. Künstliche Intelligenz hängt eng mit großen Modellen zusammen. Wir brauchen große Sprachmodelle, brauchen sehr komplexe große Sprachmodelle und Technologien, aber (sollten daran denken, dass) große Sprachmodelle ein wichtiger Bestandteil der künstlichen Intelligenz sind. Was wir in der Präsentation gesehen haben, ist die vollständige Architektur, die wir als Unternehmen und Partner gemeinsam entwickelt haben, um die notwendige Infrastruktur, Software-Stacks sowie Best Practices und Blaupausen zu entwickeln. Auf diese Weise können wir große Sprachmodelle in Agenten umwandeln, die uns wirklich bei der Erledigung von Aufgaben helfen.

Yang Yuanqing: Was ist also Ihre Meinung zu AI-Agenten und physischen AI-Agenten?

Jensen Huang: Was AI-Agenten betrifft, meine Damen und Herren, bei künstlicher Intelligenz hoffen wir, Millionen, sogar Milliarden solcher AI-Systeme zu produzieren. Bei NVIDIA nennen wir diese „kleine Jensen-Spielzeuge“ (Toy Jensens). Sie werden sich überall hinbewegen und Ihnen bei verschiedenen Aufgaben helfen. Was auch immer Sie tun müssen, wird es ermöglichen. In einem umfassenderen Sinne ist künstliche Intelligenz im Wesentlichen Robotertechnik.

In Zukunft wird es digitale Roboter geben, die wir als Agenten bezeichnen. Sie werden in der Lage sein, Ihre Anweisungen zu verstehen, die Bedeutung der Anweisungen zu erfassen, sie in spezifische Aktionen aufzuteilen, Werkzeuge zu verwenden, Fachinformationen oder beliebige zugängliche Informationen abzurufen, Aufgaben zu erfüllen und bei Bedarf Maßnahmen zu ergreifen. Sie können wahrnehmen, schlussfolgern und handeln – dieser grundlegende Kreislauf ist der Kernzyklus der Robotik. Daher haben wir Informationsroboter, die wir als Agenten bezeichnen.

Wir werden auch physische Roboter haben. Diese physischen Roboter sind im Wesentlichen AI, die die physische Welt verstehen. Außerdem haben wir AI-Agenten, die die Informationswelt verstehen. Diese beiden Arten von AI – AI-Agenten und physische AI – werden die Grundlage der globalen Industrie sein. Wir werden Kollegen-AI haben, die möglicherweise im Marketing sehr gut sind, oder in unserem Unternehmen in der Lage sind, Chips zu entwerfen, Software zu programmieren, zu verifizieren oder Agenten zu erstellen, um unsere Lieferketten zu verwalten.

Diese Agenten arbeiten mit all unseren Mitarbeitern zusammen, um unsere Produktivität erheblich zu steigern. Im Wesentlichen wollen wir „Superman-artige“ Produktivität erreichen, nicht wahr? Daher wird allen Mitarbeitern sofort Unterstützung von diesen Agenten zur Verfügung gestellt, um die Produktivität zu steigern. Als Nächstes werden wir dies tun. Die größte Chance liegt in der industriellen AI, die mit Robotertechnik verbunden ist, und wir arbeiten mit Lenovo in diesem Bereich zusammen. 

Yang Yuanqing: Bei AI-Agenten und physischen AI sehe ich auch die gleichen Trends. Um diese Chance zu ergreifen, werden Lenovo und NVIDIA heute eine bedeutende Ankündigung machen, nämlich die „Lenovo Hybrid Artificial Intelligence Advantage Suite“. 

Es handelt sich dabei um eine End-to-End-AI-Plattform für die Entwicklung und Bereitstellung von AI in der neuen Ära. Es basiert auf branchenführender Infrastruktur, einschließlich AI-Geräten, AI-Servern, Speichern sowie Edge-Computing, Public Cloud und Private Cloud, wo Unternehmen ihre Daten speichern, bereinigen und organisieren. Datenalgorithmen und beschleunigte Computing-Fähigkeiten treiben die Umsetzung von AI in Unternehmen voran, um Prozesse zu optimieren, bessere Entscheidungen zu treffen und die Produktivität zu steigern.

In all diesen Bereichen spielt der Service eine wichtige Rolle – das Design, die Bereitstellung, Erweiterung und Wartung der Infrastruktur über den gesamten Lebenszyklus hinweg, die Verbesserung der Datenanalyse- und Governance-Fähigkeiten, die Beratung und Optimierung von AI-Modellen sowie die Erweiterung des AI-Software-Ökosystems für Kunden. Daher bieten wir zusätzlich zum Konzept der hybriden AI-Fabrik die Lenovo AI Application Library. Unsere Strategie ist es, Modularität mit Kundenspezifischer Anpassung zu kombinieren, um schnell auf die Bedürfnisse der Kunden zu reagieren und maßgeschneiderte Lösungen für sie zu entwickeln.

All diese Bereiche zusammen bilden das vollständige System der „Hybrid Artificial Intelligence Advantage Suite“, die gemeinsam von Lenovo und NVIDIA entwickelt wurde. Wir werden gemeinsam daran arbeiten, die „Hybrid Artificial Intelligence Advantage Suite“ weiter zu entwickeln und zu perfektionieren. Möchten Sie mehr darüber erzählen, wie die Technologie von NVIDIA hilft, diese Plattform aufzubauen?

Jensen Huang: Yuanqing, als wir uns das erste Mal trafen, war die PC-Revolution im Gange. Die PC-Architektur war damals recht einfach, mit CPU, Betriebssystem und Anwendungen. Natürlich war dieses Computermodell damals revolutionär, aber im Vergleich zu heute war es sehr einfach. Die Entstehung der künstlichen Intelligenz hat sehr lange gedauert, weil sie äußerst komplex war. Die gesamte Architektur umfasst einen echten Supercomputer als Recheninfrastruktur, die Algorithmen und verteiltes Computing in NVLink/Switch-, InfiniBand- oder Spectrum-X-Netzwerken betreibt. Diese verteilten Rechenfähigkeiten werden durch sehr komplexe Software realisiert und effizient gemacht. 

Das ist also der Computer. Aber darüber hinaus sind große Sprachmodelle, die das neue Betriebssystem der AI-Welt darstellen könnten, erforderlich. Darüber hinaus gibt es viele andere Anwendungsbibliotheken. Diese Anwendungsbibliotheken helfen in einfacher Weise, einen neuen AI-Kollegen einzuarbeiten. Er ist ein AI-Kollege, der die Arbeit ausführen soll, und Ihre Aufgabe besteht darin, Daten zu erstellen, um die AI zu korrigieren und ihr bei der Einführung zu helfen. Er ist Ihr AI-Agent, und Sie müssen ihm sehr spezifische Fähigkeiten beibringen. 

Sie werden ihnen Informationen bereitstellen, damit sie ihre Arbeit erledigen können. Bewerten Sie sie, wie Sie es bei einem Mitarbeiter tun würden. Implementieren Sie sie, stellen Sie sicher, dass sie funktional abgesichert sind, stellen Sie sicher, dass sie die Funktionen ausführen, die ihnen beigebracht wurden. Und Blackwell ermöglicht es den Agenten, im Laufe der Zeit besser zu werden. Diese gesamte Anwendungsbibliothek ist vollständig beschleunigt und läuft auf GPUs. 

Das macht es für jedes Unternehmen möglich, große Sprachmodelle zu integrieren und sie in eigene Agenten umzuwandeln, um spezifische Aufgaben auszuführen, die Sie von ihnen erwarten, wie z.B. Kundenservice, AI-Datenbankabfragen und viele andere Anwendungen.

Yang Yuanqing: NVIDIA bietet dazu in der Tat viel Wert auf verschiedenen Ebenen mit entsprechenden Plattformen. (Unser Ziel ist es, den höheren Zielsetzungen der Kunden gerecht zu werden – sie erwarten nicht nur mehr leistungsfähige beschleunigte Computing-Fähigkeiten, sondern versuchen auch, ihre Effizienzziele zu erreichen. Wie hilft NVIDIA dabei, diese Art von Kundenanforderungen zu erfüllen?

Jensen Huang: In der frühen Phase der neuen Computerrevolution ist es Ihr bester Ansatz, Ihre Roadmap zu beschleunigen. Der Grund ist folgender: Wenn die Leistung sich jährlich verdoppeln oder verdreifachen kann – und dies geschieht jedes Jahr – können wir die Kosten von AI, die Arbeitslast und den Energieverbrauch effizient senken und gleichzeitig die Einkommensmöglichkeiten von AI erhöhen. Diese neuen Computer entsprechen hocheffizient arbeitenden Fabriken.

Im Gegensatz zu Rechenzentren, die lediglich Dateien speichern, sind diese Rechenzentren AI-Fabriken, die Token produzieren. Sie möchten, dass die Produktion von Token – diese Token sind tatsächlich künstliche Intelligenz – so hoch wie möglich ist.

Wenn wir die Geschwindigkeit jedes Jahr verdoppeln oder verdreifachen können, können wir Ihnen helfen, Kosten zu senken und den Umsatz zu steigern. Das ist wichtig. Wir haben diese Fähigkeit, weil wir von Ende zu Ende die gesamte AI-Fabrik aufgebaut haben, von CPU, GPU, NVLink/Switch, InfiniBand-Switch, Netzwerkkarten bis hin zu Ethernet-Switches und Netzwerktechnologien.

Wir haben die Fähigkeit, ein vollständiges Rechenzentrum und eine AI-Fabrik von Ende zu Ende zu entwickeln, und wir sind auch in der Lage, Software von Ende zu Ende und von Grund auf neu zu entwickeln. Deshalb bauen wir jedes Jahr neue AI-Fabriken, die die Leistung multiplizieren und die Kosten senken, um die Entwicklung von AI zu beschleunigen und demokratisieren.

Yang Yuanqing: Unsere gesamten F&E-Teams haben die Mission, für Nachhaltigkeit zu entwickeln. 

Jensen Huang: Heute ist Geschwindigkeit Nachhaltigkeit, Geschwindigkeit ist Ausdruck, Geschwindigkeit ist Energieeffizienz.

Yang Yuanqing: Ohne Zweifel, NVIDIA hat in Bezug auf Nachhaltigkeit hervorragende Arbeit geleistet. Lenovo hat auch Kerntechnologien mitgebracht. Unsere führende Position in der Flüssigkeitskühlungstechnologie reicht inzwischen zehn Jahre zurück, jetzt bei der sechsten Generation, nämlich unserer Neptune-Flüssigkeitskühltechnologie. Lassen Sie uns nun ein Produkt mit dem Neptune-Flüssigkeitskühlungssystem der sechsten Generation zeigen.

Jensen Huang: Natürlich, bitte. Weißt du, Yuanqing, all die Jahre der Bemühungen von Lenovo beim Bau von Hochleistungsrechnern haben sich gelohnt, oder nicht? 

Yang Yuanqing: Ja, natürlich. Wir haben über ein Jahrzehnt in die Forschung an der Wasserkühlungstechnologie investiert. Dies ist das von Lenovo entworfene ThinkSystem SC777, ausgestattet mit dem NVIDIA Grace Blackwell GB200. Es ist zu 100 % wasserkühlungsbasiert, sodass keine Lüfter oder spezielle Rechenzentrumsklimaanlagen benötigt werden. Das System kann in Standard-Racks installiert und mit Standardstromquellen betrieben werden, sodass Kunden jeweils nur ein Tray kaufen müssen. Es umfasst auch die NVIDIA NVLink-Verbindungstechnologie und unterstützt NVIDIA Netzwerk- und NVIDIA AI Enterprise-Software. Was denkst du darüber?

Jensen Huang: Stimmt, das ist wirklich schön, für einen Ingenieur ist das sehr attraktiv.

Yang Yuanqing: Danke, Jensen. Danke für die wichtige Zusammenarbeit zwischen uns. Neben der Zusammenarbeit im Bereich unternehmensorientierter Rechenzentren arbeiten wir auch mit NVIDIA im Bereich Fahrzeugcomputing zusammen, um die neue NVIDIA DRIVE AGX Thor-Plattform, die auf der Blackwell-Architektur basiert, einzuführen. Lassen Sie uns nun mit Jensen Lenovo's smarteren und leistungsstärkeren AI-Compute-DPU präsentieren.

Jensen Huang: Yuanqing, wissen Sie, wie erstaunlich das ist? Der gleiche Aufbau wie bei diesem Computer gilt für diesen Computer. Dieser Computer wird genutzt, um das „Gehirn“ zu erschaffen, das auf diesem Computer läuft. Denn Autos sind die weltweit am weitesten produzierten Roboter.

Yang Yuanqing: Ja, genau, Roboter auf Rädern.

Jensen Huang: Sie können die Welt wie Roboter wahrnehmen, Handlungsstrategien entwickeln und das Lenkrad steuern. Daher werden sie die weltweit am weitesten produzierten Roboter sein. In der Zukunft werden wir jedoch alle möglichen robotischen Systeme haben, und dieser spezielle Computer kann für alle diese Systeme verwendet werden. Also ja, sehr aufregend. Vielen Dank.