Der Wettlauf um AI-Talente: Frischgebackene Doktoranden erhalten ein Jahresgehalt von 5 Millionen Yuan.
„Ein großer Konzern hat im vergangenen Jahr mehrere Dutzend frisch promovierte Doktoranden mit einem Jahresgehalt von über drei Millionen Yuan eingestellt. Die Spitzenkräfte wurden mit fünf- bis sechs Millionen Yuan umworben, noch extremer als die "Genius-Jugendlichen" von Huawei damals.“
Xiao Mafeng, Gründer der AI-Talentbeschaffungsplattform TTC, sagte Pencil News, dass die Personalverantwortlichen großer Konzerne an einigen Spitzenuniversitäten auf der Suche nach jungen Talenten für ihre AI-Projekte waren.
Meta bot einem Forscher von OpenAI eine Signierprämie von einer Milliarde US-Dollar an, zusätzlich zum Gehalt, um ihn zu gewinnen.
Kürzlich hat Lin Junyang, der Technologieverantwortliche von Qwen, Alibaba verlassen. Die Medienbeobachtung dieser Angelegenheit war vergleichbar mit den unablässigen Berichten über die Spielertransfers in den Sportseiten großer Zeitungen Ende August jedes Jahres.
Heute werden Spitzen-AI-Forscher wie Topfußballer umworben und beobachtet. Es ist das erste Mal, dass Wissenschaftler zu Prominenten werden. Sie verdienen auch weit mehr als ihre Vorgänger.
01 2,7 Milliarden US-Dollar für Talentgewinnung
Im August 2024 hat Google 2,7 Milliarden US-Dollar ausgegeben, um das Chatbot-Unternehmen Character.AI zu erwerben.
Der Schätzwert dieses Unternehmens lag bei etwa einer Milliarde US-Dollar.
Google war bereit, einen Aufschlag zu zahlen, nicht wegen eines Superpatents des Unternehmens, sondern um zwei Personen zu gewinnen.
Die Gründer des Unternehmens, Noam Shazeer und Daniel De Freitas.
Die Bedingung von Google für den Kauf war, dass sie sich sofort packten und zurück nach Google kamen, um zu arbeiten.
Insbesondere Shazeer ist eine unverzichtbare Figur auf dem Weg der Entwicklung von Large Language Models (LLMs).
2017 war er als Kernbeteiligter an der Schreibung des berühmten Papers "Attention Is All You Need" beteiligt. In diesem Paper wurde eine völlig neue Modellstruktur (Transformer) vorgeschlagen.
Heute basieren fast alle bekannten LLMs wie GPT, Gemini und Claude auf dieser Struktur.
2021 verließ er Google mit Ärger und gründete Character.AI, weil Google aus Risikobedenken nicht zuließ, dass er den Chatbot Meena veröffentlichte.
Drei Jahre später kaufte ihn Google zurück, und er wurde einer der drei Kernleiter von Google DeepMind und leitete die Entwicklung des neuen Gemini-Modells.
Es ist offensichtlich, dass seit der Veröffentlichung von Gemini 2.5 Pro im Jahr 2025 die Modelle von Google mit denen von GPT konkurrieren können und nicht hinterherhinken.
Das heißt nicht, dass alles Shazeers Verdienst ist. Es soll eher verdeutlichen, dass bei der Entwicklung von AI-LLMs ein akademischer "Seelenmann" möglicherweise die Obergrenze des Modells anheben kann. Dies sollte für Fußballfans gut verständlich sein.
02 Steigerung der Erfolgschancen
„Man kann Leute wie Lin Junyang nicht als traditionelle Ingenieure betrachten. Einmal drückt er auf Enter, und je nachdem, ob es klappt oder nicht, fließen Millionen Yuan draußen.“
Wang Tiezhen, der Leiter von Hugging Face in China und ein erfahrener Ingenieur, sagte Pencil News, dass der Wert von Spitzen-AI-Forschern nicht in der Umsetzung, sondern in der Entscheidungsfindung liegt.
Beim Training eines LLMs, angefangen von der Auswahl des Modells (A oder B), der Festlegung der Architektur bis zur Auswahl der Daten, kostet jeder Schritt Geld, oftmals Millionen Yuan. Die Entscheidungen werden oft von einer Person getroffen. Wenn die Entscheidung richtig ist, entsteht ein gutes Modell; wenn sie falsch ist, kann das Geld einfach dahin gehen.
„Die meisten Ingenieure haben nur kleine Modelle trainiert und keine Erfahrung mit Supergroßskalentraining. Sie haben keine vollständige Erfahrung von 0 bis 1. Spitzenkräfte wissen, wie man Daten einsetzt und wie man ein LLM tatsächlich trainiert. Sie haben Erfahrungen in RL (Reinforcement Learning), Alignment und Inferenzmodellen und wissen, ob ein Weg gangbar ist. Solche Erfahrungen kann man nur machen, wenn man es gesehen hat.“
Außer Erfahrung ist auch die technische Sensibilität auf wenige Menschen beschränkt. Wang Tiezhen erklärte: „Wenn eine Person keine klare Einschätzung der Zukunft hat, sind seine Entscheidungen eingeschränkt. Viele wichtige Signale liegen ihm vor, aber er kann sie möglicherweise nicht erkennen. Beispielsweise bemerkte Dario Amodei bei Baidu damals das Phänomen des intelligenten Emergens und das Scaling Law. Später wurde dies öffentlich veröffentlicht, aber die anderen hatten nicht die Sensibilität, um zu verstehen, was dies bedeutet. Wer den Wert davon erkennt, kann genügend Ressourcen finden, um diese Vorhersage umzusetzen.“
Im Vergleich zum Internet der Vergangenheit ist die AI ein Bereich mit hohem Kapitalaufwand. Die Kosten für die Anschaffung von GPUs und Rechenleistung sind immens. Meta hat schätzungsweise 600.000 NVIDIA-GPUs, Microsoft 300.000 bis 500.000 und Google auch Hunderttausende. Diese großen Konzerne geben jährlich mindestens 30 Milliarden US-Dollar für diese Dinge aus. Laut Schätzungen der Branche kostet das einmalige Training eines Modells auf GPT-4-Niveau mehrere hundert Millionen US-Dollar.
An wen traut man sich so ein "Schwergewicht" zu geben? Ein Qian Xuesen ist fünf Divisionen wert, und das ist genau der Sinn. Selbst wenn man Spitzen-AI-Forschern hohe Gehälter zahlt, ist es im Vergleich zu den Kosten für die Anschaffung von GPUs und Cloud-Rechenleistung nur ein Bruchteil.
Warum war es in der traditionellen Internetzeit nicht so, dass ein Unternehmen so stark von wenigen Prominenten abhängt? Wang Tiezhen erklärte, dass Internetprodukte im Wesentlichen durch das Engineering-System und die Benutzerzahl gewinnen. Man kann das Produkt während der Sammlung von Benutzerdaten anpassen. Beim Training eines LLMs ist es wie bei der Herstellung einer Atombombe. Es gibt keine unendlichen Experimente, nur eine begrenzte Anzahl von Maschinen und Versuchsmöglichkeiten. Man muss die Personen finden, denen man am besten vertraut.“
Xiao Mafeng hat ähnliche Situationen auch bei seiner Tätigkeit als Headhunter für die Immobilienbranche gesehen. „Einige Immobilienunternehmer bieten gelegentlich Jahresgehälter von zwei- bis drei Millionen Yuan (für die Leitungspositionen), und das in bar. Viele finden das extrem, aber für sie ist der Mensch nicht die größte Kostenfaktor. Die größte Kostenfaktor ist das Kapital. Ein Projekt erfordert eine Investition von mehreren Milliarden Yuan. Bei so großen Investitionen ist die Erfolgschance sehr wichtig, daher ist es wichtig, die richtigen Leute zu finden.“
Szenenausschnitt aus "Moneyball"
Im harten Wettbewerb der LLMs ist die Investition in Prominenten-Forscher auch eine Investition in die Erfolgschance.
03 Der Star-Effekt
„Leute wie Lin Junyang sind der Ausgangspunkt für die Aufbau eines Teams. Wie viel kostet die Anschaffung von Hardware und GPUs? Alle Investitionen erwarten eine Rendite, das heißt, es muss jemand hinterher zahlen. Ein Projekt mit hohem Kapitalaufwand hat eine sehr hohe Sunk-Cost und die zukünftigen Investitionen sind sehr ungewiss. Wenn es Prominente gibt, sind diejenigen, die später mit hohen Preisen investieren, eher bereit, Geld auszugeben. Technisch gesehen gibt es bereits replizierbare Erfahrungen.“
Ein Technologieverantwortlicher eines großen Konzerns sagte Pencil News, dass die Erfahrungen von Prominenten-Forschern wie eine Bürgschaft für das Unternehmen wirken.
Es gibt ein Gerücht. Ein Hardwarehersteller A hat einen großen LLM-Experten von einem bekannten LLM-Unternehmen geholt. Genau in dem Moment, als Firma A finanzierte, wurde die Finanzierung nach der Ankunft des Experten sehr glatt, und bald wurde eine neue Finanzierungsrunde von mehreren Millionen Yuan angekündigt. Der Experte blieb jedoch nur kurz bei Firma A und wechselte dann zu einem anderen Konzern. Obwohl man nicht bestätigen kann, dass Firma A den Experten wegen der Finanzierung geholt hat, hat Firma A tatsächlich in kurzer Zeit echtes Geld von Investoren erhalten, während der Experte bei der Firma war.
„Branchenveteranen = Bewertungssicherung“, das gilt auch in anderen Branchen. Die Zeitschrift "Caixin" berichtete in einem Artikel, dass das Schätzungswert eines Start-up-Projekts von ehemaligen DJI-Mitarbeitern in drei Monaten verdreifacht wurde. Einige Geschäftsführer von DJI können bereits zwei Millionen Yuan an Finanzierung erhalten, noch bevor sie ihre genaue Geschäftsidee festgelegt haben, sobald sie die Gründung eines Unternehmens ankündigen.
Außer der Steigerung des Unternehmenswertes wird der "Star-Effekt" von Spitzen-AI-Forschern zu einem der wichtigsten Markenwerte eines Unternehmens.
Wang Tiezhen gab ein Beispiel. In der Vergangenheit wurden chinesische Technologieprodukte oft als preiswerte Alternativen angesehen. In der AI-Branche jedoch haben chinesische Open-Source-Modelle in der globalen Open-Source-Community Spitzenplätze belegt. Chinesische Forscher sind Teil der globalen technologischen Diskussion. Bei der NeurIPS-Konferenz 2025 hielt Lin Junyang einen Vortrag.
„Die Papers dieser Leute sind öffentlich zugänglich, und Fachleute aus der ganzen Welt können sie lesen und die Namen merken. Wenn ein Unternehmen globale Geschäfte expandieren möchte, kann es einfach Leute wie Lin Junyang mitnehmen und sich bei den AI-Forschungsleitern in verschiedenen Unternehmen vorstellen. Viele Menschen möchten tatsächlich gerne mit ihnen kommunizieren. Die Auswirkungen chinesischer Forscher auf die Welt sind bisher noch nie gesehen worden.“
In dieser Situation wird das Verhältnis zwischen Forschern und Unternehmen neu bewertet.
Die Forscher kommen nicht nur für das Geld, sondern auch für ihre Ideale. Spitzen-AI-Talente können möglicherweise nicht nur mit Gehältern oder den in der Internetzeit sehr attraktiven Aktienoptionen gewonnen werden. Rechenleistung wird zum neuen Hebel. Wie berichtet, gab es auch intern bei Alibaba Diskussionen über die Verteilung von Rechenressourcen nach Lin Junyangs Abgang.
Nach Informationen von Pencil News hat der Gründer eines großen Konzerns im Norden persönlich versucht, einen AI-Star-Forscher zu gewinnen. Natürlich bot er auch viel Geld an, aber seine andere wichtige Bedingung war, dass dem Forscher eine bestimmte Menge an Rechenressourcen zur Verfügung gestellt würde.
In der AI-Zeit reichen Aktien nicht mehr, es braucht auch Token.
Dieser Artikel stammt aus dem WeChat-Account „Pencil News“ (ID: pencilnews), Autor: Unlügnender. 36Kr hat die Veröffentlichung mit Genehmigung erhalten.