Eine gründliche Analyse von 151 Stellenbeschreibungen: Enthüllungen über Datenannotatoren – Polarisierung, 30-fache Gehaltsunterschiede und eine brutale Zukunft
Um neun Uhr morgens setzt Xiaolin ihre Kopfhörer auf, öffnet die Annotation-Plattform und es kommt ein Stück Mandarin mit südchinesischem Akzent in ihre Ohren.
Zuerst muss sie diesen Sprachabschnitt Wort für Wort transkribieren, dann die Ausspracheabweichungen, ungewöhnlichen Intonation und dialektalen Merkwörter markieren. Schließlich muss sie beurteilen, was die KI richtig erkannt hat und wo sie daneben lag. Es klingt, als würde sie einem Podcast lauschen, und andere mögen denken, dass sie fauliert, aber das ist ihre Arbeit.
Ihr offizieller Titel lautet "Datenannotatorin", aber sie bevorzugt es, sich "KI-Trainerin" zu nennen – das klingt cooler. Im Bewusstsein der meisten Menschen ist diese Arbeit die Montageband der KI-Zeit: Sie sitzt vor dem Computer und klickt mechanisch mit der Maus, tagtäglich Boxen zeichnen und Labels setzen. Es ist wenig anspruchsvoll und typisch eine "menschliche Batterie".
Wenn jemand sie aber fragt, was sie genau macht, schweigt Xiaolin normalerweise zwei Sekunden und antwortet dann: "Nun … ich lehre die KI, Menschensprache zu verstehen." Mehr kann sie nicht sagen.
Vielleicht kann die Arbeitsbeschreibung in diesem Lebenslauf eines Berufstätigen ungefähr erklären, was sie täglich tun.
Für immer mehr junge Menschen, die in die KI-Branche eintreten möchten, wird die Datenannotation zu einer Einstiegsarbeit, die sie in Betracht ziehen. Warum gibt es diesen Beruf? Wie sieht die Branche aus? Wohin gehen die Berufstätigen? Wir haben 302 Stellenangebote auf Boss Zhipin unter dem Stichwort "Datenannotation" in Peking gesammelt und 151 vollständige Jobdeskriptions (JD) einzeln analysiert.
1
Bei der gleichen Annotationstätigkeit kann es einen Unterschied von dreißigfacher monatlicher Bezahlung geben
ChatGPT kann Gedichte schreiben, weil die Annotatoren jeden Satz bewerten: "Dieser ist gut, jener ist schlecht". Ein autonomes Fahrzeug kann Ampeln an Kreuzungen erkennen, weil jemand an Tausenden von Straßenansichtsbildern Pixel für Pixel die Grenzen markiert hat. Wenn Sie einem Agenten sagen: "Spiele Songs von Jay Chou", versteht es sofort und führt es aus. Hinter diesem Vorgang stecken Tausende von Sprachbefehlen mit Akzenten, Umgebungsgeräuschen, Wortverschmelzungen, die von Menschen annotiert wurden.
Heutzutage steigt die Komplexität der Sprachannotation exponentiell, um eine natürlichere Interaktion zu ermöglichen. Es geht nicht nur darum, die Stimme in Text umzuwandeln, sondern auch Emotionen, Absichten und pragmatische Szenarien zu markieren. Selbst die feinen Unterschiede in Dialekten müssen markiert werden, damit das Modell wirklich lernt, "Menschensprache zu verstehen".
Hinter jedem intelligenten Moment steht eine menschliche Hand. Wie viel der Besitzer dieser Hand damit verdient und wie lange er es machen kann, ist eine andere Geschichte. Schauen wir uns zuerst das Einkommen an.
Bei den 151 vollständigen JDs liegt der Median des monatlichen Gehalts für Datenannotationsstellen in Peking bei 10.500 Yuan, das Minimum bei 2.000 Yuan und das Maximum bei 65.000 Yuan – ein Unterschied von über dreißigfacher Bezahlung zwischen Anfang und Ende.
An der niedrigen Gehaltsseite befinden sich hauptsächlich Praktika, Teilzeitjobs und Crowdsourcing-Aufträge. Es gibt 84 Stellen mit täglicher Bezahlung, der Median liegt bei 185 Yuan pro Tag. In den Stellenausschreibungen steht: "Datenannotation, Wochenende frei, Anfänger können es machen", es werden keine Anforderungen an Bildung und Erfahrung gestellt, das monatliche Gehalt liegt zwischen 4.000 und 5.000 Yuan. Am anderen Ende des Spektrums bietet Baidu Praktikanten für die Datenannotationsalgorithmen in der autonomen Fahrweise 500 bis 600 Yuan pro Tag an, die Bewerber müssen Master-Abschluss haben. Alibaba bietet für die Stelle einer KI-Trainerin 20.000 bis 35.000 Yuan monatlich mit 16 Gehaltszahlungen an, auch hier wird ein Master-Abschluss verlangt.
Bei der gleichen Annotationstätigkeit kann es einen Unterschied von zehnfacher Bezahlung geben. Der Unterschied kommt daher, dass die Arbeitsinhalte bereits differenziert sind: An der niedrigen Gehaltsseite ist es die Ausführung, die Annotationen werden nach Vorgaben und Standard Operating Procedures (SOP) durchgeführt; an der hohen Gehaltsseite ist es die Definition, die Annotationregeln festzulegen, die Qualitätsstandards zu verwalten und die Schleife zwischen Algorithmus und Daten zu schließen. Die ersteren können leicht ersetzt werden, die letzteren sind schwer zu replizieren.
Ein sechsjähriger Veteran in der Annotationbranche sagte es direkt: 2016 waren die Annotatoren Handwerker, erfahrene Arbeiter waren gefragt; jetzt sind die Annotatoren Montagebandarbeiter, jeder kann es machen, Sie sind nur ein Account.
2
Von "Boxen zeichnen" zu Entscheidungen für die KI treffen
Aus den 151 JDs lassen sich vier Hauptmodalitäten unterscheiden.
Textannotation macht 16 % aus, es geht um die Reinigung von Sprachmaterial, die Bewertung der Gesprächsqualität und die Übersetzungskorrektur in mehreren Sprachen.
In der Ära der großen Modelle hat der Bedarf in dieser Kategorie stark zugenommen. Tencent sucht "Datenannotatoren für große Modelle – Code-Richtung". Die Bewerber müssen Code verstehen, beurteilen, was an den von der KI geschriebenen Programmen gut ist und wo es Fehler gibt, und dann mit menschlicher Einsicht korrigieren.
Bild- und Videoannotation macht 17 % aus, einschließlich Boxauswahl, Punktmarkierung, Segmentierung und Markierung von Schlüsselpunkten. Die autonome Fahrweise ist ein großer Anwender.
Für die Stelle eines "Algorithmusingenieurs für die Datenannotation in der intelligenten Fahrweise" bei einem großen Automobilhersteller wird die Verarbeitung von 4D-Punktwolken und LiDAR-Daten verlangt, die Ausgabe von zeitlich konsistenten BBox-Wahrheiten. Das monatliche Gehalt liegt zwischen 40.000 und 70.000 Yuan mit 15 Gehaltszahlungen. Dies ist längst nicht mehr "Boxen zeichnen", sondern es ist erforderlich, die Prinzipien der Sensoren und die dreidimensionale Raumbeziehung zu verstehen.
Sprach- und Audioannotation hat den geringsten Anteil auf der Stellenbörse, nur 1 %, aber die Anforderungen sind keinesfalls gering.
Anfang Juni dieses Jahres hat Musk's xAI weltweit Chinesische KI-Mentoren gesucht, um die chinesische Sprachfähigkeit von Grok zu trainieren. Es wird Muttersprachlichkeit in Chinesisch, Kenntnis der Dialekte und regionalen Akzentunterschiede verlangt, die Fähigkeit zur Sprachtranskription, Aussprachekorrektur und Audioannotation. Der Stundenlohn in den USA liegt zwischen 35 und 45 US-Dollar. Zur gleichen Zeit sucht JD Technology Annotatoren für Französisch, Deutsch und Niederländisch. Ein C2-Niveau ist die Mindestanforderung, die Fähigkeit zur Erkennung von Aussprachefehlern und Intonationsabweichungen – die Standards sind vergleichbar mit linguistischen Forschungen.
Multimodale Annotation hat den größten Anteil, nämlich 36 %. Ein Job umfasst gleichzeitig Bilder, Texte, Audio und Video und ist häufig in Teams für Daten von großen Modellen anzutreffen. Die Austauschbarkeit von Einstellungskandidaten mit nur einer Fähigkeit ist immer höher, während Allrounder gefragter sind.
Betrachtet man die 151 JDs nach Geschäftsfeldern, zeigt sich eine hohe Konzentration:
Sprachmaterial für große Modelle/AIGC macht direkt 28 % aus, die autonome Fahrweise und medizinische Bildgebung machen jeweils 7 % aus. Fast ein Drittel der Stellen ist damit beschäftigt, die großen Modelle zu "füttern". Der Wettlauf ist in die heiße Phase geraten. Die Anzahl der GPU ist nicht mehr das einzige Kriterium. Wer bessere Daten hat, die näher an der realen menschlichen Sprache liegen, hat mehr Chancen.
Die Zugangshürden werden auch neu definiert. Fast neunzig Prozent der Stellen verlangen einen Bachelor- oder Fachhochschulabschluss. Scheinbar ist es immer noch ein Beruf mit niedrigen Zugangshürden. Aber die 13 Stellen, die einen Master-Abschluss verlangen, liegen fast alle in den Bereichen der Bewertung von großen Modellen, der Algorithmenunterstützung und der Übersee-Multisprachigkeit. Der "Expertendatenannotator" von Shanda Network bekommt 400 bis 800 Yuan pro Tag, ein Master-Abschluss ist erforderlich, Remote-Arbeit ist möglich. Die KI-Trainerin von Alibaba bekommt 20.000 bis 35.000 Yuan monatlich mit 16 Gehaltszahlungen, nur Master-Absolventen werden eingestellt. Es gibt auch Finanzannotationsexperten mit einem Stundenlohn von 150 bis 200 Yuan.
Die professionellen Barrieren werden auch höher. Bei der medizinischen Annotation wird ein Hintergrund in Klinischer Medizin oder Radiologie verlangt. Bei der Code-Richtung wird ein Informatikstudium verlangt, die Fähigkeit zum Programmieren und Debugging. Bei der filmischen Ästhetikannotation werden Abschlüsse in Dramatistik, Digitalen Medienkunst bevorzugt. Bei der Finanzannotation wird ein Studium in Finanzwirtschaft verlangt. Bei der Embodied Intelligence Annotation wird ein Hintergrund in Maschinenbau und Automatisierung verlangt. Je näher man an der oberen Stufe der Datenwertschöpfungskette ist, desto weniger reicht es aus, nur sorgfältig und geduldig zu sein, sondern es bedarf echten Fachwissens.
Unter demselben Hut gibt es einen Taglohn von 100 Yuan für Crowdsourcing-Aufträge und ein monatliches Gehalt von 65.000 Yuan für Experten. Der mittlere Bereich wird ständig eingeengt.
Aus einer anderen Perspektive kann eine Stelle Medizinstudenten, Programmierer, Designer und Finanzexperten aufnehmen. Sie wird zu einem Ausgangspunkt für fast alle Fachrichtungen.
3
Große Unternehmen bestimmen die Regeln, Outsourcing-Firmen teilen die Arbeit auf
Betrachten wir nun die Unternehmen in der Stellenbörse. Große Unternehmen und Outsourcing-Anbieter sind klar getrennt.
Unter den 302 Stellen können wir bekannte Große Unternehmen wie JD, Tencent, Alibaba, Kuaishou, Xiaohongshu und Baidu erkennen. Aber die meisten Stellen werden nicht von ihnen angeboten, sondern von Outsourcing-Firmen für Annotation und Datendienstleistern. Haitian Ruisheng, Yunce Data und Beisai Technology belegen die Spitzenplätze in der Anzahl der Stellen.
Die Branchenlogik ist klar: Große Unternehmen bestimmen die Annotationregeln und Bewertungsstandards, Outsourcing-Firmen teilen die Arbeit in feine SOPs auf und subkontrahieren sie weiter.
Viele Annotatoren finden die Arbeit mechanisch und können das Ganze nicht sehen. Der Grund liegt hier: Sie stehen am Ende der Montageband, haben nur einen Account und eine Reihe von Anweisungen in der Hand.
Aber die Kernfähigkeiten der Modelle geben die großen Unternehmen nicht leicht her.
Tencent sucht selbst Datenannotatoren für große Modelle in der Code-Richtung. Kuaishou sucht direkt Projektmanager für die Annotation von Keling AI. Xiaohongshu sucht Praktikanten für die Datenannotation von großen Modellen. Je wichtiger das Modell ist, desto mehr muss die Datenqualität in eigenen Händen gehalten werden.
4
Die Vergangenheit, Gegenwart und Zukunft der Datenannotation
Die Datenannotation ist die menschliche Grundlage hinter dem Fortschritt der KI. Um zu verstehen, wie sie bis heute entwickelt wurde und wohin sie in Zukunft gehen wird, müssen wir uns ihre gesamte Geschichte ansehen.
2006 - 2014 war die Vorzeit der Annotation.
Damals war "Datenannotation" noch keine eigene Berufsbezeichnung. Als Li Feifei an der Princeton University das ImageNet-Projekt startete, engagierte sie zunächst Studenten mit einem Stundenlohn von 10 US-Dollar, um die Bilder einzeln zu annotieren. Aber die Studenten konnten diese repetitive Arbeit bald nicht mehr ertragen. Nach der damaligen Effizienz würde es 19 Jahre dauern, den gesamten Datensatz zu annotieren. Der Wendepunkt kam mit Amazon Mechanical Turk: Von 2008 bis 2010 haben fast 50.000 Crowdsourcing-Arbeiter aus 167 Ländern über 14 Millionen Bilder annotiert. In der akademischen Welt wurde die Annotation als "Bauernarbeit" angesehen. Li Feifeis Antrag auf eine Stiftung wurde sogar von der NIH als "eine Schande für Princeton" bewertet.
2012 gewann AlexNet mit einer Top-5-Fehlerrate von 15,3 % den ILSVRC-Meisterschaftstitel, über 10 Prozentpunkte vor dem Zweiten. Yann LeCun nannte es später den unbestrittenen Wendepunkt in der Geschichte des maschinellen Sehens. Die gesamte Branche erkannte damit, dass der Algorithmusunterschied eingeholt werden kann, aber der Datenunterschied ist die Barriere. Die Annotation hatte erstmals die Möglichkeit, zu einem Geschäft zu werden.
2014 - 2017 war die Zeit der Annotationswerke.
Die ersten Datenannotationsfirmen wurden gegründet. Diese Fir