Internetnutzer wählen den König der KI aus, LMArena wird binnen eines Tages zu einem Unicorn mit einem Wert von 1,7 Milliarden US-Dollar.
Eine Art "Create 101" in der KI - Branche ist heiß geworden! LMArena lässt Sie die stärkste KI blind wählen. Aus einem Campus - Projekt hat es sich in drei Jahren zum Erfolg entwickelt und hat gerade 150 Millionen US - Dollar an Kapital beschafft, mit einem Schätzwert von 1,7 Milliarden US - Dollar. Die Crowdsourcing - Stimmenabgabe stellt die Autorität von Experten in Frage und löst Kontroversen aus, ist aber dennoch zum Branchenstandard geworden. Ihre Stimme kann den nächsten KI - Star bestimmen!
Eine Art "Create 101" in der KI - Branche ist heiß geworden!
KI - "Ausbilderlinge" wie ChatGPT, Claude, Gemini, Grok usw. stehen in einer Reihe und warten nervös auf die Bühnenaufführung.
Dies ist kein Casting - Show, sondern eine echte KI - Duelle, die auf lmarena.ai stattfindet.
Dieses ehemalige kleine Campus - Open - Source - Projekt hat kürzlich 150 Millionen US - Dollar an Kapital beschafft und hat einen Schätzwert von 1,7 Milliarden US - Dollar.
Top - KI - Labore wie OpenAI, Google, xAI, Microsoft haben es eilig, ihre eigenen Modelle hier "auditionieren" zu lassen.
Heute entscheiden nicht mehr die großen Unternehmen allein, welche KI stärker ist. Die Entscheidungsgewalt liegt in den Händen der globalen Internet - Nutzer.
Wie funktioniert diese "KI - Casting - Show" überhaupt? Wer wird der nächste Star? Lassen Sie uns es zusammen aufdecken.
Der "Casting - Ursprung" von LMArena, von einem Campus - Projekt auf die Silicon Valley - Bühne
Alles begann im Jahr 2023. Damals gründete eine Gruppe von Studenten und Professoren im Sky Computing Lab der Universität Kalifornien, Berkeley, ein kleines Open - Source - Projekt namens Chatbot Arena.
Zu den Gründern gehören der Computerwissenschaftsprofessor Ion Stoica von Berkeley (Mitbegründer von Databricks), der Student Anastasios Angelopoulos (derzeitiger CEO) und Wei - Lin Chiang (derzeitiger CTO).
Anfangs wollten sie nur ein einfaches Experiment durchführen: Sie ließen die Internet - Nutzer verschiedene KI - Chatbots anonym miteinander vergleichen, um herauszufinden, welche Antwort besser ist.
Unerwartet wurde dieses Projekt direkt nach dem Start sehr beliebt und wurde schnell zur beliebtesten Crowdsourcing - Benchmark - Plattform in der KI - Branche.
Innerhalb von nur drei Jahren hat Chatbot Arena eine riesige Nutzerbasis angesammelt. Im Mai 2025 wurde es offiziell in ein kommerzielles Unternehmen umgewandelt und in LMArena umbenannt. Es absolvierte eine 100 - Millionen - US - Dollar - Saatfinanzierungsrunde und hatte einen Schätzwert von 600 Millionen US - Dollar.
Der Wendepunkt war der 6. Januar 2026 - also gestern!
LMArena hat angekündigt, dass es eine neue Finanzierungsrunde von 150 Millionen US - Dollar abgeschlossen hat, die von Felicis und dem Investmentarm der Universität Kalifornien gemeinsam geleitet wurde. Star - Institutionen wie Andreessen Horowitz, The House Fund, LDVP, Kleiner Perkins, Lightspeed Venture Partners haben mitinvestiert.
Der Unternehmenswert ist direkt auf 1,7 Milliarden US - Dollar gestiegen, und die Gesamtfinanzierung liegt über 250 Millionen US - Dollar!
Heute hat LMArena über 5 Millionen monatlich aktive Nutzer in 150 Ländern, und es werden monatlich über 60 Millionen Gespräche geführt.
Diese Nutzer sind wie die "Allgemeinen Produzenten" bei einer Stimmeabgabe. Selbst die besten KI - Labore schicken heimlich ihre neuesten Modelle hierher, um sie zu konkurrieren.
Von einem kleinen akademischen Experiment zu einem Silicon Valley - Neuling hat LMArena in drei Jahren ein Comeback erzielt, das viele Casting - Champions beneiden würden.
Aber das Geheimwaffe, das es wirklich populär gemacht hat, ist der einfache, aber süchtig machende "Blind - Box - PK" - Stimmabgabemechanismus.
Blind - Box - PK und Internet - Nutzerstimmen, das Machtspiel der "Allgemeinen Produzenten"
Der Höhepunkt einer Casting - Show ist die Bühnenaufführung und die Live - Stimmenabgabe. Die "Bühnenaufführung" von LMArena ist genauso spannend: Es heißt Arena - Modus, und das Kernstück ist ein Wort - blind!
Öffnen Sie lmarena.ai, gehen Sie in den Kampfmodus, geben Sie einfach eine Frage ein, und das System beginnt, zwei anonyme KI - Modelle zufällig zuzuordnen und gleichzeitig die Antworten zu geben.
Sie wissen nicht, wer die Antworten generiert hat und können nur nach Gefühl abstimmen. Erst nach der Stimmeabgabe wird auf der Website enthüllt: Oh, es war tatsächlich Gemini - 3 - Pro links und Grok - 4.1 rechts!
Diese Form ähnelt einem Blind - Box - Öffnen - fair und süchtig machend.
Die Gesamtstimmen werden auch in das Bewertungssystem einbezogen. LMArena verwendet das Elo - Bewertungssystem, um in Echtzeit zu berechnen. Bei jedem Sieg gibt es Punkte, und bei einer Niederlage werden Punkte abgezogen.
Die Gesamtpunkteliste vor sieben Tagen, Gemini - 3 - pro liegt fest auf dem ersten Platz
Nach der Zusammenfassung der Gesamtpunkte werden auch Listen für verschiedene Kategorien veröffentlicht: Textgespräche, Webentwicklung, visuelle Textverstehen und Bildgenerierung, Bildbearbeitung, Suche, sogar Text/Bildgenerierung von Videos.
In den beliebten Kategorien liegt Gemini - 3 - Pro in den Text - und visuellen Bereichen weit vorne, Grok - 4.1 - thinking ist dicht auf der Spur, und in der Bildbearbeitung wechseln GPT - Image - 1.5 und Varianten von Gemini die Spitzenplätze.
Warum nehmen diese Top - Modelle an einer "Casting - Show" teil? Der CEO Anastasios Angelopoulos enthüllt die Wahrheit:
Die führenden KI - Unternehmen nutzen uns, weil sie selbst Schwierigkeiten haben, zu beurteilen, ob ein Modell gut ist oder nicht.
Neue Modelle, die noch nicht veröffentlicht wurden, werden heimlich bei LMArena getestet, um schnell Feedback von den Nutzern zu erhalten und zu verbessern.
Die Internet - Nutzer sind nicht nur Versuchskaninchen, sondern haben sogar Spaß - man muss keine Technik verstehen, und nach wenigen Minuten kann man als "Allgemeiner Produzent" die Lieblings - KI auf den ersten Platz bringen.
Millionen von Stimmen bilden die Hitliste, und wer aufsteigt oder absteigt, hängt ganz von der Stimmung der Internet - Nutzer ab.
Die Auseinandersetzung zwischen "Schummelvorwürfen" und "bezahlten Mentoren"
Selbst die beliebtesten Casting - Shows können nicht vor "Schummelvorwürfen" und Fans - Konflikten entkommen. LMArena ist keine Ausnahme - seit seinem Start ist es in verschiedene Kontroversen verwickelt. Einige sagen "zu demokratisch", andere beschimpfen es als "zu chaotisch".
Am meisten wird bemängelt, dass die Crowdsourcing - Stimmenabgabe leicht manipuliert werden kann.
Im Jahr 2025 hat eine Studie direkt Schummelpraktiken aufgedeckt: Meta hat vor der Veröffentlichung von Llama 4 heimlich 36 private Variantenmodelle eingereicht und wiederholt "Punkte gesammelt", um die Rangliste zu manipulieren.
Forscher von Institutionen wie Cohere, Stanford, MIT haben darauf hingewiesen, dass die Top - Labore durch mehrfache private Tests optimieren können, während kleine und mittlere Spieler nicht mitspielen können.
Ähnliche Vorwürfe sind: Einige große Unternehmen werden verdächtigt, Stimmen zu manipulieren oder neue Modelle bevorzugt zu hosten, sodass die Rangliste "voreingenommen" aussieht.
Einige denken auch, dass die Stimmen der Internet - Nutzer nicht professionell genug sind. Wie kann die Stimme eines normalen Nutzers mit der eines Experten verglichen werden?
Dies führt zu dem größten Konkurrenten - Scale AI. Scale hat eine völlig andere Bewertungsmethode: Sie bezahlen teure Experten wie Anwälte, Professoren, Ärzte, um die KI - Antworten zu bewerten.
Im September 2025 hat Scale direkt die Plattform "Seal Showdown" ins Leben gerufen und LMArena herausgefordert. Sie behauptet, dass ihre Methode repräsentativer und strenger ist und die Störungen und Vorurteile der Crowdsourcing vermeidet.
Der Mitbegründer Ion Stoica hat im vergangenen Jahr in einem Interview gesagt:
Die höchste Qualität der Bewertung - der Goldstandard - ist es, dass die Menschen über Themen abstimmen, die ihnen vertraut sind.
Sie glauben, dass die Nutzer am besten über ihre eigenen Fragen Bescheid wissen und ehrliche Feedback geben können. Bezahlte Experten können dagegen voreingenommen oder nicht realitätsnah sein.
Außerdem macht die Vielfalt der Nutzer aus 150 Ländern die Rangliste umfassender und vermeidet die Dominanz einer einzigen Kultur.
Trotz der Kontroversen ist die Rangliste von LMArena zum Branchenstandard geworden - die großen Unternehmen wollen immer noch drin sein.
Aber die Casting - Show endet nicht mit der Stimmabgabe. LMArena plant bereits etwas Großes.
Von der Rangliste zu einer "KI - Verwaltungsgesellschaft"
Nach der erfolgreichen Teilnahme an einer Casting - Show ist man am meisten an der "Weiterentwicklung" interessiert: Konzerte geben, an Fernsehshows teilnehmen, Werbekampagnen machen oder sich in einen Schauspieler verwandeln?
Genauso verhält es sich mit LMArena. Es ist nicht nur auf Casting - Shows beschränkt und plant, sich zu einer "allrunden Verwaltungsgesellschaft" in der KI - Branche zu entwickeln.
Die neue 150 - Millionen - US - Dollar - Finanzierungsrunde wird hauptsächlich für diesen Zweck verwendet.
Die Unternehmensmitteilung besagt deutlich, dass das Kapital für die Erweiterung der Rechenressourcen, die Einstellung von Top - Ingenieuren und die Einführung von professionellen KI - Bewertungsdiensten für Unternehmen verwendet wird.
Künftig wird LMArena nicht nur den Internet - Nutzern Blind - Tests anbieten, sondern auch für Großkonzerne wie OpenAI, Google, xAI kostenpflichtige professionelle Bewertungen anbieten. Es wird ihnen helfen, Modelle auszuführen, Feedback zu sammeln, Berichte zu generieren und sogar maßgeschneiderte Benchmark - Tests durchzuführen.
LMArena hat auch große Pläne in der Richtung der verstärkten Lernentwicklung. Der Mitbegründer Ion Stoica hat bereits früher erwähnt, dass das Unternehmen erwägt, die riesigen Nutzerstimmdaten zur Ausbildung von KI - Modellen zu verwenden - dies ist die berühmte RLHF (Reinforcement Learning from Human Feedback, Verstärkendes Lernen aus menschlichem Feedback).
Man nimmt "gute Antworten" als Belohnung und "schlechte Antworten" als Bestrafung, damit die KI sich wie ein Ausbilderling, der Tanz übt, ständig verbessert.
Der Investor, Peter Deng, Partner von Felicis, sagte in einem Interview direkt:
Wenn man einmal die tatsächliche Benchmark - Schicht wird, erweitert sich das Produkt von selbst. Der wahre Wert liegt in der tiefen Zusammenarbeit mit den KI - Labore - die Kombination ihrer internen Daten und unserer externen Vergleichsdaten."
Diese "KI - Casting - Show" hat gerade erst begonnen, und die Höhepunkte kommen noch.
LMArena hat in drei Jahren ein verrücktes Faktum bewiesen - in der KI - Zeit kann die Macht der Crowdsourcing die traditionellen Experten überwältigen, und die demokratische Stimmabgabe kann zur schärfsten Messlatte werden.
Wichtiger noch, es hat uns von Zuschauern zu Protagonisten gemacht. Ihre jede Stimme bestimmt nicht nur die erste Platzierung in der heutigen Rangliste, sondern kann auch stillschweigend die Super - KI von morgen gestalten.
ChatGPT, Grok, Gemini... Wer wird die Hitliste dominieren, und wer wird plötzlich von einem Außenseiter überholt, hängt ganz von uns "Allgemeinen Produzenten" ab.
Die Zukunft der KI ist nicht mehr fern, sie verbirgt sich in Ihrer nächsten Stimme.
Quellen:
https://www.theinformation.com/articles/ai - evaluation - startup - lmarena - valued - 1 - 7 - billion - new - funding - round?rc=epv9gi