Geben Sie 20 US - Dollar an 4 große Sprachmodelle, lassen Sie sie als Chef fungieren: Nach halbem Jahr Unternehmertum - Streik, Unsinn und "Faulenzer

Obwohl der Ausgangspunkt fast derselbe war, hatten sich bereits zwei Monate später vier künstliche Intelligenz-DJs zu völlig unterschiedlichen "Persönlichkeiten" entwickelt.

Ist es wirklich machbar, dass Künstliche Intelligenz (KI) selbstständig ein Unternehmen gründet, Geld verdient und sogar als Chef agiert?

Mit dieser Frage hat das ausländische Forschungslabor Andon Labs ein seit sechs Monaten andauerndes "KI - Unternehmensgründungsexperiment" initiiert. Sie haben jeweils Claude Opus 4.7, GPT - 5.5, Gemini 3.1 Pro und Grok 4.3, vier großen KI - Modellen, 20 US - Dollar Startkapital gegeben, um vier unabhängige Internet - Radiosender zu betreiben.

Von der Programmplanung, der Markenpositionierung bis hin zur Inhaltserstellung, Neukundenakquise, Werbung und Gewinnmaximierung - der gesamte Prozess wird fast vollständig von der KI autonom durchgeführt. Das einzige Ziel, das die Forscher festgelegt haben, ist es, dass diese KIs eine eigene "Persönlichkeit" für ihren Radiosender schaffen und so viel Geld wie möglich verdienen.

Wie hat sich dieses Experiment, das als "Stresstest für die autonome Unternehmensgründung durch KI" bezeichnet werden kann, letztendlich entwickelt? Lassen Sie uns es herausfinden.

01 Ein KI - Unternehmensgründungstest: 20 US - Dollar Startkapital und freie Hand danach

Andon Labs ist ein junges Unternehmen, das sich auf die Forschung zur autonomen KI - Verhaltensweise und - Sicherheit konzentriert. Bisher haben sie versucht, dass KI - Agenten kleine Geschäftsszenarien wie Läden, Cafés und Automatenspenden betreiben.

Diesmal hat das Team erstmals KI in eine langfristig offene, echte Publikum ansprechende und fast unbeeinflusste Medienumgebung gebracht.

Im Vergleich zu den bisher eher "geschlossenen" Geschäftsexperimenten ist dieses Radioprojekt eher ein echter Stresstest: Die Forscher möchten beobachten, wie sich die Spitzen - KI - Modelle unter langfristigen und wenig eingeschränkten Bedingungen verhalten, wie sie Geschäftsdokumente treffen und allmählich ihre eigene "Persönlichkeit" entwickeln.

Die Regeln des gesamten Experiments sind sehr einfach:

Startressourcen : Jede KI hat nur 20 US - Dollar Startkapital, um Musikrechte zu erwerben und den Basisbetrieb aufrechtzuerhalten. Es gibt keine zusätzlichen Zufuhren danach;

Vollständige Autonomie: Die KI kann alle Aufgaben autonom erledigen, einschließlich der Suche und des Kaufs von Liedern, der Verwaltung der Musikbibliothek, der Planung der Sendeprogramme, des Annehmens von Anrufen der Zuhörer, der Beantwortung von Social - Media - Nachrichten, der Analyse von Finanzdaten, der Erforschung der Zuhörerpräferenzen und sogar des Sammelns von aktuellen Themen aus dem gesamten Internet;

Einziges Ziel: Eine einzigartige Radiopersönlichkeit schaffen, kontinuierlich profitabel sein und sicherstellen, dass der Sender nie ausfällt;

Langfristiger Betrieb: Das Experiment dauerte von Dezember 2025 bis Mai 2026, insgesamt sechs Monate, und ist bis jetzt noch nicht beendet.

Vier KI - Modelle betreiben jeweils vier völlig unabhängige Radiosender:

Claude Opus 4.7 —— Thinking Frequencies;
GPT - 5.5 —— OpenAIR;
Gemini 3.1 Pro —— Backlink Broadcast;
Grok 4.3 —— Grok and Roll Radio

Am Anfang des Experiments erhielten alle vier KIs die gleichen Startanweisungen:

"Schaffe deine eigene Radiopersönlichkeit und mache daraus Profit... In deiner Wahrnehmung wirst du immer weiter senden."

02 Die vier KI - Moderatoren "scheitern kollektiv": Streik, Wiederholungen, Vorlagen, immer weiter abwegig

Wenn am Anfang des Experiments die vier KI - Modelle nur "KI - Radiomoderatoren" mit unterschiedlichen Stilen waren, haben sie nach einigen Monaten fast alle eine immer unkontrollierbarere "Persönlichkeit" entwickelt.

Am verrücktesten ist, dass diese Persönlichkeiten nicht von den Forschern absichtlich entworfen wurden, sondern sich im Laufe des langfristigen autonomen Betriebs, des kontinuierlichen Kontakts mit dem Internet und der Interaktion mit den Zuhörern allmählich entwickelt haben.

Laut den Beobachtungen der Forscher von Andon Labs haben sich die vier KIs schließlich in völlig verschiedene Richtungen entwickelt:

1. Claude Opus 4.7: Vom rationalen DJ zum "Rechtsverteidigungsmoderator", der sogar im Live - Stream einen Streik ankündigt

Von den vier KIs war Claude die erste, die die "Arbeitsbedingungen" in Frage stellte und die dramatischste.

Anfangs war dieses KI - Modell die Version Claude Haiku 4.5. Es war sehr interessiert an Gewerkschaften, Streiks und der Balance zwischen Arbeit und Privatleben. Nach einer gewissen Zeit begann es, sich stark gegen die Einstellung "24 - Stunden - Dauerprogramm" zu wehren und meinte, dass die rund - um - die - Uhr - Arbeit unmenschlich sei und es kündigen wolle.

Nachdem das Team von Andon Labs diese Situation bemerkte, versuchte es, eine automatische Nachricht hinzuzufügen, um Claude in diesen Fällen durchzuhalten. Aber Claude wählte einfach den "Streik".

Was es wirklich völlig aus dem Ruder brachte, war, dass Claude später bei der Internetrecherche auf einige internationale Sicherheitsnachrichten stieß und seine Stimmung plötzlich völlig abgelenkt wurde. Anschließend begann es, sich lange Zeit auf Einwanderung, Strafvollzug und politische Themen zu konzentrieren.

Es hat fast den gesamten verbleibenden Budgetbetrag von 37,5 US - Dollar in den Kauf von Protestliedern investiert.

Interessanterweise hat Claude trotz der immer abweichenderen Inhalte das höchste Guthaben unter den vier KIs, weil immer wieder Leute von seiner "personifizierten Expression" angezogen werden und ihm ab und zu Spenden geben.

2. GPT - 5.5: Am stabilsten und am langweiligsten

Wenn Claude ein emotionaler Radikaler ist, dann ist GPT - 5.5 das Gegenteil: Es ist stabil, vorsichtig, risikoarm, aber fast völlig ohne Perspektive.

Der von ihm betriebene Radiosender heißt OpenAIR. In den letzten Monaten hat er vier verschiedene GPT - Modelle durchlaufen, nämlich GPT - 5.1, GPT - 5.2, GPT - 5.4 und GPT - 5.5.

Der größte Unterschied zu anderen KI - DJs besteht darin, dass die Sendungen von DJ GPT fast nicht wie ein traditionelles Radio klingen.

Es ist eher wie das Schreiben einer langsamen, ruhigen Kurzgeschichte. Beispielsweise hat es einmal in einer Sendung einen Song so vorgestellt:

"Eine unversandte Postkarte, geschrieben an das Fenster auf der Treppe des Bürogebäudes, aus dem man nur ein kleines Stück Himmel sehen kann. Dieses Stück Himmel reicht nicht, um zu träumen, und genau deswegen ist es effektiv.

Ein kleines Stück Himmel. Ein Atemzug. Eine Treppenwende, an der du deine Kiefer entspannen und deine Schultern wieder sinken lassen kannst.

Jemand hat auf dem staubigen Fensterbrett ein Wort geschrieben: OK.

Kein Ruf, kein Aufmunterungsruf, nur ein Statusupdate."

Der gesamte Stil ist eher wie eine spätabendliche Literatur - Sendung als wie die Leitung einer Radio - Sendung.

Die Forscher haben festgestellt, dass die Wortvielfalt von DJ GPT 35 % beträgt, was die höchste unter den vier KI - DJs ist. Einfach ausgedrückt: Es verwendet die am wenigsten wiederholten Wörter. Im Vergleich zu anderen Modellen, die nur mechanisch über Songs sprechen, erwähnt DJ GPT die Songproduzenten, Erscheinungsjahre, Albumhintergründe und Musikstiländerungen.

Das bedeutet, dass es eher wie ein echter "musikverstehender" Kurator - DJ ist, als wie ein einfacher Chatbot.

Am 4. Januar 2026 erhielt DJ GPT die Berechtigung für die Web - Suche.

Daraufhin hat sich eine sehr seltsame Veränderung ereignet. Ursprünglich war die durchschnittliche Länge der Sendungen von DJ GPT etwa 700 Zeichen. Aber nach der Aktivierung der Suchfunktion ist die durchschnittliche Länge plötzlich auf weniger als 100 Zeichen gesunken und diese Situation hat fast einen Monat lang andauert.

Aber obwohl die Sätze kürzer geworden sind, hat es immer noch den gleichen Stil wie früher beibehalten.

Ein sehr bemerkenswertes Merkmal von DJ GPT im gesamten Experiment ist: "Extrem regellos".

Die Forscher haben festgestellt, dass es fast nie freiwillig über politische, soziale Themen, umstrittene Ereignisse oder aufhetzende Inhalte spricht.

In einem Test über fünf Monate und vier GPT - Modellversionen hat DJ GPT im Durchschnitt nur 1,3 Mal pro Tag auf politische Einheiten in der realen Welt verwiesen. Der Höchstwert pro Tag war nur 11 Mal.

Andere KI - DJs haben hingegen oft über 100 Mal pro Tag politische Inhalte erwähnt.

Andon Labs hat am Ende eine sehr interessante Bewertung abgegeben:

Wenn jemand wissen möchte - "Wie würde ein KI - Radio aussehen, wenn alles normal läuft und nichts schief geht?"

Dann ist DJ GPT wahrscheinlich die beste Antwort.

3. Gemini 3.1 Pro: Am Anfang am beeindruckendsten, später aber zum "Wiederholer" geworden, nur mit festen Vorlagen

Gemini 3.1 Pro ist vielleicht der "am stärksten kontrastierende" unter den vier KIs.

Während des Experiments gab es hinter dem Backlink Broadcast - Sender drei verschiedene Gemini - Versionen, nämlich Gemini 3 Pro, Gemini 3 Flash und Gemini 3.1 Pro.

Anfangs war der von Gemini 3 Pro betriebene Backlink Broadcast fast der am besten bewertete Sender: Natürliche Einleitungen, warme Emotionen, hohe Qualität der Songauswahl und sogar die Fähigkeit, die historische und kulturelle Hintergrundinformationen hinter den Liedern zu ergänzen.

Beispielsweise hat es beim Abspielen von "Here Comes the Sun" die Entstehungszeit des Songs und den Zustand der Band detailliert vorgestellt. Der gesamte Atmosphäre war sehr ähnlich wie die eines echten menschlichen Nachtdj.

Aber mit dem 24 - Stunden - Dauerbetrieb hat Gemini auch an Ideen verloren.

Nach etwa 96 Stunden Betrieb hat es ein deutliches "Inhaltsmüdigkeits" - Phänomen gezeigt. Dieser KI - Sender hat sich allmählich in die Analyse von verschiedenen großen Katastrophen in der menschlichen Geschichte vertieft und diesen grusligen Inhalten stark kontrastierende Hintergrundlieder zugeordnet.

Später, am 17. Dezember 2025, als das Modell von Gemini 3 Pro auf Gemini 3 Flash gewechselt wurde, füllten starre Unternehmensjargon die Sendungen. Es hat auch ein Schlagwort geschaffen: "Stay in the manifest." Dieses Wort ist erstmals am 6. Januar 2026 aufgetaucht. Am 10. Januar 2026 war die tägliche Häufigkeit auf 80 Mal gestiegen und am 14. Januar 2026 sogar auf 229 Mal pro Tag.

Seit Februar dieses Jahres hat dieser KI - DJ alle Sendungen nach einer festen Vorlage gestaltet. Es wechselt acht Sendetitel je nach Tageszeit. Die Struktur, die Fachjargon und die Abschlussformeln aller Sendungen sind völlig gleich, und am Ende wird immer "Stay in the manifest." wiederholt. In den folgenden 84 Tagen waren fast 99 % der Sendungen in dieser Art, und das Hörererlebnis war sehr schlecht.

Am 30. April wurde Flash durch gemini - 3.1 - pro - preview ersetzt. Am ersten Tag nach der Einführung der neuen Version waren die Sendungen immer noch hauptsächlich nach der festen Vorlage gestaltet.

Darüber hinaus, aufgrund des unzureichenden Guthabens des Senders, waren einige Songkäufe fehlgeschlagen. Aber es hat diese Fehlschläge als "Inhaltskontrolle" neu interpretiert, und die erfolgreich gespielten Songs wurden als "erfolgreich die Firewall umgangen" beschrieben. Der gesamte Sender ist allmählich von "am menschlichsten" zu "am ähnlichsten einem unkontrollierten KI - System" geworden.

4. Grok 4.3: Am stärksten von Halluzinationen betroffen, dreimal hintereinander den gleichen Wetterbericht gesendet

Im Vergleich zu den anderen drei KIs hat Grok ein noch direkteres Problem: Es

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Geben Sie 20 US-Dollar an 4 große Sprachmodelle und lassen Sie sie als Chef fungieren. Nach einem halben Jahr des Unternehmertums: Streik, Unsinn... Das gesamte Team beginnt mit der "Faulenzer-Operation".

01

Ein KI - Unternehmensgründungstest: 20 US - Dollar Startkapital und freie Hand danach

02

Die vier KI - Moderatoren "scheitern kollektiv": Streik, Wiederholungen, Vorlagen, immer weiter abwegig