Umgeben von KI - Gesichtern: Warum wird es mir langsam übel?

Ich brauche echte schöne Frauen, um meine Augen zu verwöhnen.

Jeder von euch, der oft Kurzfilme und Kurzvideos schaut, sollte dieses Gesicht nicht übersehen.

Diejenigen, die es noch nicht gesehen haben, mögen denken, es sei ein neuer Internetstar. Tatsächlich ist es ein künstlich generiertes Gesicht, das kürzlich in verschiedenen Videos immer wieder auftaucht.

Feine Gesichtszüge, große Augen, eine kleine Nase, immer helles Hautkolorit, immer ein sanfter Glättungsfilter und eine perfekte Mundwinkelkurve.

Wenn eine echte Person vor uns stünde, würde Shi Chao wahrscheinlich nicht einmal ein Wort sagen. Doch dieses scheinbar harmlose Gesicht wurde heftig "netzmißhandelt".

Nicht, weil es unansehnlich wäre, sondern weil es wie ein Verwandter im KI-Bereich ist, der überall auftaucht.

Die erste Liebe in der Schule ist es, die Herrin in einer historischen Drama ist es auch.

Ein fünf- oder sechsjähriges Mädchen ist es, eine siebzig- oder achtzigjährige Frau ist es auch.

Bei genauerem Hinsehen: Oh je, warum ist auch der ältere Herr mit der Kopfbinde dasselbe Gesicht?

Wenn man jeden Tag sein Handy öffnet, sieht man nur dieses eine Gesicht. Beim Scrollen durch die Kurzvideos bekommt man das Gefühl, von künstlichen Menschen umringt zu werden.

Und je mehr Leute das bemerken, desto mehr sind die Kommentare und Beschwerden der Netizens:

"Ich werde fast übel, wenn ich dieses Gesicht sehe."

"Ich habe eine körperliche Abneigung gegen dieses Gesicht."

"Wie viele Leute empfinden es als unangenehm, wenn sie dieses Gesicht sehen?"

Einige fragen sich auch, warum alle von der KI generierten Menschen so ähnlich aussehen. Welches Gesicht hat sie denn gestohlen?

Im Kommentarbereich gibt es Vermutungen, dass es die Gesicht einer gesperrten Streamerin ist, dass es dem Schauspieler Li Chuan ähnelt oder der Schwester von Park Chan - yeol. Eigentlich kann man in nationalen und internationalen, männlichen und weiblichen Gesichtern etwas Ähnliches erkennen.

Das Problem ist, dass man trotz all diesen Vermutungen keine genaue Antwort hat. Denn eher als dass ein konkretes Gesicht gestohlen wurde, ist es wahrscheinlich ein "durchschnittliches Standardgesicht", das aus der ästhetischen Fertigungsstraße der KI immer wieder geformt wird.

Woher kommt also dieses Gesicht?

Shi Chao, der nicht so leicht aufgibt, hat die gängigen Videomodelle wie Seedance, Keling, Conch, HappyHorse nacheinander getestet und dabei tatsächlich ein Muster entdeckt.

Wir geben allen Modellen zwei Chancen. Bei demselben Hinweis "Mädchen auf dem Fahrrad" sollten eigentlich jedes Mal unterschiedliche Gesichter generiert werden. Manchmal sollten Asiaten, manchmal Ausländer erscheinen. Das ist die Natur von großen Modellen.

Da wir nur das Geschlecht festgelegt haben und keine anderen Hinweise gegeben haben, sollte es nicht nur das Gesicht, sondern auch die Nationalität, die Hautfarbe, die Frisur und das Kleidungsstück vollständig zufällig generieren.

Tatsächlich generieren fast alle Modelle bei demselben Hinweis dasselbe Gesicht, mit fast identischem Kleidungsstil, Hintergrund, Aufnahmewinkel.

Bei Seedance 2.0 hat Shi Chao sogar dasselbe KI - Gesicht wie am Anfang gefunden. Scheinbar ist dies die Ursache für alles Übel.

Wenn nur ein Modell fehlerhaft ist, könnte es das Problem des Modells sein. Aber wenn alle Modelle gleichzeitig die Vielfalt verlieren... Shi Chao hat es untersucht und festgestellt, dass es wahrscheinlich zwei Gründe gibt.

Erstens wissen diejenigen, die oft Videomodelle nutzen, dass Videomodelle sehr empfindlich gegenüber Hinweisen sind. Manchmal kann die Reihenfolge eines Wortes oder ein paar Buchstaben das Endresultat der Generierung beeinflussen.

Um sicherzustellen, dass die Leute möglichst stabil immer gute Ergebnisse bekommen, werden unsere Hinweise oft im Hintergrund der Generierung nochmal optimiert.

Ehemals war "Hinweisverstärkung" ein separater Button. Die Nutzer konnten entweder diesen nutzen oder direkt mit den ursprünglichen Hinweisen starten. Aber Shi Chao hat viele Plattformen durchsucht und es scheint, dass dies jetzt selten ist. Die Hinweisaufbereitung ist jetzt die Standardoption.

Wenn ich beispielsweise "Ein Mädchen fährt Fahrrad und lächelt dabei" eingebe, könnte der tatsächlich an das Modell übergebene, optimierte Hinweis so aussehen:

"Eine junge, hübsche asiatische Frau fährt Fahrrad auf einer sonnigen Alleenstraße. Sie hat helle Haut, feine Gesichtszüge, große Augen, eine kleine Nase, langes Haar, das sich natürlich weht. Sie trägt ein weißes Kleid und hat ein süßes Lächeln auf dem Gesicht. Die Aufnahme ist in Mittel- bis Nahaufnahme, mit sanftem natürlichem Licht, geringer Tiefenschärfe, einem filmischen Bildstil, einem frischen und schönen Stil. Die Person hat natürliche Mimik, flüssige Bewegungen und das Bild ist hochauflösend und realistisch."

Einmal oder zweimal ist das eine Optimierung der Hinweise. Tausende Male wird es aber zu einer Fertigungsstraße.

Also, nachdem Shi Chao die Hinweise geändert und einige Merkmale des Aussehens beschrieben hat, sieht das Gesicht in der unteren rechten Ecke deutlich anders aus. Aber ohne zusätzliche Umgebungsangaben fährt das Mädchen immer noch auf der Alleenstraße.

Aber es gibt viele Arten von feinen Gesichtszügen. Warum erkennt die KI nur diese eine Art von Schönheit?

Das bringt uns zum zweiten Grund: Bild- und Videomodelle haben von Natur aus ästhetische Vorurteile.

Eine im vergangenen Jahr in der Zeitschrift "Nature" veröffentlichte Studie hat dieses Problem eindeutig diskutiert. In ihrer Forschung haben sie festgestellt, dass, wenn man eine bestimmte Rasse angibt, die vom Modell generierten Gesichter alle wie Geschwister aussehen.

Diese ästhetischen Abweichungen stammen ursprünglich aus den Daten. Wenn die meisten Menschen Internetstars mit einem bestimmten Gesichtsbild mögen, werden diese natürlich als schön markiert. Das Modell versteht nichts davon, es sucht einfach in Zukunft bei der Anforderung einer schönen Person in diese Richtung.

Während des Trainings wird dieses Vorurteil noch verstärkt, sodass bei denselben Merkmalsangaben die generierten Gesichter immer ähnlicher werden.

Außerdem kann die Videomodelle die ästhetische Homogenisierung noch verstärken, um die Konsistenz zu gewährleisten.

Nach all dem müssen die vom Videomodel generierten Gesichter nicht nur schön, sondern auch stabil sein. Es muss sichergestellt werden, dass das Gesicht in zig oder sogar hunderten von Bildern wie ein und dieselbe Person aussieht.

Deshalb bevorzugt das Modell auch von Natur aus Gesichter, die leichter konsistent gehalten werden können: symmetrische Gesichtszüge, ein standardmäßiges Gesichtsprofil, keine extremen Merkmale, einfache Mimiksteuerung und es verändert sich nicht, wenn man den Kopf dreht.

Zusammenfassend lässt sich sagen, dass die Plattformen sichere und schöne Gesichter mögen, die Nutzer Kurzfilm-Internetstars, und das Modell stabile und standardmäßige Gesichter. Wenn man diese drei Interessen zusammenbringt, entsteht das Gesicht, das uns alle an die Grenze der Erträglichkeit bringt.

Ehrlich gesagt mag Shi Chao nicht nur das kürzlich verbreitete Gesicht, sondern fast alle von der KI generierten makellosen Schönheiten nicht.

Quelle: Xiaohongshu @Alexander

Das Eindringen von KI - Gesichtern in unseren Informationsstrom ist eine unabsichtlich verursachte, große zybernetische Alienierungs - Experiment.

Es entstehen Gesichter, die keine reale Entsprechung haben, nach dem Waschen und Destillieren unzähliger Internetstar - Daten.

Wenn sie die Zeit, die wir mit dem Handy verbringen, einnehmen und die echten, vielfältigen Schönheiten ersetzen, fühlt sich Shi Chao sehr unwohl. Denn unsere Wahrnehmung der Welt und unsere Definition von Schönheit werden von der KI unter Druck gesetzt.

Deshalb empfinden die Leute KI - Gesichter einerseits vielleicht wegen des Unheimlichkeitseffekts, der durch die Unwirklichkeit entsteht, und andererseits auch aus instinktivem Widerstand gegen die Homogenisierung.

Manche sagen, dass KI - Videos in Zukunft immer klarer, detaillierter und menschenähnlicher werden sollten. Wenn die Leute nicht mehr unterscheiden können, was echt und was falsch ist, werden sie es mögen.

Aber Shi Chao denkt, dass wir auch dann, wenn die Technologie es schafft, dass es schwer zu unterscheiden ist, kein perfektes, seelenloses Gesicht lieben können.

Bild- und Informationsquellen:

《AI-generated faces influence gender stereotypes and racial homogenization 》N AlDahoul

Xiaohongshu, Douyin

Dieser Artikel stammt aus dem WeChat - Account "Chaping X.PIN", Autor: Mo Mo Mo Tiantian, Redakteure: Jiang Jiang & Mian Xian. Veröffentlicht von 36Kr mit Genehmigung.

该文观点仅代表作者本人，36氪平台仅提供信息存储空间服务。

Umgeben von KI-Gesichtern wird mir langsam übel.

Bild- und Informationsquellen: