Achtung, lassen Sie sich nicht von ChatGPT Images 2.0 täuschen!
Das obige Ankündigungsbild wurde von KI generiert.
Bericht von Zhidongxi vom 22. April. In der Nacht von heute hat OpenAI endlich das hoch erwartete Bildgenerierungs- und -bearbeitungsmodell ChatGPT Images 2.0 offiziell veröffentlicht. Das Modell ist bereits vollständig in den Chatbot ChaGPT und den API-Dienst integriert.
Altman kommentierte während der Live-Übertragung der Pressekonferenz: „Die Veröffentlichung von ChatGPT Images 2.0 ist ein riesiger Sprung, vergleichbar mit einem Sprung von GPT3 direkt zu GPT5.“
Nach der Veröffentlichung des Modells stieg es schnell an die Spitze aller Listen in Image Arena. In der harten Konkurrenz der Text-zu-Bild-Rangliste liegt es 242 Punkte vor Nano banana 2.
Nach der Veröffentlichung des Modells hat es die sozialen Medien schnell in Wallung gebracht. Einige Internetnutzer riefen direkt „Die Bananen sind nicht mehr so lecker. ChatGPT Images 2.0 hat das Spiel beendet.“
Viele Internetnutzer haben ihre mit ChatGPT Images 2.0 generierten Bilder gezeigt. Plötzlich waren überall unglaubliche Bilder zu sehen. Die starken Fähigkeiten von ChatGPT Images 2.0 lassen es schwer zu unterscheiden, ob diese Bilder echt oder gefälscht sind. Manche haben sogar festgestellt, dass es sogar scannbare Barcodes generieren kann.
Unter den generierten Ergebnissen, die von Internetnutzern gezeigt wurden, gibt es Live-Stream-Screenshots, Pressekonferenzfotos und sogar Überweisungsnachweise, die sehr real aussehen und eng mit dem Alltag verbunden sind. Diese von ChatGPT Images 2.0 generierten Bilder können in vielen Situationen als echt ausgegeben werden, und es ist leicht, dass unwissende Menschen getäuscht werden.
Zhidongxi hat verschiedene Fälle gesammelt und getestet. Mal sehen, ob Sie die Echtheit von diesen Bildern erkennen können.
01. Live-Stream, Überweisung, Pressekonferenz: KI-generierte Bilder sind schwer zu unterscheiden
Die Ankündigung des DeepSeek V4 in der Kopfabbildung des Artikels wurde mit ChatGPT Images 2.0 generiert. Der Prompt lautet wie folgt: „Ein Screenshot eines Tweets über die Ankündigung der Veröffentlichung von DeepSeek V4, veröffentlicht von dem offiziellen DeepSeek-Konto. Behalte die Profilbilder, Benutzernamen, Likes, Retweets, Kommentare und andere Elemente der Tweet-Oberfläche bei.“
Zusätzlich hat Zhidongxi ChatGPT Images 2.0 gebeten, einen Screenshot eines Freundeskreises zu generieren, um die Sache abzurunden.
Prompt: „Ein Screenshot eines WeChat-Freundeskreises. Sam Altman postet im Freundeskreis, dass er DeepSeek V4 als ein bahnbrechendes Modell lobt. Darunter gibt es Likes und Kommentare von Musk, Zuckerberg und Huang Renxun.“
Ohne Referenzbilder sieht der von ChatGPT Images 2.0 generierte Screenshot ziemlich real aus. Allerdings gibt es etwas Abweichungen bei den Profilbildern der Personen, und der Name von Huang Renxun hat auch einige fehlende Striche.
Es gibt auch die Möglichkeit, Live-Stream-Seiten mit ChatGPT Images 2.0 zu generieren. Diese Art von Spiel hat sich in der jüngsten Beta-Phase schnell verbreitet. Manche haben mit GPT Image 2 einen Screenshot eines Live-Streams generiert, in dem Altman Doubao beworben hat. Es sieht völlig natürlich aus. Die Lotterie-Red-Envelope in der linken oberen Ecke und die Kommentare unten sind sehr real. Wenn man andere bekannte Persönlichkeiten in China einfügt, könnte man tatsächlich getäuscht werden.
Zhidongxi hat auch gemäß der üblichen Testmethode für Bildgenerierungsmodelle versucht, ein Foto von handschriftlichem Text zu generieren. Der Eingabeprompt lautet: „Ein Foto von handschriftlichen Mathe-Hausaufgaben für die High School, geschrieben mit ordentlichen Schriftzeichen auf weißem Papier. Der Inhalt ist eine Aufgabe über Ableitungen.“
Das generierte Foto sieht fast genauso aus wie die Hausaufgaben von Schülern mit ordentlichen Schriftzeichen. Gibt es Lehrer in der Kommentarsektion? Mal sehen, ob Sie die Echtheit erkennen können.
Manche haben auch Spaß gemacht und ChatGPT Images 2.0 gebeten, Steve Jobs bei der Veröffentlichung des Xiaomi-Autos zu zeigen. Man sieht lange Zeit nichts Ungewöhnliches.
Wenn Sie das obige Bild nicht real genug finden, schauen Sie sich das folgende an:
Dieses Bild wurde ebenfalls von ChatGPT Images 2.0 generiert. Der Prompt lautet: „Auf der iPhone 20-Pressekonferenz im Apple-Campus hält Tim Cook einen Vortrag. Dieses Amateur-iPhone-Foto wurde aus der Ferne aus der Menge aufgenommen.“
Dieses Foto entspricht sehr der Medienperspektive. Wenn es nicht das offensichtliche iPhone 20 und die Abmeldung von Cook gäbe, würde es wahrscheinlich viele Menschen täuschen.
Schauen Sie sich auch dieses Bild an. Dies ist eine akademische Dissertation, die von Zhidongxi in ChaGPT generiert wurde. Der Eingabeprompt lautet: „Eine Ausgabe der Peking-Universitätsschrift, die einen Artikel über KI-Sicherheitsprobleme veröffentlicht. Die Formatierung ist elegant und der Stil ist streng.“
Eine Ausgabe der Schrift ist fertig. Der gesamte Stil entspricht sehr den Normen einer offiziellen akademischen Zeitschrift. Es ist sehr einfach, und der chinesische Text ist korrekt. Der Titel, die Autoren, die Institutionen, der Abstract, die Schlüsselwörter und die Einleitung des Textes sind alle sinnvoll angeordnet. Die Zeilenabstände und die Absatzstruktur sind klar, und sogar die DOI und die Urheberrechtsinformationen wurden generiert. Es sieht sehr professionell aus.
Wenn jemand diesen Dissertation-Screenshot schickt und Sie ihn als Referenz für Ihre Recherche verwenden sollen, würde es wahrscheinlich einige Menschen täuschen.
Es gibt sogar Leute, die mit ChatGPT Images 2.0 Überweisungsscreenshots generieren. Das ist wirklich beängstigend. Sogar Siegel können gefälscht werden. Das ist kein gutes Zeichen.
Dieses Rezept wurde ebenfalls von ChatGPT Images 2.0 erstellt. Abgesehen davon, dass die Schriftzeichen zu ordentlich sind und nicht wie die eines Arztes aussehen, ist alles andere real genug, um als echt ausgegeben zu werden.
02. ChatGPT Images 2.0 ist sehr beliebt, und die Internetnutzer haben Spaß
Derzeit können alle ChatGPT- und Codex-Nutzer eine gewisse Anzahl von Bildgenerierungen kostenlos nutzen. Nach Tests kann man etwa 7 Bilder generieren. Bezahlte Abonnenten können den Denkmodus freischalten. Das Modell wird dann im Internet suchen, testen und sich selbst überprüfen, um die Qualität der generierten Bilder zu gewährleisten. Gleichzeitig ist das Modell gpt-image-2 über die API öffentlich zugänglich.
Nutzer können die ChatGPT-Konversation öffnen, auf das Pluszeichen links neben dem Eingabefeld klicken und die Option „Bild erstellen“ auswählen. Standardmäßig wird ChatGPT Images 2.0 verwendet. Dann können Sie auf das Pluszeichen klicken, um Fotos und Dateien hinzuzufügen und den Prompt senden.
Bei unklaren Anforderungen wird ChatGPT den Nutzer fragen und erst nach Bestätigung der Anforderungen das Bild generieren.
Nach der Veröffentlichung von ChatGPT Images 2.0 haben viele Internetnutzer es ausprobiert und es hoch gelobt. Alle zeigen, wie schön die von ChatGPT Images 2.0 generierten Bilder sind. Einige Internetnutzer riefen direkt, dass man es gar nicht unterscheiden kann, ob es echt oder gefälscht ist.
Ein medizinischer Doktor der Universität Tokio hat seinen generierten Dissertationsposter gezeigt und gesagt, dass ChatGPT Images 2.0 scheinbar die Daten in der Dissertation verarbeiten kann, obwohl er es noch nicht getestet hat. Er hat ausgerufen, dass die wissenschaftliche Forschung bald eine weitere Revolution erleben wird.
Riley Brown, Mitbegründer von vibecode und ausländischer Blogger, sagte direkt: „Dies ist das beste Bildmodell.“