Diese versteckte Funktion des Pixel 10 sagt dir, ob ein Foto von KI bearbeitet wurde.
Das weltweit intelligenteste Smartphone, das Google Pixel, übernimmt diesmal sogar die Bildbearbeitung für Sie.
Das gerade neu veröffentlichte Pixel 10-Smartphone-Serie kann nicht nur mit KI Ihnen beim Fotografieren helfen oder Ihre ferne Aufnahmen verbessern, sondern unterstützt auch ein neues KI-Bildbearbeitungstool: Sagen Sie einfach Gemini, wie Sie das Bild haben möchten, und die KI bearbeitet es automatisch für Sie.
KI-Fotografie: Die unumgängliche Tendenz?
Als das Redaktionsteam von ifanr dieses Feature zum ersten Mal hörte, fanden einige Fotografen es überflüssig. Nachdem sie bereits mit verschiedenen Nachbearbeitungssoftware perfekt umgehen können, können sie alle gewünschten Effekte manuell einstellen, ohne mit der KI zu kämpfen.
Für die meisten Einsteiger ist es jedoch oft schwierig, die Probleme auf einem unansehnlichen Foto zu identifizieren, geschweige denn, es zu bearbeiten.
Darüber hinaus ist es mit herkömmlichen Bildbearbeitungssoftware sehr schwierig, Fotos mit Linsenglanz oder "tödlichem Oberlicht" zu retten. Um die Farbtönung und Helligkeit des gesamten Bildes harmonisch zu halten, sind sehr komplexe und feine Operationen erforderlich, was für viele Menschen eine Herausforderung darstellt.
Jetzt müssen Sie nur sagen, dass Sie die Lichtverhältnisse eines Fotos verbessern möchten, und nach kurzer Wartezeit erhalten Sie ein natürlich optimiertes Bild.
Bildquelle: Beleuchtung und Komposition verbessern
Sogar wenn Sie möchten, dass einige Störobjekte im Hintergrund entfernt werden, dass der Himmel mit Wolken versehen wird oder dass ein altes Foto repariert wird, versteht Gemini Ihre Wünsche.
Die Verwendung von KI-Assistenten zur Bildbearbeitung ist nicht neu: Einige chinesische Hersteller bieten auch KI-Sprachassistenten an, die Bilder gemäß den Anweisungen der Benutzer bearbeiten können. Obwohl noch nicht umgesetzt, hat Apple letztes Jahr auch gezeigt, dass Siri Bilder bearbeiten kann.
Tatsächlich unterscheidet sich dies von der Bildbearbeitungsfunktion von Gemini grundlegend. Diese KI-Assistenten können in der Regel nur sehr einfache Funktionsanweisungen verstehen, wie "Schönheitsfilter" oder "Helligkeit erhöhen". Einige leistungsstärkere können auch Passanten entfernen oder das Bild stylisieren.
Die Fähigkeit von Gemini besteht darin, die Text-zu-Bild-Fähigkeit seines eigenen Modells zu nutzen und das Bild auf der Grundlage der ursprünglichen Aufnahme neu zu zeichnen, basierend auf den Anweisungen des Benutzers.
Diese Art der Bildbearbeitung ist nicht neu. Diskussionen über die Feinbearbeitung von Bildern mit Doubao oder ChatGPT sind in sozialen Netzwerken nicht selten. ifanr hat auch eine Bewertung und Anleitung zur Bildbearbeitung mit Doubao veröffentlicht, die im Wesentlichen dasselbe wie die KI-Bildbearbeitung des Pixel 10 ist.
Der größte Vorteil besteht natürlich darin, dass diese Funktion in der Standardbildanwendung des Pixel 10 integriert ist. Nach der Aufnahme müssen Sie nicht zwischen verschiedenen Anwendungen wechseln, was den gesamten Prozess sehr bequem macht.
Anweisung: Plastiktüte entfernen, Bildquelle: MKBHD
Da die KI-Bildbearbeitung in der Regel auf großen Cloud-Modellen basiert, ist es eine KI-Anwendung, die sich lohnt, zu fördern. Chinesische Hersteller können vollständig mit großen Modellen wie Doubao zusammenarbeiten, um Funktionen wie die Anweisungsbasierte Bildbearbeitung in das System zu integrieren.
Als das einzige Unternehmen weltweit, das sowohl eigene Chips und Smartphones als auch ein erstklassiges großes Modell hat, kann Google für das Pixel natürlich noch mehr Funktionen bieten.
Der neue Tensor G5-Chip, der von TSMC hergestellt wird, verbessert die Leistung erheblich. Dies führt auch zu einer deutlichen Steigerung der Effizienz des lokalen Betriebs des Gemini Nano-Modells, sodass Google die KI direkt in die Kamera integrieren kann, während die Aufnahme immer noch sehr schnell erfolgt.
Dies bringt dem Pixel 10-Kamera ein herausragendes Fotografiefeature: Die verbesserte 100-fache Zoomfunktion Pro Res Zoom.
Foto mit 100-fachem Zoom, links: Vor KI-Optimierung; rechts: Nach KI-Optimierung, Bildquelle: CNET
Mit einem herkömmlichen Kameralinsen ist ein Foto mit 100-fachem Zoom in der ursprünglichen Auflösung fast unbrauchbar, da es so unscharf ist, dass es wie "Mosaik" aussieht.
Das Pixel 10 Pro kann jedoch nach der Aufnahme die fehlenden Details des Sensors mit lokaler KI berechnen und in nur 4-5 Sekunden ein relativ scharfes Foto generieren.
Aktuell scheinen einige KI-Fotografiefunktionen des Pixel 10 eher "für die KI als solche" zu sein und haben für die Benutzer nur begrenzten Nutzen.
Zum Beispiel bietet die neue "Camera Coach"-Funktion die Möglichkeit, mit der Edge-KI den Sucherinhalt in Echtzeit zu analysieren und schnell einige Alternativen für das fertige Foto anzubieten. Anschließend wird der Benutzer Schritt für Schritt gelehrt, wie man professionellere Aufnahmen macht.
Im Gegensatz dazu kann bei der ähnlichen "KI-gestützten Kompositionshilfe" von Huawei das Smartphone automatisch zoomen und die Komposition einstellen, wenn der Benutzer nur auf die Punkte im Sucher zielt. Diese Möglichkeit, direkt ein Ergebnis zu erzielen, kommt eher der von uns erwarteten Künstlichen Intelligenz nahe.
Die Grenze zwischen Ausdruck und Wirklichkeit
Von der Komposition der Aufnahme über die tatsächliche Abbildung bis zur Nachbearbeitung hat die KI in jeder Ecke der Fotografie des Pixel-Smartphones Einzug gehalten. Die Diskussion und Debatte über die Echtheit von Fotos ist daher ein Problem, das wir nicht ignorieren können.
Im Vergleich zum Pixel Studio des vergangenen Jahres, das wegen der Möglichkeit, normale Fotos beliebig zu verändern, heftige Kontroversen ausgelöst hat, hat die KI-Fotografiefunktion des Pixel 10 dieses Jahr deutlich langsamer Fortschritte gemacht. Die Funktionen konzentrieren sich mehr auf die Verbesserung der Qualität der Aufnahmen und schränken den Freiraum für die Kreativität der Benutzer ein.
Darüber hinaus hat Google für die Google Photos-Albumanwendung das "C2PA"-Inhaltszertifikat eingeführt. In Zukunft kann man in den Details jedes Fotos, das mit dem Pixel 10 aufgenommen wurde, sehen, mit welchem Gerät es aufgenommen wurde und ob es mit KI bearbeitet wurde.
Bildquelle: The Verge
Isaac Reynolds, Produktmanager der Pixel-Kamera, ist der Meinung, dass das C2PA-Zertifikat, das schwer zu ändern ist, effektiver als ein herkömmliches Wasserzeichen ist. Google glaubt, dass diese Art der Kennzeichnung allmählich akzeptiert wird, sich aber derzeit noch in der "Aufklärungsphase" befindet.
Dies wirft die Frage auf: Was zählt eigentlich als "mit KI bearbeitetes Foto"?
Zum Beispiel wenn man einem Straßenfoto Feuer hinzufügt oder einem Speisefoto eine Kakerlake einfügt, ist es eindeutig ein "mit KI bearbeitetes Foto". Dies ist wahrscheinlich auch der Hauptgrund, warum Google das C2PA eingeführt hat: um Menschen davor zu schützen, von diesen hochrealistischen KI-bearbeiteten Bildern getäuscht zu werden. Es ist auch eine Reaktion auf die Kontroversen um das Pixel 9 des vergangenen Jahres.
Bezüglich der Grenzen der KI-Bildbearbeitung hat Apple-Manager Craig Federighi letztes Jahr seine Bedenken geäußert: Apple sah Fotos ursprünglich als vertrauenswürdige Repräsentation der Realität an, nicht als "Illusion", und wollte daher keine KI-Bildbearbeitungsfunktion einführen.
Aber aufgrund des starken Bedarfs der Benutzer war Apple bereit, einen kleinen Schritt vorwärts zu machen und es den Benutzern zu ermöglichen, unwichtige Details auf Fotos zu entfernen.
Außerdem wird jedes mit KI bearbeitete Foto mit der Markierung "mit Reinigungsfunktion bearbeitet" versehen und kann jederzeit rückgängig gemacht werden.
Fällt die 100-fache Zoomfunktion des Pixel 10 dieses Jahr in die Kategorie der KI-Bildbearbeitung?
Seit langem ist die Smartphone-Fotografie auf Algorithmen angewiesen, um die Erkennung des aufgenommenen Objekts zu verbessern und die Details des Bildes zu optimieren. Die Pro Res Zoom-Funktion ist im Wesentlichen die Weiterentwicklung dieses Prozesses, sodass das Bild auch bei 100-fachem Zoom noch brauchbar ist.
Früher haben einige Smartphone mit hervorragender Fotografiequalität auch stark auf Algorithmen gesetzt, um die Details von Mondaufnahmen zu verbessern, was von den Nutzern sogar als "Zeichnen des Mondes" bezeichnet wurde.
Auch die derzeitigen chinesischen Smartphones mit Superfernobjektiven, die auf "Fernaufnahmen" setzen, sind ab einer 30-fachen Vergrößerung stark auf die Wiederherstellung der Bilddetails angewiesen, was im Wesentlichen ähnlich wie die Pro Res Zoom-Funktion ist.
Nach Ansicht von Google gehört ein solcher Prozess bereits in die Kategorie der KI-Bildbearbeitung und wird im C2PA entsprechend gekennzeichnet.
Darüber hinaus gehört auch die von vielen Herstellern eingesetzte "Multi-Frame-Synthese"-Technologie in die Kategorie der "KI-Bildbearbeitung" nach Google.
Dies wirft die Frage auf, wie man die "KI-Bildbearbeitung" definiert, da es bisher keine konkreten Standards gibt. Tatsächlich haben auch Fotos, die wir als "direkt aus der Kamera" betrachten, hinter den Kulissen eine Menge Rechenprozesse.
Ein Foto, dessen Qualität nur mit KI verbessert wurde, unterscheidet sich in puncto Echtheit erheblich von einem Foto, in das eine KI eine Kakerlake eingefügt hat.
Wenn dieser Standard tatsächlich global verbreitet wird und soziale Netzwerke die entsprechenden Informationen anzeigen können, wird das Fotografieren und Teilen von Bildern sicherlich eine andere Note bekommen.
Oft ist das Fotografieren und Teilen von Bildern eher eine Möglichkeit, Erinnerungen und Emotionen zu bewahren und zu teilen, als eine Darstellung der Wirklichkeit.