StartseiteArtikel

Google beansprucht die stärkste AI-Version von Photoshop. Jetzt ist sie für alle zugänglich, und die Ergebnisse sind wirklich beeindruckend.

量子位2025-08-27 15:14
Die geheimnisvolle nano-banana hat ihre "Bananenschale" abgenommen.

Der heißbegehrte mysteriöse Bildbearbeitungsalgorithmus nano-banana hat endlich seine "Bananenschale" abgelegt!

Heute hat Google diesen Algorithmus offiziell in Anspruch genommen und erklärt, dass es sich tatsächlich um Gemini 2.5 Flash Image handelt.

Hier ist auch die neueste Welle offizieller Demos:

Es hat auch eine hervorragende Fähigkeit zur Bildinferenz gezeigt:

Der Algorithmus kann jetzt kostenlos auf Gemini und Google AI Studio genutzt werden. Gleichzeitig ist die API für jedes Bild zu einem Preis von 0,039 $ (etwa 0,28 Euro) verfügbar.

Wie performt der Algorithmus konkret? Lassen Sie uns zusammen schauen!

Außergewöhnliche Bildbearbeitungsfähigkeiten

Die Offizielle hat viele interessante Anwendungen gezeigt.

Außer den herkömmlichen Bildbearbeitungsmethoden kann es auch bis zu drei Bilder zusammenführen, um etwas Neues zu schaffen.

Es kann surrealistische Kunst generieren, verschiedene Fotoelemente kombinieren oder Objekte, Farben und Texturen nahtlos verschmelzen.

Oder kann Designideen einfach umsetzen.

Es kann auch aus einigen Fotos eine zusammenhängende Geschichte erzählen, die wie Filmaufnahmen aussehen.

Noch bevor die Offizielle die Identität bestätigte, waren die Internetnutzer schon von den verschiedenen privaten Fällen von nano-banana fasziniert und begannen heftige Diskussionen.

Zum Beispiel kann es Gesichtsausdrücke und das Wetter präzise ändern.

Oder kann einem kahlköpfigen Mann verschiedene Frisuren geben.

Ein Internetnutzer sagte: Photoshop ist in Gefahr.

Schließlich kann diese "Banane" nicht nur flache Bilder bearbeiten, sondern auch die Umwandlung von 2D in 3D durchführen. Der Benutzer muss nur ein gewöhnliches 2D-Bild bereitstellen, und das System kann automatisch die entsprechende 3D-Sicht generieren. Jeder Winkel ist perfekt und harmonisch.

Das Wahnsinnigste ist, dass es sogar Bildinferenz durchführen kann. Der Satz des Pythagoras ist so einfach, Winkelberechnungen sind kein Problem, und die Erkennung der Struktur eines Quallen im Bild erfolgt sogar augenblicklich. Es ist wie die AI-Version von "Zeichne und Rate".

Ehrlich gesagt, was mich am meisten beeindruckt hat, ist, dass, als wir diese "Banane" baten, einen Plan für eine Person von A nach B zu geben, es direkt eine Leiter generiert hat!

Okay, okay, okay, der Bildbearbeiter kann tatsächlich denken.

Wir haben diesen Algorithmus auch selbst getestet und festgestellt, dass er wirklich interessant ist:

Gebe ihm eine Katze, und die Katze kann die Welt bereisen.

Anweisung: Generiere Reisebilder mit dieser Katze als Hauptfigur.

Anweisung: Lass die Katze ein Selfie im Kaiserpalast machen.

Wenn man keine realen Szenen will, kann man auch sagen, dass Lin Daiyu und Sun Wukong als Marvel-Helden zusammen kämpfen~

Außerdem versteht es die Details von Licht und Schatten ziemlich realistisch.

Anweisung: Eine Banane liegt auf der Küchentheke. Neben ihr sind ein Wasserbecher, ein Messer und ein Schneidebrett. Das Sonnenlicht fällt durch das Fenster herein, und die Banane wirft einen natürlichen Schatten.

Man kann sehen, dass das generierte Ergebnis ziemlich gut ist. Der Schatten, der durch die Brechung des Sonnenlichts durch den Wasserbecher entsteht, und der Schatten der Pflanze nebenan sind ziemlich vernünftig.

Es kann auch die Charakteristiken von Charakteren gut erfassen und den Hauptcharakter problemlos ändern:

Was wäre, wenn Kudo Shinichi damals nicht das Verkleinerungsmittel getrunken hätte, sondern...

Der mysteriöse Bananenalgorithmus

Nano Banana tauchte zuerst auf einer Website namens LMArena auf, einer Stelle, an der verschiedene KI-Algorithmen anonym in "Kampfmodus" antreten können.

Der Grund, warum Nano-banana so heiß geworden ist, ist einfach: Seine Leistung ist wirklich hervorragend.

Es ist wieder ein SOTA-Bildbearbeitungsalgorithmus - und am Anfang gab es keine offiziellen Dokumente.

Aber bevor die Offizielle die Ankündigung machte, hatten einige Leute schon vermutet, dass es ein Mitglied der Google-Familie ist.

Einerseits ähnelt die Leistung dieses Algorithmus der kürzlich veröffentlichten multimodalen Version von Gemini. Eine so hervorragende Leistung ist kaum das Produkt eines Garage-Teams.

Andererseits ähnelt seine Veröffentlichungsstrategie - anonyme Veröffentlichung, keine Markenidentifikation, Lassen der Benutzercommunity sich selbst zu erkunden - genau der Vorgehensweise von DeepMind, als es in der frühen Phase große Sprachmodelle auf anonymen Testplattformen evaluierte.

Es gibt noch einen zusätzlichen Grund: Einige Entwickler, die mit Google verbunden sind, haben sel,tsame Bananen-Inhalte auf sozialen Medien gepostet 🍌

Ein Internetnutzer fragte, warum Google es geheimnisvoll veröffentlichen wollte. Die Offizielle gab folgende Erklärung:

Es bereitet sich auf die globale Veröffentlichung vor.

Internetnutzer: Wann wird die vollständige Version veröffentlicht?

Nachdem die Offizielle das gesagt hat, können die Internetnutzer es nicht abwarten.

Sie sagten: Können wir jetzt die vollständige Version nutzen?