Google hat die gesamte Erde in ein großes Modell integriert, führt Echtzeitbeobachtungen durch und aktualisiert es täglich.
Die ChatGPT-Zeit der Erde ist da!
Google DeepMind hat das AlphaEarth Foundations-Modell (im Folgenden kurz AEF) vorgestellt, das es ermöglicht, die Erde mit hoher Präzision zu kartieren.
Der Nobelpreisträger und Chef von Google DeepMind, Demis Hassabis, sagte: Es wird den Wissenschaftlern beinahe Echtzeit-Beobachtungen der Erde ermöglichen.
Das Modell löst hauptsächlich zwei große Probleme: Datenüberlastung und Informationsinkonsistenz. Einfach ausgedrückt, es gibt viele Beobachtungsdaten, aber wenige hochwertig annotierte Daten, was die Kartierung der Weltkarte schwierig macht.
AEF ist wie ein virtueller Satellit, der petabytegroße Mengen an Erdbeobachtungsdaten wie optische Satellitenbilder und Klimasimulationen integriert. Es kann aus multiquelligen und diskreten Daten eine allgemeine geospatiale Darstellung generieren, sodass Wissenschaftler auf Wunsch Erdkarten erstellen können und die weltweite Kartierung und Überwachung mühelos möglich ist.
Der von ihm generierte Satelliten-Einbettungsdatensatz wird jetzt von über 50 globalen Organisationen wie der Ernährungs- und Landwirtschaftsorganisation der Vereinten Nationen und dem Harvard Forest verwendet.
Tatsächlich können nicht nur Wissenschaftler, sondern auch normale Menschen mithilfe von AlphaEarth Foundations die Veränderungen der Erde leicht verstehen.
Von der Epoche der Großen Entdeckungen bis zur Gegenwart hat es der Mensch 500 Jahre gedauert, die Erde zu kartieren. Jetzt macht die Entstehung von AEF es möglich, die Erde täglich neu zu kartieren.
Darüberhinaus rief Bilawal Sidhu, ein ehemaliger Forscher bei Google Maps, aus: Google hat einen wichtigen Schritt in Richtung der Schaffung einer ChatGPT-Version für die Erde gemacht.
Schauen wir uns an, wie es das schafft.
Hohe Präzision bei der Verfolgung der Erde
Fusion multiquelliger Informationen und kontinuierliche Modellierung der Zeit
Heutzutage gibt es unzählige Geräte wie Satelliten, Radar, Drohnen und Wetterstationen, die täglich Daten über die Erde wie Bilder, Temperatur, Feuchtigkeit und Topographie sammeln.
Aber die Annotationsstandards für Beobachtungsdaten können in verschiedenen Ländern und Institutionen unterschiedlich sein. Außerdem ändert sich die Erdoberfläche ständig (z. B. wird Wald gerodet), aber die Feldannotationen werden oft erst alle paar Jahre aktualisiert, was dazu führt, dass die annotierten Daten nicht mehr mit der Realität übereinstimmen.
Einfach ausgedrückt, die Erdbeobachtungsdaten sind wie "unzählige Fotos der Erde", aber es gibt nur wenige Annotationsdaten, die "was genau auf den Fotos zu sehen ist" sagen. Dies behindert direkt die Präzision und Effizienz der weltweiten Kartierung.
Der Wert von AEF liegt darin, dass es auch bei wenigen Annotationen die riesigen Mengen an Beobachtungsdaten nutzen und genauere Karten zeichnen kann.
AEF ist ein Einbettungsfeldmodell, dessen Kern der Raum-Zeit-Präzisions-Kodierer (STP) ist. Der STP erfasst geografische Fernbeziehungen durch räumliche Selbst-Attention, analysiert zeitliche Dynamiken durch Selbst-Attention auf der Zeitachse und behält lokale feine Merkmale mithilfe von Faltungsoperationen bei.
Einfacher ausgedrückt, es komprimiert die komplexen Informationen auf der Erdoberfläche (z. B. Topographie, Vegetation, Klima) zu einer Gruppe von "digitalen Codes" (Einbettungsvektoren), die die raumzeitlichen Merkmale der Erdoberfläche präzise widerspiegeln und sowohl das Ganze als auch die Details erfassen können.
Eine weitere Innovation von AEF ist die Fähigkeit zur kontinuierlichen Modellierung der Zeit.
Es trennt die Unterstützungsperiode der Beobachtungsdaten (der Zeitraum, in dem die Daten tatsächlich gesammelt werden) von der Gültigkeitsdauer der Kartenproduktion (der Zeitraum, der abgebildet werden muss). Selbst wenn es in der Gültigkeitsdauer keine direkten Beobachtungsdaten gibt, kann es kontinuierliche Ergebnisse durch Interpolation oder Extrapolation generieren.
Wenn es beispielsweise nur Satellitenbilder aus den Jahren 2018 und 2020 gibt, kann das Modell zuverlässig den Zustand der Erdoberfläche einer Region im Jahr 2019 vorhersagen. Dies löst das Problem herkömmlicher Modelle, die nur Daten für feste Zeitpunkte verarbeiten können.
Bei der Datenverarbeitung erreicht AEF eine tiefe Fusion multiquelliger Informationen.
Es kann über 10 verschiedene Eingaben wie optische Satelliten, Radar, Lidar, Klimadaten und sogar geographische Texte empfangen und bricht so die Barrieren zwischen verschiedenen Datentypen. Durch eine einheitliche Kodierungsmethode werden diese Daten unterschiedlicher Typen und Auflösungen in kompatible Merkmale umgewandelt.
Beispielsweise werden die Farbe der Vegetation in optischen Bildern, die Informationen über die Erdoberflächenstruktur aus Radar und die Temperaturdaten von Wetterstationen in einem einzigen Einbettungsvektor integriert, der nur 64 Byte groß ist.
Der Trainingsmechanismus des Modells ist ebenfalls bemerkenswert. Es verwendet ein Lehrer-Schüler-Modell und eine Kontrastlernstrategie. Gleichzeitig wird ein Textausrichtungs-Training eingeführt, um die geographischen Textdeskriptionen mit den Einbettungsvektoren der entsprechenden Regionen zu verknüpfen und so die semantischen Informationen der Merkmale zu erweitern.
Schließlich analysiert das von AEF generierte Einbettungsfeld die Landmassen und Küstengewässer der Erde in Form von 10x10-Meter-Feldern genau und erstellt für jedes Feld eine hochkompakte Zusammenfassung. Der Speicherplatzbedarf beträgt nur ein Sechzehntel des anderer KI-Systeme, was die Analysekosten senkt.
Und diese Einbettungsvektoren können ohne erneutes Training direkt für verschiedene Kartierungsaufgaben verwendet werden. Egal, ob es sich um die Landbedeckungsklassifizierung, die Erkennung von Kulturpflanzen oder die Detektion von Waldveränderungen handelt, es können hochpräzise Ergebnisse durch einfaches Transferlernen erzielt werden.
Ausgezeichnete Leistung
Im Vergleich zu herkömmlichen Methoden und anderen KI-Kartierungssystemen behält AEF bei der Ausführung verschiedener Aufgaben in verschiedenen Zeiträumen, einschließlich der Erkennung der Landnutzung und der Schätzung von Erdoberflächenattributen, immer die höchste Genauigkeit bei.
Beispielsweise erreichte AEF in einer Landbedeckungsklassifizierungsaufgabe eine balancierte Genauigkeit von 0,82, während das zweitbeste Modell nur 0,69 erreichte.
AEF zeichnet sich besonders in Situationen mit wenigen Labeldaten aus. Die durchschnittliche Fehlerrate ist um 24 % niedriger als die der getesteten Modelle, was eine ausgezeichnete Lernleistung zeigt.
Betrachtet man die konkreten Anwendungsfälle, zeigt sich AEF in der thematischen Kartierung (z. B. Landbedeckungsklassifizierung), der Schätzung biophysikalischer Variablen und der Veränderungsdetektion umfassend.
Beispielsweise kann es bei der Erkennung der jährlichen Landbedeckungsveränderungen genau zwischen Wald, Ackerland, Städten usw. unterscheiden. Die Fehler bei der Erfassung von kleinen Veränderungen sind weit geringer als bei herkömmlichen Methoden.
Satelliten-Einbettungsdatensatz
Im Google Earth Engine ist der von AEF angetriebene Satelliten-Einbettungsdatensatz einer der größten Datensätze in seiner Klasse und enthält jedes Jahr über 1,4 Billionen Einbettungsspuren. Der Datensatz wurde jetzt im Earth Engine-Datenkatalog veröffentlicht.
Diese Reihe von jährlichen Einbettungsdaten wurde von mehreren globalen Organisationen übernommen, darunter die Ernährungs- und Landwirtschaftsorganisation der Vereinten Nationen, der Harvard Forest und die Organisation für Erdbeobachtung. Sie nutzen den Datensatz, um leistungsstarke benutzerdefinierte Karten zu erstellen.
Beispielsweise zielt das Projekt "Globaler Ökosystem-Atlas" darauf ab, die erste umfassende Ressource für die Kartierung und Überwachung der globalen Ökosysteme zu schaffen. Das Projekt nutzt diesen Datensatz, um Ländern zu helfen, nicht kartierte Ökosysteme in Kategorien wie Küstenbuschland und extrem trockene Wüsten einzuteilen.
Nick Murray, der globale Wissenschaftliche Leiter des Globalen Ökosystem-Atlas, sagte:
Der Satelliten-Einbettungsdatensatz verändert unsere Arbeit grundlegend. Er hilft Ländern, unbekannte Ökosysteme zu kartieren - was für die genaue Bestimmung der Schwerpunktbereiche für Schutzmaßnahmen von entscheidender Bedeutung ist.