Fünf Stunden verloren im kanadischen Busch: Die rettende Superfähigkeit von ChatGPT, zuverlässiger als Karten
Stellen Sie sich vor, Sie sind fünf Stunden lang in einem kanadischen Wald verirrt, Ihr Handy hat nur noch 3 % Akkustand, Google Maps funktioniert nicht mehr und das Signal ist schwach. Aber ChatGPT hat dank der Echtzeitkoordinaten die Lage gerettet. Ein echtes Lehrstück für die KI-Navigation! Schauen Sie sich das mal an.
Neulich hat ein Beitrag auf der Plattform X für Aufsehen gesorgt. Eine Gruppe Leute war mit Allradfahrzeugen (ATV) in der abgelegenen kanadischen Stadt Mabou unterwegs und war fünf Stunden lang total verirrt. Erst dank der Navigation von ChatGPT konnten sie sicher zurückkehren.
Mabou ist ein kleines Örtchen, umgeben von unentwickelten Wäldern und Pfaden.
Ursprünglich wollten sie von der Upper Southwest Mabou Rd starten und 18 Kilometer bis nach Whycocomagh fahren, um dort eine Runde zu machen.
Der Plan war gut, aber sie haben versehentlich die Hauptstraße verlassen und sich in Pfade verirrt, die nicht auf der Karte markiert waren.
Das Ergebnis war, dass weder Google Maps noch die speziellen ATV-Apps funktionierten, denn diese Tools kennen nur die Hauptstraßen und haben diese verborgenen Pfade nicht in ihrer Datenbank. So waren sie völlig verirrt.
Das Handy-Signal war auch schlecht und der Akkustand nur noch 3 %. Ein Reiter hatte die Idee, ChatGPT zur Navigation zu nutzen und schickte alle 5 - 10 Minuten die GPS-Koordinaten an ChatGPT.
Überraschenderweise hat dieser Trick tatsächlich geholfen.
ChatGPT rettet Schritt für Schritt
Im ersten Screenshot hat ChatGPT eine klare und praktische Antwort gegeben und die Route in einfache Schritte aufgeteilt.
Um Hilfe mit den Koordinaten bitten
Sie haben ihre aktuelle Position (45,9697°N, 61,4119°W) per Handy-GPS an ChatGPT geschickt und gefragt, ob es eine Route nach Whycocomagh (45,96435°N, 61,1426°W) gibt.
ChatGPT gibt eine tolle Antwort
ChatGPT hat die Koordinaten und das Gelände analysiert und eine super klare Schritt-für-Schritt-Anleitung gegeben:
Erster Schritt: Fahren Sie von der Upper Southwest Mabou Rd östlich. Es ist eine Schotterstraße, die für ATVs befahrbar ist.
Zweiter Schritt: Fahren Sie auf den Chestico Trail / Celtic Shores Coastal Trail (Chestico-Weg / Küstenweg der Kelten) ein. Dieser Weg beginnt im Osten und ist für ATVs legal nutzbar. Er ist etwa 17 Kilometer lang und führt von Fort Hood bis zum Mabou-Fluss.
Dritter Schritt: Fahren Sie östlich entlang des Weges, parallel zur Route 19, durch den Wald und folgen Sie dem Mabou-Fluss.
Vierter Schritt: Wenn Sie nahe dem Dorf Mabou sind, biegen Sie südlich oder östlich ab und nehmen Sie die Route 252 (die Straße nach Whycocomagh). Dann sind Sie da!
Diese Anleitung enthält nicht nur Straßennamen, sondern auch die Richtung (Osten, Süden) und das Gelände (Wald, Fluss). Sie ist sehr praktisch und jeder Verirrte kann sie verstehen.
Route jederzeit anpassen
Sie haben alle 5 - 10 Minuten neue Koordinaten geschickt und ChatGPT hat die Empfehlung entsprechend der neuen Position angepasst.
Der folgende Screenshot zeigt, dass ChatGPT bestätigt hat, dass sie auf dem richtigen Weg sind, und empfohlen hat, weiterhin dem Mabou-Fluss zu folgen. Es hat auch die nächsten Möglichkeiten angegeben.
Übertrumpft herkömmliche Navigation
Google Maps und die ATV-Apps haben aufgrund fehlender Daten über die Pfade komplett versagt.
ChatGPT hingegen hat mithilfe der GPS-Koordinaten und der Satellitenansicht herausgefunden, wie die Pfade verbunden sind und hat eine einfache Anleitung gegeben. Das war wie ein rettender Strohhalm, besonders in der Wildnis.
Manche haben ChatGPT als „rettendes Werkzeug“ gelobt, aber andere haben kritisiert: Wenn man Handy-Signal und GPS hat, warum nicht einfach die Satellitenansicht nutzen?
Die Antworten im Beitrag erklären, dass die Satellitenansicht zwar nützlich ist, aber nicht wie ChatGPT Echtzeit- und individuelle Textanleitungen geben kann, besonders in komplexen Geländen.
Studien haben gezeigt, dass Large Language Models (LLMs) wie ChatGPT tatsächlich Potential in der Outdoor-Navigation haben.
Zum Beispiel das PathGPT-Framework, das historische Routen in Texte umwandelt und dann mit KI individuelle Routen generiert. Das funktioniert ausgezeichnet.
PathGPT: Wie beim Freund nachfragen
Stellen Sie sich vor, Sie öffnen Ihre Navigations-App und sagen: „Finde mir eine Route von der Arbeit nach Hause, ohne Stau und wo ich noch einen Kaffee holen kann.“ Die App gibt sofort ein genaues Planung.
Neulich hat ein Forschungsteam der Shanghai Jiao Tong University PathGPT vorgestellt, das die Navigation mit einem LLM revolutioniert hat.
Link zur Studie: https://arxiv.org/abs/2504.05846
Frühere Navigationsalgorithmen, wie der Dijkstra-Algorithmus für kürzeste Wege, sind wie starre Roboter: Die kürzeste Strecke ist das oberste Gebot, alles andere spielt keine Rolle.
Aber im wirklichen Leben ist Fahren und Gehen nicht so einfach.
Manche mögen Umwege, um die Landschaft zu genießen, andere sind in Eile und wollen Staus vermeiden, wieder andere möchten noch das Kind abholen. Diese komplexen Anforderungen können herkömmliche Algorithmen nicht bewältigen.
Später kamen Machine Learning-Modelle, die aus historischen Fahrdaten Muster lernen können, wie zum Beispiel die Empfehlung von Routen basierend auf dem Verkehrsgeschehen.
Aber auch diese haben Nachteile: Ein trainiertes Modell kann nur nach festen Regeln arbeiten.
Möchte man eine neue Anforderung hinzufügen, wie „über einen bestimmten Geschäftsviertel fahren“, muss man ein neues Modell trainieren. Das ist zeitaufwändig, arbeitsintensiv und kostspielig.
Der Kerngedanke von PathGPT ist: Wenn große Modelle (wie GPT) natürliche Sprache verstehen können, warum nicht diese nutzen, um die Anforderungen der Nutzer zu verstehen?
Wenn ein Nutzer sagt „schnellste Route“ oder „schöne Landschaft“, kann das große Modell das verstehen und in Kombination mit historischen Routendaten eine Lösung generieren.
Aber auch LLMs haben Schwächen: Sie kennen möglicherweise nicht die genauen Straßenverhältnisse einer Stadt oder können auch „Halluzinationen“ haben.
Deshalb hat PathGPT ein „Extras“: die Retrieval Augmented Generation (RAG)-Technologie.
Einfach ausgedrückt, wird zuerst eine Wissensdatenbank mit historischen Routen erstellt: Der Startpunkt, der Endpunkt und die Namen der Straßen jeder Route werden in natürliche Sprache umgewandelt. Beispielsweise von dem Volksplatz zum Bundeshaus, über die Nanjingstraße und die Zhongshan Oststraße 1.
Wenn ein Nutzer eine Frage stellt, sucht PathGPT zuerst in der Wissensdatenbank nach historischen Routen, die dem Start- und Endpunkt des Nutzers ähneln.
Ergebnisse der praktischen Tests: Maximale Flexibilität, aber noch Verbesserungspotenzial
Das Forschungsteam hat Experimente mit Taxifahrtdaten in Städten wie Peking, Chengdu und Harbin durchgeführt.
Die Ergebnisse zeigen, dass PathGPT bei der Generierung der „schnellsten Route“ zwar Präzision und Recall geringer sind als bei einigen herkömmlichen Machine Learning-Modellen (beispielsweise in den Harbin-Daten hat die schnellste Route eine Präzision von 48,4 %), aber es hat einen Trumpf: Es kann auch ungewöhnliche Anforderungen bewältigen, für die es nicht trainiert wurde.
Wenn ein Nutzer beispielsweise eine Route wünscht, die drei Parks passiert, sind herkömmliche Modelle möglicherweise ratlos, aber PathGPT kann in Kombination mit natürlicher Sprache und historischen Daten eine vernünftige Lösung finden.
Die größte Bedeutung von PathGPT ist, dass es die Navigation in ein natürliches Gespräch verwandelt. In Zukunft kann man einfach so wie beim Freund nachfragen.
Natürlich gibt es noch Verbesserungspotenzial, wie beispielsweise gelegentliche falsche Wegweisungen (das Problem der „Halluzinationen“ von LLMs) und die Zuverlässigkeit in komplexen Verkehrssituationen muss noch verbessert werden.
Aber wenn man bedenkt, dass die Entwicklung der großen Modelle erst vor kurzem begonnen hat und bereits so viel erreicht wurde, könnte es in Zukunft, wenn es mit präziseren Echtzeitverkehrsdaten und einer besseren Wissensdatenbank kombiniert wird, tatsächlich zu einem intelligenten Reisebegleiter für jeden werden.
ChatGPT kann nicht nur chatten, sondern auch nützliche Empfehlungen basierend auf Echtzeitdaten geben. Das ist besonders nützlich, wenn herkömmliche Karten nicht funktionieren.
KI verändert die Art und Weise des Outdoor-Entdeckens. Die Navigation in einem unkartierten Wald mithilfe von Koordinaten und Logik ist definitiv ein Meilenstein.
Quellen
https://x.com/rohanpaul_ai/status/1937199835318485177
https://arxiv.org/abs/25