Übertreffen Sie 90 % der Stadtplaner: Tsinghua-Universität, MIT und andere stellen ein neues Paradigma für die Mensch-Maschine-Kollaboration vor
Tsinghua Universität hat zusammen mit Institutionen wie MIT ein neues Framework namens "Großes Sprachmodell + Planer" vorgeschlagen. Künstliche Intelligenz (KI) begleitet den gesamten Planungsprozess wie ein Assistent, vom Austausch über die Anforderungen, der Zeichnung von Plänen bis hin zur Vorabsimulation der Auswirkungen mit virtuellen Einwohnern. Dadurch wird die Stadtplanung schneller und wissenschaftlicher. Experimente zeigen, dass die KI bereits über 90 % der menschlichen Stadtplaner übertreffen kann. In Zukunft werden Menschen und Maschinen ihre Stärken ausspielen und gemeinsam Städte gestalten, die lebenswerter und gerechter sind.
Angesichts der zunehmend komplexen städtischen Systeme und der vielfältigen gesellschaftlichen Anforderungen stoßen traditionelle Stadtplanungsmethoden an ihre Grenzen.
Heute bringt die Künstliche Intelligenz (KI) eine umwälzende Revolution in dieses alte und wichtige Feld.
Kürzlich hat ein interdisziplinäres Team aus Wissenschaftlern der Stadtwissenschaftlichen und Computergestützten Forschungszentrale der Fakultät für Elektronik und Informationstechnik der Tsinghua Universität, der Fakultät für Architektur der Tsinghua Universität, dem Senseable City Lab des Massachusetts Institute of Technology (MIT) und der Northeastern University in den Vereinigten Staaten einen Meinungseintrag in der internationalen Spitzenzeitschrift "Nature Computational Science" veröffentlicht. Zum ersten Mal wurde systematisch ein von einem großen Sprachmodell (LLM) angetriebenes intelligentes Stadtplanungsframework vorgeschlagen.
Link zur Studie: https://www.nature.com/articles/s43588-025-00846-1
Dieses Framework integriert die starken Rechen-, Inferenz- und Generierungsfähigkeiten der KI tiefgreifend mit der professionellen Erfahrung und Kreativität menschlicher Stadtplaner. Das Ziel ist es, die KI als "intelligenten Planungsassistenten" für den Menschen zu gestalten, um gemeinsam den komplexen Herausforderungen in der modernen Stadtplanung zu begegnen und einen neuen Paradigmenwechsel hin zu einer effizienteren, innovativeren und reaktionsschnelleren Stadtgestaltungsprozess einzuleiten.
Der erste Autor dieser Studie ist der Doktorand Zheng Yu aus der Fakultät für Elektronik und Informationstechnik der Tsinghua Universität. Die Korrespondenzautoren sind Professor Li Yong aus der Fakultät für Elektronik und Informationstechnik der Tsinghua Universität, Assistentprofessorin Lin Yuming aus der Fakultät für Architektur der Tsinghua Universität und Associate Professor Qi R. Wang aus der Fakultät für Umwelttechnik der Northeastern University.
Die Mitwirkenden umfassen Assistentprofessor Xu Fengli aus der Fakultät für Elektronik der Tsinghua Universität sowie Forscher Paolo Santi und Professor Carlo Ratti aus dem Senseable City Lab des MIT.
Die Entwicklung und die Grenzen der Stadtplanung
Die Theorie und Praxis der Stadtplanung haben sich stetig entwickelt, von der frühen "Künstlerischen Gestaltung", die auf physischen Räumen und ästhetischen Formen fokussierte, hin zur "Wissenschaftlichen Planung" nach dem Zweiten Weltkrieg, bei der Städte als komplexe Systeme betrachtet und wissenschaftliche Modelle zur Analyse eingesetzt wurden.
Heute stehen diese Methoden jedoch neuen Herausforderungen gegenüber:
Einerseits ist der Planungsprozess immer noch um den Planer zentriert, und die Beteiligung der Öffentlichkeit ist in Bezug auf Umfang und Tiefe begrenzt.
Andererseits ist die Bewertung von Planungskonzepten oft qualitativ, subjektiv und verzögert, was es schwierig macht, wissenschaftliche quantitative Entscheidungen zu treffen und schnelle Iterationen vorzunehmen.
In den letzten Jahren wurden traditionelle KI-Modelle wie generative adversarial networks (GANs) und reinforcement learning (RL) in der Stadtplanung eingesetzt und zeigten Potential bei der Generierung von Straßennetzen und Funktionszonen.
Aber diese Modelle sind normalerweise für bestimmte Aufgaben entwickelt und haben ein eingeschränktes Wissensgebiet, was es schwierig macht, der zunehmenden interdisziplinären Komplexität in der modernen Stadtplanung zu begegnen.
Das Aufkommen von großen Sprachmodellen (LLM) bringt mit ihrer starken Fähigkeit zur Wissensintegration, logischen Inferenz und multimodalen Generierung eine historische Chance, diese Grenzen zu überwinden.
Der neue von LLM angetriebene Stadtplanungsprozess
Angesichts der Mängel traditioneller Methoden hat das Forschungsteam innovativ ein geschlossenes Framework vorgeschlagen, das aus drei Kernphasen besteht: Konzeption (Conceptualization), Generierung von Plänen (Generation) und Bewertung der Auswirkungen (Evaluation).
Dieses Framework wird von einem großen Sprachmodell, einem großen visuellen Modell (VLM) und einem intelligenten LLM-Agenten gemeinsam angetrieben und bietet menschlichen Stadtplanern eine ganzheitliche intelligente Unterstützung.
Abbildung 1: Das vorgeschlagene von einem großen Sprachmodell angetriebene Stadtplanungsframework
Konzeption: Das LLM wird zum "Planungsberater" mit interdisziplinärem Wissen
Zu Beginn des Planungsprozesses geben Planer Texteinformationen wie Anforderungen, Beschränkungen und Leitlinien ein.
Das LLM, das mit einer riesigen Menge an Daten vortrainiert wurde, kann Wissen aus verschiedenen Bereichen wie Geographie, Gesellschaft und Ökonomie tiefgreifend integrieren und mehrere Runden von "Dialog" mit Planern führen.
Es kann nicht nur innovative Konzeptideen entwickeln, sondern auch basierend auf komplexem Kontext schlussfolgern und detaillierte Planbeschreibungstexte und erste räumliche Skizzen generieren, was die Effizienz und Tiefe der Konzeptionsphase erheblich verbessert.
Abbildung 2: Flussdiagramm der LLM-basierten Stadtkonzeption
Generierung von Plänen: Das VLM wird zum "visuellen Designer" und wandelt Texte in Pläne um
Dieses Framework nutzt ein großes visuelles Modell (VLM), um abstrakte Textkonzepte in konkrete, visualisierbare Stadtentwürfe umzuwandeln.
Planer können über Textbefehle (Prompt) genau die Planungskonzepte und Beschränkungen beschreiben. Das VLM, das mit Stadtentwurfsdaten feinjustiert wurde, kann detaillierte visuelle Ausgaben generieren, wie Landnutzungspläne, Gebäudekonturen und sogar realistische dreidimensionale Stadtlandschaften, und gleichzeitig sicherstellen, dass die Entwürfe geographischen und anderen realen Beschränkungen entsprechen.
Abbildung 3: Schematische Darstellung der Stadtplanungsgenerierung
Bewertung der Auswirkungen: Der intelligente LLM-Agent baut eine "virtuelle Stadt" und simuliert zukünftiges Leben
Um eine wissenschaftliche Bewertung von Planungskonzepten durchzuführen, wurde in das Framework ein intelligenter LLM-Agent zur Simulation von städtischen Dynamiken eingeführt.
Die Forscher haben dem Agenten verschiedene demografische Merkmale (z. B. Alter, Beruf) zugewiesen, damit er die täglichen Aktivitäten von Einwohnern wie Fahrten und Nutzung von Einrichtungen in der generierten virtuellen Stadt simulieren kann.
Durch die Analyse dieser simulierten Verhaltensweisen können quantitative Bewertungsindikatoren in mehreren Dimensionen wie Verkehrsdistanzen, Nutzungshäufigkeit von Einrichtungen, CO2-Emissionen und soziale Gerechtigkeit ermittelt werden, die eine wissenschaftliche und vorausschauende Rückmeldung für die iterative Verbesserung von Planungskonzepten liefern.
Abbildung 4: Bewertungsplan für die Stadtplanung basierend auf intelligenten LLM & VLM-Agenten
Erste Erfolge: Die KI zeigt Potenzial, menschliche Experten zu übertreffen
Um die Machbarkeit der Kernfähigkeiten dieses Frameworks zu überprüfen, hat die Stadtwissenschaftliche und Computergestützte Forschungszentrale der Fakultät für Elektronik der Tsinghua Universität kontinuierlich eine Reihe von sprachlich-visuellen multimodalen großen Stadtmodellen wie CityGPT, CityBench und UrbanLLaVA sowie Stadtemulationsplattformen und soziale Simulationssysteme wie UrbanWord, EmbodiedCity und AgentSociety veröffentlicht, die die technische Grundlage für die Stadtplanung und soziale Verwaltung in der Ära der großen Modelle gelegt haben.
Das Forschungsteam hat eine Reihe von Machbarkeitsversuchen für die Stadtplanung in der Ära des LLM durchgeführt.
In einem Test liess der Forscher das LLM Fragen aus der Fachprüfung für Stadtplaner beantworten. Die Ergebnisse zeigten, dass das LLM mit der größten Größe bei der Beantwortung von Fragen zu komplexen Planungskonzepten besser abschneidet als die besten 10 % der menschlichen Stadtplaner, was sein enormes Potenzial in der Konzeptionsphase beweist.
In einem Simulationsversuch in der Bewertungsphase nutzte das Team den intelligenten LLM-Agenten, um die Nutzung von Einrichtungen durch Einwohner in zwei Stadtteilen von New York und Chicago in den Vereinigten Staaten zu simulieren.
Die Simulationsergebnisse zeigten, dass die Hotspots der Agentennutzung mit den realen Daten zur Bevölkerungsbewegung stark übereinstimmen, was die Genauigkeit und Effektivität des intelligenten LLM-Agenten bei der Vorhersage der tatsächlichen Auswirkungen von Planungskonzepten beweist.
Abbildung 5: Schematische Darstellung der von LLM generierten Stadtplanungsergebnisse
Herausforderungen und Perspektiven: Die Gestaltung einer zukünftigen Stadt durch Mensch-Maschine-Kooperation
Das Forschungsteam betont abschließend, dass dieses Framework nicht die menschlichen Stadtplaner ersetzen soll, sondern eine neue Arbeitsweise der Mensch-Maschine-Kooperation etablieren will.
In diesem Modell können Planer von mühsamen Datenverarbeitungs- und Zeichnungsarbeiten befreit werden und sich stärker auf Innovation, ethische Überlegungen und die Kommunikation mit verschiedenen Interessengruppen konzentrieren, während die KI effizient die Wissensintegration, die Generierung von Plänen und die Simulationsbewertung übernimmt.
Zugleich weist der Artikel auch auf die Herausforderungen hin, denen diese Technologie begegnet, einschließlich der Knappheit an hochwertigen Stadtentwurfsdaten, des hohen Bedarfs an Rechenressourcen und potenzieller geografischer und sozialer Vorurteile in den Modellen.
Zukünftige Forschung muss offene Datenplattformen aufbauen, effizientere spezielle Modelle entwickeln und Algorithmen für Gerechtigkeit entwerfen, um sicherzustellen, dass die KI-Technologie fair und inklusiv für alle städtischen Umgebungen eingesetzt werden kann.
Wir können in naher Zukunft erwarten, dass Stadtplaner mit der Hilfe starker KI-Assistenten schneller und besser effiziente, lebenswerte und nachhaltige Städte entwerfen können und die menschliche Kreativität voll ausgeschöpft werden kann, um unsere gemeinsame städtische Heimat zu gestalten.
Quellen
https://www.nature.com/articles/s43588-025-00846-1
Dieser Artikel stammt aus dem WeChat-Account "New Intelligence Yuan", Autor: LRST, veröffentlicht von 36Kr mit Genehmigung.