Sie würden denken, dass die Vorhersage von Demenzsterien oder Kartierung von Lärm von Stadttätern, Expertenteams, Bodenumfragen und Satellitenbildgebungsunternehmen erfordern würde. Aber ein neues KI -Modell – entwickelt von durch Forscher An der Peking Jiaotong College und der College of Montreal kann dies alles auf einmal erledigen, indem sie sich nur Karten, Tweets und Bilder ansehen. Das System heißt OmnigeoUnd wenn die Forschung ihrem Versprechen entspricht, könnte es neu definieren, wie wir Städte, Katastrophen und menschliche Umgebungen in Echtzeit lesen.
Warum die Entschlüsselung von Geospatialdaten so schwierig ist
Geoai – Quick für geospatiale künstliche Intelligenz – battle immer ein kniffliges Spiel. Stellen Sie sich das so vor: Es ist, als würde man versuchen, eine Stadt zu verstehen, indem sie fünf Sprachen gleichzeitig lesen. Sie haben Satellitenbilder, Fotos auf Straßenebene, Statistiken für öffentliche Gesundheit, Tweets voller Slang und Hashtags sowie Standortdaten von Tausenden von angemessenen Orten. Jeder dieser Datentypen spricht einen anderen Dialekt – und die meisten KI -Systeme sind heute nur fließend ein oder zwei.
Vorhandene Modelle können intestine in der Klassifizierung von Distant -Erfassungsbildern oder dem Tagging -Stellen im Textual content klassifizieren. Wenn Sie jedoch all diese Aufgaben in einen Topf werfen, fallen die Dinge auseinander. Hier tritt Omnigeo ein: Es ist ein einziges KI -System, das darauf trainiert ist, sie alle zu behandeln.
Das Group hinter Omnigeo entwickelte a Multimodales großes Sprachmodell (MLLM)– Eine Artwork KI, die Satellitenbilder, Geospatial -Metadaten und natürliche Sprache auf einmal interpretieren kann. Es basiert auf Open-Supply-Modellen wie Llava und Qwen2, ist jedoch für fünf Kernbereiche fein abgestimmt: Gesundheitsgeographie, städtische Geographie, Fernerkundung, städtische Wahrnehmung und Geospatialsemantik.
Anstatt ein Modell für jede Aufgabe zu erstellen, behandelt Omnigeo sie alle gleichzeitig. Das Geheimnis? Anweisungsbasiertes Lernen gepaart mit dem, was die Forscher als „multimodale Feinabstimmung“ bezeichnen. In einfachen Worten lernt es aus Bildkaptionspaaren, Zeitreihendaten, räumlichen Vektoren und mehr-alle an denselben Orten ausgerichtet.
Sprechen wir über reale Anwendungen
Hier werden die Dinge interessant. Omnigeo wurde ausgebildet zu:
- Prognose Demenz-bezogene Sterblichkeitsraten auf Kreisebene unter Verwendung historischer Daten und Satellitenbilder.
- Erkennen Sie die Hauptfunktion städtischer Nachbarschaften-wie die Frage, ob ein Gebiet von Schulen oder Handelsbüros dominiert wird-auf Daten auf Straßenebene und POI (Level of Curiosity).
- Beurteilen Sie, wie „laut“ oder „lebhaft“ eine Straße basiert und nur auf Bildern und zugehörigen Bildunterschriften beruht.
- Analysieren Sie sich Ortbeschreibungen in Tweets während Naturkatastrophen – wie die Extraktion „21719 Grand Hole Lane, Katy, TX“ aus einer Hochwasserrettungsanfrage.
Allein dieser letzte Anwendungsfall reicht aus, um auf das Potenzial dieses Modells in der Notfallreaktion und im Good Metropolis Administration hinzuweisen.
Wie Omnigeo die Welt sieht
Technisch gesehen arbeitet Omnigeo, indem er geografische Daten in lesbare Erzählungen umwandelt. Beispielsweise werden Satellitenbilder in natürliche Sprachunterschriften („Grünflächen mit spärlichen Industriezonen“) verwandelt und dann mit strukturierten Daten wie Sterblichkeitsraten oder POI -Verteilungen ausgerichtet. All dies wird in einen Anweisungsdatensatz eingebunden, sodass das Modell wie ein Mensch im Kontext lernen kann.
Es ist nicht nur theoretisch. Omnigeo übertraf GPT-4O und andere führende Modelle in wichtigen Geospatial-Aufgaben, einschließlich SzenenklassifizierungAnwesend StandorterkennungUnd Urbanfunktion Vorhersage. In einigen Fällen senkte es die Fehlerraten um mehr als die Hälfte. Selbst in subjektiven Gebieten wie der städtischen Wahrnehmung – wie „schön“ oder „deprimierend“ eine Straße – battle es eindrucksvoll genau.
Warum jetzt?
Städte werden immer schwerer zu verwalten und leichter zu befragen. Mit Klimaereignissen, Bevölkerungsausschüssen und Krisen im Bereich der öffentlichen Gesundheit, die alle auf einmal treffen, benötigen die politischen Entscheidungsträger schnellere Werkzeuge für die Interpretation des Geodaten -Chaos. Omnigeo kommt in einem Second an, in dem AI endlich in der Lage ist, hochdimensionale Daten über die Formate hinweg absorbieren.
Der Unterschied? Die meisten großen Modelle heute sprechen einfach. Omnigeo sieht, hört und versteht Raum.
Omnigeo ist eine Blaupause für die zukünftige Geospatial-KI: Ein System, das über Modalitäten geschult ist, mit realen Eingaben ausgerichtet und bereit zu verallgemeinern.
Wenn Chatgpt Ihr Sprachassistent ist, Omnigeo könnte das nächste Notfallhirn Ihrer Stadt sein-Visuelles Chaos und Ort überdringen in Echtzeit, umsetzbare Erkenntnisse.
Und es macht alles, ohne jemals nach draußen zu treten.
Ausgewähltes Bildnachweis: Kerem Gülen/Midjourney