Mit der Rückkehr des Frühlings auf der Nordhalbkugel beginnt die Tornadosaison. Der wirbelnde Trichter aus Staub und Trümmern eines Tornados ist ein unverkennbarer Anblick. Doch dieser Anblick kann für das Radar, das Werkzeug der Meteorologen, verdeckt sein. Es ist schwer, genau zu wissen, wann sich ein Twister gebildet hat oder warum.
Ein neuer Datensatz könnte Antworten liefern. Er enthält Radarrückmeldungen von Tausenden von Tornados, die in den letzten zehn Jahren die Vereinigten Staaten heimgesucht haben. Stürme, die Tornados hervorbrachten, werden von anderen schweren Stürmen flankiert, bei denen es nie zu solchen kam, einige mit nahezu identischen Bedingungen. Die Forscher des MIT Lincoln Laboratory, die den Datensatz kuratiert haben, nannten TorNethaben es nun als Open Supply freigegeben. Sie hoffen, damit Durchbrüche bei der Erkennung eines der mysteriösesten und gewaltigsten Phänomene der Natur zu ermöglichen.
„Viele Fortschritte werden durch leicht verfügbare Benchmark-Datensätze vorangetrieben. Wir hoffen, dass TorNet eine Grundlage für maschinelle Lernalgorithmen zur Erkennung und Vorhersage von Tornados legt“, sagt Mark Veillette, gemeinsam mit James Kurdzo der leitende Forscher des Projekts. Beide Forscher arbeiten in der Air Visitors Management Programs Group.
Zusammen mit dem Datensatz veröffentlicht das Staff auch darauf trainierte Modelle. Die Modelle sind vielversprechend, was die Fähigkeit des maschinellen Lernens zur Erkennung von Tornados angeht. Auf dieser Arbeit aufzubauen, könnte den Meteorologen neue Möglichkeiten eröffnen und ihnen helfen, genauere Warnungen bereitzustellen, die möglicherweise Leben retten.
Wirbelnde Unsicherheit
In den Vereinigten Staaten treten jedes Jahr etwa 1.200 Tornados auf, die Millionen bis Milliarden Greenback kosten. wirtschaftlicher Schaden und forderte im Durchschnitt 71 Todesopfer. Letztes Jahr gab es einen ungewöhnlich lang anhaltender Twister Auf einer 95 Kilometer langen Strecke in Mississippi kamen 17 Menschen ums Leben, mindestens 165 weitere wurden verletzt.
Tornados sind jedoch notorisch schwer vorherzusagen, da Wissenschaftler kein klares Bild davon haben, warum sie entstehen. „Wir können zwei Stürme sehen, die identisch aussehen, und einer wird einen Twister erzeugen, der andere nicht. Wir verstehen das nicht vollständig“, sagt Kurdzo.
Die Grundbestandteile eines Tornados sind Gewitter mit Instabilität, die durch rasch aufsteigende warme Luft und Windscherung verursacht wird, die Rotation verursacht. Wetterradare sind das wichtigste Instrument zur Überwachung dieser Bedingungen. Tornados liegen jedoch zu niedrig, um erkannt zu werden, selbst wenn sie sich mäßig nahe am Radar befinden. Wenn sich der Radarstrahl mit einem bestimmten Neigungswinkel weiter von der Antenne entfernt, steigt er höher über den Boden und sieht hauptsächlich Reflexionen von Regen und Hagel, die in der „Mesozyklone“, dem breiten, rotierenden Aufwind des Sturms, mitgeführt werden. Eine Mesozyklone erzeugt nicht immer einen Twister.
Angesichts dieser eingeschränkten Sicht müssen Meteorologen entscheiden, ob sie eine Tornadowarnung herausgeben oder nicht. Sie handeln dabei oft zu vorsichtig. Infolgedessen liegt die Charge der Fehlalarme bei Tornadowarnungen bei über 70 Prozent. „Das kann zu einem Syndrom führen, bei dem der Junge immer nur „Wolf“ ruft“, sagt Kurdzo.
In den letzten Jahren haben Forscher maschinelles Lernen eingesetzt, um Tornados besser erkennen und vorhersagen zu können. Rohdatensätze und Modelle waren jedoch nicht immer für die breite Öffentlichkeit zugänglich, was den Fortschritt behinderte. TorNet füllt diese Lücke.
Der Datensatz enthält mehr als 200.000 Radarbilder, von denen 13.587 Tornados zeigen. Die übrigen Bilder sind nicht tornadoartig und stammen von Stürmen in einer von zwei Kategorien: zufällig ausgewählte schwere Stürme oder Stürme mit Fehlalarm (solche, die einen Meteorologen dazu veranlassten, eine Warnung herauszugeben, aber keinen Twister hervorbrachten).
Jede Probe eines Sturms oder Tornados besteht aus zwei Sätzen von sechs Radarbildern. Die beiden Sätze entsprechen unterschiedlichen Radarschwenkwinkeln. Die sechs Bilder stellen unterschiedliche Radardatenprodukte dar, wie z. B. Reflektivität (zeigt die Niederschlagsintensität an) oder Radialgeschwindigkeit (zeigt an, ob sich der Wind auf das Radar zu oder von ihm weg bewegt).
Eine Herausforderung bei der Zusammenstellung des Datensatzes struggle zunächst die Suche nach Tornados. Innerhalb des Korpus der Wetterradardaten sind Tornados äußerst seltene Ereignisse. Das Staff musste diese Tornadoproben dann mit schwierigen Nicht-Tornadoproben abgleichen. Wäre der Datensatz zu einfach, etwa durch den Vergleich von Tornados mit Schneestürmen, würde ein auf den Daten trainierter Algorithmus Stürme wahrscheinlich zu sehr als tornadoartig klassifizieren.
„Das Schöne an einem echten Benchmark-Datensatz ist, dass wir alle mit denselben Daten arbeiten, mit demselben Schwierigkeitsgrad, und die Ergebnisse vergleichen können“, sagt Veillette. „Außerdem wird die Meteorologie für Datenwissenschaftler zugänglicher und umgekehrt. Es wird für diese beiden Parteien einfacher, an einem gemeinsamen Drawback zu arbeiten.“
Beide Forscher stehen für den Fortschritt, der durch übergreifende Zusammenarbeit entstehen kann. Veillette ist Mathematiker und Algorithmenentwickler, der schon lange von Tornados fasziniert ist. Kurdzo ist ausgebildeter Meteorologe und Experte für Signalverarbeitung. Während seines Studiums verfolgte er Tornados mit speziell angefertigten mobilen Radargeräten und sammelte Daten, die er auf neue Weise analysieren konnte.
„Dieser Datensatz bedeutet auch, dass ein Doktorand nicht ein oder zwei Jahre damit verbringen muss, einen Datensatz aufzubauen. Er kann direkt mit seiner Forschung beginnen“, sagt Kurdzo.
Dieses Projekt wurde finanziert durch das Lincoln Laboratory Initiative zum Klimawandeldessen Ziel darin besteht, die vielfältigen technischen Stärken des Labors zu nutzen, um zur Lösung der Klimaprobleme beizutragen, die die menschliche Gesundheit und die globale Sicherheit bedrohen.
Mit Deep Studying auf der Suche nach Antworten
Anhand des Datensatzes entwickelten die Forscher grundlegende Modelle für künstliche Intelligenz (KI). Besonders erpicht waren sie darauf, Deep Studying anzuwenden, eine Type des maschinellen Lernens, die sich hervorragend für die Verarbeitung visueller Daten eignet. Alleine kann Deep Studying aus Bildern eines Datensatzes Merkmale (Schlüsselbeobachtungen, die ein Algorithmus zur Entscheidungsfindung verwendet) extrahieren. Bei anderen Ansätzen des maschinellen Lernens müssen Menschen Merkmale zunächst manuell kennzeichnen.
„Wir wollten sehen, ob Deep Studying wiederentdecken kann, wonach die Leute bei Tornados normalerweise suchen, und sogar neue Dinge identifizieren kann, nach denen Meteorologen normalerweise nicht suchen“, sagt Veillette.
Die Ergebnisse sind vielversprechend. Ihr Deep-Studying-Modell zeigte eine ähnliche oder bessere Leistung als alle in der Literatur bekannten Twister-Erkennungsalgorithmen. Der trainierte Algorithmus klassifizierte 50 Prozent der schwächeren EF-1-Tornados und über 85 Prozent der Tornados mit der Einstufung EF-2 oder höher korrekt, was die verheerendsten und kostspieligsten Vorkommnisse dieser Stürme ausmacht.
Sie evaluierten außerdem zwei weitere Arten von maschinellen Lernmodellen und ein traditionelles Modell zum Vergleich. Der Quellcode und die Parameter aller dieser Modelle sind frei verfügbar. Die Modelle und der Datensatz werden auch in einem Papier bei einer Zeitschrift der American Meteorological Society (AMS) eingereicht. Veillette präsentierte diese Arbeit auf der Jahrestagung der AMS im Januar.
„Der wichtigste Grund, unsere Modelle zu veröffentlichen, ist, dass die Group sie verbessern und andere großartige Dinge tun kann“, sagt Kurdzo. „Die beste Lösung könnte ein Deep-Studying-Modell sein, aber jemand könnte feststellen, dass ein Modell ohne Deep Studying tatsächlich besser ist.“
TorNet könnte in der Wetter-Group auch für andere Zwecke nützlich sein, etwa für die Durchführung groß angelegter Fallstudien zu Stürmen. Es könnte auch mit anderen Datenquellen wie Satellitenbildern oder Blitzkarten ergänzt werden. Die Zusammenführung mehrerer Datentypen könnte die Genauigkeit von Modellen des maschinellen Lernens verbessern.
Schritte in Richtung Betrieb unternehmen
Kurdzo hofft, dass die Modelle nicht nur Tornados erkennen, sondern auch dazu beitragen könnten, die wissenschaftlichen Hintergründe ihrer Entstehung zu entschlüsseln.
„Als Wissenschaftler sehen wir alle diese Vorboten von Tornados – eine Zunahme der Rotation in geringer Höhe, ein Hakenecho in den Reflektivitätsdaten, einen spezifischen differentiellen Phasenfuß (KDP) und differentielle Reflektivitätsbögen (ZDR). Aber wie hängen sie alle zusammen? Und gibt es physikalische Erscheinungen, von denen wir nichts wissen?“, fragt er.
Diese Antworten könnten mithilfe erklärbarer KI herausgearbeitet werden. Erklärbare KI bezieht sich auf Methoden, die es einem Modell ermöglichen, seine Gründe für eine bestimmte Entscheidung in einem für Menschen verständlichen Format darzulegen. In diesem Fall könnten diese Erklärungen physikalische Prozesse aufdecken, die vor Tornados stattfinden. Dieses Wissen könnte dazu beitragen, Meteorologen und Modelle zu trainieren, die Anzeichen früher zu erkennen.
„Keine dieser Technologien soll jemals einen Meteorologen ersetzen. Aber vielleicht kann sie eines Tages Meteorologen in komplexen Situationen leiten und eine visuelle Warnung für ein Gebiet ausgeben, in dem Tornadoaktivität vorhergesagt wird“, sagt Kurdzo.
Eine solche Unterstützung könnte besonders nützlich sein, da die Radartechnologie immer besser wird und zukünftige Netzwerke möglicherweise dichter werden. Die Datenaktualisierungsrate in einem Radarnetzwerk der nächsten Technology wird voraussichtlich von fünf Minuten auf etwa eine Minute steigen, möglicherweise schneller, als Meteorologen die neuen Informationen interpretieren können. Da Deep Studying riesige Datenmengen schnell verarbeiten kann, könnte es sich intestine dazu eignen, Radarrückmeldungen in Echtzeit gemeinsam mit Menschen zu überwachen. Tornados können sich innerhalb von Minuten bilden und wieder verschwinden.
Doch der Weg zu einem funktionsfähigen Algorithmus ist lang, insbesondere in sicherheitskritischen Situationen, sagt Veillette. „Ich denke, die Meteorologen-Group ist verständlicherweise immer noch skeptisch gegenüber maschinellem Lernen. Eine Möglichkeit, Vertrauen und Transparenz zu schaffen, besteht darin, öffentliche Benchmark-Datensätze wie diesen bereitzustellen. Das ist ein erster Schritt.“
Die nächsten Schritte, so hofft das Staff, werden von Forschern auf der ganzen Welt unternommen, die sich von den Daten inspirieren lassen und motiviert sind, ihre eigenen Algorithmen zu entwickeln. Diese Algorithmen werden dann in Testumgebungen eingesetzt, wo sie schließlich den Meteorologen präsentiert werden, um den Übergangsprozess in den Betrieb einzuleiten.
Am Ende könnte der Weg wieder zum Vertrauen führen.
„Mit diesen Instruments werden wir vielleicht nie mehr als eine 10- bis 15-minütige Tornadowarnung erhalten. Aber wenn wir die Charge der Fehlalarme senken könnten, könnten wir Fortschritte bei der öffentlichen Wahrnehmung erzielen“, sagt Kurdzo. „Die Leute werden diese Warnungen nutzen, um die notwendigen Maßnahmen zu ergreifen, um ihr Leben zu retten.“