Eine autonome Drohne mit Wasser, mit der ein Waldbrand in der Sierra Nevada ausgelöscht wird, könnte auf den wirbelnden Santa Ana -Wind stoßen, die sie drohen, sie abzuschieben. Die schnelle Anpassung an diese unbekannten Störungen ist eine enorme Herausforderung für das Flugkontrollsystem der Drohne.

Um eine solche Drohne zu unterstützen, entwickelten MIT-Forscher einen neuen, maschinell lernbasierten adaptiven Kontrollalgorithmus, der seine Abweichung von seiner beabsichtigten Flugbahn angesichts unvorhersehbarer Kräfte wie böigen Winden minimieren könnte.

Im Gegensatz zu Standardansätzen erfordert die neue Technik nicht, dass die Individual die autonome Drohne im Voraus über die Struktur dieser unsicheren Störungen weiß. Stattdessen lernt das künstliche Intelligenzmodell des Steuerungssystems alles, was es aus einer kleinen Menge an Beobachtungsdaten wissen muss, die aus 15 Minuten Flugzeit gesammelt wurden.

Wichtig ist, dass die Technik automatisch bestimmt, welchen Optimierungsalgorithmus sie an die Störungen anpassen sollte, was die Verfolgung der Leistung verbessert. Es wählt den Algorithmus aus, der der Geometrie spezifischer Störungen am besten entspricht, mit dem diese Drohne ausgesetzt ist.

Die Forscher schulen ihr Kontrollsystem so, dass beide Dinge gleichzeitig mit einer Technik namens Meta-Studying durchgeführt werden, wodurch das System gelehrt wird, wie man sich an verschiedene Arten von Störungen anpasst.

Zusammengenommen ermöglichen diese Inhaltsstoffe ihr adaptives Steuerungssystem, 50 Prozent weniger Flugbahnverfolgung als Basismethoden in Simulationen zu erreichen und mit neuen Windgeschwindigkeiten, die sie während des Trainings nicht gesehen haben, besser abschneiden zu können.

In Zukunft könnte dieses adaptive Kontrollsystem autonome Drohnen trotz starker Winde oder der Überwachung feuergefährdeter Gebiete eines Nationalparks dazu beitragen.

“The concurrent studying of those elements is what provides our methodology its power. By leveraging meta-learning, our controller can robotically make decisions that can be greatest for fast adaptation,” says Navid Azizan, who’s the Esther and Harold E. Edgerton Assistant Professor within the MIT Division of Mechanical Engineering and the Institute for Knowledge, Programs, and Society (IDSS), a principal investigator of the Laboratory for Data and Resolution Programs (LIDS), and the Senior Autor von a Papier auf diesem Steuerungssystem.

Azizan wird von der Hauptautorin Sunbhochen Tang, einem Doktorand der Abteilung für Luftfahrt und Astronautik, und Haoyuan Solar, Doktorandin der Abteilung für Elektrotechnik und Informatik, auf dem Papier begleitet. Die Forschung wurde kürzlich auf der Dynamik- und Kontrollkonferenz für Lernen vorgestellt.

Finden des richtigen Algorithmus

In der Regel enthält ein Steuerungssystem eine Funktion, die die Drohne und ihre Umgebung modelliert und einige vorhandene Informationen zur Struktur potenzieller Störungen enthält. Aber in einer realen Welt voller ungewisse Bedingungen ist es oft unmöglich, diese Struktur im Voraus von Hand zu entwickeln.

Viele Steuerungssysteme verwenden eine Anpassungsmethode, die auf einem beliebten Optimierungsalgorithmus basiert, der als Gradientenabstieg bezeichnet wird, um die unbekannten Teile des Issues abzuschätzen und festzustellen, wie die Drohne während des Fluges so nah wie möglich an ihrer Zielbahn hält. Gradientenabstieg ist jedoch nur ein Algorithmus in einer größeren Familie von Algorithmen zur Auswahl, die als Spiegelabstieg bezeichnet wird.

„Spiegelabstieg ist eine allgemeine Familie von Algorithmen, und für jedes Drawback kann einer dieser Algorithmen besser geeignet sein als andere. Der Identify des Spiels ist, wie man den jeweiligen Algorithmus auswählt, der für Ihr Drawback geeignet ist. In unserer Methode automatisieren wir diese Wahl“, sagt Azizan.

In ihrem Kontrollsystem ersetzten die Forscher die Funktion, die eine gewisse Struktur potenzieller Störungen durch ein neuronales Netzwerkmodell enthält, das lernt, sie von Daten zu approximieren. Auf diese Weise müssen sie keine a priori -Struktur der Windgeschwindigkeit haben, die diese Drohne im Voraus begegnen könnte.

Ihre Methode verwendet auch einen Algorithmus, um automatisch die Funktion des richtigen Spiegelabzins zu wählen, während das neuronale Netzwerkmodell aus Daten gelernt wird, anstatt davon auszugehen, dass ein Benutzer die ideale Funktion bereits ausgewählt hat. Die Forscher geben diesem Algorithmus eine Reihe von Funktionen, aus denen er auswählen kann, und findet denjenigen, das am besten zum vorliegenden Drawback passt.

„Die Auswahl einer guten Entfernung erzeugende Funktion zum Erstellen der richtigen Anpassung des Spiegelabsachens ist sehr wichtig, um den richtigen Algorithmus zu erhalten, um den Monitoring-Fehler zu verringern“, fügt Tang hinzu.

Sich anpassen zu lernen

Während die Windgeschwindigkeit, die die Drohne möglicherweise begegnen kann, sich jedes Mal ändern könnte, wenn sie Flug benötigt, sollte das neuronale Netzwerk und die Spiegelfunktion des Controllers gleich bleiben, sodass sie nicht jedes Mal neu berechnet werden müssen.

Um ihren Controller flexibler zu machen, verwenden die Forscher Meta-Studying und lehren es, sich während des Trainings eine Reihe von Windgeschwindigkeitsfamilien anzupassen.

„Unsere Methode kann mit unterschiedlichen Zielen fertig werden, da wir mit Meta-Studying eine gemeinsame Darstellung durch verschiedene Szenarien effizient aus Daten lernen können“, erklärt Tang.

Am Ende füttert der Benutzer dem Steuerungssystem eine Zielbahn und kalkuliert in Echtzeit kontinuierlich, wie die Drohne den Schub erzeugen sollte, um sie so nah wie möglich an diese Flugbahn zu halten und gleichzeitig die unsicheren Störungen aufzunehmen, denen sie begegnet.

Sowohl in Simulationen als auch in realen Experimenten zeigten die Forscher, dass ihre Methode zu einem signifikant weniger Trajektorienverfolgungsfehler als Basisansätze bei jeder getesteten Windgeschwindigkeit führte.

„Selbst wenn die Windstörungen viel stärker sind als wir während des Trainings gesehen haben, zeigt unsere Technik, dass sie sie immer noch erfolgreich umgehen kann“, fügt Azizan hinzu.

Darüber hinaus wuchs der Rand, mit dem ihre Methode die Baselines übertraf, als sich die Windgeschwindigkeiten intensivierten, was zeigt, dass sie sich an herausfordernde Umgebungen anpassen kann.

Das Crew führt jetzt {Hardware} -Experimente durch, um sein Steuerungssystem auf realen Drohnen mit unterschiedlichen Windbedingungen und anderen Störungen zu testen.

Sie möchten auch ihre Methode erweitern, damit sie Störungen aus mehreren Quellen gleichzeitig behandeln können. Zum Beispiel kann das Ändern der Windgeschwindigkeiten das Gewicht eines Pakets verursachen, das die Drohne in die Flugverschiebung verändert, insbesondere wenn die Drohne schlupfende Nutzlasten trägt.

Sie wollen auch ein kontinuierliches Lernen untersuchen, sodass sich die Drohne an neue Störungen anpassen kann, ohne dass auch die Daten, die sie bisher gesehen hat, umgeschrieben werden muss.

„Navid und seine Mitarbeiter haben Durchbruchsarbeiten entwickelt, die das Meta-Studying mit herkömmlicher adaptiver Kontrolle kombinieren, um nichtlineare Merkmale aus Daten zu lernen. Der Schlüssel zu ihrem Ansatz ist die Verwendung von Spiegelabstichtechniken, die die zugrunde liegende Geometrie des Issues in einer Weise ausnutzen können. Professor für Elektrotechnik und Pc- und Mathematikwissenschaften bei Caltech, der nicht an dieser Arbeit beteiligt struggle.

Diese Forschung wurde teilweise von MathWorks, dem MIT-IBM Watson AI Lab, dem MIT-Amazon Science Hub und dem MIT-Google-Programm zur Berechnung von Innovationen unterstützt.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert