Wenn einige Pendlerzüge am Ende der Linie ankommen, müssen sie zu einer Schaltplattform reisen, um umdreht zu werden, damit sie den Bahnhof später, oft von einer anderen Plattform als die, auf der sie ankamen, abreisen können.

Ingenieure verwenden Softwareprogramme, die als algorithmische Solvers bezeichnet werden, um diese Bewegungen zu planen, aber an einer Station mit Tausenden von wöchentlichen Ankünften und Abfahrten wird das Drawback zu komplex, als dass ein traditioneller Solver auf einmal entwirren, um sich auf einmal zu enträtseln.

Mit maschinellem Lernen haben MIT-Forscher ein verbessertes Planungssystem entwickelt, das die Lösungszeit um bis zu 50 Prozent verkürzt und eine Lösung erzeugt, die das Ziel eines Benutzers besser erreicht, wie z. Die neue Methode könnte auch zur effizienten Lösung anderer komplexer logistischer Probleme verwendet werden, z.

Ingenieure brechen diese Artwork von Problemen oft in eine Abfolge überlappender Unterprobleme, die jeweils in einer realisierbaren Zeit gelöst werden können. Die Überschneidungen führen jedoch dazu, dass viele Entscheidungen unnötig umgewendet werden. Daher dauert der Löser viel länger, um eine optimale Lösung zu erreichen.

Der neue, künstliche Intelligenzansatz erfährt, welche Teile jedes Teilproblems unverändert bleiben sollten, und friert diese Variablen ein, um redundante Berechnungen zu vermeiden. Dann packt ein traditioneller algorithmischer Solver die verbleibenden Variablen.

„Oft könnte ein engagiertes Staff Monate oder sogar Jahre damit verbringen, einen Algorithmus zu entwerfen, um nur eines dieser kombinatorischen Probleme zu lösen. Das moderne Deep Studying gibt uns die Möglichkeit, neue Fortschritte zu nutzen, um das Design dieser Algorithmen zu rationalisieren. Wir können das, was wir wissen, intestine wirken, und die AI -Karriere mit AI Speed up IT Speed up IT Speed up Affiliate -Professal und THOMAS D. und Virginia W. und Cabot -Growth -Affiliate -Affiliate -Affiliate -Affiliate -Affiliate -Affiliate -Associ -. für Daten, Systeme und Gesellschaft (IDSS) am MIT und ein Mitglied des Labors für Informations- und Entscheidungssysteme (LIDS).

Sie ist an der Papier von leitender Autorin Sirui Li, einem IDSS -Doktorand; Wenbin Ouyang, ein CEE -Doktorand; und Yining MA, A Lids Postdoc. Die Forschung wird auf der Internationalen Konferenz über Lernrepräsentationen vorgestellt.

Redundanz beseitigen

Eine Motivation für diese Forschung ist ein praktisches Drawback, das der Pupil eines Meisters Devin Camille Wilkins im Einstiegskurs der WU identifiziert hat. Der Pupil wollte an einem echten Zug-Dispatch-Drawback an der Nordstation Boston ein Verstärkungslernen anwenden. Die Transitorganisation muss viele Züge einer begrenzten Anzahl von Bahnstücken zuweisen, auf denen sie weit vor ihrer Ankunft am Bahnhof umdrehen können.

Dies stellt sich als sehr komplexes Drawback der kombinatorischen Planung heraus – genau an der genauen Artwork von Drawback, an der das Labor von Wu in den letzten Jahren gearbeitet hat.

Bei einem langfristigen Drawback, bei dem eine begrenzte Reihe von Ressourcen wie Fabrikaufgaben einer Gruppe von Maschinen zugewiesen werden, rahmen Planer das Drawback häufig als versatile Arbeitsgeschäfte ein.

Bei der Planung flexibler Jobgeschäfts benötigt jede Aufgabe eine andere Zeit, um zu vervollständigen, aber jeder Maschine können Aufgaben zugewiesen werden. Gleichzeitig besteht jede Aufgabe aus Operationen, die in der richtigen Reihenfolge durchgeführt werden müssen.

Solche Probleme werden für traditionelle Löser schnell zu groß und unhandlich, sodass Benutzer die Rolling -Horizon -Optimierung (RHO) einsetzen können, um das Drawback in überschaubare Brocken zu unterteilen, die schneller gelöst werden können.

Mit Rho weist ein Benutzer Maschinen in einem festen Planungshorizont, möglicherweise einem vierstündigen Zeitfenster, einige erste Aufgaben zu. Anschließend führen sie die erste Aufgabe in dieser Sequenz aus und verschieben den vierstündigen Planungshorizont nach vorne, um die nächste Aufgabe hinzuzufügen, und wiederholen den Vorgang, bis das gesamte Drawback gelöst ist und der endgültige Zeitplan der Aufgaben-Maschinen-Zuweisungen erstellt wird.

Ein Planungshorizont sollte länger sein als die Dauer einer Aufgabe, da die Lösung besser ist, wenn der Algorithmus auch Aufgaben berücksichtigt, die auftreten werden.

Wenn der Planungshorizont jedoch voranschreitet, schafft dies eine gewisse Überschneidung mit den Operationen im vorherigen Planungshorizont. Der Algorithmus entwickelte bereits vorläufige Lösungen für diese überlappenden Operationen.

„Vielleicht sind diese vorläufigen Lösungen intestine und müssen nicht wieder berechnet werden, aber vielleicht sind sie nicht intestine. Hier kommt maschinelles Lernen ins Spiel“, erklärt Wu.

Für ihre Technik, die sie als lerngeführte Rollhorizon-Optimierung (L-RHO) bezeichnen, unterrichten die Forscher ein maschinelles Lernmodell, um vorherzusagen, welche Operationen oder Variablen, wenn der Planungshorizont vorwärts rollt.

L-RHO verlangt Daten, um das Modell zu trainieren, sodass die Forscher eine Reihe von Unterproblemen unter Verwendung eines klassischen algorithmischen Solvers lösen. Sie nahmen die besten Lösungen an – diejenigen mit den meisten Operationen, die nicht neu berechnet werden müssen – und diese als Trainingsdaten verwendet.

Nach dem Coaching erhält das maschinell-lernende Modell ein neues Teilproblem, das es zuvor noch nicht gesehen hat, und prognostiziert, welche Operationen nicht neu berechnet werden sollten. Die verbleibenden Operationen werden in den algorithmischen Solver zurückgeführt, der die Aufgabe ausführt, diese Operationen wieder berechnet und den Planungshorizont vorwärts bewegt. Dann beginnt die Schleife von vorne.

„Wenn wir im Nachhinein sie nicht wiederoptimieren mussten, können wir diese Variablen aus dem Drawback entfernen. Da diese Probleme exponentiell an Größe wachsen, kann dies sehr vorteilhaft sein, wenn wir einige dieser Variablen fallen lassen können“, fügt sie hinzu.

Ein anpassungsfähiger, skalierbarer Ansatz

Um ihren Ansatz zu testen, verglichen die Forscher L-RHO mit mehreren Basisalgorithmic-Solvers, spezialisierten Solvers und Ansätzen, die nur maschinelles Lernen verwenden. Es übertraf sie alle, die die Lösungszeit um 54 Prozent senkte und die Lösungsqualität um bis zu 21 Prozent verbesserte.

Darüber hinaus übertraf ihre Methode weiterhin alle Baselines, wenn sie sie an komplexeren Varianten des Issues testeten, z. Es übertraf sogar zusätzliche Baselines, die die Forscher geschaffen haben, um ihren Löser herauszufordern.

„Unser Ansatz kann ohne Änderung an all diese verschiedenen Varianten angewendet werden, was wir wirklich mit dieser Forschungslinie tun“, sagt sie.

L-RHO kann sich auch anpassen, wenn sich die Ziele ändern, und generiert automatisch einen neuen Algorithmus, um das Drawback zu lösen-alles, was es benötigt, ist ein neuer Trainingsdatensatz.

In Zukunft möchten die Forscher die Logik hinter der Entscheidung ihres Modells, einige Variablen, aber nicht andere, besser zu verstehen. Sie möchten ihren Ansatz auch in andere Arten komplexer Optimierungsprobleme wie Inventarmanagement oder Fahrzeugrouting integrieren.

Diese Arbeit wurde teilweise von der Nationwide Science Basis, dem MIT Analysis Assist Committee, einem PhD -Stipendium von Amazon Robotics und MathWorks unterstützt.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert