Die meisten modernen Visualisierungs -Autoring -Instruments wie Charticulator, Information Illustrator und LYRA sowie Bibliotheken wie GGPLOT2 und Vegalite erwarten ordentliche Daten, bei denen jede Variable eine Spalte ist und jede Beobachtung eine Zeile ist. Wenn sich die Eingabedaten in einem ordentlichen Format befinden, müssen Autoren lediglich Datenspalten an visuelle Kanäle binden. Andernfalls müssen sie die Daten vorbereiten, auch wenn die ursprünglichen Daten sauber sind und alle Informationen enthalten. Darüber hinaus müssen Benutzer ihre Daten mit speziellen Bibliotheken wie Tidyverse oder Pandas oder separaten Instruments wie Wrangler transformieren, bevor sie Visualisierungen erstellen können. Diese Anforderung stellt zwei große Herausforderungen dar – die Notwendigkeit von Programmierkenntnissen oder spezialisiertem Werkzeugwissen und den ineffizienten Workflow, ständig zwischen Datenumwandlungs- und Visualisierungsschritten zu wechseln.
Es sind verschiedene Ansätze entstanden, um die Erstellung der Visualisierung zu vereinfachen, beginnend mit der Grammatik von Grafikkonzepten, die die Grundlage für die Zuordnung von Daten zu visuellen Elementen bildeten. Auf hohe Grammatik-basierte Instruments wie GGPLOT2, VEGA-LITE und ALTAIR haben ihre prägnante Syntax und Abstraktion komplexer Implementierungsdetails an Popularität gewonnen. Zu den erweiterten Ansätzen gehören die Visualisierung durch Demonstrationstools wie Lyra 2 und VBD, mit denen Benutzer Visualisierungen durch direkte Manipulation angeben können. Natürliche Sprachschnittstellen wie NCNET und Visqa wurden ebenfalls entwickelt, um die Erstellung der Visualisierung intuitiver zu gestalten. Diese Lösungen erfordern jedoch entweder ordentliche Dateneingaben oder führen neue Komplexitäten ein, indem sie sich auf ähnliche Spezifikationen auf niedriger Ebene wie FALX konzentrieren.
Ein Group von Microsoft Analysis hat den Datenformulator vorgeschlagen, ein innovatives Visualisierungsautoring -Software, das sich um ein neues Paradigma namens Idea Binding basiert. Es ermöglicht Benutzern, ihre Visualisierungsabsichten auszudrücken, indem sie Datenkonzepte an visuelle Kanäle verbinden, bei denen Datenkonzepte entweder aus vorhandenen Spalten stammen oder auf Bedarf erstellt werden können. Das Software unterstützt zwei Methoden zum Erstellen neuer Konzepte: natürliche Sprachaufforderungen für die Datenableitung und beispielhafte Eingaben für die Datenumstellung. Wenn Benutzer einen Diagrammtyp auswählen und ihre gewünschten Konzepte zuordnen, färbt der KI -Backend von Information Formulator die erforderlichen Datenumwandlungen und generiert Kandidatenvisualisierungen. Das System bietet ein erklärendes Suggestions für mehrere Kandidaten und ermöglicht es den Benutzern, ihre Visualisierungen durch eine intuitive Schnittstelle zu inspizieren, zu verfeinern und zu iterieren.
Die Architektur des Datenformulators basiert auf dem Kernkonzept der Behandlung von Datenkonzepten als erstklassige Objekte, die als Abstraktionen bestehender und potenzieller Spalten für zukünftige Tabellen dienen. Dieses Design unterscheidet sich grundlegend von traditionellen Ansätzen, indem sie sich eher auf Transformationen auf Konzeptebene als auf Operatoren auf Tabellenebene konzentrieren und es den Benutzern intuitiver machen, mit dem AI-Agenten zu kommunizieren und die Ergebnisse zu überprüfen. Die natürliche Sprachkomponente des Instruments nutzt die Fähigkeit von LLMs, hochrangige Absicht und natürliche Konzepte zu verstehen, während die Programmierkomponente durch Demonstration präzise, eindeutige Umformvorgänge bietet. Diese Hybridarchitektur ermöglicht es Benutzern, mit vertrauten Instruments zur Konfiguration von Regal zu arbeiten und gleichzeitig auf leistungsstarke Transformationsfunktionen zuzugreifen.
Die Bewertung des Datenformulators durch Benutzertests ergab vielversprechende Ergebnisse bei der Abschluss und der Benutzerfreundlichkeit. Die Teilnehmer erledigten alle zugewiesenen Visualisierungsaufgaben innerhalb einer durchschnittlichen Zeit von 20 Minuten, wobei Aufgabe 6 aufgrund ihrer Komplexität, die 7-Tage-Durchschnittsberechnungen umfasst, die größte Zeit erfordert. Der Ansatz der Twin-Interaktion-Ansatz des Methods erwies sich als effektiv, obwohl einige Teilnehmer gelegentliche Hinweise zur Auswahl des Konzepttyps und des Datentypmanagements benötigten. Bei abgeleiteten Konzepten erzielten die Benutzer durchschnittlich 1,62 Eingabeaufentwicklungsversuche mit relativ prägnanten Beschreibungen (Durchschnitt von 7,28 Wörtern), und das System erzeugte ungefähr 1,94 Kandidaten professional Eingabeaufforderung. Die meisten Herausforderungen waren geringfügig und bezogen sich eher auf die Einberufung der Schnittstellen als um grundlegende Usability -Probleme.
Zusammenfassend hat das Group den Datenformulator eingeführt, der einen signifikanten Fortschritt bei der Visualisierungsgenehmigung darstellt, indem die anhaltende Herausforderung der Datenumwandlung durch seinen konzeptorientierten Ansatz effektiv angegangen wird. Die revolutionary Kombination aus AI -Unterstützung und Benutzerinteraktion des Instruments ermöglicht es Autoren, komplexe Visualisierungen zu erstellen, ohne die Datenumwandlungen direkt zu bearbeiten. Benutzerstudien haben die Wirksamkeit des Instruments validiert und zeigen, dass selbst Benutzer, die mit komplexen Datenumwandlungsanforderungen konfrontiert sind, ihre gewünschten Visualisierungen erfolgreich erstellen können. Mit Blick auf die Zukunft ist dieser konzeptorientierte Visualisierungsansatz vielversprechend, um die nächste Technology der visuellen Datenerforschung und -autorierungswerkzeuge zu beeinflussen und möglicherweise die langjährige Barriere der Datenumwandlung bei der Erstellung der Visualisierung zu beseitigen.
Kasse Die Papier Und Github -Seite. Alle Krediten für diese Forschung gilt an die Forscher dieses Projekts. Fühlen Sie sich auch frei, uns zu folgen Twitter Und vergessen Sie nicht, sich unserer anzuschließen 75k+ ml Subreddit.
🚨 Empfohlene Open-Supply-KI-Plattform: ‚Intellagent ist ein Open-Supply-Multi-Agent“ (Befördert)
Sajjad Ansari ist ein Pupil im letzten Jahr von IIT Kharagpur. Als Tech-Fanatic befasst er sich mit den praktischen Anwendungen der KI, wobei der Schwerpunkt darauf liegt, die Auswirkungen von KI-Technologien und ihre realen Auswirkungen zu verstehen. Er zielt darauf ab, komplexe KI -Konzepte klar und zugänglich zu artikulieren.