Stellen Sie sich eine Boombox vor, die jeden Zug verfolgt und Musik vorschlägt, die Ihrem persönlichen Tanzstil entspricht. Das ist die Idee hinter „Be Beat“, einem von mehreren Projekten aus dem MIT -Kurs 4.043/4.044 (Interaktionsintelligenz)unterrichtet von Marcelo Coelho in der Abteilung für Architektur, die im Dezember 2024 auf der 38. jährlichen Neurips -Konferenz (Neural Info Processing Methods) vorgestellt wurde Auf dem Gebiet der künstlichen Intelligenz und des maschinellen Lernens sowie eines führenden Veranstaltungsortes für die Präsentation modernster Entwicklungen.
Der Kurs untersucht den aufstrebenden Feld von Große Sprachobjekteund wie künstliche Intelligenz in die physische Welt ausgedehnt werden kann. Während „Be Beat“ die kreativen Möglichkeiten des Tanzes verwandelt, umfassen andere Einreichungen der Schüler Disziplinen wie Musik, Geschichtenerzählen, kritisches Denken und Gedächtnis und schaffen generative Erfahrungen und neue Formen der Interaktion zwischen Mensch und Pc. Zusammengenommen veranschaulichen diese Projekte eine breitere Imaginative and prescient für künstliche Intelligenz: eine, die über die Automatisierung hinausgeht, um Kreativität zu katalysieren, die Bildung neu zu gestalten und soziale Interaktionen neu zu interpretieren.
Sei der Schlag
„Be Beat“, von Ethan Chang, einem MIT-Scholar für Maschinenbau- und Designstudenten, und Zhixing Chen, ein MIT-Maschinenbau- und Musikstudent, ist eine KI-angetriebene Boombox, die Musik aus der Bewegung eines Tänzers hindeutet. Der Tanz wurde traditionell von Musik im Laufe der Geschichte und in der gesamten Kulturen geleitet, doch das Konzept des Tanzens zur Schaffung von Musik wird selten untersucht.
„Be The Beat“ schafft einen Raum für die Zusammenarbeit zwischen Menschen und AI für Freestyle-Tanz und befähigt die Tänzer, die traditionelle Dynamik zwischen Tanz und Musik zu überdenken. Es verwendet Posenet, um Bewegungen für ein großes Sprachmodell zu beschreiben, sodass es den Tanzstil und die Abfrage -APIs analysieren kann, Musik mit ähnlichem Stil, Energie und Tempo zu finden. Tänzer, die mit der Boombox interagieren, berichteten, dass mehr Kontrolle über den künstlerischen Ausdruck gehabt und die Boombox als neuartiger Ansatz zur Entdeckung von Tanzgenres und Choreografie kreativ beschrieb.
Ein Geheimnis für dich
„Ein Geheimnis für Sie“ von Mrinalini Singha SM ’24, kürzlich im Kunst-, Kultur- und Technologieprogramm, und Haoheng Tang, ein Absolvent der Harvard College Graduate College of Design, ist ein Bildungsspiel, das entwickelt wurde, um sich zu kultivieren Kritisches Denken und Faktenüberprüfungsfähigkeiten bei jungen Lernenden. Das Spiel nutzt ein großes Sprachmodell (LLM) und eine materielle Schnittstelle, um eine immersive Ermittlungserfahrung zu schaffen. Die Spieler fungieren als Faktenprüfer der Bürger und reagieren auf von der Spielschnittstelle gedruckte „Nachrichtenwarnungen“. Durch Einfügen von Patronenkombinationen, um „Nachrichten-Updates“ zu verfolgen, navigieren sie mehrdeutige Szenarien, analysieren Beweise und wiegen widersprüchliche Informationen, um fundierte Entscheidungen zu treffen.
Diese Interaktion mit menschlicher Komputer fordert unsere Nachrichtengewohnheiten in Frage, indem sie Touchscreen-Schnittstellen beseitigen, das ewige Scrollen ersetzen und durch ein haptisch reichhaltiges analoges Gerät gelesen werden. Durch die Kombination der Vorteile langsamer Medien mit neuen generativen Medien fördert das Spiel nachdenkliche, verkörperte Interaktionen und veranlasst die Spieler, die heutige polarisierte Medienlandschaft besser zu verstehen und herauszufordern, in der Fehlinformationen und manipulative Erzählungen gedeihen.
Memorscope
„Memorscope“ von Kimwook Kim von MIT Media Lab Analysis ist ein Gerät, das kollektive Erinnerungen schafft, indem er die tief menschliche Erfahrung der persönlichen Interaktion mit fortschrittlichen KI-Technologien verschmelzen. Inspiriert, wie wir Mikroskope und Teleskope verwenden, um verborgene und unsichtbare Particulars zu untersuchen und aufzudecken, ermöglicht Memorscope zwei Benutzer, die Gesichter des anderen zu „betrachten“, wobei diese intime Interaktion als Tor zur Erstellung und Erforschung ihrer gemeinsamen Erinnerungen verwendet wird.
Das Gerät nutzt KI -Modelle wie OpenAI und Midjourney und führt unterschiedliche ästhetische und emotionale Interpretationen ein, was zu einem dynamischen und kollektiven Speicherplatz führt. Dieser Raum überschreitet die Einschränkungen traditioneller gemeinsamer Alben und bietet eine flüssige, interaktive Umgebung, in der Erinnerungen nicht nur statische Schnappschüsse sind, sondern auch lebende, sich entwickelnde Erzählungen, die von der anhaltenden Beziehung zwischen Benutzern geprägt sind.
Narratron
„Narratron“, von der Harvard Graduate College of Design-Schülern Xiying (ARIAy) Bao und Yubo Zhao, ist ein interaktiver Projektor, der die Geschichten von Kindern mit großer Sprachmodellen mit Schattenpuppen mit Schattenpuppen erstellt und zusammenfasst. Benutzer können den Verschluss drücken, um Protagonisten zu „erfassen“, die sie in der Geschichte sein möchten, und es dauert Handschatten (z. B. Tierformen) als Eingabe für die Hauptfiguren. Das System entwickelt dann die Story -Handlung, wenn neue Schattenfiguren eingeführt werden. Die Geschichte erscheint durch einen Projektor als Hintergrund für Shadow Puppetry, während er durch einen Sprecher erzählt wird, während die Benutzer eine Kurbel in Echtzeit „spielen“. Durch die Kombination von visuellen, auditorischen und körperlichen Interaktionen in einem System soll das Projekt Kreativität im Schattenspiel erzählen und die Zusammenarbeit mit multimodaler Human-AI ermöglichen.
Perfekte Syntax
„Excellent Syntax“ von Karyn Nakamura ’24 ist ein Video -Kunststück, das die syntaktische Logik hinter Bewegung und Video untersucht. Mit AI zur Manipulation von Videofragmenten untersucht das Projekt, wie die Fluidität von Bewegung und Zeit von Maschinen simuliert und rekonstruiert werden kann. Nakamuras Arbeit inspiriert sowohl von der philosophischen Untersuchung als auch von der künstlerischen Praxis und befragt die Beziehung zwischen Wahrnehmung, Technologie und der Bewegung, die unsere Erfahrung der Welt prägt. Durch die Neueinstellung von Movies durch Rechenprozesse untersucht Nakamura die Komplexität des Verständnisses und der Darstellung von Zeit und Bewegung.