
Im Februar 2024 schloss Reddit mit Google einen Vertrag über 60 Millionen US -Greenback ab, damit der Suchgigant Daten auf der Plattform verwenden kann, um seine Modelle für künstliche Intelligenz zu schulen. Insbesondere in den Diskussionen waren Reddit -Benutzer, deren Daten verkauft wurden.
Der Deal spiegelte die Realität des modernen Internets wider: Large Tech -Unternehmen besitzen praktisch alle unsere On-line -Daten und können entscheiden, was mit diesen Daten zu tun ist. Es ist nicht überraschend, dass viele Plattformen ihre Daten monetarisieren, und der am schnellsten wachsende Weg, um sie zu erreichen, besteht heute darin, sie an KI-Unternehmen zu verkaufen, die selbst huge Technologieunternehmen verwenden, die die Daten verwenden, um immer leistungsstärkere Modelle zu schulen.
Die dezentrale Plattform Vana, die als Klassenprojekt am MIT begann, hat die Aufgabe, den Benutzern Strom zurückzugeben. Das Unternehmen hat ein vollständig benutzerbezogenes Netzwerk erstellt, in dem Einzelpersonen ihre Daten hochladen und wie sie verwendet werden. KI -Entwickler können Benutzer Ideen für neue Modelle aufnehmen, und wenn die Benutzer sich einig sind, ihre Daten für das Coaching beizutragen, erhalten sie ein proportionales Eigentum an den Modellen.
Die Idee ist, jedem einen Anteil an den KI -Systemen zu geben, die unsere Gesellschaft zunehmend prägen und gleichzeitig neue Datenpools freischalten, um die Technologie voranzutreiben.
„Diese Daten sind erforderlich, um bessere KI-Systeme zu schaffen“, sagt Anna Kazlauskas ’19, Mitbegründerin von Vana. „Wir haben ein dezentrales System erstellt, um bessere Daten zu erhalten – die heute in großen Technologieunternehmen befindet, und gleichzeitig die Benutzer letztendlich das Eigentum behalten lassen.“
Von der Wirtschaft bis zur Blockchain
Viele Schüler haben Bilder von Popstars oder Athleten an ihren Schlafzimmerwänden. Kazlauskas hatte ein Bild der ehemaligen US -Finanzministerin Janet Yellen.
Kazlauskas kam zu MIT sicher, dass sie Ökonom werden würde, aber sie warfare eine von fünf Studenten, die 2015 dem MIT Bitcoin Membership beigetreten waren, und diese Erfahrung führte sie in die Welt der Blockchains und der Kryptowährung.
Aus ihrem Schlafsaal im MacGregor Home begann sie, das Kryptowährungs -Ethereum zu beruhigen. Sie suchte sogar gelegentlich Campus -Müllcontainer auf der Suche nach weggeworfenen Computerchips.
„Es hat mich für alles um Informatik und Networking interessiert“, sagt Kazlauskas. „Aus Blockchain -Sicht, verteilten Systemen und der Artwork und Weise, wie sie die wirtschaftliche Macht auf Einzelpersonen sowie künstliche Intelligenz und Ökonometrie verlagern können.“
Kazlauskas traf Artwork Abal, der damals die Harvard College besuchte, in den ehemaligen Ventures der Medienlaborklasse, und das Paar beschloss, an neuen Wegen zu arbeiten, um Daten zu erhalten, um KI -Systeme zu schulen.
„Unsere Frage warfare: Wie könnten Sie eine große Anzahl von Personen haben, die zu diesen KI -Systemen beitragen, die eher ein verteiltes Netzwerk verwenden?“ Kazlauskas erinnert sich.
Kazlauskas und Abal versuchten, den Establishment anzugehen, bei dem die meisten Modelle durch Scraping öffentlicher Daten im Web geschult werden. Große Technologieunternehmen kaufen häufig auch große Datensätze von anderen Unternehmen.
Der Ansatz der Gründer entwickelte sich im Laufe der Jahre und wurde nach dem Abschluss von der Erfahrung von Kazlauskas von der Monetary Blockchain Firm Celo informiert. Aber Kazlauskas schreibt ihre Zeit am MIT zu, ihr zu helfen, über diese Probleme nachzudenken, und der Ausbilder für aufstrebende Ventures, Ramesh Raskar, hilft Vana noch heute über AI -Forschungsfragen.
„Es warfare großartig, eine offene Gelegenheit zu haben, nur zu bauen, zu hacken und zu erkunden“, sagt Kazlauskas. „Ich denke, dass das Ethos am MIT wirklich wichtig ist. Es geht nur darum, Dinge zu bauen, zu sehen, was funktioniert, und weiterhin iterieren.“
Heute nutzt Vana ein wenig bekanntes Gesetz, das es Benutzern der meisten großen Tech-Plattformen ermöglicht, ihre Daten direkt zu exportieren. Benutzer können diese Informationen in verschlüsselte digitale Brieftaschen in Vana hochladen und sie ausschüttet, um Modelle zu trainieren, sobald sie für richtig halten.
KI-Ingenieure können Ideen für neue Open-Supply-Modelle vorschlagen, und die Menschen können ihre Daten bündeln, um das Modell zu trainieren. In der Blockchain -Welt werden die Datenpools als Daten DAOS bezeichnet, was für die dezentrale autonome Organisation steht. Daten können auch verwendet werden, um personalisierte KI -Modelle und Agenten zu erstellen.
In Vana werden Daten so verwendet, dass die Privatsphäre der Benutzer beibehält, da das System keine identifizierbaren Informationen aufdeckt. Sobald das Modell erstellt wurde, behalten die Benutzer das Eigentum bei, damit jedes Mal, wenn es verwendet wird, proportional belohnt werden, basierend darauf, wie viel ihre Daten dazu beigetragen haben, sie zu trainieren.
„Aus Sicht eines Entwicklers können Sie diese hyperpersonalisierten Gesundheitsanwendungen nun aufbauen, die genau berücksichtigen, was Sie gegessen haben, wie Sie geschlafen haben, wie Sie trainieren“, sagt Kazlauskas. „Diese Anwendungen sind heute aufgrund dieser ummauerten Gärten der großen Technologieunternehmen nicht möglich.“
Crowdsourced, benutzerbesitzende KI
Im vergangenen Jahr schlug ein Maschinenlerningenieur vor, Vana-Benutzerdaten zu trainieren, um ein KI-Modell zu trainieren, das Reddit-Posts generieren könnte. Mehr als 140.000 Vana -Benutzer haben ihre Reddit -Daten beigetragen, die Beiträge, Kommentare, Nachrichten und mehr enthielten. Die Benutzer entschieden sich für die Begriffe, in denen das Modell verwendet werden konnte, und behielten nach seiner Erstellung das Eigentum des Modells bei.
Vana hat ähnliche Initiativen mit benutzerfreundlichen Daten aus der Social-Media-Plattform X ermöglicht. Schlafdaten aus Quellen wie Oura -Ringen; und mehr. Es gibt auch Kooperationen, die Datenpools kombinieren, um breitere KI -Anwendungen zu erstellen.
„Nehmen wir an, Benutzer haben Spotify -Daten, Reddit -Daten und Modedaten.“ Kazlauskas erklärt. „Normalerweise arbeitet Spotify nicht mit solchen Unternehmensarten zusammen, und es gibt tatsächlich Regulierung dagegen. Benutzer können dies jedoch tun, wenn sie Zugriff gewähren. Daher können diese plattformübergreifenden Datensätze verwendet werden, um wirklich leistungsstarke Modelle zu erstellen.“
Vana hat über 1 Million Benutzer und über 20 DAOs Stay -Daten. Mehr als 300 zusätzliche Datenpools wurden von Benutzern im Vana -System vorgeschlagen, und Kazlauskas sagt, dass viele in diesem Jahr in die Produktion gehen werden.
„Ich denke, es gibt viel Versprechen in verallgemeinerten KI -Modellen, personalisierten Medizin und neuen Verbraucheranwendungen, da es schwierig ist, all diese Daten zu kombinieren oder überhaupt darauf zugreifen zu können“, sagt Kazlauskas.
Die Datenpools ermöglichen es Gruppen von Benutzern, etwas zu erreichen, mit dem auch die leistungsstärksten Technologieunternehmen heute zu kämpfen haben.
„Heute haben Large Tech -Unternehmen diesen Datengräben erstellt, sodass die besten Datensätze für niemanden verfügbar sind“, sagt Kazlauskas. „Es ist ein kollektives Aktionsproblem, bei dem meine Daten selbst nicht so wertvoll sind, aber ein Datenpool mit Zehntausenden oder Millionen von Menschen ist wirklich wertvoll. Vana lässt diese Swimming pools aufgebaut. Es ist eine Win-Win-Scenario: Nutzer können von dem Aufstieg der KI-Aufstiegsaufkommen profitieren, weil sie das Fashions besitzen. Dann landen Sie nicht in Szenario.
