Es sind die Lektionen, die wir auf unserem Weg gelernt haben. Oder doch?

ChatGPT ist ein typisches einmonatiges Praktikumsproblem im Datenbereich. Das Drawback wurde in gewisser Weise „gelöst“, aber ich bin mir nicht sicher, ob es das bedeutet, was ich mir vorgestellt habe. Für Daten- und KI-Praktiker ist dies mittlerweile eine sehr praktische Frage. Viele Groups nutzen Praktikanten oder Forschungsspitzen, um Ideen zu erkunden: Ist KI jetzt intestine genug? Geht es bei diesen Projekten nur um das endgültige Artefakt?

Praktikanten als Entdecker

Die Erstellung einer Technologie-Roadmap bei einem Daten-Startup in der Frühphase unterscheidet sich nicht wesentlich von einer typischen Videospiel-Karte:

Eine Videospielkarte, auf der die Welt Schritt für Schritt enthüllt wird. Vom Autor mit ChatGPT generiertes Bild.

Die Roadmap ist nicht nur viel umfassender als das, was Sie tun können, sondern auch was Sie können sehen. Wenn wir nur einen Blick über den „(Produkt-)Horizont“ werfen könnten, indem wir einen Entdecker schicken, um die Karte zu räumen, dann würden wir uns darüber im Klaren sein, was Sie erwartet sobald du dort angekommen bist (Der Entdecker könnte sterben, daher ist die Analogie bis zu einem gewissen Punkt intestine).

Bauplan (welches Ich conflict Mitbegründer im Jahr 2024) hat die (für seine Größe) ungewöhnliche Entscheidung getroffen, Sommerpraktika an Prime-Institutionen (Columbia College, CMU, College of Wisconsin–Madison) anzubieten, um einen Blick über den Horizont zu werfen. Es hat bisher sehr intestine funktioniert. Abgesehen von einem besseren Einstellungstrichter, einem besseren Ansehen in der Gemeinschaft und einer gewissen sozialen Schlagkraft wurden Untersuchungen durchgeführt ihren Weg in unser Produktund werden im Zuge des Unternehmenswachstums zu strategischen Vermögenswerten.

Während ich Praktikumsangebote für den Sommer 2026 verschicke, sagt mir die Hälfte meines X-Feeds, dass ich alles falsch mache. Alles andere als ein hypothetisches Drawback, in unterschiedlichen Stadien, Größen und Einschränkungen, alle Daten- und KI-Groups Heute stehen vor der gleichen Frage: Gibt es jetzt eine bessere Möglichkeit, Forschungsspitzen mit Agenten durchzuführen? Wenn ja, was ist ein gutes, getestetes KI-Setup, das sich leicht anpassen lässt?

In der Hoffnung, dass unsere Erfahrung und Perspektive für viele Datenpraktiker wertvoll sein werden, ist dies unser Aufbau und die Lehren, die wir aus einem echten Forschungsschub durch die Kombination mit ChatGPT gezogen haben.

Zuerst kamen sie, um die Berater zu holen, und ich habe mich nicht dazu geäußert …

In einer Zeit, in der KI eine Bedrohung für Wissensarbeiter darstellt, scheinen die Junior-Positionen diejenigen zu sein, die zuerst fallen. Warum sollte McKinsey einen Ivy-League-Analysten engagieren, wenn ein 200-Greenback-Abonnement schneller mehr Berichte produziert? In letzter Zeit scheint mein Feed darauf hinzudeuten, dass die KI möglicherweise auch hinter Forschern her ist und Akademiker versuchen, sich selbst zu automatisieren – „völlig autonome Forschung von der Idee zum Papier“ – und Professoren diskutieren darüber, ob das so ist Stellen Sie keine Assistenten mehr ein.

Es gibt offensichtliche Argumente, sich dem Development zu widersetzen. Wir können das angreifen Ergebnisund argumentieren, dass die Technologie immer noch fehlerhaft ist, sodass die versprochene „Ivy League“-Parität einfach nicht gegeben ist. Wir können argumentieren, dass die Gesellschaftsvertrag wird gebrochen: Natürlich waren junge Forscher immer (in gewissem Sinne) eine „Final“, aber diese Final conflict sowohl eine Möglichkeit, sie voranzutreiben, als auch eine Investition in die nächste Era. Wir können auch das Potenzial hervorheben Langzeitschäden einen wohlverstandenen Denkprozess durch einen neuen, ungetesteten Arbeitsablauf zu ersetzen.

Obwohl hinter all diesen Argumenten Gewicht steckt, könnten oberflächlich betrachtet parallele Argumente für die Erfindung von Autos oder was auch immer ausgelegt werden. Es gibt immer eine Zeit und einen Ort für diese Debatten, aber mein Interesse Heute ist viel lokaler und persönlicher: Wie würde es sich anfühlen, wenn ICH Sollte ich meine Praktikanten für ein 200-Greenback-Abonnement im Stich lassen?

Additionally (nicht unähnlich diese Physik (Experiment, das ich kürzlich entdeckt habe) Ich habe versucht, den Monat eines Praktikanten mit ChatGPT in ein Wochenende zu quetschen.

Auch wenn das genaue Drawback nicht besonders wichtig ist, kann es hilfreich sein, den Rahmen des Praktikums festzulegen, um ein Gefühl dafür zu bekommen Typ was Praktikanten bei Bauplan machen (gerne überspringen!). Bauplan ist eine verzweigte Datenplattform: Agenten und Menschen können Git-ähnliche Zweige auf ihrer Plattform öffnen Tische. Infolgedessen kann dieselbe Tabelle in verschiedenen Zweigen unterschiedliche Versionen haben. In unserem motivierenden Beispiel Acme Inc. ist ein On-line-Händler, bei dem ein Schwarm von Datenagenten damit beauftragt ist, unterschiedliche Vorhersagen über die Verkäufe von morgen zu treffen:

Abfragen einer „Vorhersage“-Tabelle, wenn mehrere Versionen nebeneinander existieren. Bild aus dem Originalpapier vom Autor.

Im Idealfall würde ein Mensch die Arbeit überprüfen, die Ergebnisse vergleichen und gegenüberstellen und sie dann zusammenführen Vorhersagen Tabelle als Die kanonische Datendarstellung. Was aber, wenn jemand eine Frage stellt, bevor das passiert?

Bestehende Systeme würden sich einfach weigern, eine Antwort zu geben, selbst wenn sich das intuitiv als Verschwendung anfühlt: Zwei Agenten, die den monatlichen Umsatz berechnen, sind sich möglicherweise nicht einig über die genaue Zahl, aber beide sind sich einig, dass der Umsatz im Vergleich zum Vorquartal um mehr als 10 % gestiegen ist. Mit anderen Worten: Auch wenn es keine systemweit vereinbarte Model der Daten gibt, können wir könnte noch viele interessante Fragen beantworten.

Unser Praktikumsziel ist es dann, einen Prototyp eines solchen Techniques zu bauen. Es erfordert das Erlernen von Verzweigungen, das Erlernen neuer Mathematik, das Entwerfen einer Lösung auf der Grundlage von Bauplan sowie die Erstellung eines Textual content-zu-SQL-Moduls (einfach) und eines benutzerdefinierten Abfragepfads (schwer).

Das KI-Setup

Bauplaner hatten kürzlich das Privileg, den einzigartigen Wes McKinney bei einer Dwell-Demo seines Setups zu sehen, additionally habe ich beschlossen, es zu übernehmen (mit einigen kleinen Änderungen):

ChatGPT 5.2 zum Planen und Entscheiden von Strategien (z. B. wie man einen Benchmark entwirft, der den Unterschied zwischen technischen Ansätzen hervorhebt);
Claude Code in Visible Studio, um die eigentliche Entwicklungsschleife durchzuführen;
Roborev um Commits lokal kontradiktorisch zu überprüfen. Die von Codex unterstützten Bewertungen heben potenzielle Probleme hervor und schlagen Verbesserungen vor.
Roborev überprüft etwa alle 10 Commits, um die Projektkomplexität zu bändigen: Diese Überprüfungen nehmen einen architektonischen Standpunkt ein und helfen dabei, die Aufblähung zu reduzieren.

Der wahre Schatz waren die Freunde, die wir unterwegs kennengelernt haben

Da ich den Gedanken nicht ertragen kann, dass KI für mich schreibt (weil ich ehrlich gesagt auch den Gedanken nicht ertragen kann, dass Praktikanten das für mich tun), habe ich den letzten Textual content geschrieben ich selbst. Da Praktika in der Regel damit enden, dass die Ergebnisse mit der Group geteilt werden, hatte ich am Ende genug Dinge für ein ACM SAO Papier, „Alles überall auf einmal abfragen“.

In gewisser Hinsicht hatte die X-Crowd Recht: Selbst wenn man eine Qualitätsinkongruenz zugab, habe ich die KI 48 Stunden lang betreut, um, sagen wir, 80 % dessen zu erledigen, was Wochen gedauert hätte. Interessanterweise ist Babysitten von anderer Natur: Die KI ist so begierig darauf, zufrieden zu sein, dass sie am Ende oft „schummelt“, um durch fest codierte Verknüpfungen oberflächliche Ergebnisse zu erzielen. Während viele Daten- und KI-Probleme oberflächlich betrachtet leicht zu überprüfen sind, lassen sie sich unserer Erfahrung nach auch leicht ausspielen: Dies gilt insbesondere dann, wenn die Interpretation des Versuchsaufbaus differenziert ist oder die endgültige Metrik nicht eindeutig ist: Sie sollten dreimal überprüfen, ob Ihre KI-Agenten bergauf klettern oder nur so tun.

Andererseits muss die KI nicht über Tarskis Modelle oder Wahrheitsschwemme aufgeklärt werden, da das Anhängen einiger Papiere ausreicht, um sofort loslegen zu können. Die Ergebnisse waren auch „greifbar“: Ich habe eine intestine aussehende Net-App, ohne D3.js erneut in die Hand nehmen zu müssen (10 Jahre nach meinem letzten Mal!), und ein Demo-Skript, das Agenten-Pipelines und Geschäftsfragen über Zweige simuliert. Wenn Sie das glauben (wie ich). Prototypen schlagen im Allgemeinen PowerPoint (oder Papiere) besteht kein Zweifel am gelieferten KI-Stack etwas.

Schwieriger in Worte zu fassen ist, was nicht geliefert wurde, oder genauer gesagt, was ICH dabei verloren. Bei aller Aufregung über das unglaubliche Diagramm und den überraschenden Benchmark hat nichts davon wirklich mehr hervorgebracht Verständnis. Ich bin nicht klüger geworden, weil ich den Forschungsvorgang durchlaufen habe: Ich habe etwas mehr Instinct als zuvor (z. B. wie ich besser zu guten SQL-Übersetzungen auffordern kann), aber meine mentalen Modelle haben weitgehend die gleiche Auflösung wie zu Beginn. Die Arbeit mit Praktikanten kann zeitaufwändig und manchmal sogar frustrierend sein, aber sie bringt bei ihnen immer bessere Gedanken hervor Und mich selbst: Indem sie sie erklären und betreuen, erklären und betreuen sie mich in gewisser Weise auch.

Wenn ich jetzt Ergebnisse bekomme, ohne viel zu lernen, fühle ich mich unwohl, vor allem weil nicht klar ist, ob das so ist sollte wichtig sein. Ich meine nicht, ob es auf globaler Ebene wichtig ist: Natürlich Wenn unsere Kinder nicht mehr lernen und unsere Wissenschaftler das Denken auf ein Gespräch verlagern, ist das schlecht. Ich bin jetzt nur noch bescheiden darauf konzentriert Das: Ist es für mich, für mein Unternehmen, für meine Investoren von Bedeutung?

Die lokale, persönliche Antwort ist weniger eindeutig – es sei denn, Sie haben ein sehr übertriebenes Selbstbewusstsein. Ich weiß, wie man programmiert, und ich könnte wahrscheinlich noch ein wenig mathematische Logik beibringen, daher geht dieses Projekt in gewisser Weise sowieso nicht auf neue Wege: Vielleicht ist es das auch nicht so viel zu lernen Hier (abgesehen von der Machbarkeit des Ganzen, die ich natürlich von Anfang an vermutet habe) und dem Unbehagen, das ich empfinde, ist das Erbe einer früheren Denkweise. OderVielleicht gibt es keine Aufgabe, die zu bescheiden ist, um eine etwas bessere Model von mir selbst zu werden: die Kleinarbeit zu erledigen, unsere APIs mit einem Diagramm zu verbinden, DataFusion 13 Mal nicht zu kompilieren, hin und her zu gehen, wie man Abfragen für einen überzeugenden Benchmark auswählt, bei dem kein anderes System unseren Abfragepfad ausdrücken – geschweige denn berechnen – kann. Ich fühle mich unwohl, weil reale Projekte für reale, nicht zu sehr egoistische Menschen eine sehr große Oberfläche von Problemen aufweisen, bei denen es sich offensichtlich weder um das Denken nach den ersten Prinzipien noch um offensichtliche Implementierungsdetails handelt.

Ich habe kein Drawback Heute (Morgen werden wir sehen…) mit der vereinfachenden Ansicht, dass Menschen denken sollten und LLMs die Matplotlib-Syntax korrigieren sollten. Aber ich habe mit der großen Grauzone zu kämpfen dazwischenund die innere Stimme flüstert das durch die Behandlung alles Als Implementierungsdetail werden meine Gedanken bald nicht mehr scharf sein. Werden wir wie diese VCs, die „Muster anpassen“ und alle Nuancen verlieren? Ist der Sinn eines Beweises, der einen Satz beweist (jedoch Außerirdisch aussehend, könnte der Beweis sein) oder uns einen Roman geben Verständnis?

Die Zukunft kann (ein bisschen) warten

Beobachten meine Entscheidungen (und nicht meine Gefühle) für den Sommer 2026 offenbaren tatsächlich die Konsequenzen dieses Experiments. Bauplan hat zwei (menschliche) Praktikanten eingestellt, zwei junge, talentierte, motivierte Informatiker, die dafür verantwortlich sind, die Grenzen unserer Produktkarte im Hinblick auf die Finish-to-Finish-KI-Optimierung (Fähigkeitsentwicklung mit GEPA) und die Skalierung von Git-for-Knowledge zu erkunden. Aus praktischer Sicht habe ich die gleiche Entscheidung getroffen wie vor diesem Projekt. Allerdings glaube ich nicht, dass ich unversehrt davongekommen bin: Meine Gefühle werden sich irgendwann in neuen Konzepten kristallisieren und dann meine Entscheidungen beeinflussen.

Einerseits als großer Fan des Kleiner PrinzMir ist nicht entgangen, dass es die mit dieser Rose verschwendete Zeit conflict, die es wichtig gemacht hat: Die Zeit, die ich diesen Sommer mit meinen Praktikanten verbringe, wird sie (glaube ich) und unser gemeinsames Projekt noch wichtiger machen. Andererseits trifft das meine heutige Stimmung nur teilweise zu. Ich musste im Internetarchiv stöbern, um etwas wiederherzustellen, an das ich mich kürzlich aus dem Jahr 2006 erinnerte (anscheinend ist die mathematische Logik nicht das Einzige, woran ich mich aus meinen Zwanzigern erinnere). Dies ist der Eintrag Nr. 1 in Blenders „50 Am schlimmsten Dinge, die mit Musik passieren können“:

#01. KINDER HEUTE

Damals hatten wir keine Ihrer schicken iPods, Klingeltöne und Downloads. Wir hatten nicht den Luxus und die Bequemlichkeit Ihrer Hodensackringe und Ihrer World Broad Net-Protokolle. Als wir das neue URIAH HEEP-Album stehlen wollten, konnten wir nicht einfach im Web danach suchen, sondern mussten es auf die altmodische Artwork und Weise tun – indem wir zum Laden gingen (bergauf, in beide Richtungen) und 12″ Vinyl unter unsere Pullover schoben (die wir selbst stricken mussten). Das ist der Grund, warum ihr heulenden Peitschenhiebe den wahren Wert der Musik nicht zu schätzen weißt. Oder Uriah Heep. Und jetzt verschwinde von unserem Rasen!

Werden wir den „wahren Wert der Dinge“ immer noch zu schätzen wissen, wenn wir sie jetzt bequem von unseren Laptops aus „stehlen“ können?

Wir sehen uns, Agenten-Cowboys

Vielen Dank an Luca, Colin und Ethan für ihre Kommentare zu einem früheren Entwurf dieses Artikels.

Wenn Sie ein Bauplan-Praktikant werden und coole Daten- und KI-Sachen machen möchten (wie Das oder Das oder Das), ich akzeptiere immer noch menschliche Kandidaten: Nehmen Sie Kontakt auf!

Es sind die Lektionen, die wir auf unserem Weg gelernt haben. Oder doch?

Praktikanten als Entdecker

Zuerst kamen sie, um die Berater zu holen, und ich habe mich nicht dazu geäußert …

Das KI-Setup

Der wahre Schatz waren die Freunde, die wir unterwegs kennengelernt haben

Die Zukunft kann (ein bisschen) warten

Wir sehen uns, Agenten-Cowboys

Von admin

Schreibe einen Kommentar Antworten abbrechen

Versäumt

Es sind die Lektionen, die wir auf unserem Weg gelernt haben. Oder doch?

Sicherstellung der Datenintegrität mit kryptografischem Hashing und der Ethereum-Blockchain

Ein Jahr voller IoT-Sensor-Zeitreihendaten mit Mimesis verspotten

Eine Implementierung des Microsoft Agent Governance Toolkits für die sichere Verwendung von AI-Agent-Instruments mit Richtlinien, Genehmigungen, Überwachungsprotokollen und Risikokontrollen

About

Categories

Tags

Recent Post

Es sind die Lektionen, die wir auf unserem Weg gelernt haben. Oder doch?

Sicherstellung der Datenintegrität mit kryptografischem Hashing und der Ethereum-Blockchain

Praktikanten als Entdecker

Zuerst kamen sie, um die Berater zu holen, und ich habe mich nicht dazu geäußert …

Das KI-Setup

Der wahre Schatz waren die Freunde, die wir unterwegs kennengelernt haben

Die Zukunft kann (ein bisschen) warten

Wir sehen uns, Agenten-Cowboys

Von admin

Ähnlicher Beitrag

Schreibe einen Kommentar Antworten abbrechen

Versäumt