In der Reihe „Writer Highlight“ unterhalten sich TDS-Redakteure mit Mitgliedern unserer Neighborhood über ihren Karriereweg in den Bereichen Datenwissenschaft und KI, ihr Schreiben und ihre Inspirationsquellen. Heute freuen wir uns, unser Gespräch mit Ihnen zu teilen Maria Mouschoutzi.

Maria ist Datenanalystin und Projektmanagerin mit umfassendem Hintergrund in den Bereichen Operations Analysis, Maschinenbau und Optimierung der maritimen Lieferkette. Sie verbindet praktische Branchenerfahrung mit forschungsorientierter Analyse, um Instruments zur Entscheidungsunterstützung zu entwickeln, Prozesse zu rationalisieren und Erkenntnisse zwischen technischen und nicht-technischen Groups zu kommunizieren.

In „Was ‚Denken‘ und ‚Argumentation‘ in KI und LLMs wirklich bedeuten“ Sie befassen sich mit der semantischen Kluft zwischen menschlichem und maschinellem Denken. Wie wirkt sich das Verständnis dieser Unterscheidung auf die Artwork und Weise aus, wie Sie in Ihrer beruflichen Arbeit an die Modellentwicklung und -interpretation herangehen?

KI hat in letzter Zeit einen großen Hype ausgelöst. Plötzlich werden viele ML-basierte Produkte der alten Schule sofort in KI umbenannt, und es scheint eine erneute Nachfrage nach allem zu geben, das mit KI ausgestattet ist. Aus diesem Grund glaube ich, dass es jetzt für jeden von entscheidender Bedeutung ist, ein grundlegendes technisches Verständnis davon zu haben, was KI ist und wie sie funktioniert, damit er in der Lage ist, einzuschätzen, was sie für ihn tun kann und was nicht.

Die Wahrheit ist, dass wir eine Menge Ballast über die Natur der KI mit uns herumschleppen, der seinen Ursprung in Erzählungen aus unserem Science-Fiction-Erbe hat. Dieser Ballast macht es leicht, sich von all dem aufregenden und vielversprechenden Potenzial der KI mitreißen zu lassen und ihre tatsächlichen aktuellen Fähigkeiten zu vergessen und sie letztendlich fälschlicherweise als eine Artwork magische Lösung einzuschätzen, die alle unsere Probleme lindern wird. Nicht technisch versierte Geschäftsanwender sind am anfälligsten für diese übermäßige Begeisterung für KI und stellen sie sich manchmal als eine Black-Field-Superintelligenz vor, die in der Lage ist, auf alles die richtigen Antworten und Lösungen zu liefern.

Im Guten wie im Schlechten könnte dies nicht weiter von der Wahrheit entfernt sein. LLMs – der wichtigste wissenschaftliche Durchbruch, um den sich die ganze KI-Aufregung wirklich dreht – sind in bestimmten Dingen beeindruckend intestine (z. B. beim Erstellen von E-Mails oder Zusammenfassungen), in anderen jedoch nicht so intestine (z. B. bei der Durchführung komplexer Berechnungen oder der Analyse mehrstufiger Ursache-Wirkungs-Beziehungen).

Ein technisches Verständnis dafür zu haben, was KI ist und wie sie grundsätzlich funktioniert, hat mir bei meiner beruflichen Arbeit ungemein geholfen. In erster Linie ermöglicht es mir, gültige KI-Anwendungsfälle zu entdecken und die Erwartungen von Geschäftsanwendern darüber zu steuern, was getan werden kann und was nicht. Auf einer eher technischen Ebene ermöglicht es mir, die spezifischen Komponenten zu unterscheiden, die in bestimmten Kontexten verwendet werden müssen, sodass die gelieferte Lösung einen echten Wert für das Unternehmen hat.

Wenn beispielsweise eine RAG-Anwendung benötigt wird, um eine bestimmte technische Dokumentation zu durchsuchen und Berechnungen auf der Grundlage der in dieser Dokumentation enthaltenen Informationen durchzuführen, bedeutet dies, dass eine Code-Terminalkomponente in die Anwendung eingebunden werden muss, um die Berechnungen durchzuführen (anstatt das Modell direkt antworten zu lassen).

Woher nehmen Sie die erste Inspiration für Ihre Artikel, insbesondere für die eher philosophischen wie die „Water Cooler Small Speak“-Reihe?

Die anfängliche Inspiration für meine „Water Cooler Small Speak“-Reihe kam von tatsächlichen Diskussionen, die ich in einem Büro erlebt habe, sowie von Geschichten von Freunden. Ich denke, dass aufgrund der Tendenz der Menschen, unnötige Konflikte in Unternehmenskonstellationen zu vermeiden, manchmal in lockeren Diskussionen rund um einen Wasserspender wirklich empörende Meinungen geäußert werden können. Und normalerweise nennt niemand falsche Fakten, nur um Konflikte zu vermeiden oder seine Kollegen herauszufordern.

Obwohl solche Gespräche wohlwollend und intestine gemeint sind – eigentlich nur eine gelegentliche Pause von der Arbeit –, führen sie manchmal dazu, dass falsche wissenschaftliche Fakten aufrechterhalten werden. Insbesondere bei komplexen und nicht so leicht intuitiv zu verstehenden Themen wie Statistik und KI können wir Dinge leicht zu stark vereinfachen und ungültige Meinungen aufrechterhalten.

Die allererste Meinung, die mich dazu veranlasste, einen ganzen Artikel darüber zu schreiben, battle diese „Wenn Sie genügend Roulette-Runden spielen, werden Sie irgendwann gewinnen, denn die Wahrscheinlichkeiten liegen bei etwa 50/50 und die Ergebnisse werden sich irgendwann ausgleichen.“ Wenn Sie jemals an einem Statistikkurs teilgenommen haben, wissen Sie, dass dies nicht der Fall ist. Aber wenn Sie diesen Statistikkurs nicht besucht haben und niemand darauf aufmerksam macht, verlassen Sie diese Diskussion möglicherweise mit einigen seltsamen Ideen darüber, wie Glücksspiel funktioniert. Meine ursprüngliche Inspiration für diese Serie waren additionally hauptsächlich missverstandene Statistikthemen.

Dennoch gibt es heutzutage bei Themen rund um KI die gleichen – wenn nicht sogar noch mehr – Missverständnisse. Der große Hype, den die KI ausgelöst hat, hat dazu geführt, dass Menschen sich alle möglichen Fehlinformationen darüber ausdenken und verbreiten, wie KI funktioniert und was sie leisten kann, und das tun sie manchmal mit unglaublichem Selbstvertrauen. Deshalb ist es so wichtig, sich über die Grundlagen zu informieren, egal ob es sich um Statistik, KI oder ein anderes Thema handelt.

Können Sie uns durch den typischen Schreibprozess für einen detaillierten technischen Artikel führen, von der ersten Recherche bis zum endgültigen Entwurf? Wie bringt man hohe technische Genauigkeit mit Zugänglichkeit für ein allgemeines Publikum in Einklang?

Jeder technische Beitrag beginnt mit einem technischen Konzept, über das ich schreiben möchte – zum Beispiel einer Demonstration, wie man eine bestimmte Bibliothek verwendet oder wie man ein bestimmtes Downside in Python strukturiert. Zum Beispiel in mein Pokémon-BeitragDas Ziel bestand darin, zu erklären, wie ein Operations-Analysis-Downside in Python strukturiert werden kann. Nachdem ich dieses technische Kernkonzept identifiziert habe, auf das ich mich konzentrieren möchte, besteht mein nächster Schritt normalerweise darin, nach einem geeigneten Datensatz zu suchen, der zur Demonstration verwendet werden kann.

Ich glaube, dass dies der schwierigste und zeitaufwändigste Teil ist – die Suche nach einem guten Open-Supply-Datensatz, der frei für Ihre Analyse verwendet werden kann. Obwohl es viele Datensätze gibt, ist es nicht so einfach, einen zu finden, der frei verfügbar ist, vollständige Daten enthält und interessant genug ist, um eine gute Geschichte zu erzählen.

Meiner Ansicht nach kann die Artwork des Datensatzes, den Sie verwenden, einen großen Einfluss auf die Beliebtheit Ihres Beitrags haben. Ein Operations-Analysis-Downside mithilfe von Pokémon zu strukturieren klingt viel lustiger als die Verwendung von Mitarbeiterschichten (eww!). Insgesamt sollte der Datensatz thematisch zu dem von mir gewählten technischen Thema passen und eine einigermaßen zusammenhängende Geschichte ergeben.

Nachdem ich das technische Thema des Beitrags und den Datensatz identifiziert habe, den ich verwenden werde, schreibe ich dann den eigentlichen Code. Dies ist ein recht unkomplizierter Schritt: Schreiben Sie den Code mithilfe des Datensatzes und sorgen Sie dafür, dass er ausgeführt wird und korrekte Ergebnisse liefert.

Nachdem ich den Code fertiggestellt und sichergestellt habe, dass er ordnungsgemäß ausgeführt wird, beginne ich mit dem Entwurf des eigentlichen Beitrags. Normalerweise beginne ich meine Beiträge mit einer kurzen Einleitung zu dem, was ursprünglich mein Interesse an diesem speziellen Thema geweckt hat (z. B. was ich machen wollte). eine komplexe Visualisierung für meine Doktorarbeitund die Searoute-Python-Bibliothek hat mir das Leben erleichtert) und wie dieses Thema für den Leser nützlich sein kann (die Lektüre meines Tutorials, das API-Aufrufe an die Pokémon-Daten-API erklärt, kann Ihnen helfen zu verstehen, wie man Aufrufe an jede API schreibt).

Ich füge außerdem, wo angemessen, einige kurze allgemeine Erklärungen der zugrunde liegenden theoretischen Prämisse des Anwendungsfalls, den ich demonstriere, sowie eine kurze Einführung in die Codebibliotheken hinzu, die ich verwenden werde.

Im Hauptteil des technischen Beitrags zeige ich normalerweise, wie man den Code mit Python-Snippets strukturiert, und erkläre Schritt für Schritt, wie alles abläuft und welche Ergebnisse erwartet werden, wenn alles korrekt läuft.

Ich füge auch gerne GIF-Screenshots hinzu, die alle interaktiven Diagramme demonstrieren, die in den Code integriert sind – ich glaube, dass sie die Beiträge für den Leser viel interessanter, leichter verständlich und optisch ansprechender machen.

Und da haben Sie es! Ein technisches Tutorial!

Was hat Sie ursprünglich dazu motiviert, Ihr Wissen und Ihre Erkenntnisse mit der breiteren Knowledge-Science-Neighborhood zu teilen, und welche Auswirkungen hat der Prozess des Schreibens auf Ihre berufliche Praxis?

Als ich 2017 meine Diplomarbeit schrieb, stieß ich zum ersten Mal auf Medium und die Publikation „In the direction of Knowledge Science“. Nachdem ich einige Beiträge gelesen hatte, battle ich völlig fasziniert von der Fülle an technischem Materials, der Themenvielfalt und der Kreativität der Beiträge. Es fühlte sich an wie eine Knowledge-Science-Neighborhood mit Autoren mit unterschiedlichem Hintergrund und auf unterschiedlichen technischen Niveaus – es gab Artikel für jedes Niveau und für verschiedene Bereiche.

Aber abgesehen davon, dass ich den technischen Charakter der Tutorials zu schätzen wusste, die es mir ermöglichten, mehr über Knowledge Science zu lernen und zu verstehen, gefielen mir auch die Kreativität und das Storytelling der Beiträge. Im Gegensatz zu einer GitHub-Seite oder einer Stack Overflow-Antwort battle in den meisten Beiträgen eine gewisse Kreativität und Kunstfertigkeit zu erkennen. Es hat mir wirklich Spaß gemacht, solche Beiträge zu lesen – sie haben mir dabei geholfen, viel über Datenwissenschaft und maschinelles Lernen zu lernen, und mit der Zeit entwickelte sich in mir im Stillen der Wunsch, solche Beiträge auch selbst zu schreiben.

Nachdem ich eine Weile darüber nachgedacht hatte, verfasste und reichte ich widerwillig meinen allerersten Beitrag ein, und so veröffentlichte ich Anfang 2023 zum ersten Mal bei TDS. Seitdem habe ich mehrere weitere Beiträge für TDS geschrieben und jeden einzelnen genauso sehr genossen wie diesen ersten Beitrag.

Eine Sache, die mir beim Schreiben technischer Artikel für TDS wirklich Spaß macht, ist das Teilen von Dingen, die ich selbst schwer zu verstehen oder besonders interessant fand. Manchmal können komplexe Themen wie Operations Analysis, Wahrscheinlichkeiten oder KI beängstigend und einschüchternd wirken und Menschen davon abhalten, überhaupt mit dem Lesen und Erfahren mehr darüber zu beginnen – ich selbst bin daran schuld.

Indem ich eine vereinfachte, geradlinige und sogar scheinbar unterhaltsame Model eines komplexen Themas erstelle, habe ich das Gefühl, dass ich es den Leuten ermögliche, mit einem sanften, nicht ganz so förmlichen Einstieg mehr darüber zu lesen und mehr darüber zu lernen und selbst zu sehen, dass es doch nicht so beängstigend ist.

Andererseits hat mir das Schreiben auf persönlicher und beruflicher Ebene sehr geholfen. Meine schriftliche Kommunikation hat sich erheblich verbessert. Im Laufe der Zeit ist es für mich einfacher geworden, komplexe, technische Themen so zu präsentieren, dass sie auch für kaufmännisch nicht technisch versierte Zielgruppen verständlich sind. Wenn Sie sich in die Lage versetzen, jemand anderem ein Thema in einfachen Worten zu erklären, müssen Sie es letztendlich vollständig verstehen und vermeiden, zweideutige Stellen zu hinterlassen.

Wenn Sie auf Ihren beruflichen Werdegang zurückblicken: Auf welche nicht-technische Fähigkeit hätten Sie sich lieber früher konzentriert?

In einer Datenkarriere ist Kommunikation die wichtigste nichttechnische Fähigkeit.

Während Kommunikation in jedem Bereich wertvoll ist, ist sie in Datenrollen besonders wichtig. Es ist im Wesentlichen das, was die Lücke zwischen komplexer technischer Arbeit und praktischem Geschäftsverständnis schließt und Sie zu einem vielseitigen Datenprofi macht.

Denn ganz gleich, wie stark Ihre technischen Fähigkeiten sind: Wenn Sie den Wert Ihrer Ergebnisse den Geschäftsanwendern und dem Administration nicht vermitteln können, werden Sie damit nicht weit kommen.

Es ist wichtig, dass Sie in der Lage sind, einem technisch nicht versierten Publikum den Wert Ihrer Arbeit zu erklären, ihre Sprache zu sprechen, zu verstehen, was für sie wichtig ist, und Ihre Ergebnisse auf eine Weise zu kommunizieren, die zeigt, welchen Nutzen Ihre Arbeit für sie hat.

Daten und Mathematik, so wertvoll sie auch sind, können für Geschäftsanwender oft einschüchternd oder unverständlich wirken. Die Fähigkeit, Daten in aussagekräftige Geschäftserkenntnisse umzuwandeln und diese Erkenntnisse dann effektiv zu kommunizieren, ist letztlich das, was Ihren Datenanalyseprojekten einen echten Einfluss auf ein Unternehmen ermöglicht.


Um mehr über Marias Arbeit zu erfahren und über ihre neuesten Artikel auf dem Laufenden zu bleiben, können Sie ihr folgen TDS oder LinkedIn.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert