Sie möchten Datenwissenschaftler werden und nicht wissen, wo Sie anfangen sollen?

In diesem Artikel möchte ich Ihnen eine unkomplizierte, unsinnige Lernroadmap zur Verfügung stellen, die Sie befolgen können, um in die Branche einzudringen.

Am Ende haben Sie endlich ein klares Verständnis dafür, was erforderlich ist und die besten Ressourcen zu verwenden, die hoffentlich alle Überwältigung reduzieren sollten, die Sie möglicherweise haben, und Ihnen helfen, diesen Datenwissenschaftsjob schneller zu landen!

Ein Hügel, auf dem ich bereit bin zu sterben, ist, dass Statistik meiner Meinung nach der wichtigste Bereich ist, den Sie als Datenwissenschaftler kennen sollten.

Neue Traits für maschinelles Lernen kommen und gehen, Technologien werden häufig ersetzt, aber Statistiken haben seit Jahrhunderten den Check der Zeit bestanden.

Entsprechend Wikipedia:

Statistik ist die Disziplin, die die Sammlung, Organisation, Analyse, Interpretation und Darstellung von Daten betrifft.

Angesichts des Titels „Daten“ -Schüreer ist es offensichtlich, wie wichtig Statistiken für unser Gebiet sind.

Glücklicherweise müssen Sie keinen Doktortitel in kausaler Schlussfolgerung oder stochastischer Berechnung haben, um über das erforderliche Statistikwissen zu verfügen. Die Grundlagen sind die wichtigsten und buchstäblich 90% des Jobs.

Was zu lernen?

Die Bereiche, die Sie stark erfassen müssen, sind:

  • Zusammenfassungsstatistik – Mittelwert, Median, Modus, Varianz, Korrelationen, alles, was Sie ermöglicht, Daten zusammenzufassen, um interessante Schlussfolgerungen zu ziehen.
  • Visualisierungen – Lernen Sie, Daten mit Grafiken wie Balkendiagramm, Zeilendiagramm, Kreisdiagramm usw. zu zeichnen. Schließlich spricht ein Bild 1000 Wörter.
  • Wahrscheinlichkeitsverteilungen – Lernen Sie die häufigsten wie regular, Poisson, Binomial und Gamma. Dies sind diejenigen, die ich am häufigsten verwende.
  • Wahrscheinlichkeitstheorie Dieser Bereich ist ziemlich groß, aber die wichtigsten Dinge, die zu lernen sind, sind: Zufällige Variablen, Zentralgrenze, Stichproben und maximale Wahrscheinlichkeitsschätzung.
  • Hypothesentest – Wenn Sie an Experimenten arbeiten, müssen Sie verstehen, wie sie statistisch ausgeführt werden. Dies beinhaltet das Erlernen von Konfidenzintervallen, Signifikanzniveaus, Z-Check, T-Check und Teststatistik. Sie müssen lediglich wissen, wie man Hypothesentests durchführt.
  • Bayes’sche Statistik – Es lohnt sich, einige Bayes’sche Statistiken zu kennen, da Menschen die ganze Zeit über diesen Begriff lose auf dem Feld herumwerfen, ohne wirklich zu verstehen. Es ist ein massives Gebiet, aber wie immer lernen Sie die Grundlagen wie Bayes ‚Theorem, konjugierte Priors, glaubwürdige Intervalle und Bayes’sche Regression.

Wie man lernt

Wie ich zu Beginn erwähnt habe, möchte ich, dass diese Roadmap einfach ist und jede Analyse -Lähmung verhindern kann, die Sie möglicherweise erleben. Um quick alle oben genannten zu lernen, empfehle ich, das zu bekommen Praktische Statistiken für die Datenwissenschaft (Affiliate -Hyperlink) Lehrbuch.

Es deckt jedoch keine Bayesian -Statistiken ab, und dafür empfehle ich dies jedoch nicht Denken Sie an Bayes (Affiliate -Hyperlink) Lehrbuch.

Diese beiden Bücher sind alles, was Sie brauchen, und sie sind speziell für Datenwissenschaftler konzipiert und befinden sich in Python.

Statistiken sind von Natur aus ein ziemlich angewandtes Feld, und einige der Konzepte erfordern reine Mathematikwissen, um vollständig zu verstehen.

Wenn es um Bereiche wie maschinelles Lernen geht, benötigen Sie außerdem ein gutes Verständnis der linearen Algebra und des Kalküls, um zu erfassen, was unter der Motorhaube passiert.

Was zu lernen?

Infinitesimalrechnung

Infinitesimalrechnung ist, wie Algorithmen für maschinelles Lernen tatsächlich „lernen“. Ihr „Lernen“ erfolgt durch numerische kontinuierliche Optimierung, und die Bereiche, die Sie lernen sollten, sind:

  • Was ist ein Derivat und was misst es?
  • Erfahren Sie die Derivate von Standardfunktionen wie Sinus, Cosinus, Exponential, Tan usw.
  • Was sind Wendepunkte, Maxima und Minima?
  • Ketten- und Produktregeln sind der Grund, warum neuronale Netze so intestine funktionieren, da sie der Kernprozess für die Backpropagation sind.
  • Verstehe Teilungsderivate und ihre Verwendung im multivariablen Kalkül.
  • Was ist die Integration und was macht das?
  • Integration durch Teile und Substitution.
  • Das Integral von Standardfunktionen wie Sinus, natürliches Log und andere Polynome.

Lineare Algebra

Lineare Algebra ist ein mathematisches Feld, das sich mit Vektoren, Matrizen und ihren Transformationen befasst.

Sie sollten lernen:

  • Vektoren, ihre Größe, Ausrichtung und Komponente. Darüber hinaus Operationen wie die DOT- und Kreuzproduktregeln.
  • Matrizen und deren Operationen, einschließlich Spuren, Inverse, Transponieren, DOT -Produkt- und Kreuzproduktregeln.
  • Erfahren Sie, wie Sie Systeme von linearen Gleichungen durch Techniken wie Eliminierung, Reihenreduzierung und Cramers Regel lösen können.
  • Ein Verständnis für Eigenwerte und Eigenvektoren erlangen. Dies sind die Grundlage von Techniken wie der Hauptkomponentenanalyse, die dazu beiträgt, die Dimensionalität in Datensätzen zu verringern.

Wie man lernt

In früheren Movies habe ich einige Lehrbücher empfohlen, die zwar nützlich waren, aber für die meisten Menschen in nur wenigen Monaten nicht praktisch waren.

Deshalb schlage ich jetzt vor, das zu nehmen Mathematik für maschinelles Lernen und Datenwissenschaftspezialisierung auf Coursera.

Dieser Kurs ist speziell für Datenwissenschaft mit Übungen in Python zugeschnitten. Es überspringt die unnötige Theorie und konzentriert sich auf das, was Sie für reale Arbeiten benötigen.

Es gibt zwei und nur zwei Programmiersprachen, die Sie benötigen: Python Und Sql.

Was zu lernen?

Python

Halten Sie es einfach und lernen Sie die Grundlagen:

  • Variablen und Datentypen
  • Boolesche und Vergleichsbetreiber
  • Kontrollfluss und Bedingungen
  • Für und während Schleifen
  • Funktionen und Klassen

Sie möchten auch bestimmte wissenschaftliche Computerbibliotheken lernen:

Sql

Sie möchten alle grundlegenden Funktionen lernen, die für die Analyse in SQL erforderlich sind. Es ist eine ziemlich kleine Sprache, additionally gibt es nicht viele Dinge zu lernen.

  • Wählen Sie * aus (Standardabfrage)
  • Ändern, einfügen, erstellen (Tabellen ändern)
  • Gruppe von, bestellen von
  • Wo und, oder zwischen, in, haben(Filtertabellen)
  • AVG, Graf, min, max, summe(Aggregatfunktionen)
  • Full Be a part of, hyperlinks Be a part of, rechts bei, innere Beitritt, Union, Union
  • FALL(wenn Aussagen)
  • DATEADD, DEMEDIFF, DATERAPT(Datums- und Zeitfunktionen)

Wie man lernt

Es gibt viele einleitende Python- und SQL -Kurse, und alle lehren das gleiche Materials. Additionally, wählen Sie einen und machen Sie sich damit los. Sie können hier buchstäblich nichts falsch machen.

Wenn Sie eine Empfehlung wünschen, können Sie es auschecken W3schools oder Freecodecamp -Movies. Ich habe beide benutzt und sie sehr intestine gefunden.

Neben Python und SQL müssen Sie einige Zeit investieren, um andere Technologien zu lernen, die bei der Arbeit verwendet werden.

Was zu lernen?

Es gibt so viele Instruments, und jedes Unternehmen ist anders, aber diese sind diejenigen, die durchweg konsistent bleiben:

  • Git und Github– Praktisch jedes Unternehmen verwendet dies für die Versionskontrolle, sodass Sie es lernen müssen. Ich fürchte, es gibt keine Möglichkeit, es zu tun.
  • Verprügeln/ZSH –Sie werden viel im Terminal arbeiten, und die Mehrheit der Unternehmen ist auf Unix-ähnliche Systeme angewiesen, sodass Sie in der Befehlszeile bequem sein müssen.
  • Poesie / Pyenv / UVDas Verwalten von Paketen und Python-Versionen ist in jeder realen Anwendung von entscheidender Bedeutung. Daher lohnt es sich, sich mit diesen Instruments vertraut zu machen.

Wie man lernt

Für Git empfehle ich diesen Crashkurs von Freecodecamp:

Für das Lernterminal und das Bash -Shell -Skripte empfehle ich dieses Video auch vom Freecodecamp.

Und um Pyenv, Poesie und UV zu lernen, schauen Sie sich folgende Artikel an:

Richtig, Zeit für das lustige Zeug!

Maschinelles Lernen ist ein riesiges Gebiet, und wir können nicht alles lernen, auch wenn wir unser ganzes Leben lang versucht haben.

Um ein Datenwissenschaftler zu sein, wie ich immer sage, müssen wir nur die Grundlagen und ein wenig tiefes Lernen kennen.

Vergessen Sie das Lernen von LLMs, Transformatoren, Diffusionsmodellen usw., die für die meisten Einstiegspositionen nicht erforderlich sind, und um ehrlich zu sein, für viele Jobs im Allgemeinen.

Konzentrieren Sie sich auf das Nageln der Grundlagen, wenn sie in alles andere übergehen. Bis heute verwende ich immer noch grundlegende Regressionsmodelle, ebenso wie viele leitende Ingenieure für maschinelles Lernen, mit denen ich zusammenarbeite.

Es geht nur um die Anwendung und das Verständnis Ihres Issues, anstatt zu versuchen, durch die neueste hochmoderne Technologie auffällig zu sein, wenn sie nicht benötigt wird.

Was zu lernen?

Die wichtigsten Algorithmen und Konzepte, die Sie lernen sollten, sind:

  • Lineare, logistische und polynomiale Regression.
  • Entscheidungsbäume, zufällige Wälder und laufende Bäume.
  • Vektormaschinen unterstützen.
  • Regelmäßige neuronale Netze.
  • Okay-Means und Okay-nearste Nachbarn.
  • Regularisierung, Vorurteile gegen Varianz Kompromisse und Kreuzvalidierung.

Wie man lernt

Die folgenden zwei Ressourcen sind alles, was Sie brauchen. Arbeiten Sie additionally iterativ durch, und Ihr Wissen über maschinelles Lernen übertrifft das der meisten Praktiker in der Branche. Vertrau mir.

Der erste Kurs ML -Kurs, den ich absolvierte, struggle Spezialisierung des maschinellen Lernens von Andrew Ng Und ich denke, es ist wahrscheinlich das Beste da draußen. Sie könnten davon einfach davonkommen, dies selbst zu tun, da es so intestine ist.

Das zweite ist wahrscheinlich das beste maschinelles Lernenbuch, das jemals geschrieben wurde: Praktische ML mit Scikit-Be taught, Keras und Tensorflow (Affiliate -Hyperlink).Wenn ich nur ein Buch geben müsste, um maschinelles Lernen zu lernen, wäre es das!

Meiner Meinung nach ist dies optionally available, aber ich weiß, dass viele von Ihnen sich für tiefes Lernen interessieren, additionally habe ich es hier zur Vollständigkeit aufgenommen.

Ich persönlich würde hier nicht zu viel Zeit verschwenden, da es leicht sein kann, sich in den neuesten Entwicklungen zu verlieren.

Was zu lernen?

Diese tiefen Lernkonzepte haben den Check der Zeit bestanden, daher sind sie es wert, Ihr Lernen in zu investieren: in:

Wie man lernt

Dies sind die Ressourcen, die ich verwendet habe, um tiefes Lernen zu lernen, und sie sind alles, was Sie brauchen.

Deep Studying Spezialisierung von Andrew Ng. -Dies ist der Folgekurs aus der Spezialisierung des maschinellen Lernens und wird alles lehren, was Sie über Deep Studying, CNNs und RNNs wissen müssen.

Wieder das Praktische ML mit Scikit-Be taught, Keras und Tensorflow (Affiliate -Hyperlink)Lehrbuch als exzellenter Abschnitt Deep Studying ab Kapitel 14.

Schließlich haben einige von Ihnen vielleicht gehört Andrej KarpathyWenn Sie es nicht getan haben, ist er derzeit wahrscheinlich einer der besten KI -Forscher und hat bei Tesla und Openai gearbeitet.

Wie auch immer, seine Neuronale Netze: Null zu Helden YouTube Der Kurs ist phänomenal und lehrt Sie, wie Sie Ihre eigenen generativen vorgeschriebenen Transformatoren (GPT) von Grund auf neu erstellen.


Wenn Sie in diesem Artikel alles durchlaufen, haben Sie hervorragendes Wissen, um in das Feld Information Science einzugeben.

Dieses Wissen reicht jedoch nicht aus; Sie müssen ein solides Portfolio bauen, um einen Job zu landen.

Aus diesem Grund empfehle ich, meinen vorherigen Artikel anzusehen, in dem ich genau die Projekte erkläre, die Sie erstellen müssen, um einen Job so schnell wie möglich zu sichern.

Wir sehen uns dort!

Hören Sie auf, nutzlose ML -Projekte aufzubauen – was eigentlich funktioniert | Auf Information Science
So finden Sie Projekte für maschinelles Lernen, mit denen Sie eingestellt werden.in RichtungDatascience.com

Ich biete 1: 1 -Teaching -Anrufe an, bei denen wir uns über alles unterhalten können, was Sie brauchen – sei es Projekte, Karriereberatung oder einfach nur Ihren nächsten Schritt herauszufinden. Ich bin hier, um Ihnen zu helfen, vorwärts zu kommen!

1: 1 Mentoring -Anruf mit Egor Howell
Karriereanleitung, beratende Beratung, Projekthilfe, Lebenslaufüberprüfungtopmate.io

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert