Was befindet sich in meiner Lesezeichenleiste: Data Science Edition Was befindet sich in meiner Lesezeichenleiste: Data Science Edition
Bild vom Autor

# Einführung

Mit der Datenwissenschaft Schritt zu halten ist nicht immer einfach. Jeden Tag gibt es neue Bibliotheken, Artikel, Datensätze und Instruments, und ich kann mich nicht an alle erinnern. Ich habe festgestellt, dass das bloße Verfolgen von Newslettern oder Threads nicht wirklich funktioniert. Was noch hilfreicher ist, ist, ein paar nützliche Ressourcen parat zu haben. Für mich ist es wie ein kleiner Knotenpunkt, an dem ich Recherchen, Codierungsmaterial, Datensätze, Visualisierungen und Kurzreferenzen an einem Ort aufbewahre. Nachdem ich eine Menge Dinge ausprobiert hatte, Ich habe jetzt 10 Lesezeichen, die ich ständig verwende. Sie helfen mir, konzentriert zu bleiben, Zeit zu sparen und zu wissen, was passiert. Jeden Morgen öffne ich sie und sie geben irgendwie den Ton für meinen Tag vor. Hier ist ein Blick auf meine High-Lesezeichen und warum ich sie behalte:

# 1. arXiv: Maschinelles Lernen (cs.LG) Neue Artikel

arXiv Hier schaue ich mir die neuesten Forschungsergebnisse zum maschinellen Lernen an. Der Abschnitt cs.LG deckt alles von der Theorie bis zum angewandten maschinellen Lernen in NLP, Imaginative and prescient und RL ab. Ich setze ein Lesezeichen und schaue oft nach, damit ich keine Beiträge verpasse, die zu neuen Ideen oder Projekten inspirieren könnten. Dies ist eine großartige Möglichkeit, auf dem Laufenden zu bleiben und sich über neue Methoden zu informieren, bevor sie in Artikeln oder auf GitHub erscheinen.

# 2. GitHub Trending Python Repos

Diese Seite zeigt jede Woche die beliebtesten Python-Projekte, von neuen Bibliotheken bis hin zu experimentellen Instruments. Ich behalte es im Lesezeichen, weil es bei der Datenwissenschaft nicht nur um Algorithmen, sondern auch um Instruments geht. Das Scannen von Developments hilft mir, nützliche Bibliotheken oder Muster frühzeitig zu erkennen, bevor sie zu überfüllt sind. Nur 10 Minuten professional Woche hier bringen mir normalerweise ein oder zwei Dinge, die es wert sind, ausprobiert zu werden.

# 3. Daten sind Plural

Daten sind Plural ist ein E-newsletter und Archiv voller ungewöhnlicher und interessanter Datensätze. Ich behalte es in meinen Lesezeichen, weil es sich hervorragend zum Auffinden von Projektideen, Tutorials oder Hackathon-Herausforderungen eignet. Jeder Datensatz verfügt über eine kurze Beschreibung und einen Hyperlink. Es ist eine einfache Möglichkeit, neue Daten zu erkunden und Ideen zu erhalten, die über Kaggle oder die üblichen Quellen hinausgehen.

# 4. Die heruntergekommene KI

Die heruntergekommene KI fasst die wichtigsten Nachrichten und Artikel zu KI und maschinellem Lernen zusammen und erspart mir so stundenlanges Suchen. Ganz gleich, ob es sich um ein neues Papier, eine Software-Veröffentlichung oder einen neuen Ansatz handelt: Es bietet einen schnellen Überblick, sodass ich erkennen kann, was related ist. Im Grunde eine einfache Möglichkeit, informiert zu bleiben und über Developments auf dem Laufenden zu bleiben.

# 5. RAWGraphs

RAWGgraphs ist ein kostenloses, browserbasiertes Software zum schnellen Erstellen sauberer, anpassbarer Diagramme. Ich kann Visualisierungen direkt aus CSV oder JSON erstellen, ohne kompliziert schreiben zu müssen matplotlib oder seegeboren Code. Es eignet sich hervorragend zum Erkennen von Developments und Ausreißern oder zum Erstellen von Diagrammen für Berichte. Die Diagramme lassen sich problemlos in Vektorformate exportieren, sodass sie in Folien oder Artikeln professionell aussehen.

# 6. Quartz Unhealthy Information Information

Der Quarz-Leitfaden für fehlerhafte Daten ist eine meiner Anlaufstellen, wenn ich unordentliche Daten bereinige. Es geht auf häufige Probleme wie fehlende Werte, verstümmelten Textual content, inkonsistente Formatierung und falsch eingegebene Zahlen ein und gibt Tipps zu deren Behebung. Unordentliche Daten sind nur ein Teil der Arbeit, und dieser Leitfaden erspart mir viel Zeit bei der Fehlerbehebung. Mir gefällt auch die Strukturierung danach, wer was reparieren soll, was das Verfolgen und Lösen von Problemen viel einfacher macht.

# 7. Fünf-Minuten-Statistiken

Fünf-Minuten-Statistiken ist eine Kurzreferenz für wichtige Statistikkonzepte und -formeln. Ich kann Themen wie Hypothesentests, Wahrscheinlichkeitsverteilungen, Korrelationen und beschreibende Statistiken in nur wenigen Minuten problemlos auffrischen. Es ist perfekt, wenn Sie Berechnungen überprüfen, Unterrichtsstunden vorbereiten oder Tutorials schreiben möchten, ohne in Lehrbüchern wühlen zu müssen.

# 8. Fantastische Datenanalyse

Tolle Datenanalyse ist eine GitHub-Sammlung von Instruments und Ressourcen für alle Teile des Datenworkflows. Ich behalte es als Lesezeichen, weil es sich hervorragend zum Bereinigen, Bearbeiten und Visualisieren von Daten und zum Erstellen von Pipelines für maschinelles Lernen eignet. Wenn ich neue Bibliotheken ausprobiere, mein Toolkit auffrische oder mit Kollegen oder Studenten teile, hilft es mir, schnell zuverlässige, intestine gepflegte Instruments zu finden.

# 9. Mockaroo

Mockaroo ist ein Software zum Generieren von Zufallsdaten und Schein-APIs. Ich kann schnell realistische Datensätze in CSV, JSON, SQL oder Excel erstellen, ohne alles von Hand eintippen zu müssen. Es eignet sich hervorragend zum Testen von Code, Dashboards oder Machine-Studying-Workflows, einschließlich kniffliger Randfälle. Mit Mock-APIs kann ich auch gleichzeitig am Frontend und Backend arbeiten.

# 10. Foorilla

Foorilla ist eine Plattform für Stellenangebote im Technologie- und Datenbereich. Ich nutze es, um neue Stellenangebote zu durchsuchen, Unternehmen zu folgen und Jobs nach Thema, Standort oder Distant-Optionen zu filtern. Sie können Hear auch im CSV- oder JSON-Format exportieren, was es einfacher macht, den Überblick über Chancen zu behalten. Dies ist eine einfache Möglichkeit, über den Arbeitsmarkt auf dem Laufenden zu bleiben, ohne zwischen mehreren Web sites wechseln zu müssen.

Kanwal Mehreen ist ein Ingenieur für maschinelles Lernen und ein technischer Redakteur mit einer großen Leidenschaft für Datenwissenschaft und die Schnittstelle zwischen KI und Medizin. Sie ist Mitautorin des E-Books „Maximizing Productiveness with ChatGPT“. Als Google Technology Scholar 2022 für APAC setzt sie sich für Vielfalt und akademische Exzellenz ein. Sie ist außerdem als Teradata Variety in Tech Scholar, Mitacs Globalink Analysis Scholar und Harvard WeCode Scholar anerkannt. Kanwal ist ein leidenschaftlicher Verfechter von Veränderungen und hat FEMCodes gegründet, um Frauen in MINT-Bereichen zu stärken.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert