5 weniger bekannte Python zeigt, dass jeder Datenwissenschaftler wissen sollte

Bild von Editor | Chatgpt

# Einführung

Python ist eine der beliebtesten Sprachen, die im Datenwissenschaftsbereich verwendet werden und für die Einfachheit, Vielseitigkeit und das leistungsstarke Ökosystem von Bibliotheken, einschließlich der Bibliotheken, geschätzt werden NumpyAnwesend PandasAnwesend Scikit-Be taughtUnd Tensorflow. Während diese Instruments einen Großteil des schweren Hebens liefern, enthält Python selbst eine Reihe von Funktionen, mit denen Sie sauberer, schneller und effizienterer Code schreiben können. Viele dieser Funktionen bleiben unbemerkt, können jedoch die Artwork und Weise verbessern, wie Sie Ihre Projekte strukturieren und verwalten.

In diesem Artikel untersuchen wir fünf weniger bekannte, aber vorteilhafte Python-Funktionen, die jeder Datenwissenschaftler in seinem Toolkit haben sollte.

# 1. Die `else` Klausel auf Schleifen

Wussten Sie for Und whereas Schleifen in Python können eine haben else Klausel?

Während dies zunächst nicht intuitiv klingen magazine, die else Block wird nur ausgeführt, wenn die Schleife ohne a abgeschlossen ist break Stellungnahme. Dies ist nützlich, wenn Sie einen Datensatz durchsuchen und nur dann eine Logik ausführen möchten, wenn eine bestimmte Bedingung nie erfüllt wurde.

for row in dataset:
    if row('goal') == 'desired_value':
        print("Discovered!")
        break
else:
    print("Not discovered.")

In diesem Ausschnitt die else Block wird nur ausgeführt, wenn die Schleife endet, ohne auf eine Pause zu stoßen. Auf diese Weise können Sie vermeiden, zusätzliche Flags oder Bedingungen außerhalb der Schleife zu erstellen.

# 2. Die `dataclasses` Modul

Der DataClasses Das in Python 3.7 eingeführte Modul bietet einen Dekorations- und Helferfunktionen, der automatisch spezielle Methoden erzeugt __init__()Anwesend __repr__()Und __eq__() für Ihre Klassen. Dies ist in der Datenwissenschaft nützlich, wenn Sie leichte Klassen benötigen, um Parameter, Ergebnisse oder Konfigurationseinstellungen zu speichern, ohne sich wiederholte Boilerplate -Code zu schreiben.

from dataclasses import dataclass

@dataclass
class ExperimentConfig:
    learning_rate: float
    batch_size: int
    epochs: int

Mit @dataclassSie erhalten einen sauberen Konstruktor, eine lesbare String -Darstellung und Vergleichsfunktionen.

# 3. Der Walros -Betreiber (`:=`)

Der Walross -Betreiber (:=), eingeführt in Python 3.8, können Sie Variablen als Teil eines Ausdrucks Werte zuweisen. Dies ist nützlich, wenn Sie einen Wert sowohl berechnen als auch testen möchten, ohne die Berechnung an mehreren Stellen zu wiederholen.

knowledge = (1, 2, 3, 4, 5)

if (avg := sum(knowledge) / len(knowledge)) > 3:
    print(f"Common is {avg}")

Hier, avg wird gleichzeitig zugewiesen und überprüft. Dadurch wird die Notwendigkeit einer anderen Zeile entfernt und erleichtert Ihr Code leichter zu lesen.

# 4. `enumerate()` Für indexierte Schleifen

Wenn Sie sowohl den Index als auch den Wert beim Iterieren benötigen, enumerate() ist die pythonischste Artwork, es zu tun. Es dauert iterable (wie eine Liste, ein Tupel oder eine Zeichenfolge) und gibt Paare von (Index, Wert) während der Loop zurück.

for i, row in enumerate(knowledge):
    print(f"Row {i}: {row}")

Dies verbessert die Lesbarkeit, verringert die Wahrscheinlichkeit von Fehlern und macht Ihre Absicht klarer. Es ist nützlich in der Datenwissenschaft, wenn sie über Datenreihen oder Ergebnisse mit Positionen iteriert werden.

# 5. die `collections` Modul

Python collections Das Modul bietet spezielle Containerdatenatypen, die effizienter und ausdrucksvoller sein können als nur Hear oder Wörterbücher. Zu den beliebtesten gehört Counterwas Elemente in einem iterbaren mit minimalem Code zählen kann.

from collections import Counter

word_counts = Counter(phrases)
most_common = word_counts.most_common(5)

Benötigen Sie ein bestelltes Wörterbuch? Verwenden OrderedDict. Benötigen Sie ein Wörterbuch mit Standardwerten? Versuchen defaultdict. Diese Instruments beseitigen die benötigte lanuelle Logik aus der ausführlichen Hand und können sogar die Leistung in der Datenverarbeitung in großem Maßstab verbessern.

# Abschluss

Werkzeuge wie die else Klausel auf Schleifen, dataclassesund der Walros -Bediener kann unnötige Kesselplatten beseitigen und logisch prägnanter gestalten. Funktionen wie enumerate() und Module mögen collections Helfen Sie, Daten mit Eleganz und Effizienz zu iterieren, zu zählen und zu organisieren. Durch die Einbeziehung dieser weniger bekannten Edelsteine in Ihren Workflow können Sie die Komplexität verringern, gemeinsame Fallstricke vermeiden und sich mehr auf die Lösung des tatsächlichen Datenproblems konzentrieren, als Ihren Code zu streiten.

Jayita Gulati ist ein Fanatic und technische Schriftsteller für maschinelles Lernen, der von ihrer Leidenschaft für den Aufbau maschineller Lernmodelle angetrieben wird. Sie hat einen Grasp -Abschluss in Informatik an der Universität von Liverpool.

5 weniger bekannte Python zeigt, dass jeder Datenwissenschaftler wissen sollte

# Einführung

# 1. Die `else` Klausel auf Schleifen

# 2. Die `dataclasses` Modul

# 3. Der Walros -Betreiber (`:=`)

# 4. `enumerate()` Für indexierte Schleifen

# 5. die `collections` Modul

# Abschluss

Von admin

Schreibe einen Kommentar Antworten abbrechen

Versäumt

Wie man Claude Code dazu bringt, seine eigenen Fehler zu verbessern

Ausgelagerte Aufmerksamkeit in LLMs für große Sprachmodelle

KI verändert EDI-Compliance-Dienste

Wer sollte dafür verantwortlich sein, AGI in humanoide Roboter einzubauen?

About

Categories

Tags

Recent Post

Wie man Claude Code dazu bringt, seine eigenen Fehler zu verbessern

Ausgelagerte Aufmerksamkeit in LLMs für große Sprachmodelle

# Einführung

# 1. Die else Klausel auf Schleifen

# 2. Die dataclasses Modul

# 3. Der Walros -Betreiber (:=)

# 4. enumerate() Für indexierte Schleifen

# 5. die collections Modul

# Abschluss

Von admin

Ähnlicher Beitrag

Schreibe einen Kommentar Antworten abbrechen

Versäumt

# 1. Die `else` Klausel auf Schleifen

# 2. Die `dataclasses` Modul

# 3. Der Walros -Betreiber (`:=`)

# 4. `enumerate()` Für indexierte Schleifen

# 5. die `collections` Modul