Daten beschreiben: Eine Einführung in die StatologieDaten beschreiben: Eine Einführung in die Statologie
Bild vom Autor | Midjourney & Canva

Die Schwesterseite von KDnuggets, Statologiebietet eine große Auswahl an verfügbaren, von Experten verfassten Statistikinhalten, die sich über ein paar Jahre angesammelt haben. Wir haben uns entschieden, unsere Leser auf diese großartige Ressource für Statistik-, Mathematik-, Datenwissenschafts- und Programmierinhalte aufmerksam zu machen, indem wir einige der fantastischen Tutorials organisieren und mit der KDnuggets-Group teilen.

Statistik zu lernen kann schwierig sein. Es kann frustrierend sein. Und vor allem kann es verwirrend sein. Deshalb Statologie ist hier, um zu helfen.

Diese Sammlung von Tutorials befasst sich mit dem immer wichtiger werdenden Thema der Datenbeschreibung. Wenn wir versuchen, unsere Daten zu verstehen, ist es wichtig, sie auf bestimmte Weise beschreiben zu können. Diese Beschreibungstools sind auch nützlich, um zusammenfassende Aspekte unserer Daten mit anderen zu teilen. Die Beherrschung der folgenden gängigen Datenbeschreibungsmethoden ist Ihr Schlüssel zum besseren Verständnis Ihrer Daten und zum besseren Verständnis des restlichen Inhalts von Statology.

Maße der zentralen Tendenz: Definition und Beispiele

Ein Maß für die zentrale Tendenz ist ein einzelner Wert, der den Mittelpunkt eines Datensatzes darstellt. Dieser Wert kann auch als „zentrale Lage“ eines Datensatzes bezeichnet werden.

In der Statistik gibt es drei gängige Maße für die zentrale Tendenz:

  • Der Mittelwert
  • Der Median
  • Der Modus

Jede dieser Maßnahmen ermittelt den zentralen Standort eines Datensatzes mithilfe unterschiedlicher Methoden. Je nach Artwork der zu analysierenden Daten ist eine dieser drei Maßnahmen möglicherweise besser geeignet als die beiden anderen.

Streuungsmaße: Definition und Beispiele

Bei der Analyse eines Datensatzes sind uns häufig zwei Dinge wichtig:

  1. Wo sich der „Mitte“-Wert befindet. Wir messen die „Mitte“ häufig mithilfe des Mittelwerts und des Medians.
  2. Wie „verstreut“ die Werte sind. Wir messen die „Verstreuung“ anhand von Spannweite, Interquartilsabstand, Varianz und Standardabweichung.

SOCS: Ein hilfreiches Akronym zur Beschreibung von Verteilungen

In der Statistik sind wir oft daran interessiert, zu verstehen, wie ein Datensatz verteilt ist. Insbesondere gibt es vier Dinge, die bei einer Verteilung hilfreich sind:

1. Type
Ist die Verteilung symmetrisch oder einseitig verzerrt?
Ist die Verteilung unimodal (ein Peak) oder bimodal (zwei Peaks)?

2. Ausreißer
Sind in der Verteilung Ausreißer vorhanden?

3. Mitte
Was sind Mittelwert, Median und Modus der Verteilung?

4. Verbreitung
Was sind Spannweite, Interquartilsabstand, Standardabweichung und Varianz der Verteilung?

Weitere Inhalte dieser Artwork finden Sie weiterhin bei Statology. Abonnieren Sie den wöchentlichen E-newsletter, um nichts zu verpassen.

Matthias Mayo (@mattmayo13) hat einen Grasp-Abschluss in Informatik und ein Diplom in Information Mining. Als leitender Redakteur von Abonnieren und Statologieund beitragender Redakteur bei Beherrschung des maschinellen LernensMatthew möchte komplexe Konzepte der Datenwissenschaft zugänglich machen. Seine beruflichen Interessen umfassen die Verarbeitung natürlicher Sprache, Sprachmodelle, Algorithmen für maschinelles Lernen und die Erforschung neuer KI. Sein Ziel ist es, das Wissen in der Datenwissenschaftsgemeinschaft zu demokratisieren. Matthew programmiert, seit er sechs Jahre alt ist.



Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert