Bild vom Autor | Midjourney & Canva
Die Schwesterseite von KDnuggets, Statologiebietet eine große Auswahl an verfügbaren, von Experten verfassten Statistikinhalten, die sich über ein paar Jahre angesammelt haben. Wir haben uns entschieden, unsere Leser auf diese großartige Ressource für Statistik-, Mathematik-, Datenwissenschafts- und Programmierinhalte aufmerksam zu machen, indem wir einige der fantastischen Tutorials organisieren und mit der KDnuggets-Group teilen.
Statistik zu lernen kann schwierig sein. Es kann frustrierend sein. Und vor allem kann es verwirrend sein. Deshalb Statologie ist hier, um zu helfen.
Diese neueste Sammlung von Tutorials konzentriert sich auf die Visualisierung von Daten. Keine Daten- oder Statistikanalyse ist vollständig, ohne die Daten zu visualisieren. Es gibt eine Vielzahl von Instruments, mit denen wir unsere Daten durch Visualisierung besser verstehen können, und diese Tutorials helfen Ihnen dabei. Lernen Sie diese verschiedenen Techniken kennen und lesen Sie dann weiter in den Archiven von Statology, um weitere Perlen zu finden.
Boxplots
Ein Boxplot (manchmal auch Field-and-Whisker-Plot genannt) ist ein Diagramm, das die fünfstellige Zusammenfassung eines Datensatzes zeigt.
Die fünfstellige Zusammenfassung umfasst:
- Das Minimal
- Das erste Quartil
- Der Median
- Das dritte Quartil
- Das Most
Mithilfe eines Boxplots können wir die Verteilung der Werte in einem Datensatz leicht anhand eines einfachen Diagramms visualisieren.
Stamm-Blatt-Diagramme: Definition und Beispiele
Ein Stamm-Blatt-Diagramm stellt Daten dar, indem jeder Wert in einem Datensatz in einen „Stamm“ und ein „Blatt“ aufgeteilt wird.
In diesem Tutorial wird die Erstellung und Interpretation von Stamm-Blatt-Diagrammen erläutert.
Streudiagramme
Streudiagramme werden verwendet, um die Beziehung zwischen zwei Variablen anzuzeigen.
Angenommen, wir haben den folgenden Datensatz, der das Gewicht und die Größe der Spieler einer Basketballmannschaft zeigt:
Die beiden Variablen in diesem Datensatz sind Größe und Gewicht.
Um ein Streudiagramm zu erstellen, platzieren wir die Größe entlang der x-Achse und das Gewicht entlang der y-Achse. Jeder Spieler wird dann als Punkt im Streudiagramm dargestellt:
Streudiagramme helfen uns, Beziehungen zwischen zwei Variablen zu erkennen. In diesem Fall sehen wir, dass Größe und Gewicht eine constructive Beziehung haben. Mit zunehmender Größe nimmt tendenziell auch das Gewicht zu.
Kin Häufigkeitshistogramm: Definition + Beispiel
In Statistiken stößt man häufig auf Tabellen, die Informationen zu Häufigkeiten enthalten. Häufigkeiten geben lediglich an, wie oft ein bestimmtes Ereignis aufgetreten ist.
Beispielsweise zeigt die folgende Tabelle, wie viele Artikel ein bestimmtes Geschäft in einer Woche verkauft hat, basierend auf dem Preis des Artikels:
Diese Artwork von Tabelle wird als Häufigkeitstabelle bezeichnet. In einer Spalte steht die „Klasse“ und in der anderen Spalte die Häufigkeit der Klasse.
Wir verwenden häufig Häufigkeitshistogramme, um die Werte in einer Häufigkeitstabelle zu visualisieren, da es normalerweise einfacher ist, Daten zu verstehen, wenn wir die Zahlen visualisieren können.
Was sind Dichtekurven? (Erklärung und Beispiele)
Eine Dichtekurve ist eine Kurve in einem Diagramm, die die Verteilung von Werten in einem Datensatz darstellt. Sie ist aus drei Gründen nützlich:
- Eine Dichtekurve gibt uns eine gute Vorstellung von der „Type“ einer Verteilung. Unter anderem gibt sie Aufschluss darüber, ob eine Verteilung einen oder mehrere „Spitzen“ mit häufig auftretenden Werten aufweist und ob die Verteilung nach hyperlinks oder rechts verzerrt ist.
- Mithilfe einer Dichtekurve können wir visuell erkennen, wo sich Mittelwert und Median einer Verteilung befinden.
- Eine Dichtekurve lässt uns visuell erkennen, welcher Prozentsatz der Beobachtungen in einem Datensatz zwischen verschiedenen Werten liegt
Weitere Inhalte dieser Artwork finden Sie weiterhin bei Statology. Abonnieren Sie den wöchentlichen E-newsletter, um nichts zu verpassen.
Matthias Mayo (@mattmayo13) hat einen Grasp-Abschluss in Informatik und ein Diplom in Knowledge Mining. Als leitender Redakteur von Abonnieren und Statologieund beitragender Redakteur bei Beherrschung des maschinellen LernensMatthew möchte komplexe Konzepte der Datenwissenschaft zugänglich machen. Seine beruflichen Interessen umfassen die Verarbeitung natürlicher Sprache, Sprachmodelle, Algorithmen für maschinelles Lernen und die Erforschung neuer KI. Sein Ziel ist es, das Wissen in der Datenwissenschaftsgemeinschaft zu demokratisieren. Matthew programmiert, seit er sechs Jahre alt ist.