7 alltägliche Verteilungen einfach erklärt

# Die Handlung verdichtet sich

Sie haben wahrscheinlich schon einmal jemanden sagen hören: „Das ist eine Normalverteilung“, als wäre es ein Zauberspruch, der alles erklärt. Die Wahrheit ist, dass es sich bei Verteilungen lediglich um Geschichten darüber handelt, wie sich Zahlen im wirklichen Leben darstellen. Manche Geschichten sind glatte Kurven. Einige sind klumpig. Bei einigen handelt es sich im Grunde um einen Münzwurf mit besserem Branding.

Dieser Artikel ist eine kurze, alltägliche Tour durch sieben Distributionen, die Sie tatsächlich erkennen werden, wenn Sie wissen, wonach Sie suchen müssen. Keine schwere Mathematik. Kein Gatekeeping. Nur die Stimmung von: „Ohhh, deshalb verhalten sich diese Zahlen so.“ Sobald Sie diese Muster erkennen, fühlen sich Statistiken nicht mehr wie ein Schulfach an, sondern wie ein Cheat-Code zur Interpretation der Welt.

# 1. Normalverteilung

Die Kurve „Die meisten Dinge gruppieren sich in der Mitte“.

Die Normalverteilung ist die klassische Glockenkurve. Es wird angezeigt, wenn ein Wert vorliegt ist geprägt von vielen kleinen, unabhängigen Einflüssen die es nach oben oder unten bewegen. Stellen Sie es sich wie ein Gruppenprojekt vor, bei dem jeder einen kleinen Beitrag leistet und das Endergebnis meistens irgendwo im Durchschnitt liegt.

Alltagsbeispiele:

Körpergrößen (innerhalb eines bestimmten Alters und einer bestimmten Bevölkerungsgruppe), kleine Messfehler, Testergebnisse in großen Gruppen und „Wie lange brauche ich, um eine E-Mail zu beantworten“, wenn Ihr Tag weitgehend stabil verläuft.

Was es regular erscheinen lässt, ist die Symmetrie. Es gibt eine Mitte, in der die meisten Werte leben, und je weiter man sich von dieser Mitte entfernt, desto seltener werden die Dinge. Wenn Leute sagen „zwei Standardabweichungen entfernt“, meinen sie im Grunde „das ist ziemlich ungewöhnlich für diese Glockenkurve“.

# 2. Gleichmäßige Verteilung

Das Muster „Alles ist gleich wahrscheinlich“.

Einheitlich ist die Distribution, die keine Favoriten spielt. Jedes Ergebnis in einem Bereich hat die gleiche Probability, angezeigt zu werden.

Perfekte Beispiele sind normalerweise von Menschenhand geschaffen:

Wirf einen fairen Würfel, wähle eine zufällige Karte aus einem intestine gemischten Stapel, erzeuge eine Zufallszahl zwischen 0 und 1 oder drehe eines dieser Gewinnräder mit gleichen Würfeln.

Im wirklichen Leben wahre Einheitlichkeit ist selten, weil die Welt Vorurteile hat. Dennoch ist es als Mannequin unglaublich hilfreich. Wenn Sie Zufälligkeiten simulieren oder eine Grundannahme erstellen, ist „Uniform“ die saubere „Startpunkt“-Verteilung.

Außerdem gibt es Uniform in zwei Geschmacksrichtungen:

  • Diskrete Uniform (ein Würfelwurf mit 1–6)
  • Kontinuierlich gleichmäßig (jeder Wert zwischen 0 und 1)

# 3. Binomialverteilung

Die Frage „Wie viele Erfolge?“ Schalter

Binomial wird verwendet, wenn Sie Folgendes haben:

  1. Eine feste Anzahl von Versuchen
  2. Jeder Versuch ist ein Ja/Nein-Ergebnis
  3. Die Wahrscheinlichkeit bleibt jedes Mal gleich

Es ist die Verteilung, wie viele Erfolge Sie erzielen.

Alltagsbeispiele:

Wie viele Personen öffnen Ihre E-Mail von 100 Empfängern, wie viele Schüsse machen Sie aus 20 Freiwürfen, Wie oft tragen Sie persönliche Schutzausrüstung (PSA)? auf einer Baustelle.

Die Binomialverteilung ist im Grunde eine strukturierte Artwork zu sagen: „Welche Zählungen sind bei gegebenen N Versuchen und der Wahrscheinlichkeit p am wahrscheinlichsten?“

Es ist auch die Verteilung, die vielen Überlegungen zur „Conversion-Charge“ zugrunde liegt. Wenn jemand sagt: „Unsere Anmeldequote liegt bei 8 %,“ steht Binomial nonetheless hinter ihm und rechnet nach welche Abweichungen regular und welche verdächtig sind.

# 4. Poisson-Verteilung

Die Frage „Wie viele Ereignisse in einem Zeitfenster?“ Tracker

Poisson ist die Verteilung, die Sie erreichen, wenn Sie Ereignisse zählen, die zufällig über Zeit oder Raum auftreten. vor allem, wenn sie relativ selten und unabhängig sind.

Alltagsbeispiele:

Anzahl der Kundensupport-Tickets professional Stunde, Tippfehler professional Seite in einem langen Dokument, Autos, die einen Kontrollpunkt in 5 Minuten passieren, Web site-Anmeldungen an einem Tag (wenn der Verkehr stabil ist), Anrufe, die bei einem kleinen Unternehmen eingehen.

Poisson hat eine ganz besondere Atmosphäre: Es geht darum, in einem Fenster zu zählen. Nicht „ist es passiert“, sondern „wie viele sind passiert.“

Es ist auch eine der ersten Distributionen, die die Leute fragen lässt: „Warten Sie, Statistiken können das tatsächlich modellieren?“ Weil es überraschend gute Arbeit leistet Vorhersage der chaotischen Zufälligkeit realer Ereigniszahlen.

# 5. Exponentielle Verteilung

Das Modell „Warten bis zum nächsten Ding“.

Wenn Poisson zählt, wie viele Ereignisse in einem Fenster passieren, wird es exponentiell umgedreht und fragt: „Wie lange dauert es bis zum nächsten Occasion?“

Einige Beispiele sind:

Wie lange dauert es, bis das nächste Assist-Ticket eintrifft, Zeit zwischen den Ankünften in einer Warteschlange, wie lange, bis der nächste Kunde ein ruhiges Geschäft betritt, Zeit zwischen zufälligen Systemausfällen in einigen vereinfachten Zuverlässigkeitskonfigurationen.

Menschlich ausgedrückt: Wenn Ereignisse wirklich zufällig und mit konstanter Geschwindigkeit ablaufen, führt eine Wartezeit von bereits 10 Minuten nicht dazu, dass das nächste Ereignis „fälliger“ wird. Das kann sich emotional seltsam anfühlen, weil Menschen Muster lieben, aber exponentiell ist immer noch eine nützliche Methode, um zeitliche Intervalle auf der Grundlage historischer Daten zu modellieren, wenn der zugrunde liegende Prozess annähernd gedächtnislos ist.

# 6. Lognormalverteilung

Der „Proper-Skewed, Lengthy Tail“-Realitätscheck

Lognormal wird angezeigt wenn eine Variable durch Multiplikation von Faktoren entsteht anstatt sie hinzuzufügen. Durch diese Multiplikation entsteht eine Verteilung, bei der die meisten Werte klein oder mittelgroß sind, einige jedoch extrem groß werden.

Einige Orte, an denen es angewendet wird, sind:

Einkommen, Immobilienpreise in vielen Märkten, Zeit bis zum Abschluss eines Projekts, Dateigrößen, Web site-Sitzungsdauer und die Reichweite von Social-Media-Beiträgen.

Aufgrund dieser Verteilung kann „durchschnittlich“ irreführend sein. Bei lognormalen Daten können einige wenige große Werte den Mittelwert nach oben ziehen, selbst wenn die meisten Werte viel niedriger gruppiert sind. Aus diesem Grund erzählt der Median in diesen Zusammenhängen oft eine ehrlichere Geschichte.

# 7. Potenzgesetzverteilung

Das Muster „Ein paar Riesen, jede Menge Kleinigkeiten“.

Potenzgesetze sind die excessive Model des langwierigen Verhaltens. Sie tauchen auf, wenn große Ergebnisse selten sind, aber nicht so selten, wie man es erwarten würde, wenn die Welt regular wäre. Der Schwanz bleibt schwer.

Sie können es in Aktion sehen mit:

Stadtgrößen, Follower in sozialen Medien, Web site-Verkehr nach Seite, Verkäufe nach Produkt, Reichtum in einigen vereinfachten Modellen und wie oft bestimmte Wörter in der Sprache vorkommen.

Die Idee ist einfach: Eine kleine Anzahl von Dingen dominiert die Gesamtsumme, und ihre Wirkung ist deutlich größer als die der meisten Einheiten in einem einzelnen Bereich. Dies spiegelt sich auch darin wider, wie Materie im Universum dazu neigt, sich anzuhäufen – wenn wir die Gravitationsdynamik, die dunkle Materie und die kosmische Enlargement außer Acht lassen –, was einer der Gründe dafür ist, dass es im Weltraum riesige Hohlräume gibt und nicht jede Area gleichmäßig mit kleinen Galaxien gefüllt ist.

# Zusammenfassung

Das Schöne daran ist: Sie müssen sich keine Formeln merken, um Verteilungen intestine nutzen zu können. Sie müssen nur die Geschichte erkennen, die die Daten erzählen.

Beginnen Sie damit, Muster wie dieses zu kennzeichnen, und Ihre Instinct wird schnell schärfer. Statistiken werden zu etwas, das eher der „Mustererkennung mit Belegen“ ähnelt.

Sie sehen sich alltägliche Zahlen an, vom Posteingangsverhalten bis hin zu Verkehrsspitzen, und Sie erhalten ein besseres Gespür dafür, was regular, was zufällig und was tatsächlich eine Untersuchung wert ist.

Nahla Davies ist Softwareentwickler und technischer Autor. Bevor sie sich hauptberuflich dem technischen Schreiben widmete, schaffte sie es – neben anderen faszinierenden Dingen –, als leitende Programmiererin bei einer Inc. 5.000-Organisation für experimentelles Branding zu arbeiten, zu deren Kunden Samsung, Time Warner, Netflix und Sony gehören.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert