: Wenn die Fähigkeiten nicht genug sind
Sie beobachten, wie Ihr Crew den Besitz dominiert, die Anzahl der Aufnahmen doppelt so hoch wiet … und trotzdem verlieren. Ist es nur Pech?
Followers beschuldigen Schiedsrichter. Die Spieler beschuldigen „Off Days“. Coach erwähnen „Schwung“. Aber was wäre, wenn wir Ihnen diese Zufälligkeit sagen – nicht Expertise oder Taktik – eine wichtige versteckte Variable bei den Sportergebnissen sein würde?
Dieser Beitrag taucht tief in ein Wie Glück den Sport beeinflusstwie wir versuchen können, die Zufälligkeit mit Daten zu quantifizieren, und wie Information Science uns hilft, die Fähigkeiten von Zufall zu trennen.
Wie immer finden Sie hier eine kurze Zusammenfassung dessen, was wir heute durchmachen werden:
- Glück im Sport definieren
- Glück messen
- Fallstudie
- Berühmte Zufälligkeit Momente
- Was wäre, wenn wir Glück entfernen könnten?
- Letzte Gedanken
Glück im Sport definieren
Dies könnte umstritten sein, da verschiedene Menschen es anders definieren und alle Interpretationen gleichermaßen akzeptabel wären. Hier ist meins: Glück im Sport geht es um Varianz Und Unsicherheit.
Mit anderen Worten könnten wir sagen, dass Glück die Varianz der Ergebnisse ist, die nicht durch Fähigkeiten erklärt werden.
Für die anderen Datenwissenschaftler ist eine andere Artwork zu sagen: Glück ist das Restrauschen, das unsere Modelle nicht angemessen erklären oder angemessen vorhersagen können (das Modell könnte beispielsweise ein Fußballspiel sein). Hier sind einige Beispiele:
- Ein Schuss mit leerem Tor, der den Pfosten schlug, anstatt hineinzugehen.
- Ein Tennisnetzkabel, das die Ballrichtung ändert.
- Eine kontroverse VAR -Entscheidung.
- Ein Münze -Wurf -Sieg im Cricket oder amerikanischen Fußball.
Glück ist überall, ich entdecke hier nichts Neues. Aber können wir es messen?
Glück messen
Wir könnten das Glück in vielerlei Hinsicht messen, aber wir werden drei von Fundamental zu Fortgeschrittenen besuchen.
Regressionsreste
Wir konzentrieren uns in der Regel auf die Modellierung der erwarteten Ergebnisse eines Ereignisses: HWO werden viele Tore ein Crew erzielen, was der Punktunterschied zwischen zwei NBA -Groups sein wird…
Es gibt kein perfektes Modell und es ist unrealistisch, ein 100percentiger Genehmigungsmodell anzustreben. Das wissen wir alle. Aber genau dieser Unterschied, was unser Modell von einem perfekten unterscheidet, was wir definieren können Regressionsreste.
Lassen Sie uns ein sehr einfaches Beispiel sehen: Wir möchten das Endergebnis eines Fußballspiels (Fußball) vorhersagen. Wir verwenden Metriken wie XG, Besitz %, Heimvorteil, Spielermetriken… und unser Modell sagt voraus, dass das Heimteam 3,1 Tore erzielte und die Anzeigetafel des Besuchers eine 1,2 aufweisen wird (offensichtlich müssten wir sie umrunden, weil Tore in echten Spielen Ganzzahlen sind).
Das Endergebnis beträgt jedoch 1: 0 (anstelle von 3,1-1,2 oder der abgerundeten 3-1). Dieses Rauschen, der Unterschied zwischen dem Ergebnis und unserer Vorhersage, ist das Glückskomponente Wir reden darüber.
Das Ziel wird immer darin bestehen, dass unsere Modelle diese Glückskomponente (Fehler) reduzieren, aber wir könnten es auch verwenden, um Groups durch Übertrefferformance im Vergleich zu erwarteten zu rangieren und so zu sehen, welche Groups mehr von Glück betroffen sind (basierend auf unserem Modell).
Monte Carlo -Methode
Natürlich musste MC in diesem Beitrag erscheinen. Ich habe bereits einen Beitrag, der sich tiefer in ihn ausgräbt (na ja, genauer gesagt in Markov -Kette Monte Carlo) Aber ich werde es trotzdem vorstellen.
Der Monte Carlo Methode oder Simulationen bestehen darin, wiederholt Stichprobenzahlen zu verwenden, um numerische Ergebnisse in Kind der Wahrscheinlichkeit einer Reihe von Ergebnissen des Auftretens zu erhalten.
Grundsätzlich wird es verwendet, um die möglichen Ergebnisse oder die Verteilung eines unsicheren Ereignisses zu schätzen oder zu approximieren.
Mit unserem weitermachen Sport Beispiele: Nehmen wir an, ein Basketballspieler schießt genau 75% aus der Freiwurflinie. Mit diesem Prozentsatz könnten wir 10.000 Spielzeiten simulieren, vorausgesetzt, jeder Spieler hat das gleiche Fähigkeitsniveau und generiere stochastisch.
Mit den Ergebnissen konnten wir die mit der Fähigkeit basierenden vorhergesagten Ergebnisse mit den simulierten Verteilungen vergleichen. Wenn wir sehen, dass der tatsächliche Rekord des Groups außerhalb der 95% des Simulationsbereichs liegt, dann ist das wahrscheinlich Glück (Intestine oder schlecht, je nach Extrem, in dem sie liegen).
Bayes’sche Inferenz
Bei weitem meine bevorzugte Artwork, das Glück zu messen, weil die Fähigkeit der Bayes’schen Modelle, die zugrunde liegenden Fähigkeiten von lauter Leistung zu trennen, zu trennen.
Angenommen, Sie sind in einem Fußball -Scouting -Crew und überprüfen einen sehr jungen Stürmer des besten Groups der örtlichen norwegischen Liga. Sie interessieren sich besonders für seine Zielumwandlung, denn das braucht Ihr Crew und Sie sehen, dass er in den letzten 10 Spielen 9 Tore erzielt hat. Ist er Elite? Oder Glück?
Mit einem Bayesian Prior (z. B. durchschnittliche Konversionsrate = 15%) aktualisieren wir unseren Glauben nach jedem Spiel und haben am Ende eine hintere Verteilung, die zeigt, ob seine Leistung ist nachhaltig überdurchschnittlich oder ein Zufall.
Wenn Sie sich mit dem Thema Bayesianer Inferenz einlassen möchten, habe ich einen Beitrag geschrieben, der versucht habe, die Champions League der letzten Saison mit diesen Methoden vorherzusagen: https://towardsdatascience.com/using-bayesian-modeling-to-predict-the-champions-league-8ebb069006ba/
Fallstudie
Lass uns die Hände schmutzig machen.
Das Szenario ist das nächste: Wir haben eine Spherical-Robin-Saison zwischen 6 Groups, in denen jedes Crew zweimal (zu Hause und weg) gespielt hat. Jedes Spiel erzielte für beide Groups die erwarteten Tore (XG) und die tatsächlichen Ziele wurden aus einer Poisson-Verteilung um XG abgetastet:
Heim | Weg | xg Haus | xg weg | Tore nach Hause | Ziele weg |
---|---|---|---|---|---|
Crew a | Crew b | 1.65 | 1.36 | 2 | 0 |
Crew b | Crew a | 1.87 | 1.73 | 0 | 2 |
Crew a | Crew c | 1.36 | 1.16 | 1 | 1 |
Crew c | Crew a | 1.00 | 1.59 | 0 | 1 |
Crew a | Crew d | 1.31 | 1.38 | 2 | 1 |
Schätzen wir die, wo wir im vorherigen Abschnitt abgereist sind, die wahre Fähigkeit zur Torschreibung von jedem Crew und sehen, wie sehr ihre tatsächliche Leistung davon abweist – was wir interpretieren werden Glück oder Varianz.
Wir werden ein Bayes’sche Poisson -Modell verwenden:
- Sei λₜ die latente Torquote für jedes Crew.
- Dann ist unser Prior λₜ ∼ Gamma (α, β)
- Und wir nehmen die Ziele ∼ Poisson (λₜ) an, die Überzeugungen über λₜ unter Verwendung der tatsächlichen Ziele über Spiele aktualisieren.
λₜ | Daten ∼ Gamma (α+Gesamtziele, β+Gesamtübereinstimmungen)
Genau, jetzt müssen wir unsere Werte für α und β entscheiden:
- Mein erster Glaube (ohne Daten zu betrachten) ist, dass die meisten Groups rund 2 Tore professional Spiel erzielen. Ich weiß auch, dass der Mittelwert in einer Gamma -Verteilung mithilfe des Mittelwerts berechnet wird α/β.
- Aber ich bin nicht sehr zuversichtlich, additionally möchte ich, dass die Standardabweichung relativ hoch ist, sicherlich über einem Ziel. Wiederum wird in einer Gamma -Verteilung die Standardabweichung berechnet √α/β.
Wenn wir die einfachen Gleichungen lösen, die aus diesen Argumentation hervorgehen, finden wir das α = 2 Und β = 1 sind wahrscheinlich gute vorherige Annahmen.
Wenn wir unser Modell ausführen, erhalten wir die nächsten Ergebnisse:
Crew | Spiele gespielt | Gesamtziele | Hinteres Mittelwert (λ) | Hintere std | Beobachteter Mittelwert | Glück (OBS – Put up) |
---|---|---|---|---|---|---|
Crew a | 10 | 14 | 1.45 | 0,36 | 1.40 | –0,05 |
Crew d | 10 | 13 | 1.36 | 0,35 | 1.30 | –0,06 |
Crew e | 10 | 12 | 1.27 | 0,34 | 1.20 | –0,07 |
Crew f | 10 | 10 | 1.09 | 0,31 | 1.00 | –0.09 |
Crew b | 10 | 9 | 1.00 | 0,30 | 0,90 | –0.10 |
Crew c | 10 | 9 | 1.00 | 0,30 | 0,90 | –0.10 |
Wie interpretieren wir sie?
- Alle Groups haben ihre posterioren Erwartungen leicht unterdurchschnittlich – in kurzen Saisons aufgrund von Abweichungen häufig.
- Crew b Und Crew c Hatte die größte adverse „Glück“ -Lücke: Ihr tatsächlicher Wert warfare 0,10 Tore professional Spiel niedriger als die Bayes’sche Schätzung.
- Crew a warfare seiner vorhergesagten Stärke am nächsten – das „neutralste Glück“ -Crew.
Dies warfare ein gefälschtes Beispiel mit gefälschten Daten, aber ich wette, Sie können bereits seine Kraft spüren.
Lassen Sie uns nun einige historische Zufälligkeitsmomente in der Welt des Sports activities überprüfen.
Berühmte Zufälligkeit Momente
Jeder NBA -Fan erinnert sich an die 2016 Finale. Es ist Spiel 7, Cleveland spielt bei Warriors ‚und sie sind mit 89 mit weniger als einer Minute übrig. Kyrie Irving sieht sich Stephen Curry gegenüber und trifft eine unvergessliche Kupplung. Dann gewinnen die Cavaliers das Finale.
Struggle diese Fähigkeit oder Glück? Kyrie ist ein High -Spieler und wahrscheinlich auch ein guter Schütze. Aber mit der Opposition, die er hatte, die Zeit und der Anzeigetafel Druck … wir können einfach nicht wissen, welches es warfare.
Wenn wir uns jetzt zum Fußball bewegen, konzentrieren wir uns jetzt auf die 2019 Champions League SemisLiverpool gegen Barcelona. Dieser ist persönlich verletzend. Barça gewann das erste Bein zu Hause mit 3: 0, verlor jedoch in Liverpool im Rückspiel mit 4: 0 und gab den Roten die Möglichkeit, bis zum Finale voranzukommen.
Liverpools Übererformance? Oder eine statistische Anomalie?
Ein letzter Beispiel: NFL -Münzwurf von OT gewinnt. Die gesamten Playoff -Ergebnisse werden durch ein 50/50 -einfacher Szenario entschieden, in dem die Münze (Glück) die gesamte Kraft zu entscheiden hat.
Was wäre, wenn wir Glück entfernen könnten?
Können wir Glück entfernen? Die Antwort ist ein klares Nein.
Doch warum versuchen so viele von uns? Für Fachleute ist klar: Diese Unsicherheit beeinflusst die Leistung. Je mehr Kontrolle wir über alles haben können, desto mehr können wir unsere Methoden und Strategien optimieren.
Mehr Gewissheit (weniger Glück) bedeutet mehr Geld.
Und wir tun dies zu Recht: Glück ist nicht abnehmbar, aber wir können es verringern. Deshalb erstellen wir komplexe XG -Modelle oder bauen Wettmodelle mit probabilistischer Begründung auf.
Aber Sport soll unvorhersehbar sein. Das macht sie für den Zuschauer aufregend. Die meisten würden sich kein Spiel ansehen, wenn wir das Ergebnis bereits wüssten.
Letzte Gedanken
Heute hatten wir die Gelegenheit, über die Rolle des Glücks im Sport zu sprechen, was massiv ist. Wenn man es versteht, kann es den Followers helfen, überreagiert zu werden. Es könnte aber auch helfen, Scouting und Teammanagement zu sammeln oder intelligentere Wetten- oder Fantasy -League -Entscheidungen zu informieren.
Alles in allem müssen wir wissen, dass das beste Crew nicht immer gewinnt, aber Daten können uns sagen, wie oft sie haben sollten.