Vor ein paar Wochen tauchte diese Frage auf das Sydney Morning Herald Good Weekend-Quiz:
Was ist Malmsey: ein milder Kater, ein Hexenfluch oder ein Likörwein?
Angenommen, wir haben keine Ahnung von der Antwort: Gibt es in dieser Scenario eine Möglichkeit, eine fundierte Vermutung anzustellen? Ich denke, das gibt es.
Denken Sie ruhig darüber nach, bevor Sie weiterlesen.
Wenn man sich dieses Wort ansieht, es fühlt als ob es eine dieser Optionen bedeuten könnte. Die Mehrfachauswahl ist natürlich so aufgebaut, dass sie sich so anfühlt.
Aber wir können hier einen rationalen Ansatz verfolgen, der darin besteht, zu erkennen, dass jede dieser Optionen unterschiedlich ist Basistarife. Das heißt, wenn wir für einen Second vergessen, was ein Malmsey ist und was nicht, können wir spüren, dass es wahrscheinlich nicht so viele Namen für Kater gibt wie für Hexenflüche, und dass es bestimmt noch mehr Namen dafür geben wird all die verschiedenen Likörweine da draußen.
Um dies weiter zu quantifizieren:
- Wie viele Wörter gibt es für einen leichten Kater? Vielleicht 1?
- Wie viele Wörter wird es wohl für Hexenflüche geben? Ich bin kein Experte, aber mir fallen schon einige Synonyme dazu ein vielleicht 10?
- Wie viele Wörter gibt es wahrscheinlich für Likörweine? Auch hier bin ich kein Experte, aber ich kann einige nennen (Portwein, Sherry …) und es wird wahrscheinlich noch viel mehr geben vielleicht 100?
Da es additionally keine anderen Hinweise gibt, die die richtige Antwort liefern könnten, wäre Likörwein eine wohlbegründete Vermutung. Basierend auf meinen obigen Schätzungen auf der Rückseite des Umschlags wäre Likörwein mit 100-facher Wahrscheinlichkeit korrekt wie der milde Kater und 10-fach so wahrscheinlich wie der Fluch der Hexe.
Selbst wenn ich mit diesen Mengen daneben liege, bin ich zumindest in dieser Größenordnung der Grundpreise zuversichtlich und werde deshalb Likörwein als meine beste Vermutung festlegen.
Die Argumentation magazine trivial erscheinen, aber das Vernachlässigen von Basiszinssätzen bei derartigen Urteilen ist eine der großen menschlichen Vorurteile, über die Kahneman und Tversky und viele andere seitdem gesprochen haben. Sobald wir es sehen, sehen wir es überall.
Betrachten Sie die folgende Denksportaufgabe von Rolf Dobelli Die Kunst, klar zu denken:
Mark ist ein dünner Mann aus Deutschland mit Brille, der gerne Mozart hört. Was ist wahrscheinlicher? Dass Mark A) LKW-Fahrer oder (B) Literaturprofessor in Frankfurt ist?
Aufgrund des Stereotyps, das wir mit der Beschreibung verbinden, ist die Versuchung groß, sich für B zu entscheiden, aber die vernünftigere Vermutung wäre A, weil es in Deutschland viel, viel mehr Lkw-Fahrer gibt als in Frankfurt Literaturprofessoren.
Das Rätsel ist eine Abwandlung des Bibliothekar-Bauern-Charakterporträts von Kahneman und Tversky (siehe Urteil unter Unsicherheit) das auch den Rahmen für das Große bildet 3B1B-Erklärer zum Bayes-Theorem wobei dieser Denkprozess auf die bedingten und marginalen Wahrscheinlichkeiten (Basisraten) der Bayes-Formel abgebildet wird.
Der Bayes’sche Rahmen hilft uns, zwei häufige Fallen im probabilistischen Denken klarer zu erkennen. In der Sprache von Kahneman und Tversky könnten wir sagen, dass es ein Werkzeug für das System-II-Denken („langsam“) darstellt, um unser impulsives und fehleranfälliges System-I-Denken („schnell“) außer Kraft zu setzen.
Die erste Erkenntnis ist, dass die bedingte Wahrscheinlichkeit einer Sache bei einer anderen gegeben ist, p(A|B), nicht dasselbe ist wie die Wahrscheinlichkeit der umgekehrten Sache, p(B|A), obwohl wir im täglichen Leben oft versucht sind, Urteile zu fällen als ob sie gleich wären.
Im Dobelli-Beispiel ist dies der Unterschied von:
- P(👓|🧑🏫) – Wahrscheinlichkeit, dass 👓) Mark ein dünner Mann aus Deutschland mit Brille ist, der gerne Mozart hört angesichts dessen 🧑🏫) Mark ist Literaturprofessor in Frankfurt
- P(🧑🏫|👓) – Wahrscheinlichkeit, dass 🧑🏫) Mark Literaturprofessor in Frankfurt ist angesichts dessen 👓) Mark ist ein dünner Mann aus Deutschland mit Brille, der gerne Mozart hört
Glaubt man Stereotypen, erscheint das obige P(👓|🧑🏫) recht wahrscheinlich, wohingegen p(🧑🏫|👓) unwahrscheinlich ist, da wir davon ausgehen würden, dass es in Deutschland noch viele andere Menschen gibt, auf die die gleiche Beschreibung zutrifft sind keine Literaturprofessoren.
Die zweite Erkenntnis besteht darin, dass diese beiden bedingten Wahrscheinlichkeiten miteinander in Beziehung stehen, sodass uns die Kenntnis der einen zur anderen führen kann. Was wir brauchen, um die beiden zu verbinden, sind die einzelnen Basiszinssätze von A und B, und der Skalierungsfaktor ist tatsächlich ein einfaches Verhältnis der beiden Basiszinssätze wie folgt:
Dies ist die Bayes-Formel.
Wie hilft uns das?
Abgesehen von Lehrbüchern und Spielzeugbeispielen erwarten wir nicht, dass uns alle Zahlen zur Verfügung stehen, die wir in die Formel von Bayes einbauen können, aber dennoch bietet sie einen nützlichen Rahmen für die Organisation unserer bekannten und unbekannten Zahlen und für die Formalisierung einer begründeten Vermutung.
Für das Dobelli-Szenario könnten wir beispielsweise mit den folgenden Schätzungen beginnen:
- % der Professoren, die eine Brille tragen und der Beschreibung entsprechen: 25 % (1 von 4)
- % der Menschen in Deutschland, die in Frankfurt Literaturprofessoren sind: 0,0002 % (1 von 500.000)
- % der LKW-Fahrer, die eine Brille tragen und der Beschreibung entsprechen: 0,2 % (1 von 500)
- % der Menschen in Deutschland, die Lkw-Fahrer sind: 0,1 % (1 von 1.000)
- % der Gesamtbevölkerung, die eine Brille trägt und der Beschreibung entspricht: 0,2 % (1 von 500)
- Bevölkerung Deutschlands: ~85m
Alle diese Parameter sind meine Schätzungen basierend auf meiner persönlichen Weltanschauung. Lediglich die Bevölkerung Deutschlands ist ein Datenpunkt, den ich nachschlagen könnte, aber diese werden mir helfen, rational über die Dobelli-Frage nachzudenken.
Der nächste Schritt besteht darin, diese in Kontingenztabellen zu fassen, die die relative Häufigkeit jedes auftretenden Ereignisses sowohl zusammen als auch einzeln zeigen. Indem wir mit der Gesamtbevölkerung beginnen und unsere prozentualen Schätzungen anwenden, können wir damit beginnen, zwei Tabellen für die Frankfurter Professoren und LKW-Fahrer auszufüllen, die jeweils der Beschreibung entsprechen (für diesen Abschnitt können Sie gerne auch mitmachen). diese Tabelle):
Die vier weißen Kästchen stellen die vier Arten dar, wie die beiden Ereignisse auftreten können:
- A und B
- A, aber nicht B
- B, aber nicht A
- Weder A noch B
Die grau schattierten Ränder stellen die Gesamthäufigkeiten jedes Ereignisses dar, unabhängig von der Überlappung, die lediglich die Summe der Zeilen und Spalten ist. Aus diesen Margen ergeben sich die Basiszinssätze, weshalb sie oft auch als „Margins“ bezeichnet werden Grenzwahrscheinlichkeiten.
Als nächstes können wir die Lücken wie bei einem Sudoku ausfüllen, indem wir alle Zeilen und Spalten addieren:
Und jetzt, da unsere Kontingenztabellen vollständig sind, haben wir ein vollständiges Bild unserer Schätzungen rund um die Basiszinssätze und der Wahrscheinlichkeiten, dass die Profile mit den Beschreibungen übereinstimmen. Alle bedingten und marginalen Wahrscheinlichkeiten aus der Bayes-Formel sind nun hier dargestellt und können wie folgt berechnet werden:
Zurück zur ursprünglichen Frage: Die Wahrscheinlichkeit, die uns interessiert, ist die dritte in der obigen Liste: die Wahrscheinlichkeit, dass es sich aufgrund der Beschreibung um einen Professor/Lkw-Fahrer handelt.
Und basierend auf unseren Parameterschätzungen sehen wir, dass die Wahrscheinlichkeit, dass LKW-Fahrer die Anforderungen erfüllen, um das Vierfache höher ist als bei unseren Professoren (0,001 / 0,00025). Dies steht im Gegensatz zur umgekehrten Bedingung, bei der die Beschreibung um den Faktor x125 (0,25 / 0,002) eher auf den Professor als auf den LKW-Fahrer passt!
Kommen wir nun zurück zu dem Punkt, an dem wir mit dem Malmsey-Beispiel begonnen haben. Hoffentlich setzt sich die Instinct durch und die Rolle der Basiszinssätze bei der Schätzung ist klar.
Im Hinblick auf die Abbildung des Denkens auf die Bayes-Formel würde der Denkprozess im Wesentlichen darin bestehen, unsere Glaubensgrade an die folgenden drei Szenarien zu vergleichen:
- Wahrscheinlichkeit (A die Antwort ist leichter Kater | B das Wort ist Malvasier)
- Wahrscheinlichkeit (A die Antwort ist Hexenfluch | B das Wort ist Malvasier)
- Wahrscheinlichkeit (A die Antwort ist Likörwein | B das Wort ist Malvasier)
Da wir in diesem Fall keine Ahnung haben, was malmsey bedeuten könnte (das wäre anders, wenn wir zum Beispiel etymologische Vermutungen hätten), könnten wir sagen, dass B ist nicht informativ Um additionally irgendeine begründete Vermutung anzustellen, müssen wir uns lediglich an den Wahrscheinlichkeiten von A orientieren. Anhand der Bayes-Formel können wir sehen, dass die Wahrscheinlichkeit, an der wir interessiert sind, mit der Basisrate von A skaliert:
Der Vollständigkeit halber: Hier So könnte es aussehen, unsere Glaubensgrade im Stil der Kontingenztafeln aus dem Dobelli-Beispiel tabellarisch aufzulisten. Da B nicht informativ ist, geben wir eine Wahrscheinlichkeit von 50:50 dafür, dass das Wort Malmsey mit einem anderen Wort oder Konzept übereinstimmt. Das ist übertrieben und kaum notwendig, wenn wir erst einmal erkennen, dass wir unseren Glauben an die Antwort einfach mit den Basisraten skalieren können, aber es zeigt, dass das Bayes’sche Rahmenwerk für dieses abstraktere Drawback immer noch zusammenpasst.
Ich vorher schrieb über das Thema des Irrtums des Staatsanwalts (eine Type der Vernachlässigung des Basiszinssatzes), der weitere Beispiele zur Vernachlässigung des Basiszinssatzes und deren Auswirkungen für Analytiker liefert.
An dieser Stelle lohnt es sich noch einmal, den Zusammenhang herzustellen: Bei herkömmlichen A/B-Testmethoden verwechseln Menschen häufig die Wahrscheinlichkeit, die Testergebnisse zu sehen, mit der Wahrscheinlichkeit, dass die Hypothese selbst wahr ist. Über p-Werte und ihre Fallstricke ist viel geschrieben worden (siehe z. B. Ein schmutziges Dutzend: Zwölf P-Wert-Missverständnisse), aber auch hier hilft die Bayes’sche Denkweise, unsere Argumentation zu verdeutlichen, und es hilft, wachsam gegenüber dem Konzept der Vernachlässigung des Basiszinssatzes zu sein, was in diesem Fall unser Vertrauen darauf ist, dass die Hypothese überhaupt wahr ist (unsere Prioren).
Ich ermutige Sie zum Lesen der Artikel um eine bessere Instinct dafür zu bekommen.
- Behandelte Konzepte: Vernachlässigung des Basiszinssatzes, bedingte vs. marginale Wahrscheinlichkeiten, Bayes-Formel, Kontingenztabellen.
- Achten Sie darauf, p(A|B) bei der alltäglichen Wahrscheinlichkeitsbeurteilung nicht mit p(B|A) gleichzusetzen.
- Berücksichtigen Sie die Basiszinssätze, wenn Sie beurteilen, ob eine neue Beobachtung Ihre Hypothese bestätigt.
- TIL: Malmsey ist ein Likörwein von der Insel Madeira. In Shakespeares Richard III ertrinkt George Plantagenet, der Herzog von Clarence, in einem Bottich Malmsey.