Der Einfachheit halber untersuchen wir das Simpson-Paradoxon und konzentrieren uns dabei auf zwei Kohorten, männliche und weibliche Erwachsene.
Bei der Untersuchung dieser Daten können wir drei Aussagen zu drei interessanten Variablen treffen:
- Das Geschlecht ist eine unabhängige Variable (es „hört“ nicht auf“ die anderen beiden)
- Die Behandlung hängt vom Geschlecht ab (wie wir sehen können, ist in diesem Zusammenhang die verabreichte Dosis vom Geschlecht abhängig – Frauen wurde aus irgendeinem Grund eine höhere Dosis verabreicht.)
- Das Ergebnis hängt sowohl vom Geschlecht als auch von der Behandlung ab
Demnach können wir den Kausalgraphen wie folgt zeichnen
Beachten Sie, wie jeder Pfeil dazu beiträgt, die obigen Aussagen zu vermitteln. Ebenso wichtig ist, dass das Fehlen eines auf das Geschlecht zeigenden Pfeils vermittelt, dass es sich um eine unabhängige Variable handelt.
Wir stellen auch fest, dass die Pfeile, die vom Geschlecht auf die Behandlung und das Ergebnis zeigen, als gemeinsame Ursache zwischen ihnen.
Das Wesen des Simpson-Paradoxons besteht darin, dass das Ergebnis zwar wie erwartet durch Änderungen in der Behandlung beeinflusst wird, es aber auch eine Hintertürpfad Informationsfluss über Gender.
Die Lösung dieses Paradoxes liegt, wie Sie vielleicht bereits erraten haben, in der gemeinsamen Ursache. Das Geschlecht ist eine Störvariable, die kontrolliert.
Die Kontrolle einer Variablen bedeutet im Sinne eines Kausaldiagramms, die Beziehung zwischen Geschlecht und Behandlung zu eliminieren.
Dies kann auf zwei Arten erfolgen:
- Vor der Datenerfassung: Einrichten einer Randomisierte Kontrollstudie (RCT), bei der die Teilnehmer unabhängig von ihrem Geschlecht eine Dosis erhalten.
- Nach der Datenerfassung: Da in diesem erfundenen Szenario die Daten bereits erfasst wurden, müssen wir uns mit dem befassen, was als Beobachtungsdaten.
Sowohl vor als auch nach der Datenerfassung kann die Beseitigung der Behandlungsabhängigkeit des Geschlechts (d. h. die Kontrolle des Geschlechts) erfolgen, indem die Grafik so geändert wird, dass der Pfeil zwischen ihnen wie folgt entfernt wird:
Das Anwenden dieser „grafischen Operation“ bedeutet, dass die letzten beiden Anweisungen geändert werden müssen (der Einfachheit halber schreibe ich alle drei):
- Das Geschlecht ist eine unabhängige Variable
- Die Behandlung ist eine unabhängige Variable
- Das Ergebnis hängt vom Geschlecht und der Behandlung ab (es gibt jedoch keinen Hintertürpfad)
Dadurch lässt sich der relevante Kausalzusammenhang ermitteln: Wir können die direkten Auswirkungen einer Behandlungsänderung auf das Ergebnis beurteilen.
Der Prozess der Kontrolle eines Störfaktors, additionally die Manipulation des Datengenerierungsprozesses, wird formal als Anwendung eines InterventionDas heißt, wir sind nicht länger passive Beobachter der Daten, sondern spielen eine aktive Rolle bei deren Modifizierung, um die kausalen Auswirkungen zu beurteilen.
Wie äußert sich dies in der Praxis?
Im Falle einer randomisierten kontrollierten Studie muss der Forscher sicherstellen, dass wichtige Störvariablen kontrolliert werden. Hier beschränken wir die Diskussion auf das Geschlecht (aber in realen Situationen sind auch andere Variablen wie Alter, sozialer Standing und alles andere, was für die Gesundheit related sein könnte, denkbar).
RCTs gelten in vielen experimentellen Umgebungen als Goldstandard für die Kausalanalyse, da sie Störvariablen verwenden. Allerdings hat die Methode auch viele Nachteile:
- Es kann sein teuer die Rekrutierung von Personen und kann kompliziert sein logistisch
- Der untersuchte Eingriff ist möglicherweise nicht physisch möglich oder ethisch durchzuführen (man kann zum Beispiel nicht zufällig ausgewählte Personen auffordern, zehn Jahre lang zu rauchen oder nicht)
- Künstliche Umgebung eines Labors – nicht wirklich natürlich Lebensraum der Bevölkerung
Beobachtungsdaten hingegen sind in der Industrie und in der Wissenschaft viel leichter verfügbar und daher viel billiger und könnten die tatsächlichen Gewohnheiten der einzelnen Personen besser widerspiegeln. Wie im Simpson-Diagramm dargestellt, können sie jedoch Störvariablen enthalten, die kontrolliert werden müssen.
Hier machen in den letzten Jahrzehnten in der Kausalgemeinschaft entwickelte geniale Lösungen Fortschritte. Sie im Element zu beschreiben, würde den Rahmen dieses Beitrags sprengen, aber am Ende erwähne ich kurz, wie man mehr erfahren kann.
Um dieses Simpson-Paradoxon mit den gegebenen Beobachtungsdaten zu lösen,
- Berechnet für jede Kohorte die Auswirkungen der Änderung der Behandlung auf das Ergebnis
- Berechnet einen gewichteten Durchschnittsbeitrag jeder Kohorte zur Bevölkerung.
Hier konzentrieren wir uns auf die Instinct, aber in einem zukünftigen Beitrag werden wir die Mathematik hinter dieser Lösung beschreiben.
Ich bin sicher, dass viele Analysten, genau wie ich, Simpsons Effekt irgendwann in ihren Daten bemerkt und hoffentlich korrigiert haben. Jetzt kennen Sie den Namen dieses Effekts und beginnen hoffentlich zu verstehen, wie nützlich kausale Werkzeuge sind.
Dennoch ist es OK, in diesem Stadium verwirrt zu sein 😕
Ich gebe zu, dass ich Schwierigkeiten hatte, dieses Konzept zu verstehen, und ich musste drei Wochenenden lang in Beispiele eintauchen, um es zu verinnerlichen. Das warfare für mich die Einstiegsdroge zur Kausalität. Ein Teil meines Prozesses zum Verständnis von Statistiken besteht darin, mit Daten zu spielen. Zu diesem Zweck habe ich eine interaktive Webanwendung, die in Streamlit gehostet wird den ich Simpsons Taschenrechner nenne 🧮. Ich werde in Zukunft einen separaten Beitrag dazu schreiben.
Auch wenn Sie verwirrt sind, ist die wichtigste Erkenntnis aus Simpsons Paradoxon folgende:
- Dabei kann es vorkommen, dass Traits in Untergruppen existieren, sich im Großen und Ganzen jedoch umkehren.
- Das Drawback kann möglicherweise gelöst werden, indem Störvariablen zwischen den Behandlungs- und den Ergebnisvariablen identifiziert und kontrolliert werden.
Dies wirft die Frage auf: Sollten wir einfach alle Variablen außer der Behandlung und dem Ergebnis kontrollieren? Behalten wir dies im Hinterkopf, wenn wir das Berkson-Paradoxon lösen.