Unsere Forschungsfrage lautet: Welchen Einfluss hat die Behandlung D auf das Ergebnis y? DiD ermöglicht uns abzuschätzen, was mit der Behandlungsgruppe passiert wäre, wenn die Intervention nicht stattgefunden hätte. Dieses kontrafaktische Szenario ist wichtig, um die wahre Wirkung der Behandlung zu verstehen. Jeder Job oder jede Arbeit dreht sich um die Beantwortung ähnlicher Fragen wie der Wirkung von Interventionen, politischen Veränderungen oder Behandlungen in verschiedenen Bereichen. In der Wirtschaft beurteilt es die Auswirkungen von Steuersenkungen auf das Wirtschaftswachstum, während es in der öffentlichen Politik die Auswirkungen neuer Verkehrsgesetze auf die Unfallrate bewertet. Im Advertising and marketing analysiert DiD den Einfluss von Werbekampagnen auf den Umsatz.
Im obigen Diagramm haben wir beispielsweise Bevölkerungsdaten in unserer Stichprobe. Wir werden die Daten in Behandlungs- und Kontrollgruppen unterteilen, wobei die Behandlung die Intervention erhielt. Wir können für beide Gruppen Submit- und Pre-Variablen beobachten.
Einfacher Schätzer für Behandlungs-/Kontrollunterschiede
Mit dieser Gleichung lässt sich die Wirkung der Behandlung berechnen, indem die Ergebnisänderungen im Zeitverlauf zwischen der Behandlungs- und der Kontrollgruppe verglichen werden.
Ich habe ein gefälschtes Beispiel erstellt, um die Mathematik leichter verständlich zu machen.
Der DiD-Koeffizient wäre 9 mithilfe der oben genannten Formel.
DiD Estimator: Berechnung mittels Regression
DiD hilft bei der Kontrolle zeitinvarianter Merkmale, die die Schätzung der Behandlungseffekte verzerren könnten. Dies bedeutet, dass der Einfluss von Variablen, die im Laufe der Zeit konstant sind (z. B. geografischer Standort, Geschlecht, ethnische Zugehörigkeit, angeborene Fähigkeiten usw.), eliminiert wird. Dies ist möglich, weil diese Merkmale sowohl die Zeit vor der Behandlung als auch die Zeit nach der Behandlung für jede Gruppe gleichermaßen beeinflussen.
Die Kerngleichung für ein grundlegendes DiD-Modell lautet:
Wo:
- y ist die Ergebnisvariable für das Individuum 𝑖 in der Gruppe J zur Zeit 𝑡.
- 𝐴𝑓𝑡𝑒𝑟 ist eine Dummy-Variable, die gleich 1 ist, wenn die Beobachtung in der Nachbehandlungsphase liegt.
- 𝑇𝑟𝑒𝑎𝑡𝑚𝑒𝑛𝑡 ist eine Dummy-Variable, die gleich 1 ist, wenn die Beobachtung zur Behandlungsgruppe gehört.
- 𝐴𝑓𝑡𝑒𝑟 × 𝑇𝑟𝑒𝑎𝑡𝑚𝑒𝑛𝑡 ist der Interaktionsterm mit dem Koeffizienten β Erfassung der DiD-Schätzung.
Der Koeffizient für den Interaktionsterm ist der DiD-Schätzer in y. Die Regression ist bei Forschern beliebter, da sie hilft, Standardfehler anzugeben und zusätzliche Variablen zu kontrollieren.
Dies ist eine der wichtigsten Annahmen von DiD. Sie basiert auf der Annahme, dass der Unterschied zwischen der Behandlungs- und der Kontrollgruppe ohne Behandlung im Laufe der Zeit konstant bliebe. Mit anderen Worten: Ohne Behandlung β (DiD-Schätzung) = 0.
Formal bedeutet dies:
Eine andere Möglichkeit, darüber nachzudenken, ist, dass der Unterschied zwischen den beiden Gruppen ohne die Politikänderung im Laufe der Zeit gleich geblieben wäre. Wenn die Traits vor der Behandlung nicht parallel verlaufen, können die DiD-Schätzungen verzerrt sein.
So überprüfen Sie diese Annahme
Die nächste Frage ist nun: Wie kann man das überprüfen? Die Gültigkeit der Annahme eines parallelen Traits kann durch grafische Analysen und Placebotests beurteilt werden.
Es wird angenommen, dass die Behandlungsgruppe (orange Linie) und die Kontrollgruppe (blaue gestrichelte Linie) ohne Behandlung im Laufe der Zeit parallele Wege einschlagen würden. Die Intervention (vertikale Linie) markiert den Zeitpunkt, an dem die Behandlung angewendet wird. Dies ermöglicht den Vergleich der Unterschiede in den Traits zwischen den beiden Gruppen vor und nach der Intervention, um den Behandlungseffekt abzuschätzen.
Beispiele, die gegen die Annahme paralleler Traits verstoßen
Vereinfacht ausgedrückt achten wir bei der Behandlung auf zwei Dinge:
- Änderung der Steigung
In beiden oben genannten Fällen ist die Annahme eines parallelen Traits nicht erfüllt. Das Ergebnis der Behandlungsgruppe wächst entweder schneller (Teil a) oder langsamer (Teil b) als das Ergebnis der Kontrollgruppe. Mathematisch ausgedrückt heißt das:
DiD = tatsächlicher Effekt + differenzieller Pattern (der differenzielle Pattern sollte 0 sein)
Der differenzielle Pattern könnte positiv (Teil a) oder negativ (Teil b) sein.
DiD wird nicht in der Lage sein, die Auswirkung der Intervention (tatsächliche Wirkung) zu isolieren, da wir auch hier einen differenziellen Pattern feststellen.
2. Sprung in der Behandlungslinie (entweder nach oben oder nach unten) nach dem Eingriff
Im obigen Bild änderte sich der Pattern der Behandlungsgruppe anders als der Pattern der Kontrollgruppe, der ohne die Intervention konstant hätte bleiben sollen. Ein Sprung ist in der DiD-Studie nicht zulässig.
Placebotests werden verwendet, um zu überprüfen, ob beobachtete Behandlungseffekte tatsächlich auf die Behandlung und nicht auf andere Störfaktoren zurückzuführen sind. Dabei wird die gleiche Analyse auf einen Zeitraum oder eine Gruppe angewendet, in der kein Behandlungseffekt erwartet wird. Wenn bei diesen Placebotests ein signifikanter Effekt festgestellt wird, deutet dies darauf hin, dass die ursprünglichen Ergebnisse möglicherweise falsch waren.
Beispielsweise wurde 2019 eine Interventionsstudie zur Verteilung von Tablets an weiterführende Schulen durchgeführt. Wir können einen Placebotest durchführen, das heißt, wir können ein falsches Interventionsjahr, beispielsweise 2017, erstellen, von dem wir wissen, dass es keine politische Veränderung gab. Wenn die Anwendung der Behandlungseffektanalyse auf das Placebodatum (2017) keine signifikante Veränderung zeigt, deutet dies darauf hin, dass der beobachtete Effekt im Jahr 2019 (falls vorhanden) wahrscheinlich auf die tatsächliche politische Intervention zurückzuführen ist.
- Veranstaltungsstudie DiD: Schätzt jahresspezifische Behandlungseffekte, was nützlich ist, um den Zeitpunkt der Behandlungseffekte zu beurteilen und nach Vortrends zu suchen. Das Modell ermöglicht es, dass der Behandlungseffekt von Jahr zu Jahr variiert. Wir können den Effekt zum Zeitpunkt untersuchen t+1, T+2, …, T+N
- Synthetische Kontrollmethode (SCM): SCM erstellt eine synthetische Kontrollgruppe, indem mehrere unbehandelte Einheiten gewichtet werden, um ein Komposit zu erstellen, das die Eigenschaften der behandelten Einheit vor der Intervention annähert. Diese Methode ist besonders nützlich, wenn Eine einzelne behandelte Einheit wird mit einem Pool unbehandelter Einheiten verglichen. Es liefert ein glaubwürdigeres kontrafaktisches Argument, indem es Informationen aus mehreren Einheiten kombiniert.
Es gibt noch viel mehr, aber ich werde mich auf zwei beschränken. Vielleicht schreibe ich später einen Beitrag, in dem ich alle anderen im Element erkläre.
In diesem Beitrag habe ich den Distinction-in-Variations (DiD)-Schätzer analysiert, eine beliebte Methode zur Schätzung durchschnittlicher Behandlungseffekte. DiD wird häufig verwendet, um politische Auswirkungen zu untersuchen, indem Veränderungen im Zeitverlauf zwischen Behandlungs- und Kontrollgruppen verglichen werden. Der Hauptvorteil von DiD ist die Fähigkeit, unbeobachtete Störfaktoren zu kontrollieren, die im Zeitverlauf konstant bleiben, wodurch die wahre Wirkung einer Intervention isoliert wird.
Wir haben auch Schlüsselkonzepte wie die Annahme paralleler Traits, die Bedeutung von Daten vor der Behandlung und die Überprüfung auf Annahmeverletzungen mithilfe grafischer Analysen und Placebotests untersucht. Darüber hinaus habe ich Erweiterungen und Variationen von DiD besprochen, wie z. B. das Occasion Examine DiD und die Artificial Management Technique, die weitere Einblicke und Robustheit in verschiedenen Szenarien bieten.
(1) Wing, C., Simon, Okay., & Bello-Gomez, RA (2018). Unterschiedliche Studien gestalten: Finest Practices für die Forschung zur öffentlichen Gesundheitspolitik. Jährliche Überprüfung der öffentlichen Gesundheit, 39453–469.
(2) Callaway, B., & Sant’Anna, PH (2021). Differenz-in-Differenzen mit mehreren Zeiträumen. Zeitschrift für Ökonometrie, 225(2), 200–230.
(3) Donald, SG, & Lang, Okay. (2007). Inferenz mit Differenz-in-Differenzen und anderen Paneldaten. Die Überprüfung der Wirtschaftswissenschaften und Statistik, 89(2), 221–233.
Vielen Dank fürs Lesen!
Vielen Dank fürs Lesen! 🤗 Wenn Ihnen dieser Beitrag gefallen hat und Sie mehr sehen möchten, denken Sie darüber nach Folgen mir. Sie können mir auch folgen auf LinkedIn. Ich habe vor, Blogs über kausale Inferenz und Datenanalyse zu schreiben, wobei ich immer darauf abziele, die Dinge einfach zu halten.
Ein kleiner Hinweis: Ich schreibe, um zu lernen, daher können trotz aller Bemühungen Fehler passieren. Wenn Sie Fehler entdecken, lassen Sie es mich bitte wissen. Ich freue mich auch über Vorschläge für neue Themen!