Bisher haben wir uns auf a konzentriert Bevölkerungsmittelwert E(Y) als unsere interessierende Größe. Wir haben darüber gesprochen, dies mit Gewichten oder zu schätzen MRP.
- Inverse-Response-Wahrscheinlichkeitsgewichte (IPW): 1/E(R | X)
Oder normalisiert als Bedeutung der Stichprobengewichte W = E(R)/E(R|X) = p(X)/p(X|R=1).
Mit E(Y) = E(YW | R = 1) ermitteln wir die interessierende Größe. - (Mehrstufige) Regression und Poststratifizierung ((M)RP):
E(Y) = E(E(Y | X, R = 1)) ist die Artwork und Weise, wie wir die interessierende Größe identifizieren.
Diese sind äquivalent, wenn wir vollständig gesättigte Modelle verwenden, um E(R|X) und E(Y|X,R=1) zu schätzen, siehe Lumley 2010 Abschnitt 9.2.2 und Hernán und Robins (2020) Technischer Punkt 2.3.

Aber was ist nun, wenn uns eine Untergruppe wie … am Herzen liegt? Wähler E(Y | V=1) ? Angenommen, die Wahl hat noch nicht stattgefunden, sodass wir kein V (ob Sie Wähler sind) in der Bevölkerung haben. Und V in der Umfrage leidet unter der „Voreingenommenheit bei der übermäßigen Berichterstattung über Stimmen“. Ghitza und Gelman 2013 Und Ghitza und Gelman 2020 Notiz. Der New York Occasions schätzt E(V | X), das als Teil der Gewichte verwendet werden soll:
Andere Umfragen, darunter The Occasions/Siena Ballot, verwenden ein sogenanntes probabilistisches Modell. Anstatt Wähler mit geringer Wahrscheinlichkeit vollständig aus der Stichprobe auszuschließen, kombinieren Meinungsforscher die verfügbaren Daten, um abzuschätzen, wie wahrscheinlich es ist, dass jeder Befragte wählt, und ihre Antworten werden entsprechend gewichtet.
Da p(X) bekannt ist, können wir Bayes verwenden, um p(X | V = 1) zu erhalten, wie auf Seite 157 von getan Gelman 2007. Und auf S.764 von Ghitza und Gelman 2013 Sie erwähnen die Schätzung der Zellgrößen N_j oder Zellwahrscheinlichkeiten p(X=j | V =1), die für MRP benötigt werden:
Möglicherweise bilden wir den Durchschnitt über die Bevölkerung im Wahlalter, die wahlberechtigte Bevölkerung oder die Wählerpopulation … Wenn die N_Jsind bekannt … Poststratifizierung ist einfach. Wenn das N_J Da es sich lediglich um Schätzungen handelt, wenden wir weiterhin (1) an und fügen dieses Mal Schätzungen der N_ ein.J Das ergibt sich aus einer vorläufigen Analyse.
Die oben genannten Methoden sehen nun additionally so aus:
- Gewichte:
Jetzt Bedeutung der Stichprobengewichte sind W = E(V|X)/E(V) / E(R|X)/E(R) = p(X|V=1)/p(X|R=1).
- Mehrstufige Regression und Poststratifizierung (MRP):
E(Y | V=1) = E(E(Y | X, R = 1, V = 1) | V = 1) erfordert nun p(X | V=1) für den äußeren Erwartungswert.
Wir haben mindestens drei Möglichkeiten, so etwas wie das NYT-Wahrscheinlichkeitswählermodell E(V | X) zu verwenden:- Verwenden Sie Bayes, um Wahrscheinlichkeiten auf Zellebene p(X=j | V=1) wie in zu schätzen Gelman 2007 Und Ghitza und Gelman 2013
- Machen Sie Weichengewichte T = E(V|X)/E(V), den Zähler der oben genannten Wichtigkeitsgewichte. Dann bewerten Sie unser MR-Modell für alle außer gewichtet:
E(E(Y | X, R = 1, V = 1) * T) - Im Gespräch mit Andrew unter Spielzimmer Heute schlug er vor, dass zum „X“ im MRP auch Weichengewichte hinzugefügt werden können.
Diese Taxonomie kehrt viel unter den Teppich! Es wurde erstellt, um zu zeigen, wie Wahlbeteiligungsgewichte mit inversen Antwortwahrscheinlichkeitsgewichten zusammenhängen. Wenn wahrscheinliche Wähler auch eher an Umfragen teilnehmen, kann der Non-Response-Bias als zusätzliche Gewichtung der Wahlbeteiligung angesehen werden.
