Wir haben uns getroffen Herr P (Mehrstufige Regression und Poststratifizierung). Wir haben uns getroffen Frau P (Mehrstufige Regression mit synthetischer Poststratifizierung). Jetzt treffen wir uns Frau P (Mehrstufig Strukturiert Regression mit Poststratifizierung) aus Gao et al. 2021.

Lassen Sie uns zunächst einen Rückblick geben Nachschichtung:

  • Wir wollen den Populationsmittelwert E(Y)
  • Wir haben Y,X in der Stichprobe, X in der Inhabitants.
  • Additionally wir kalibrieren unsere Schätzungen von E(Y) zur Bevölkerungsverteilung von X.

Gao et al. 2021Beispiel:

  • Y = Unterstützung der Homo-Ehe
  • X = Geschlecht, Rasse, Einkommen, Staat, Alter, Bildung
  • Beispieldaten zu Y, X aus der Nationwide Annenberg Election Survey 2008
  • Bevölkerungsdaten zu X aus dem American Group Survey (ACS)

Von das Gesetz der totalen Erwartung: E(Y) = E(E(Y|X)). Wenn unsere Schätzung von E(Y|X) der Stichprobenmittelwert von Y für Personen mit diesem X ist, handelt es sich bei der Gesamtschätzung um eine klassische Poststratifizierung (keine Ehrenbezeichnung). Wenn unsere Schätzung von E(Y|X) auf einem Modell basiert, das über X reguliert, beträgt die Gesamtschätzung Herr P.

Wie reguliert man über X hinweg? Angenommen, das Alter ist eine der X-Variablen. Gao et al. 2021 Betrachten Sie 3 Prioritäten für die Koeffizienten a_j der Altersgruppen j = 1,…,J:

  1. Unabhängige Normalität: a_j ~ N(0, Sigma)
  2. Autoregressiv: a_j | a_{j-1} ~ N(rho a_{j-1}, Sigma) mit rho in (-1,1)
  3. Zufallsgang: a_j | a_{j-1} ~ N(a_{j-1}, Sigma)

Der erste wird oft verwendet in Herr P. Die nächsten beiden gehören zu Frau Pda sie die Ordnungszahl verwenden Struktur volljährigwobei die Altersgruppe j näher an der Altersgruppe j + 1 liegt als an der Altersgruppe j + 5. Die Verwendung dieser Struktur kann Frau P dabei helfen, stärker zu regulieren, mit kleinerem Sigma und mehr Ausleihinformationen über die Altersgruppen hinweg.

Gao et al. 2021 Simulieren Sie Daten aus E(Y|X) = logit^-1(… f(X_age(j))…), wobei die Funktion f(X_age(j)) angibt, wie die Unterstützung je nach Alter variiert. Sie überlegen 3 reibungslose Funktionen f(x). Für die von jedem simulierten Daten passen sie Modelle mit den drei oben genannten Prioritäten an. Frau P übertrifft Herrn Pwobei die Random-Stroll-Struktur am besten funktioniert:

Diese Fußnote in der Stan-Dokumentation könnte erklären, warum Random Stroll Autoregressive übertrifft:

In der Praxis kann es nützlich sein, die Einschränkung zu entfernen, um zu testen, ob ein instationärer Satz von Koeffizienten eine bessere Anpassung an die Daten bietet. Es kann auch nützlich sein, dem Modell einen Trendterm hinzuzufügen, da sich ein nicht angepasster Pattern als Instationarität manifestiert.

Gao et al. 2021 auch bedenken räumliche Prioritätenwo benachbarte PUMAs stärker korrelieren. Sie simulieren Daten sowohl mit räumlicher Glätte als auch mit unabhängigen Normalen, um zu bestätigen, dass der Prior „keine räumliche Struktur erzwingt, wenn sie nicht vorhanden ist“. Haben sie dies für das Altersmodell übersprungen?

Neben den Simulationsstudien Gao et al. 2021 Wenden Sie Frau P auch auf die Nationwide Annenberg Election Survey 2008 und das ACS-Beispiel oben an.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert