Thomas Lumley (in seinem Weblog voreingenommen und ineffizient) Und Andrew, Jennifer und Aki (in ihrer Buchregression und anderen Geschichten) schreibe über 3 Geschmacksrichtungen von Gewichten in der Statistik:


1. Umfragegewichte Beschreiben Sie, wie die Umfrageprobe bis zur Bevölkerung skaliert werden kann. Eine Möglichkeit, über sie nachzudenken, ist, wie viele Menschen in der Bevölkerung jede Particular person in der Stichprobe repräsentieren. Diese können komplizierter sein als 1/Wahrscheinlichkeit, wie wir unten sehen werden.
2. Frequenzgewichte Beschreibe, wie viele tatsächliche Beobachtungen Haben Sie ein bestimmtes Muster von Variablen (z. B. ein Gewicht von 12 in der Frauenfrauen-AGE-37-from-New York Row, sagt, dass 12 solche Frauen in den Daten sind).
3. Präzisionsgewichte Beschreiben Sie die Präzision (1/Varianz) der Beobachtungen, wodurch sie sich von den ersten 2 Geschmacksrichtungen unterscheidet.
Bei den meisten Punktschätzungen werden alle 3 gleich behandelt. Was unterschiedlich ist, ist die Varianzschätzung. Gehen Sie und lesen Sie Thomas und Andrew et al. für viel mehr. Wir hier werden sich auf den ersten Geschmack konzentrieren und ihn in die Brechung bringen 3 Unterflächen (meine Rechtschreibprüfung besagt, dass dies kein Wort ist) der Umfragegewichte:
A) Inverse-Response-Likelihood-Gewichte basieren auf einem Modell für die Antwort R (z. B. logistische Regression). Das Gewicht ist dann w = 1/ehat (r | x). Sehen Lumley 2010 Abschnitt 9.2.2:

B) Äquivalente Gewichte basieren auf einem Modell für das Ergebnis von Interesse Y. Wir kalibrieren zu bekannten Bevölkerungsdaten über X: E (Ehat (y | x, Stichprobe)). Dann sind die äquivalenten Gewichte die Ausdrücke in Gelman 2007zumindest für linear Modelle von Y. Vereinfachung zu klassischer linear Modelle, dies ist der Greg -Schätzer für generalisierte Regression (Greg) und dieselbe wie unser 3. Unterfluss:
C) kalibrierte Gewichte basieren auf der Suche nach W, so dass die gewichteten Schätzungen von X ihren bekannten Gesamtsummen entsprechen. Hier gibt es kein explizites Modell.
Särndal 2007 Kontrast B und C:
Statistiker, die in der arbeiten Fläche sind zwei Arten: diejenigen, die sich dem „Greg -Denken“ widmen, und diejenigen, die sich dem „Kalibrierungsdenken“ widmen …Ich bin nicht Ich wage zu sagen nationale statistische Agenturen und die ersteren häufiger In den akademischen Kreisen, aber vielleicht gibt es eine solche Tendenz … Der lineare Greg -Schätzer impliziert Gewichte, die zufällig kalibriert werden …
Särndal musste beide Arten von Statistiker, als Forscher bei Schwedens nationalen statistischen Agenturen und als Professor.
Welche Artwork von Statistiker bist du? Was ist dein Lieblingsgewichtsgeschmack?

