ICH schrieb über die Imputation im Juli träumten, dass wir im Kommentarbereich die Edundrums der Praktizierenden lösen könnten (wie passiert HierDanke Gaurav !). Aber so struggle Statistik (und das Leben) für mich, ich kreisen immer wieder um die gleichen Fragen.

Lassen:
- Z = beobachtete Kovariate
- X = nicht beobachtete Kovariate
- Y = Ergebnis
Wir wollen modellieren (y | z, x).
D’Agostino McGowan et al. (2024) Schauen Sie sich die kontinuierlichen Y- und linearen Modelle für E (y | x, z) an. Sisk et al. (2023) Schauen Sie sich binäre y- und logistische Modelle für e (y | x, z) an. Beide bedenken:
- deterministische Imputationen
- mit y: xhat = e (x | z, y)
- ohne y: xhat = e (x | z)
- zufällige Imputationen
- mit y: x ~ p (x | z, y)
- ohne y: x ~ p (x | z)
Um dies zu verstehen, schauen wir uns ein einfaches Beispiel an: Verg vergessen Sie alle linearen Modelle.
Wir wollen die Steigung von einer Regression von y auf x: cov (y, x)/v (x)
Das Imputationsmodell ist eine Regression von x auf y: x = a + durch + e
Verwenden der richtigen x = a + by + E erhält:
COV (y, a + durch + e) / v (a + nach + e) = bv (y) / (b^2 V (y) + V (e))
Verwenden von xhat = a + von als deterministische Imputation, die vergessen wird, bekommt eine zu große Steigung:
COV (y, a + by) / v (a + by) = bv (y) / (b^2 v (y))
D’Agostino McGowan et al. (2024) Lassen Sie Anhänge lange Berechnungen durchführen, um Versionen dieses Phänomens anzuzeigen:

Denken Sie jetzt daran, wir sind ein Staff von Praktikern und unterschiedlichen Teamkollegen haben unterschiedliche „Y“ -Variablen. Daher muss die deterministische Imputation das YS aller respektieren, ausgenommen sie von den Imputationsmodellen. Ist dies ein Argument für zufällige Imputation? Auf diese Weise kann sich das Staff vollständig bedingen (siehe Der MäusealgorithmusZum Beispiel). Gedanken ?
