In Unser Beitrag von vor zwei Wochen Wir haben begonnen, über die aktuelle Umfrage zur Beschäftigungsstatistik (CES) des US -amerikanischen Bureau of Labour Statistics (BLS) zu erfahren, die den monatlichen Stellenbericht erstellen.
Wir haben uns gefragt, warum die Größe der Einrichtung in der Schichtung und nicht in der Schätzung verwendet wird. Kommentatoren schlugen vor, die BLS zu kontaktieren, um sie zu fragen, additionally habe ich es getan! Sie schrieben schnell mit den ersten Ressourcen und einer Zeitleiste für ihre vollständige Antwort zurück, die ich am Freitag (15. August 2025) bekam, und werden jetzt mit Ihnen verdauen.

Steve ManceCES Department Chief bei The BLS, schreibt (alles fett ist mein eigener):
Die CES Privatsektor Die Probe verwendet ein geschichtestes einfaches Zufallsstichprobenentwurf, das von Staat, 8 Geschäftsgrößenklassen und 13 breiten Industrien zugewiesen wurde und die Gewichte als Umkehrung der Auswahlwahrscheinlichkeit zugewiesen sind. Die Schätzstruktur besteht aus über 500 Zellen, die durch die detaillierte NAICS -Industrie (und Area im Bau) definiert sind. Auf dieser detaillierten Branchenebene entwickelte Schätzungen, die zur Bildung der nationalen gesamten privaten Schätzung entwickelt wurden.
Dies entspricht meinem Verständnis: Beispielschichten werden durch staatliche, Größe und (breite) Branche definiert. Schätzzellen werden durch (detaillierte) Industrie und Area definiert.
Regierung Schätzungen verwenden weiterhin ein Quotendesign und umfassen regionale Schichtung zur Schätzung der staatlichen und lokalen Bildung. Staatliche und Metro -Schätzungen verwenden dieselbe Stichprobe wie die nationalen Daten, werden jedoch unabhängig berechnet und verwenden unterschiedliche Aggregationsstrukturen. In einigen Fällen umfassen sie explizite Anpassungen für nicht antwortende Gewichtsanpassungen, die durch detaillierte NAICs in einer breiten Branche definiert sind.
Das struggle neuer für mich. Die Auftragszählungen der Regierung basieren auf einer Quote (nicht Wahrscheinlichkeit). Die Schätzung scheint nur (detaillierte) Industrie und Area zu verwenden, wie für den privaten Sektor.
In den meisten Fällen führt CES in den nationalen Daten keine expliziten Nichtanpassungen (entweder durch Gewichtsanpassungen oder eine Imputation) vor. Unser Schätzer entspricht der Einstellung von Nichtbefragten unter Verwendung des relativen Beschäftigungswachstums der Befragten, die auf Schätzungszellebene berechnet wurden.
Wie wir in der besprochen haben Nachstratifikation Und Imputation Beiträge: Wir können die Befragten verwenden, um die Beschäftigung von Per-Zellen abzuschätzen, die dann unter Verwendung einer bekannten Verteilung über Zellen aggregiert werden. (Ich muss Klammern für Andrew einwerfen: E (E (y | x, Befragte)), wobei X die Zellen definieren und y beschäftigten. Die äußere Erwartung ist über X.)
In seltenen Fällen werden verspätete oder Nichtantwort von großen Stichprobeneinheiten, die historisch gesehen saisonale Unterschiede zum Relaxation der Bevölkerung aufweisen, durch explizite Imputation berücksichtigt. Wenn eines dieser Unternehmen keine CES-Daten für den aktuellen Monat meldet, können seine historischen über-monatigen Änderungsdaten in der Imputation verwendet werden, um seine erwartete saisonale Bewegung zu erfassen.
Wenn eine große Einrichtung nicht reagiert, lindern sie die Verwendung seiner Geschichte.
In der Frage, die wir erhalten haben, bemerkten Sie a Papier von Ken Copeland Ab 2003, der die Non -Response in CES untersuchte und fragte Warum wir die Größe in der Allokation verwenden, aber nicht in unserer Schätzstruktur (Ich werde auch Geographie ansprechen):
-
Zu Konstruktionszwecken muss die Zuordnung den Zustand umfassen. CES ist ein Kooperativprogramm für Fed-State, und wir müssen ein gewisses Maß an Zuverlässigkeit der Schätzungen für kleine Staaten sicherstellen. Eine optimale Zuordnung für die nationalen Daten könnte für einige Staaten unannehmbar kleine Stichprobengrößen aufweisen. Die Zuteilung der staatlichen Stichprobengrößen werden vom CES Coverage Council vereinbart, das aus Vertretern von BLS und staatlichen Arbeitskräften besteht und in der Regel alle 5 Jahre aktualisiert wird. (In jedem Zustand wird die feste Stichprobengröße jährlich auf die Branchen-/Größenschicht zugewiesen.)
Dies ist ein großartiges Beispiel für was s Raphael Nishimura und Andrew sagte in unserer Poststratifikation Diskussion „Oft wird eine Schicht absichtlich übertroffen.“
Steve Mance (BLS) fährt fort:
-
Die Größenklasse struggle auch eine wichtige Überlegung unseres Stichprobenredesigns, das in den neunziger Jahren entwickelt und Anfang der 2000er Jahre implementiert wurde. Unser früheres Quotenkonstruktion führte zu einer Stichprobe, die stark gegenüber großen Unternehmen gewichtet wurde, was als signifikante potenzielle Verzerrungsquelle angesehen wurde, obwohl die Forschung, die vor dem Redesign führte, keine Unterschiede zwischen großen und kleinen Unternehmen als wichtiger Beitrag zu Benchmark -Revisionen ansah.
Benchmark -Revisionen sind Korrekturen in CES -Schätzungen, die auf der vierteljährlichen Volkszählung und Lohnsummen (QCEW) basieren. Das QCEW hat nahezu vollständige Antwort, sodass wir sie verwenden können, um die Nichtantwortverzerrung in den CES zu bewerten. Die BLS sahen nicht, dass die Größe der Etablierung ein großer Beitrag zur Nichtantwortverzerrung struggle, obwohl die Stichprobe größere Unternehmen aufwies. Es scheint, dass X (Größe) mit R (Antwort) verbunden ist, „eine Stichprobe, die stark gegenüber großen Unternehmen gewichtet ist“. Aber wenn X einen großen Beitrag zu Nicht -Response -Verzerrungen macht, bedeutet das, dass es nicht mit Y (Jobs) verbunden ist? Das verwirrt mich.
Wenn x mit R verbunden ist, aber nicht y, dann ist x was Kuh et al. 2023 Tabelle 1 nennt „belanglos“:

Ihr Tisch wurde von inspiriert von Little und Vartivarian 2005 Tabelle 1, die warnt, dass die Anpassung an ein solches X die Varianz erhöhen kann:

Wir diskutierte sparsifizierte MRP Um diese Varianzzunahme zu vermeiden. In der Tat, Little und Vartivarian 2005 abschließen:
Ein ausgefeilterer Ansatz besteht darin, Zufallseffektmodelle anzuwenden, um die Gewichte zu verkleinern, wobei mehr Schrumpfung für Ergebnisse schrumpfen, die nicht stark mit den Kovariaten zusammenhängen (z. B. Elliott und Little 2000). Eine versatile Various zu diesem Ansatz ist die Imputation, die auf Vorhersagemodellen basiert…
Steve Mance (BLS) fährt fort:
-
Wir haben festgestellt, dass das Schichten der Schätzstruktur durch detaillierte Industrie die wichtigste Dimension bei der Aufrechterhaltung der ignorierenden Nichtantwort -Annahme ist Sie haben aus Copeland (2003) festgestellt. Innerhalb der angegebenen breiten Allokationsindustrien haben wir in Bezug auf das relative Beschäftigungswachstum und die Reaktionsneigung eine große Heterogenität und eine relative Homogenität innerhalb der Branchen festgestellt. Die Konstruktion ist eine bemerkenswerte Ausnahme, bei der eine größere geografische Heterogenität vorliegt, die in der Schätzungszellstruktur berücksichtigt wird.
Das macht Sinn. Sie haben festgestellt, dass die detaillierte Industrie am wichtigsten ist, um die Verzerrung zu verringern.
Es ist sicherlich plausibel, dass die Einbeziehung von Informationen wie Größe und Zustand in Gewichtsanpassungen oder Imputation den Nichtantwortfehler verringern könnte, und BLS erforscht derzeit direkter die Nichtantwort in CES unter Verwendung von Zustand, Größe und anderen Informationen. Die früheren Arbeiten, die Größe und andere Merkmale in nicht reagierten Anpassungen beinhalten, wie z. Copeland und Valliant (2007)lieferte keine signifikanten Verbesserungen der aggregierten Überarbeitungen in CES.
Dies wiederholt den obigen Punkt, die BLS sahen nicht, dass die Größe der Beteiligung ein großer Beitrag zur Nichtantwortverzerrung struggle. Und sie recherchieren weiter.
