Ron Bloom schrieb mit einer Frage:
Das folgende Pseudorätsel ist „klassisch“ und „frequentistisch“ – es sind keine Vorannahmen beteiligt; nur zwei PDFS (vollständig spezifiziert) und eine „Wahrscheinlichkeits“-Schlussfolgerung. Das Rätsel könnte jedoch in seinem einfachen Umfang für Sie interessant sein; und vielleicht können Sie die Lösung erkennen. Ich kann es nicht; und es lässt mich etwas erleben, das in etwa dem ähnelt, was Kendall irgendwo (über etwas ganz anderes) sagt: „… das Downside hat diesen Aspekt gewisser optischer Täuschungen; es ergibt unterschiedliche Erscheinungen, je nachdem, wie man es betrachtet …“
Angenommen, ich habe p(x|mu0) und p(x|mu1), beides gewichtete Gauß-Summen mit festgelegten Standardabweichungen und festgelegten Gewichten. Nehmen wir der Bestimmtheit halber an, dass es sich bei beiden um Summen aus drei Termen handelt. Darüber hinaus haben alle drei Gauß-Verteilungen den gemeinsamen Mittelwert, der im Ausdruck p(x|mu) genannt wird. Sie sehen additionally zumindest aus einiger Entfernung wie „schwerschwänzige“ Gauß-Verteilungen aus.
Nehmen wir an, dass auch mu0 < mu1 beides festgeschrieben ist; tatsächlich ist alles festgeschrieben; es handelt sich additionally *kein* Schätzproblem; es hat nichts mit "EM" oder maximale Wahrscheinlichkeit. Einfach klassischer Take a look at zwischen zwei einfachen Alternativen. Ein einziges Datum wird erfasst: x. Das klassische Verfahren zur Entscheidung zwischen "H0" Und "H1" ist die Wahl des Exams "Größe". Setzen Sie den Schwellenwert T auf den rechten Rand von p(x|mu0), so dass der Bereich über diesem Schwellenwert die Testgröße ist; die Teststärke dieses Exams gegenüber der festgelegten Different H1 ist natürlich der Bereich über T unter p(x|mu1). Wenn die PDFs gaußförmig oder in einer Exponentialfamilie sind oder wenn "ausreichende Statistiken vorhanden sind" Dieses Verfahren oben ist identisch mit dem, was man tut, wenn man das Neyman-Pearson-Wahrscheinlichkeitskriterium verwendet: was darauf hinausläuft, einen Schnitt mit dem gleichen "Größe" auf der komplizierteren Zufallsvariable L(x) = p(x|mu0)/p(x|mu1). Wenn die PDFS sich intestine verhalten oder allgemeiner *monoton* sind, lässt sich die Wahrscheinlichkeitsaussage über einen Ablehnungstest auf der Variable L(x) in eine Aussage über einen Ablehnungstest auf der Variable (x) simpliciter übersetzen. Aber in diesem Fall "Hübsch" Gaußsche Mischung Ich entdecke, dass für mu1, das nahe genug an mu0 liegt (und bestimmte Kombinationen von Gewichten und Standardabweichungen), das Chance-Verhältnis L(X) *nicht* monoton ist, und stehe plötzlich vor einer unerwarteten Ratlosigkeit: Es scheint (zumindest für das Auge), dass es nur eine Möglichkeit gibt, einen rechtsseitigen Ablehnungstest für ein solches Paar einfacher Hypothesen aufzustellen: und doch scheint das Argument von Neyman Pearson zu besagen, dass die Durchführung dieses Schnitts unter Verwendung der PDF von L(x) und die Durchführung dieses Schnitts unter Verwendung von p0(x|mu0) selbst nicht dasselbe Ergebnis liefern werden. "X" --- bei gleicher Testgröße. Können Sie die Lösung dieses (Pseudo-)Rätsels erkennen?
Ich antwortete: Ja, ich kann mir vorstellen, wie das passieren würde. Ob Neyman-Pearson oder Bayes, wenn Sie dem Modell glauben, ist die relevante Data das Wahrscheinlichkeitsverhältnis, von dem ich in diesem Beispiel durchaus glauben kann, dass es keine monoton zunehmende und dann abnehmende Funktion von x ist. So ist es eben! Es scheint mir kein Paradoxon zu sein, da es kein theoretisches Ergebnis gibt, das implizieren würde, dass das Verhältnis zweier unimodaler Funktionen selbst unimodal ist.
Bloom antwortete:
Ich konnte endlich sehen, was offensichtlich ist. Dass es tatsächlich viele various „Ablehnungsbereiche gleicher Größe“ gibt und wenn die PDF der „Different“ holprig ist (wie in diesem Beispiel) oder allgemeiner, wenn das Wahrscheinlichkeitsverhältnis nicht monoton ist (und dies ist *nicht* „leicht zu sehen“ für Verhältnisse „einfacher“ Gaußscher Mischungen, deren Kernel alle einen gemeinsamen Mittelwert haben), dann ist der beste (leistungsstärkste) Take a look at tatsächlich nicht unbedingt der Ablehnungstest am oberen Ende. Sehen Sie sich mein schlecht gezeichnetes Diagramm an. Dies kann übrigens unter Ihrem Thema abgelegt werden, wie der ausreichend intestine erlernte Gaußsche Ansatz Erkenntnisse wirklich behindern kann, die ansonsten (für Ungebildete) offensichtlich wären.