Benfords Gesetz macht Spaß; Es ist auch die Quelle endloser Verwirrung. Mathe ist schwer!
Dies trat kürzlich auf, als Kevin Lewis darauf hinwies Dieses Papierwas sagt:
Wir verwenden das Gesetz von Benford, um die nicht zufälligen Elemente der Gesundheitskosten zu untersuchen. Wir stellen fest, dass die Konformität mit der erwarteten Verteilung natürlich vorkommender Zahlen mit zunehmender Gesundheitsausgaben zunimmt, was auf eine Tendenz zur ineffizienten Behandlung hinweist. Regierungsversicherer befolgen das Gesetz von Benford besser als personal Versicherer, die eine effizientere Behandlung anzeigen. . . .
Dies klang interessant, aber ich bin mir ziemlich sicher, dass sie es falsch machen, weil sie versuchen, die Passform zu Benfords Gesetz in jedem „Preis-Bucket“ zu bewerten (100-999 USD, 1000-9999 USD, 10.000-99.999 USD und 100.000-99999 USD). Aufgrund meines Verständnisses der Prozesse, die Benford-ähnliches Verhalten zugrunde liegen, würden Sie nicht unbedingt erwarten, dass das Muster in jedem Behälter auf diese Weise auftritt.
Hier ist ein Beispiel dafür, wie die Dinge schief gehen. Die Autoren schreiben:
Wir folgen auch Drake und Nigrini (2000), indem wir den Mittelwert der absoluten Abweichungen (MAD) berechnen, um die Konformität mit der erwarteten Verteilung zu bewerten. . . . Wir stellen fest, dass beim MAD für den ersten Anklageber (0,010) eine geringfügig akzeptable Konformität mit dem Gesetz von Benford zeigt. Für die zweiten (0,023), dritten (0,049) und vierten (0,092) Eimer ist der MAD jedoch größer als 0,012, was auf Nichtkonformität hinweist. Wie erwartet steigt der MAD mit dem Niveau der Gesamtladungen an. . . . Eine zusätzliche Erklärung für diesen Befund sind Krankenhauspreisstrategien. . .
Okay, hier ist das Downside. Hier sind die Daten:

Dies sollte wirklich eine Grafik sein, aber hier hier sorgen wir uns nicht darum.
Konzentrieren wir uns auf den vierten Eimer, denn dort ist die Diskrepanz am höchsten. Sie sehen, was passiert, oder? In diesem vierten Eimer sind wir dort oben im Schwanz der Verteilung, der Schwanz fällt schnell ab, additionally gibt es sehr Gebühren über 200.000 US -Greenback. Das bedeutet nicht, dass jemand in seiner Abrechnung betrügt. Es ist genau das, was Sie im Schwanz der Verteilung erwarten würden. Das Benfords Gesetz gilt, wenn die zugrunde liegenden Zahlen aus einer Verteilung mit einem breiten dynamischen Bereich stammen und dass Sie dies auf diese Weise zerstören.
Ich würde sagen, ich bin überrascht, dass dies in einem legitimen Tagebuch veröffentlicht wurde, aber das Downside mit Peer Overview ist die Kollegen. Jeder tut das Beste, was er kann, Benfords Gesetz ist ein helles, glänzendes Objekt, es wird missbraucht, genau wie die lineare Regression missbraucht wird, genauso wie die logistische Regression verwendet wird, genau wie die Prüfung der Hypothesen missbraucht und missbraucht und missbraucht wird. Das Beispiel von Benford ist nur ein bisschen interessanter, weil die Mathematikverwirrung etwas weniger vertraut ist als die üblichen statistischen Fehler, die wir jeden Tag sehen. Deshalb habe ich mich um diesen Beitrag gekümmert.
