Wir haben manchmal Diskussionen über den Weblog, der die Leute davor warnen, zu viele bedeutende Ziffern zu zeigen. Zum Beispiel, Zurück im Jahr 2012 Ich fragte: „Ist es sinnvoll, über eine Wahrscheinlichkeit von„ 65,7%“zu sprechen, dass Obama die Wahl gewinnen wird?“ Und ich antwortete, nein, es ist nicht so. Diese letzte Ziffer wird im Wesentlichen reines Geräusch angezeigt, und Schwankungen in dieser Ziffer sagen uns überhaupt nichts.
Für ein anderes Beispiel diskutierte ich einst eine Arbeit, in der berichtete, dass „von den 914 sexuellen Minderheiten in unserer Stichprobe bis 2008 134 (14,66%) tot waren“, worauf ich antwortete, dass es eine schlechte Praxis ist, diese 14,66percentzu bezeichnen, sondern um 15%. Unzählige der Autoren, dies zugelassen zu haben.
Aber dann zeigte mich ein Kollege darauf Dieser Beitrag Mit dem Titel „Bitte zeigen Sie viele Ziffern“ und argumentieren: „So fangen Sie Betrugsfälle.“
Guter Punkt! Das kam in der jüngste venezolanische Wahl. Zunächst zählt die Stimmen wie berichtet:
Und dann mit ein paar zusätzlichen Dezimalstellen:
Diese zusätzlichen Ziffern würden keinen nützlichen Wert haben – wenn wir der Ansicht waren, dass die Zahlen korrekt waren. Die Verrücktheit des Ergebnisses ist jedoch ein starker Beweis dafür, dass diese genauen Stimmensummen falsch sind, dass sie aus den abgerundeten Werten umgekehrt wurden.
So ist Dean Eckles Setzen Sie es aus:
In einigen Fällen kann die Berichterstattung über viele Ziffern tatsächlich ein kostspieliges Sign sein. Wenn sie nicht auf den angegebenen Berechnungen basieren, kann es möglich sein, herauszufinden, dass sie unmöglich sind (z. B. über eine granularitätsbezogene Inkonsistenz von Mittel, akka-Grim-Assessments). Dies ist vielleicht ein Argument für zumindest überschüssige Ziffern in Tabellen (obwohl sie sicherlich nicht Abstracts und Pressemitteilungen sind!). Möglicherweise ist dieses Argument etwas veraltet, wenn zusätzlich zu einem Papier oder einem Bericht selbst Daten- und Analysecode bereitgestellt werden. Dies bleibt jedoch nicht immer der Fall.
Das Dilemma
Spucken Sie jedes Mal jedes Mal eine Zigiten von zigzahlen und Sie werden Ihre Papiere unlesbar und sogar irreführend machen. Der Autor dieses verknüpften Beitrags bezeichnet dies als eine „kleine Meinung nach dem Schreibstil“ und eine „dumme Nicht-Ausgabe“, aber. . . Kommunikation ist wichtig, und das nennen es „Stil“ oder „albern“, ändert das nicht!
Eine Möglichkeit, dies den Schülern zu erklären, besteht darin, zu sagen: So wie Sie beim Schreiben eines Artikels keinen Absatz angeben sollten, den Sie nicht lesen möchten, sollten Sie auch keine Tabelle mit Zahlen einfügen, die die Leute nicht betrachten. Die Aufmerksamkeit der Menschen ist begrenzt, und so sollte es sein.
Andererseits. . . Ja, es kann Gold in den Dezimalstellen in ihnen geben. Dies trat in unserer jüngsten Beschreibung der Wahlprognosen auf, in denen ich den Ökonom für die Abrunden ihrer Prognosen lobte (ich kann mich nicht an ihre genaue Formulierung erinnern, aber es battle so etwas wie „sogar Chancen“, „3 von 5 Likelihood“ „2 von 3 Chancen“, im Wesentlichen, im Wesentlichen die Wahrscheinlichkeit, die auf 50percentabgerundet wurde, reagierten auf 50%, 60%, 66.6%. Dann gibt es diesen unangenehmen Second, in dem die Chancen plötzlich von ungefähr bis zu ungefähr 50% auf ungefähr 60% springen und dieser scheinbare diskrete Sprung selbst irreführend sein kann. Wie in diesem verknüpften Beitrag erläutert, können zusätzliche Dezimalstellen Probleme in der Analysepipeline aufdecken.
Schauen Sie sich für ein weiteres Beispiel an Diese amüsante Geschichte Aus James Heathers: „Die Daten befinden sich auf einer Skala von 1 bis 5, der Mittelwert ist 4,61 und die Standardabweichung 1,64. . . Was ist so falsch daran? „
Was tun dann?
Meine Empfehlung ist das, was wir das genannt haben Klicklösung: Beginnen Sie mit einer zugänglichen Zusammenfassung, die den Leser einbringt. Klicken Sie dann für statistische Grafiken, die direktere visuelle Vergleiche ermöglichen. Klicken Sie dann erneut, um eine Tabelle mit allen Zahlen und einer Liste von Quellen zu erhalten.
Im Kontext eines veröffentlichten Artikels wäre Schritt 1 der Artikel selbst mit angemessen abgerundeten Zahlen (oder noch besser Grafiken). Schritt 2 sind die ergänzenden Informationen mit vollständigen Tabellen mit zusätzlichen Dezimalstellen, wenn Sie so rollen, und Schritt 3 sind die Dateien mit Daten und Code. Mach alles.