Hanno Böck schreibt:

Ich habe kürzlich gesehen eine Grafik Kommen von hier Mehrfach in sozialen Medien gepostet, dass ich in seiner Datenrepräsentation ziemlich irreführend fand.

Es gibt einige Variationen davon, aber alle teilen das gleiche Downside.

Das bemerkenswerteste Downside ist, dass die Grafik auf beiden Achsen logarithmische Skalen verwendet. Dies hat den Einfluss, alles am oberen rechten Ende zusammen zu drücken, und erzeugt visuell eine viel stärkere Korrelation als tatsächlich.

Eine andere Sache, die zu beachten ist, und hier wäre ich neugierig, was Sie darüber denken, ist, dass es am Boden einen Wert von R^2 von 0,8 gibt. Erstens ist R^2, soweit ich das beurteilen kann, nicht leicht und intuitiv verstanden werden (es scheint ein einfacher R -Koeffizient angemessener). Aber das ist nicht das Hauptproblem. Der Wert ist, soweit ich das beurteilen kann, einfach falsch.

Wenn ich versuche, R^2 für diese Daten zu berechnen, bekomme ich 0,43. Es scheint, dass das, was hier getan wurde, den R^2 -Wert über die Protokollwerte der Eingabedaten berechnet wurde. (Wenn ich das tue, bekomme ich 0,81.)

Falls Sie mit den Daten spielen möchten, Hier ist ein kurzes Python Ich schrieb, um ähnliche Grafiken mit einer Nicht-Log-Skala und den relevanten Datenquellen aus der Weltbank und der UVP zu erstellen.

Meine Antwort:

Ich denke nicht, dass die logarithmische Skala ein Downside ist, und es ist in Ordnung, den R-Quadrat für logarithmische Daten zu berechnen. In jedem Fall erzählt der ScatterPlot die Geschichte; Ich dünne R-Quadrat fügt hier nichts hinzu.

Ich habe in die Quelle geklickt, und das eigentliche Downside scheint ihr Titel zu sein: „Wie wirkt sich Energie auf das Wirtschaftswachstum aus.“ Die Daten, die sie zeigen, sind Querschnitt ohne solche kausalen Implikation.

Bock antwortete:

Ich bin überrascht, dass Sie in der Protokollskala kein Downside sehen. Ich glaube, dies ist das Hauptproblem bei dieser Grafik. (Als Faustregel würde ich sagen, dass Log -Skalen in der öffentlichen Kommunikation selten verwendet werden sollte, da sie nicht intuitiv leicht verstehen können. Wenn sie verwendet werden, muss es eine gute Erklärung geben, die ich hier nicht sehe.)

Um dies vielleicht klarer zu veranschaulichen, habe ich lineare und logarithmische Versionen der Daten angehängt. Für mich erzählen sie eine andere Geschichte. Die Protokollversion impliziert, dass es eine allgemeine, starke Korrelation zwischen dem Stromverbrauch und dem Professional -Kopf -BIP gibt. Die tatsächlichen Daten zeigen mir jedoch, dass die Korrelation nur unter einem bestimmten Schwellenwert vorhanden ist, und darüber haben wir excessive Unterschiede im Energieverbrauch in Ländern mit sehr ähnlichen BIP -Werten. (ZB ziemlich reiche Länder wie Dänemark/Schweiz mit einem sehr geringen Stromverbrauch.)

In Bezug auf Ihren Punkt über die kausale Schlussfolgerung ist dies wahrscheinlich auch ein gültiger Punkt, aber nicht wirklich das, was ich hier ankomme. Der Grund dafür ist, dass ich nicht glaube, dass der Weblog -Beitrag viel Aufmerksamkeit erregt, aber die Grafik wird sehr weit verbreitet.

Böck gepostet Eine längere Diskussion hier. Abgesehen von den oben diskutierten Problemen mit der Protokollskala und dem R-Squared hat der Relaxation seines Beitrags interessante Wirtschaftsinhalte.

Von admin

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert