Die Gefahren von täuschenden Daten – Konfusenkarten und irreführende Schlagzeilen

„Sie müssen kein Experte sein, um jemanden zu täuschen, obwohl Sie möglicherweise etwas Fachwissen benötigen, um zuverlässig zu erkennen, wann Sie getäuscht werden.“

Wenn mein Co-Instruktor und ich unsere vierteljährliche Lektion über irreführende Visualisierungen für den Datenvisualisierungskurs an der Universität von Washington beginnen, betont er unseren Schülern den obigen Punkt. Mit dem Aufkommen moderner Technologie ist es einfacher als je zuvor, hübsche und überzeugende Behauptungen über Daten zu entwickeln. Jeder kann etwas machen, das passabel erscheint, aber Versehen enthält, die es ungenau und sogar schädlich machen. Darüber hinaus gibt es auch böswillige Schauspieler, die aktiv aktiv sind wollen Um Sie zu täuschen und wer einige der besten Möglichkeiten studiert hat, dies zu tun.

Ich beginne diesen Vortrag oft mit einer Artwork Witz, schaue meine Schüler ernst und stelle zwei Fragen:

„Ist es eine gute Sache, wenn jemand dich gaslicht?“
Nach dem allgemeinen Murmeln der Verwirrung, gefolgt von einer Vereinbarung, dass Gaslicht in der Tat schlecht ist, stelle ich die zweite Frage: „Was ist der beste Weg, um sicherzustellen, dass Sie jemals von niemandem gaslicht?“

Die Schüler denken im Allgemeinen über diese zweite Frage nach, bevor sie ein wenig kichern und die Antwort erkennen: Es ist zu lernen, wie Menschen in erster Linie gaslicht. Nicht, damit Sie andere ausnutzen können, aber Sie können verhindern, dass andere Sie ausnutzen.

Gleiches gilt im Bereich der Fehlinformation und Desinformation. Menschen, die Daten irreführen möchten, werden mit einer Vielzahl von Instruments befugt, vom Hochgeschwindigkeits-Web über soziale Medien bis zuletzt generative KI und große Sprachmodelle. Um sich davor zu schützen, in die Irre geführt zu werden, müssen Sie ihre Tips lernen.

In diesem Artikel habe ich die wichtigsten Ideen aus meiner Einheit meines Datenvisualisierungskurses für Täuschung – nach Alberto Cairos hervorragendem Buch, übernommen Wie Diagramme Lüge– und erweiterte sie zu einigen allgemeinen Grundsätzen über Täuschung und Daten. Ich hoffe, dass Sie es lesen, verinnerlichen und es mitnehmen, um sich gegen den Ansturm von Lügen zu bewaffnen, die von schlecht abhängigen Menschen verewigt werden, die mit Daten betrieben werden.

Menschen können den Bereich nicht interpretieren

Zumindest nicht so intestine wie wir andere visuelle Hinweise interpretieren. Lassen Sie uns dies mit einem Beispiel veranschaulichen. Angenommen, wir haben einen extrem einfachen numerischen Datensatz. Es ist eine dimensionale und besteht aus nur zwei Werten: 50 und 100. Eine Möglichkeit, dies visuell darzustellen, ist die Länge der Balken wie folgt:

Dies gilt den zugrunde liegenden Daten. Die Länge ist eine eindimensionale Menge, und wir haben sie verdoppelt, um eine Verdoppelung des Wertes anzuzeigen. Aber was passiert, wenn wir dieselben Daten mit Kreisen darstellen wollen? Nun, Kreise sind nicht wirklich durch eine Länge oder Breite definiert. Eine Choice besteht darin, den Radius zu verdoppeln:

Hmm. Der erste Kreis hat einen Radius von 100 Pixel und der zweite einen Radius von 50 Pixel – dies ist additionally technisch korrekt, wenn wir den Radius verdoppeln wollten. Aufgrund der Berechnung dieser Fläche (πR²) haben wir die Fläche jedoch viel mehr als verdoppelt. Was ist, wenn wir das nur versuchen würden, da es visuell genauer erscheint? Hier ist eine überarbeitete Model:

Jetzt haben wir ein anderes Downside. Der größere Kreis ist mathematisch doppelt so groß wie der kleinere, aber nicht mehr Aussehen Auf diese Weise. Mit anderen Worten, obwohl es sich um einen visuell genauen Vergleich einer doppelten Menge handelt, haben menschliche Augen Schwierigkeiten, sie wahrzunehmen.

Das Downside hier ist es, den Bereich als visuelle Marker überhaupt zu nutzen. Es ist nicht unbedingt falschaber es ist verwirrend. Wir erhöhen einen eindimensionalen Wert, aber die Fläche ist eine zweidimensionale Menge. Für das menschliche Auge wird es immer schwierig sein, genau zu interpretieren, insbesondere im Vergleich zu einer natürlicheren visuellen Darstellung wie Balken.

Nun, dies magazine so aussehen, als wäre es kein großes Geschäft – aber schauen wir uns an, was passiert, wenn Sie dies auf einen tatsächlichen Datensatz erweitern. Im Folgenden habe ich zwei Bilder von Diagrammen eingefügt, die ich in Altair gemacht habe (ein Python-basierter Visualisierungspaket). Jedes Diagramm zeigt die maximale Temperatur (in Celsius) in der ersten Woche des Jahres 2012 in Seattle, USA. Der erste verwendet die Balkenlängen, um den Vergleich zu machen, und der zweite verwendet Kreisbereiche.

Welches erleichtert es, die Unterschiede zu erkennen? Die Legende hilft im zweiten, aber wenn wir ehrlich sind, ist es eine verlorene Sache. Es ist viel einfacher, präzise Vergleiche mit den Balken zu machen, selbst in einer Umgebung, in der wir so begrenzte Daten haben.

Denken Sie daran, dass der Punkt einer Visualisierung darin besteht, Daten zu klären – um versteckte Traits für die durchschnittliche Particular person leichter zu erkennen. Um dieses Ziel zu erreichen, ist es am besten, visuelle Hinweise zu verwenden, die den Prozess der Unterscheidung vereinfachen.

Hüten Sie sich auf politische Schlagzeilen (in jede Richtung)

Es gibt eine kleine Trick -Frage, die ich meinen Schülern manchmal in der vierten Unterrichtswoche auf eine Hausaufgabe stelle. Die Aufgabe beinhaltet hauptsächlich die Erstellung von Visualisierungen in Python – aber für die letzte Frage gebe ich ihnen ein Diagramm, das ich selbst generiert habe, begleitet von einer einzelnen Frage:

FRAGE: Eine Sache ist mit dem obigen Diagramm ungeheuerlich schief, ein unverzeihlicher Fehler in Datenvisualisierung. Was ist das?

Die meisten denken, dass es etwas mit den Achsen, Markierungen oder einem anderen visuellen Aspekt zu tun hat, was häufig Verbesserungen wie das Füllen der Kreise oder die Informationsbezeichnungen der Achse aufmerksam macht. Das sind gute Vorschläge, aber nicht die dringendsten.

Das fehlerhafteste Merkmal (oder das Fehlen davon, eher) in der obigen Tabelle ist die fehlender Titel. Ein Titel ist entscheidend für eine effektive Datenvisualisierung. Wie sollen wir ohne sie wissen, worum es in dieser Visualisierung überhaupt geht? Ab sofort können wir nur feststellen, dass es über eine Zeitspanne von Jahren vage etwas mit Kohlendioxidspiegeln zu tun hat. Das ist nicht viel.

Viele Leute, die das Gefühl haben, dass diese Anforderung zu streng ist. Leider ist diese Denkweise viel zu idealistisch; In Wirklichkeit muss eine Visualisierung allein stehen, da sie oft das einzige sein wird, worauf die Menschen sich ansehen-und in sozialen Medienblasen wird das einzige, was weit verbreitet wird. Infolgedessen sollte es einen Titel haben, um sich selbst zu erklären.

Natürlich sagt der Titel dieses Unterabschnitts, dass Sie sich vor solchen Schlagzeilen misstrauen sollen. Das ist wahr. Während sie notwendig sind, sind sie ein zweischneidiges Schwert. Da die Visualisierungsdesigner wissen, dass die Zuschauer auf den Titel achten, können uneinheitliche, die Menschen auch in weniger als genaue Richtungen beeinflussen. Schauen wir uns ein Beispiel an:

Die Gefahren von täuschenden Daten – Konfusenkarten und irreführende Schlagzeilen

Menschen können den Bereich nicht interpretieren

Hüten Sie sich auf politische Schlagzeilen (in jede Richtung)

Verwenden Sie nicht 3D. Bitte.

Letzte Gedanken

Von admin

Schreibe einen Kommentar Antworten abbrechen

Versäumt

Der „Adventskalender“ für maschinelles Lernen, Tag 13: LASSO und Ridge-Regression in Excel

Wer will kein Kinderimpfungsgesetz?

10 Möglichkeiten, die Inferenzkosten mit OpenAI-LLMs zu senken

Agentische KI vs. generative KI: Hauptunterschiede für Unternehmen

About

Categories

Tags

Recent Post

Der „Adventskalender“ für maschinelles Lernen, Tag 13: LASSO und Ridge-Regression in Excel

Wer will kein Kinderimpfungsgesetz?

Menschen können den Bereich nicht interpretieren

Hüten Sie sich auf politische Schlagzeilen (in jede Richtung)

Verwenden Sie nicht 3D. Bitte.

Letzte Gedanken

Von admin

Ähnlicher Beitrag

Schreibe einen Kommentar Antworten abbrechen

Versäumt