Dies ist der dritte Artikel meiner Datenvisualisierungsreihe. Sehen Teil 1: „Datenvisualisierung erklärt: Was es ist und warum es wichtig ist.“” Und Teil 2: „Datenvisualisierung erklärt: Eine Einführung in visuelle Variablen.“.“
siehst du auf dem Bild unten?

Die meisten Menschen sehen vier: Weiß, Grün und zwei verschiedene Rosa-Rot-Töne. In Wirklichkeit sind diese beiden Farbtöne genau gleich; Das Bild enthält nur drei Farben.
Diese beliebte optische Täuschung verdeutlicht eine wichtige Tatsache, die bei der Gestaltung von Datenvisualisierungen berücksichtigt werden muss: Falsch gewählte Farbkombinationen können das menschliche Auge täuschen. Für eine vollständige Behandlung der Farbe müsste ich mich mit den physiologischen Particulars des menschlichen Auges befassen und lernen, wie wir Farben tatsächlich „sehen“.
Da es sich hierbei jedoch nicht um einen Optometrie-Artikel handelt, werde ich mich stattdessen auf die Grundlagen der Farbverwendung konzentrieren, die Sie zum Erstellen klarer Datenvisualisierungen benötigen.
Der Unterschied zwischen Farbton und Farbwert
Als ich visuelle Kodierungskanäle im einführte vorheriger ArtikelIch habe zwei verschiedene Kanäle im Zusammenhang mit Farbe vorgestellt: Farbton und Wert. Lassen Sie uns diese offiziell besprechen.
Farbton ist das, woran Sie im Allgemeinen denken, wenn Sie das Wort „Farbe“ hören. Rot, Grün, Blau, Rosa, Gelb usw. sind alle unterschiedlich Farbtöne. Farbwerthingegen bezieht sich auf die „Helligkeit“ eines einzelnen Farbtons. Das Bild unten zeigt verschiedene Werte der Regenbogenfarben und zeigt, wie derselbe Farbton stark in der Helligkeit/Sättigung variieren kann:
Während beides effektive visuelle Kodierungen sein kann (Eine ausführliche Diskussion über visuelle Kodierungen finden Sie in meinem vorherigen Artikel dieser Reihe) hat der Farbwert einen bemerkenswerten Vorteil gegenüber dem Farbton: Es ist weiterhin erkennbar, wenn eine Visualisierung in Graustufen gedruckt wird.
Arten von Farbskalen
Wenn Sie Farbe als visuelle Kodierung verwenden möchten, müssen Sie zunächst eine Farbskala auswählen. Dabei sind einige Besonderheiten zu beachten:
- Wenn Ihre Daten nominal sind, können Sie eine kategoriale Farbskala verwenden, die ausschließlich auf dem Farbton basiert.
- Für quantitative Daten müssen Sie zwei zusätzliche Entscheidungen treffen: 1) ob Ihre Skala sequentiell oder divergent sein soll (d. h. ob ein oder zwei Farbtöne verwendet werden) und 2) ob Ihre Skala kontinuierlich oder in Klassen unterteilt sein soll.
Somit stehen uns fünf Farbskalen zur Verfügung, die wir im Folgenden alle besprechen werden: 1) sequentiell und nicht klassifiziert, 2) sequentiell und klassifiziert, 3) divergent und nicht klassifiziert, 4) divergent und klassifiziert und 5) kategorisch (1).
Sequentielle Skalen (ein Farbton) eignen sich zur Visualisierung numerischer Werte, die von niedrig nach hoch reichen. Divergente Skalen können sich als hilfreich erweisen, wenn die Werte von negativ nach positiv gehen oder wenn der Designer einen Unterschied zwischen den Farben an zwei Enden der Skala hervorheben möchte.
Natürlich sind das nur allgemeine Regeln. Abhängig von der jeweiligen Visualisierung eignen sich verschiedene Arten von Skalen am besten, und manchmal können auch mehrere Skalen funktionieren.
Sequentiell und nicht klassifiziert
Die folgende Karte verwendet eine sequentielle, nicht klassifizierte Farbskala, um den Anteil der Australier darzustellen, die sich zum Zeitpunkt der Volkszählung 2011 als Anglikaner identifizierten. Wir können sehen, dass ein einzelner Farbton, nämlich Grün, von hell nach dunkel an Wert zunimmt. Da es nur eine Farbe gibt, gibt es keine Divergenz, und da die Skala kontinuierlich ist, gibt es keine Klassen.

Sequentiell und klassifiziert
Im Gegensatz zur obigen Visualisierung können wir sehen, dass die Karte der Vereinigten Staaten unten diskrete Klassen aufweist, die den Farbwert variieren. Es ist immer noch sequentiell, da nur ein rosa Farbton verwendet wird. Der Farbwert steigt, wenn der Anteil der Erwachsenen in den frühen Zwanzigern in einem Landkreis steigt.

Divergent, klassifiziert und nicht klassifiziert
Divergente Skalen sind etwas schwieriger zu verstehen, daher betrachten wir beide Typen zusammen in einem Vergleichsbeispiel. Dabei werden wir auch die unterschiedlichen Vorteile von klassifizierten und nicht klassifizierten Skalen erkennen.
Die beiden folgenden Diagramme wurden in Python mithilfe von Scheindaten generiert. Die Daten bestehen aus den folgenden visuellen Darstellungen (d. h. visuellen Kodierungskanälen):
- Die x-Achse besteht aus einer Zahl, die den Standort des Geschäfts angibt.
- Die Y-Achse stellt die Monate des Jahres dar.
- Die Farbe stellt einen „Kundenzufriedenheitswert“ dar, der von den fiktiven Geschäften über monatliche Umfragen erhoben wird.

Der klassifizierte vs. nicht klassifizierte Aspekt dieser Visualisierungen ähnelt weitgehend den oben aufgeführten sequentiellen Skalen. In der linken (nicht klassifizierten) Skala wird die Gesamtheit der Werte dargestellt, während in der rechten (klassifizierten) Skala die Farben gruppierte Wertebereiche darstellen. Die linke Visualisierung bietet mehr Präzision, die rechte ist jedoch einfacher zu interpretieren und anzuwenden.
Der divergente Aspekt dieser Skalen ist komplizierter. Lassen Sie es uns aufschlüsseln:
- Die abweichende Skala verwendet hier zwei Farben: Rot und Grün (nicht die am besten zugänglichen Farben der Welt, wie wir später in diesem Artikel sehen werden).
- Die neutrale, weiße Farbe (oder die beiden hellen Farben in der klassifizierten Skala) stellt einen logischen „Mittelpunkt“ in den Daten dar, der in diesem Fall der Wert ist 0.
- Dieser mittlere Punkt ist von entscheidender Bedeutung, da er zu einer Scenario führt, in der sich auf natürliche Weise eine divergierende Skala für die Daten ergibt. Es macht wenig Sinn, mehr als eine Farbe zu verwenden, wenn sich Werte nur in eine Richtung bewegen und kein sinnvolles Zentrum hat.
Kategorisch
Der letzte und wohl einfachste Farbskalentyp ist ein kategorischer. Die folgende Grafik zeigt die Aufschlüsselung der staatlichen Finanzierung in verschiedenen Ländern und liefert ein klares Beispiel.

Wenn Sie bisher auf die in diesem Kapitel besprochenen Prinzipien geachtet haben, werden Sie wahrscheinlich feststellen, dass es sich hier nicht um eine besonders intestine gestaltete Datenvisualisierung handelt. Es bringt den Gesamtgedanken zum Ausdruck, aber es gibt ein paar zu viele verschiedene Farben, was zu einem verwirrenden endgültigen Design führt.
Allerdings ist es eine effektive Verwendung einer kategorialen Skala, wenn dieser Skalentyp korrekt auf Nominaldaten (Daten mit unterschiedlichen, ungeordneten Kategorien) angewendet wird. Ein häufiger Fehler bei der Datenvisualisierung – und den Sie unbedingt vermeiden sollten – ist die Verwendung einer kategorialen Skala mit mehreren verschiedenen Farbtönen, wenn Ihre Daten einen deutlichen numerischen Anstieg oder Rückgang aufweisen. In solchen Situationen greifen Sie abhängig von Ihren spezifischen Daten auf eine der oben besprochenen Farbskalen zurück.
Das fasst die Grundlagen von Farbskalen zusammen, die Sie kennen müssen, um eine effektive Datenvisualisierung durchführen zu können. Schauen wir uns zum Abschluss noch ein paar Tipps für den guten Einsatz von Farbe an.
(Nicht) Verwenden Sie Farbe redundant
Es kann verlockend sein, Farbe in einer Visualisierung zu verwenden, wenn sie nicht benötigt wird. Es ist beispielsweise durchaus üblich, Balkendiagramme mit klaren X-Achsen-Beschriftungen zu sehen, um die Balken zu unterscheiden, die noch Balken unterschiedlicher Farbe haben.
Das ist nicht der Fall falschaber es kann unnötig sein. Wenn es nur wenige Kategorien gibt und diese mit anderen Visualisierungen verknüpft sind, sollten Sie auf jeden Fall Farbe verwenden, um einen zusätzlichen visuellen Hinweis zu geben. Wenn die Visualisierung jedoch ohne sie intestine funktioniert, sollten Sie sie nicht erzwingen.
Im Allgemeinen sollten alle redundanten Kodierungen (Darstellungen) vermieden werden, es sei denn, sie bieten dem Betrachter eine zusätzliche Erleichterung der Interpretation. Dies ist entweder verschwenderisch, da dieser Codierungskanal für eine andere Variable verwendet werden könnte, oder verwirrend, da der Betrachter feststellen muss, ob die zusätzliche Codierung etwas darstellt, das ihm über den Kopf geht.
Machen Sie Farbpaletten zugänglich
Dieser letzte Punkt ist kurz, aber unglaublich wichtig. Gehen Sie nicht einfach nur deshalb davon aus, dass Sie die Farben in einer Visualisierung unterscheiden können, und das können alle anderen auch. Datenvisualisierungen sollten für jeden zugänglich sein, auch für Menschen mit verschiedenen Arten von Farbenblindheit (2).
Betrachten Sie beispielsweise die Python-Visualisierungen im Abschnitt über abweichende Farbskalen oben. Glauben Sie, dass jemand mit einer Rot-Grün-Blindheit es richtig interpretieren kann? Unwahrscheinlich.
Glücklicherweise müssen wir nicht allzu viel zusätzliche Arbeit leisten, um sicherzustellen, dass unsere Visualisierungen zugänglich sind. Es gibt unzählige On-line-Instruments (3, 4, 5), die automatisch die Zugänglichkeit der von Ihnen gewählten Farbpaletten prüfen. Einige helfen Ihnen sogar dabei, sie zu erstellen. Nutzen Sie sie, um Ihre Visualisierungen so zugänglich wie möglich zu machen.
Letzte Gedanken
Glückwunsch! Mit dem dritten Artikel dieser Reihe haben Sie die wesentlichen Prinzipien kennengelernt, die Sie zum Entwerfen überzeugender Datenvisualisierungen benötigen. In den kommenden Artikeln werden wir endlich damit beginnen, unsere eigenen Visualisierungen zu entwerfen und zu erstellen! Bis dahin.
Referenzen
(1) https://weblog.datawrapper.de/which-color-scale-to-use-in-data-vis/
(2) https://www.nei.nih.gov/learn-about-eye-health/eye-conditions-and-diseases/color-blindness/types-color-vision-deficiency
(3) https://coolors.co/contrast-checker/112a46-acc8e5
(4) https://webaim.org/assets/contrastchecker/
(5) https://accessibleweb.com/color-contrast-checker/
