Skip to content

Visualizations

Stefan Kasberger edited this page Apr 8, 2018 · 1 revision

Informationen zu Visualisierungen: Beispiele, Praktisches etc.

Inhaltsverzeichnis

Projekte

Personen

  • Michael Kreil
  • Flooh Perlot

Visualisierungs-Arten

  • Minima-Maxima Auflistungen.
  • Wahlbeteiligung
  • Kandidat_innen
  • Zugewinn/Verlust letze Wahl
  • Ergebnisse nach Parteien/Kandidat_innen
  • Wahlbeteiltung
  • Gewinner

All statistics here can be split by demographics and by geography (using maps); probably gives some nice insights; i would especially be interested in doing something with maps (jonas)

Beispiele

Kampagnen

Vorwahlen

Prognosen

Polls

Ergebnisse

Anderes

Tools

Tipps Flooh Perlot

Ein paar allgemeine Punkte zur Visualisierung von Wahldaten (flooh):

  • Die Idee einer Visualisierung ist, etwas grafisch so darzustellen, dass es auch grafisch verstanden (sprich ohne die genauen Daten) werden kann
  • Das heißt aber nicht, dass man auf Zahlen verzichten muss, diese können oftmals die nötige Präzision liefern, die visuell nicht wahrnehmbar ist - wenn man aber die Zahlen benötigt, um die Grafik zu verstehen, kann man sich aber auch überlegen, ob eine Tabelle nicht sinnvoller wäre (was keine Schande ist)
  • Alles in allem würde ich eher der Klarheit der Grafik den Vorzug vor zu exotischen Darstellungen geben - aber wie alle "Regeln" lässt sich das trefflich widerlegen, so sind gerade ungewohnte Grafiken gut, um Gewohntes neu darzustellen und vielleicht einen anderen Aspekt zu betonen (und letzten Endes auch ein bisschen cool - http://dhayton.haverford.edu/wp-content/uploads/2015/03/Screen-Shot-2015-03-14-at-2.46.52-PM.png)
  • Visualisierungen dürfen denke ich auch "lustig" sein, “cool” sein (technisch oder inhaltlich), ohne immer seriös genau die Daten auf die letzte Kommastelle genau darstellen zu müssen - es steht und fällt mit dem Anspruch, den die Grafik (und man selbst) stellt
  • Was einem immer klar sein sollte: Im Zweifel schlägt der optische Eindruck/das Bild jeden Erklärungstext, den man der Grafik beifügt

Konkrete Fragen vorab/danach:

  • Sind die notwendigen Daten (halbwegs) greifbar?
  • Was für alternative Quellen gibt es (zb für alles rund um die Bevölkerung siehe Statistik Austria, http://www.statistik.at - kann allerdings mühsam sein)
  • Ziel der Visualisierung: Geht es eher um ein generelles "Wie schauen die Daten eigentlich aus?" (explorativ), oder will man etwas bewusst zeigen?
  • Wenn die Grafik fertig ist sich selbst fragen: Kann das stimmen? Ist der Balken, der einen doppelt so großen Wert darstellt, auch doppelt so groß? usw.

Arten von Visualisierungen:

Weitere Überlegungen:

  • eher matte/gedeckte Farben verwenden anstelle greller Farben (zb laden die Parteien in Österreich zu "rot", “schwarz”, “blau”, “grün” usw. in der Urform ein - da gibt es aber deutlich schönere Farbtöne dafür, siehe praktisch alle Online-Medien)
  • zu viele unterschiedliche Farben verwirren eher - daher kann man sich fragen, warum etwas eine bestimmte Farbe hat, drückt das etwas aus oder ists nur Zierde? Bedeuten unterschiedliche Farben einen qualitativen Unterschied?
  • Bei der Farbwahl kann/sollte man auch an "Farbenblindheit" denken, v.a. Rot-Grün-Sehschwäche, und wenn möglich alternative Farben in Betracht ziehen
  • weiß bzw. Leere kann effektiv sein, um Elemente voneinander zu trennen und gleichzeitig nicht weitere Elemente einbauen zu müssen (etwas mehr Abstand macht zb Trennstriche überflüssig)
  • Bei vielen Datenpunkten kommt es zwangsläufig zu Überlappungen - kann man in Kauf nehmen, bewusst einzelne Elemente (zb farbig) betonen, Elementen eine gewisse Transparenz geben, oder zb interaktiv lösen, indem Elemente bei mouseover nach vorne geholt werden usw.
  • Mut zur Lücke: Eine Visualisierung setzt nicht zwangsläufig einen kompletten Datensatz voraus, man kann auch Lücken entsprechend darstellen - das kann mitunter sogar erhellend sein; wichtig ist ein halbwegs transparenter Umgang damit, sprich was "weiß" ich aufgrund der Daten, und was eben nicht (https://www.youtube.com/watch?v=JqzAuqNPYVM)
  • Ungenauigkeit: Daten/Zahlen suggerieren oft eine Genauigkeit, die nicht zutrifft (siehe Umfragen, "Schwankungsbreiten"); gleichzeitig können Zahlen auch ungenau sein (siehe statistische Daten über die Wohnbevölkerung) - auch hier kann und sollte man damit umgehen, was kann man darstellen, und was eben nicht (perfekte Daten gibt es praktisch nicht)

Generelle Überlegungen Wahldaten:

  • in der Datenquelle soweit wie möglich absolute Zahlen verwenden - das Umrechnen in Prozent geht immer und man kann selbst die Genauigkeit bestimmen, das Rückrechnen von Prozent ist zwangsläufig ungenau; sprich man bleibt flexibler
  • Skalierung von Daten: Häufig verwendet man eine lineare Skala (gleichmäßige Aufteilung der Werte auf einen gegebenen Bereich, z.B. 100% auf 1.000 Pixel = 1% enspricht 10 Pixel), das ist optisch auch am leichtesten nachzuvollziehen und zu verstehen
  • die Skalierung ist extrem wichtig, sie entscheidet darüber, ob ein Unterschied visuell groß oder klein/überhaupt vorhanden ist (zb Umfrageverlauf einer Partei in einem Schwankungsbereich von +/-4 Prozentpunkten - schaut auf einer Skala von 0-100 extrem stabil aus, auf einer Skala von 0-10 höchst dramatisch)
  • schön wäre, wenn man zumindest nicht bewusst eine Grafik so "verzerrt", dass eine Aussage herauskommt, die man sich wünscht - alles ist subjektiv, aber ein Schritt zurück und ein Blick auf das Gesamtbild schaden nicht
  • vor allem bei Balken/Säulen: es gibt nur wenige Gründe, eine y-Achse nicht bei 0 zu beginnen (gilt auch für Line Charts im Wahlzusammenhang)
  • rein grafische Darstellungen sind gut, aber oftmals bringt es viel, einzelne Elemente hervorzuheben, um den User auf spezielle Fälle aufmerksam zu machen oder etwas Kontext zu schaffen (siehe zb http://strategieanalysen.at/umfragen/)
  • Zahlen sprechen nur recht selten für sich selbst

Österreich-spezifische Überlegungen und (vermeintliche) Banalitäten:

  • "Know your Wahlrecht": zb Stimmenanteile berechnen sich immer nur auf die gültigen Stimmen; Wahlkarten werden bundesweit nur auf Bezirksebene gezählt, Gemeindeergebnisse sind immer ohne Wahlkarten (bei "Gemeinden" wie Linz oder Graz können Bezirk und Gemeinde identisch sein);
  • Daher enthalten die Excel-Dateien des BMI auch viele zusätzliche Ergebniszeilen neben den Gemeinden, die man je nach Bedarf filtern muss (Bezirke gesamt, nur Wahlkarten Bezirk, Wahlkreis, Bundesland gesamt usw.)
  • das BMI (nicht nur) nutzt in den Namen von Bezirken - speziell Wien - teilweise Beistriche, was beim Export als CSV problematisch sein kann - sollte vorab geändert werden
  • Beim Export aus Excel auf das encoding achten, da sonst alle Umlaute in den Gemeindenamen verloren gehen
  • In deutschsprachigen Programmen werden Kommazahlen mit "," getrennt, ein “.” steht als Tausendertrennzeichen - im englischsprachigen Raum ist das umgekehrt, was man unbedingt beachten sollte
  • Die Ergebnisdateien enthalten normalerweise eine Gemeindekennziffer: Das ist die Unique Id jeder Gemeinde, jedes Bezirks usw. - die erste Stelle steht immer für das Bundesland (1=Burgenland, 2=Kärnten usw), die ersten drei Stellen für den politischen Bezirk - das erlaubt teilweise sehr einfache Filterungen
  • Österreich hat auf der einen Seite sehr viele sehr kleine Gemeinden, und auf der anderen Seite Wien (und Graz) - eine lineare Skalierung ist daher meistens nicht zielführend, wenn man mit absoluten Zahlen arbeitet, da Wien alles überragt
  • eine Alternative kann eine kategoriale Skala sein, eine nicht lineare Skala usw. - das Zerlegen von Wien in seine Bezirke hilft im Übrigen weniger, als man vielleicht glaubt, da Bezirke wie die Donaustadt mit über 100.000 Wahlberechtigten die lineare Skalierung auch schwierig machen
  • 2015 wurden in der Steiermark viele Gemeinden zusammengelegt, 2016 Gemeinden in Oberösterreich, 2017 gibt es Änderungen bei den Bezirken in NÖ - das alles zieht auch Änderungen der Gemeindekennziffern nach sich, was die Kombination von aktuellen Kartendaten und früheren Wahlergebnissen erschwert (siehe http://strategieanalysen.at/wahlen/geojson/ für "alte" Versionen vor Mitte 2013)