Data Science 1 - Programmieren & Visualisieren
Saskia Otto
Universität Hamburg, IMF
Wintersemester 2022/2023
Modifiziert von: R for Data Science von Wickam & Grolemund, 2017 (lizensiert unter CC-BY-NC-ND 3.0 US).
“Once you made your data tidy data with the variables you need, there are two main engines of knowledge generation: visualisation and modelling. These have complementary strengths and weaknesses so they should always go together and any real analysis will iterate between them many times.
A good visualisation will show you things that you did not expect, or raise new questions about the data. A good visualisation might also hint that you’re asking the wrong question, or you need to collect different data. Visualisations can surprise you, but don’t scale particularly well because they require a human to interpret them.”
| aus R for Data Science
Exploration
Kommunikation
“Berinato highlights the important point that data viz is no longer being left just to the specialists: data scientists and professional designers. A new generation of data visualization tools, like datapine, and massive amounts of data make it easy for the layperson to create visualizations that communicate ideas far more effectively than spreadsheets and PowerPoint charts.”
| aus der Buchbesprechung von Sandra Durcevic zu Good Charts von Scott Berinato
In welcher visuellen Form sollen die Daten gezeigt werden?
2 Herangehensweisen:
Wenn wir eine visuelle Darstellung von Daten betrachten, dann versucht unser Gehirn gleich automatisch die vielen Formen, Größen, Positionen und Farben zu entschlüsseln (dekodieren), um ein besseres Verständnis der zugrundeliegenden quantitativen und kategorialen Variablen zu bekommen.
Als Visualisierer machen wir die Umkehrung durch die visuelle Kodierung, indem wir den Datenwerten visuelle Eigenschaften zuweisen.
→ Ziel ist, die Mischung an grafischen Elementen so zu wählen, dass die wichtigsten Informationen, die mitgegeben werden sollen, bei der Betrachtung der Grafik effektiv aufgenommen werden können.
01:00
Die Wahl des Diagrammtyps hängt von 3 Aspekten ab:
In den folgenden Folien werden die wichtigsten bzw. gebräuchlichsten Diagrammtypen vorgestellt.
03:00
Visuelle Repräsentation von Informationen und Daten mit einer Kombination aus Text, Bildern und Diagrammen: