-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathha-06-solutions.Rmd
186 lines (129 loc) · 6.1 KB
/
ha-06-solutions.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
---
title: "Hausaufgabe 06 - Treibhausgase"
author: "Füge deinen Namen hier hinzu"
date: "Füge das Datum hier hinzu"
output:
html_document:
toc: yes
toc_float: true
---
```{r setup, include=FALSE}
# Ich habe hier ein paar Standardeinstellungen für dich vorgenommen
knitr::opts_chunk$set(echo = TRUE, message = FALSE, warning = FALSE)
```
# Packages laden
```{r lade-packages2, message=FALSE}
# Ich habe die Packages bereits für dich geladen
library(readr)
library(dplyr)
library(tidyr)
library(ggplot2)
library(forcats)
library(DBI)
library(palmerpenguins)
```
# Tastaturkürzel
Ich habe hier nochmals die wichtigsten Tastaturkürzel für dich hinzugefügt
- **Einen neuen Code-chunk hinzufügen:** Ctrl + Alt + I
- **Code "Zeile für Zeile" innerhalb eines Code-chunks ausführen:** Ctrl + Enter
- **Den gesamten Code-chunk ausführen:** Ctrl + Shift + Enter
- **Die Pipe (%>%):** Ctrl + Shift + M
- **Der Zuweisungs-Operator (<-)**: Alt + -
# Übungen - Teil 1 - Projektarbeit
In diesem Teil der Hausaufgabe wird kein Code geschrieben.
# Übungen - Teil 2 - Treibhausgase
## Übung 1 - Daten importieren
1. Importiere Die CSV Ressource aus dem folgendenden Metadateneintrag in deine Arbeitsumgebung: https://opendata.swiss/de/dataset/treibhausgasemissionen-stadt-zurich-ohne-klimakorrektur-1990-20163
Dir sind zwei Wege bekannt um dies zu erreichen. Schau bei Bedarf im Praktikum 8 oder im Praktikum 9 nach.
2. Nutze den Namen `ghg` und den Zuweisungsoperator "<-" um die Daten in deiner Arbeitsumgebung zu speichern
3. Strick das Dokument und dann: git add, commit, push alle Veränderung zurück auf GitHub
```{r}
ghg <- read_csv("https://data.stadt-zuerich.ch/dataset/ugz_treibhausgasbilanz/download/ugz_treibhausgasbilanz.csv")
```
## Übung 2 - Daten transformieren und visualisieren
### 2.1 Pivoting
Die Daten sind derzeit in einem weiten Format. Das Ziel ist die Daten in ein langes Format zu bringen wobei nur die Spalte Jahr beibehalten wird und alle Spalten von Strom bis Heizoel_EL gedreht werden. Ich habe dir hier bereits etwas Code mit Lücken als Hilfestellung vorbereitet.
1. Erstelle ein neues Objekt in deiner Arbeitsumgebung (Environment), welches im langen Format ist. Fülle dazu die Lücken aus. Den Namen für das neue Objekt kannst du selbst auswählen.
2. In den Code-chunk Optionen für den folgenden Code-chunk, ersetze FALSE durch TRUE (eval=TRUE)
```{r, eval=FALSE}
ghg_long <- ghg %>%
pivot_longer(
# In diesem Argument werden die Spalten ausgewählt welche gedreht werden
col = !Jahr,
# In diesem Argument wird der Name für die neue Spalte definiert, welche
# die Namen aus den zuvor ausgewählten Spalten enthält
names_to = "Energietraeger",
# In diesem Argument wird der Name für die neue Spalte definiert, welche
# die Werte aus den zuvor ausgewählten Spalten enhält
values_to = "Emissionen"
)
```
```{r}
ghg_long <- ghg %>%
pivot_longer(cols = !Jahr,
names_to = "Energietraeger",
values_to = "Emissionen")
```
### 2.2 Daten zusammenfassen und neue Variable erstellen
1. Wieviele Spalten und Reihen hat das neue Objekt welches du im Schritt zuvor erstellt hast? **Beachte: Falls dies nicht 3 Spalten und 216 Reihen sind, gehe nochmals zur vorherigen Übung und überprüfe deinen Code**
2. Starte mit dem neu erstellten Objekt im langen Format, und erstelle eine Code Sequenz, in welcher:
- die Funktionen `group_by()` und `summarise()` um die Summe der Emmissionen pro Jahr zu berechnen
- die Funktionen `mutate()` und `lag()` die Differenz zwischen den Jahren berechnen
3. Speicher das Ergebnis als ein neues Objekt in deiner Arbeitsumgebung (Environment) mit einem Namen deiner Wahl
```{r}
ghg_long_sum <- ghg_long %>%
group_by(Jahr) %>%
summarise(
Summe = sum(Emissionen)
) %>%
mutate(Differenz = Summe - lag(Summe))
```
### 2.3 Daten visualisieren 1
1. Starte mit dem Objekt, welches du in Schritt 3 der vorheringen Übung erstellt hast
2. Erstelle ein Säulendiagram und lege das Jahr auf die x-Achse und die Differenz der Emissionen zwischen den Jahren auf die y-Achse
3. **Bonus:** Warum ist auf der x-Achse immer nur für alle zehn Jahre ein Tick mit Beschriftung?
4. **Bonus:** Wandle den Typen der Variable "Jahr" in einen Faktor um bevor du den Plot erstellst
5. **Bonus:** Passe das Layout des Plots beliebig an
```{r}
ghg_long_sum %>%
mutate(Jahr = factor(Jahr)) %>%
ggplot(aes(x = Jahr, y = Differenz)) +
geom_col()
```
### 2.4 Daten visualisieren 2 (Bonus)
1. Nutze das Objekt welches du in "2.1 Pivoting" erstellt hast, und:
- Nutze die Funktion `group_by()` um die Daten nach dem Jahr zu gruppieren
- Nutze die Funktion `filter()` um in der Spalte Jahr nur das Jahr 1990 und das Jahr 2016 anzuzeigen
- Wieviele Wege fallen dir ein um auf das Ergebnis zu kommen?
2. Speicher das Ergebnis als ein neues Objekt in deiner Arbeitsumgebung (Environment) mit einem Namen deiner Wahl
3. Nutze das neue Objekt um das Säulendiagram aus der Beschreibung der Hausaufgabe auf der Webseite für den Kurs zu reproduzieren
```{r}
ghg_long_filter <- ghg_long %>%
filter(Jahr == max(Jahr) | Jahr == min(Jahr))
# Zwei weitere Wege
# ghg_long %>%
# filter(Jahr %in% c(2016, 1990))
#
# ghg_long %>%
# filter(Jahr == 2016 | Jahr == 1990)
```
```{r}
ggplot(data = ghg_long_filter,
mapping = aes(x = Jahr,
y = Emissionen,
color = Energietraeger)) +
geom_line(size = 1) +
geom_point(size = 3) +
# Plot Styling ab hier
labs(title = "Treibhausgasemissionen in der Stadt Zürich, 1990 und 2016",
subtitle = "inklusive internationalem Flugverkehr, ohne Klimakorrektur",
y = "Treibhausgasemissionen [t CO2eq/Person]",
x = NULL,
caption = "Daten: https://data.stadt-zuerich.ch/dataset/ugz_treibhausgasbilanz",
fill = "Energieträger") +
scale_x_continuous(limits = c(1990, 2016),
breaks = c(1990, 2016)) +
scale_color_brewer(type = "qual") +
theme_minimal() +
theme(panel.grid.minor = element_blank())
```