Data Science 1 - Programmieren & Visualisieren
Saskia Otto & Monika Eberhard
Universität Hamburg, IMF
Wintersemester 2024/2025
Ganz einfach …
…ein Algorithmus ist eine Reihe von Anweisungen, die Schritt für Schritt ausgeführt werden, um eine Aufgabe oder ein Problem zu lösen
Bildquelle links: Sommer Vektor erstellt von freepik; Bildquelle rechts: Stuhlanleitung von IKEA
Programmiersprachen sind formale Sprachen, mit denen sich Rechenvorschriften formulieren lassen. Diese Vorschriften können dann von einem Computer ausgeführt werden.
Säulendiagramm der häufigsten Programme und Sprachen bei akademischen ‘data scientists’ (links) and Statistikern (rechts).
Datenquelle: Kaggle Survey, 2017
x <- 10
var x = 10;
Beispiel
if (Bedingung) {
ausführen
}
if (x < 20) {
print("Stimmt, x ist kleiner als 20!")
}
if (Bedingung) {
ausführen;
}
if (x < 20) {
alert("Stimmt, x ist kleiner als 20!");
}
Beispiel
for (i in 1:10) {
print(i)
}
for (i=0; i < 10; i++) {
alert(i);
}
Beispiel
sag_hallo <- function(name) {
print(paste("Hallo", name))
}
sag_hallo("Jan")
sag_hallo("Lena")
function sagHallo(name) {
alert("Hallo " + name);
}
sagHallo("Jan");
sagHallo("Lena");
“R is a system for statistical computation and graphics. It is a GNU project which is similar to the S language and environment which was developed at Bell Laboratories by John Chambers and colleagues. R can be considered as a different implementation of S…..R is available as Free Software under the terms of the Free Software Foundation’s GNU General Public License in source code form. It compiles and runs on a wide variety of UNIX platforms, Windows and MacOS.” | aus: http://r-project.org/
Link Youtube video: R The most powerful and most widely used statistical software
Direkt auf der Website https://cran.r-project.org
Link zur Website: https://www.jetbrains.com/de-de/lp/devecosystem-2021/r/
Unsere Workbench über den Webbrowser nutzen.
Link zur Webadresse der Workbench
Über Tools > Global Options > Pane Layout:
Vorteile
2+2
Vorteile von Projekten
In seiner einfachsten Form ist R vergleichbar mit einem einfachen Taschenrechner.
Folgende arithmetische Operatoren gibt es:
R hat aber auch Funktionen mit denen man anspruchsvollere Manipulationen durchführen kann, die durch Klammern kombinierbar sind:
Tip
Reihenfolge der Berechnung: von der innersten zur äußersten Klammer:
sqrt(9)
und exp(2)
(sqrt = square root, exp = exponent) ausführen,12
zum Ergebnis von sqrt(9)
und 1
zum Ergebnis von exp(2)
addieren,Wenn das sog. prompt Zeichen von “>” zu “+” wechselt, ist das ein Zeichen, dass der Befehl noch nicht zu Ende ist. Meist fehlen eine oder mehrere schließende Klammern. Führe entweder den Befehl zu Ende oder drücke (2mal) auf esc.
Jede Funktion hat seine eigene Hilfe die mit help()
oder ?
aufgerufen werden kann:
mean()
| 1mean()
| 2Dieses Diagramm basiert auf einer Modifikation des Codes von Andrie de Vries Blog Post.
Die von CRAN offiziell anerkannten Versionen können direkt über die Funktion install.packages()
installiert werden:
Ein Paket muss für jede Sitzung geladen werden, um auf die Funktionen zugreifen zu können. Dazu gibt es die Funktion library()
. R überprüft dann erstmal, ob dieses Paket auch installiert ist.
Pakete werden einfach mit detach()
deaktiviert …
.. oder indem das Häkchen neben dem Paketnamen im ‘Packages’ Reiter entfernt wird:
sqrt()
).Link zur Webadresse der Workbench
Link zur Webadresse der Workbench
Kursübersicht
Erklärung zum Code
swirl()
Funktion (bei jeder session):
… im swirl-Kurs werden Sie direkt an die Hand genommen und Stück für Stück angeleitet.
Dann testen Sie doch Ihr Wissen in folgendem Abschlussquiz…
Bei weiteren Fragen: saskia.otto(at)uni-hamburg.de
Diese Arbeit is lizenziert unter einer Creative Commons Attribution-ShareAlike 4.0 International License mit Ausnahme der entliehenen und mit Quellenangabe versehenen Abbildungen.
Kurswebseite: Data Science 1