Hatori Kibble

Jo eh…

Kursreihe „Data Science“ auf Coursera

with one comment

Das neue Arbeitsfeld des „data librarian“ war ja hier im Blog schon öfter Thema. Aber wie geht man eigentlich mit diesen Daten um? Auf Coursera gibt es eine Reihe von verschiedenen MOOCs zum Thema:

Johns Hopkins University – Data Science
In this course you will learn:

Formulate context-relevant questions and hypotheses to drive data scientific research
Identify, obtain, and transform a data set to make it suitable for the production of statistical evidence communicated in written form
Build models based on new data types, experimental design, and statistical inference

Die Reihe besteht aus 9 Modulen plus einem Abschlussprojekt. Den ersten Kurs habe ich bereits hinter mich gebracht:

The Data Scientist’s Toolbox

In this course you will get an introduction to the main tools and ideas in the data scientist’s toolbox. The course gives an overview of the data, questions, and tools that data analysts and data scientists work with. There are two components to this course. The first is a conceptual introduction to the ideas behind turning data into actionable knowledge. The second is a practical introduction to the tools that will be used in the program like version control, markdown, git, GitHub, R, and RStudio.

Dieses Modul ist ein guter Einstieg in die Thematik und viele der angesprochenen Werkzeuge wie git und GitHub lassen sich ja auch in anderen Kontexten nutzen.

R Programming

In this course you will learn how to program in R and how to use R for effective data analysis. You will learn how to install and configure software necessary for a statistical programming environment and describe generic programming language concepts as they are implemented in a high-level statistical language. The course covers practical issues in statistical computing which includes programming in R, reading data into R, accessing R packages, writing R functions, debugging, profiling R code, and organizing and commenting R code. Topics in statistical data analysis will provide working examples.

Auch das Erstellen von Statistiken und das Visualisieren von Daten betrifft einen größeren Kreis von Bibliothekarinnen. Die Programmiersprache R ist mir in letzter Zeit öfter untergekommen und dieser Kurs ist eine gute Gelegenheit da einmal reinzuschnuppern. Allerdings ist dieses Modul wesentlich anspruchsvoller als der vorherige. Ich bin gerade in Woche 3 und grüble über der Programmieraufgabe.

Mal sehen wie’s weitergeht und welche Module ich noch machen werde.

Ein wichtiger Tipp noch: Coursera versucht natürlich kostenpflichtige Zertifikate für diese Kurse zu verkaufen. Wenn man stattdessen mit einem „Statement of Accomplishment“ zufrieden ist, kann man die MOOCs auch gratis absolvieren.

 

Written by Peter

Juni 16, 2015 um 10:00 am

Veröffentlicht in Programmierung

Tagged with , , , , ,

Eine Antwort

Subscribe to comments with RSS.

  1. […] nun warum der gute alte Emacs im Werkzeugkasten der “data science” (vgl. dazu auch meinen letzten Artikel) vorhanden sein […]


Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: