Hatori Kibble

Jo eh…

Kursreihe „Data Science“ auf Coursera

with one comment

Das neue Arbeitsfeld des „data librarian“ war ja hier im Blog schon öfter Thema. Aber wie geht man eigentlich mit diesen Daten um? Auf Coursera gibt es eine Reihe von verschiedenen MOOCs zum Thema:

Johns Hopkins University – Data Science
In this course you will learn:

Formulate context-relevant questions and hypotheses to drive data scientific research
Identify, obtain, and transform a data set to make it suitable for the production of statistical evidence communicated in written form
Build models based on new data types, experimental design, and statistical inference

Die Reihe besteht aus 9 Modulen plus einem Abschlussprojekt. Den ersten Kurs habe ich bereits hinter mich gebracht:

The Data Scientist’s Toolbox

In this course you will get an introduction to the main tools and ideas in the data scientist’s toolbox. The course gives an overview of the data, questions, and tools that data analysts and data scientists work with. There are two components to this course. The first is a conceptual introduction to the ideas behind turning data into actionable knowledge. The second is a practical introduction to the tools that will be used in the program like version control, markdown, git, GitHub, R, and RStudio.

Dieses Modul ist ein guter Einstieg in die Thematik und viele der angesprochenen Werkzeuge wie git und GitHub lassen sich ja auch in anderen Kontexten nutzen.

R Programming

In this course you will learn how to program in R and how to use R for effective data analysis. You will learn how to install and configure software necessary for a statistical programming environment and describe generic programming language concepts as they are implemented in a high-level statistical language. The course covers practical issues in statistical computing which includes programming in R, reading data into R, accessing R packages, writing R functions, debugging, profiling R code, and organizing and commenting R code. Topics in statistical data analysis will provide working examples.

Auch das Erstellen von Statistiken und das Visualisieren von Daten betrifft einen größeren Kreis von Bibliothekarinnen. Die Programmiersprache R ist mir in letzter Zeit öfter untergekommen und dieser Kurs ist eine gute Gelegenheit da einmal reinzuschnuppern. Allerdings ist dieses Modul wesentlich anspruchsvoller als der vorherige. Ich bin gerade in Woche 3 und grüble über der Programmieraufgabe.

Mal sehen wie’s weitergeht und welche Module ich noch machen werde.

Ein wichtiger Tipp noch: Coursera versucht natürlich kostenpflichtige Zertifikate für diese Kurse zu verkaufen. Wenn man stattdessen mit einem „Statement of Accomplishment“ zufrieden ist, kann man die MOOCs auch gratis absolvieren.

 

Advertisements

Written by Peter

Juni 16, 2015 at 10:00 am

Veröffentlicht in Programmierung

Tagged with , , , , ,

Neulich im Feedreader (Teil XVI): Passkontrolle und Aktivismus in Bibliotheken, Daten und Detektivisches

leave a comment »

Diese Rubrik eignet sich doch hervorragend um sich wieder vorsichtig ans Bloggen ranzutasten…

the term microaggression gained momentum in academic scholarship about racism in the early 2000s to denote the small ways systemic racism plays out“

stellt die Autorin das Konzept des „Mikroaktivismus“ vor, kleine Aktivitäten (z.B. einfach mal feministische Beispiele bei Datenbankschulungen verwenden) mit denen sich BibliothekarInnen in der täglichen Arbeit gegen Diskriminierung und für benachteiligte Gruppen einsetzen können. (via @glaserti)

 

Written by Peter

Juni 15, 2015 at 9:23 pm

Veröffentlicht in Neulich im Feedreader

Tagged with , ,

Blick zurück und dann einen Gang runter schalten…

leave a comment »

2014 war ein ziemlich aktives Jahr hier im Blog. 68 Artikel pro Jahr sind hier neuer Rekord. Einerseits gab es durch die Ironblogger den sanften Druck jede Woche einen Beitrag zu schreiben, andererseits hatte ich durch die ELAG, den Bibliothekartag und den IFLA-Kongress einiges an Material zu verwerten.

word cloud 2014

Wordcloud 2014

Die Auswertung mit Wordle spiegelt das auch wider: „Vortrag“ und „Session“ finden sich prominent, auch „Bibliothek“ in allen möglichen Variationen und natürlich war auch der EuropeanaBot wieder Thema.

2015 wird es hier allerdings etwas ruhiger werden, aus privaten Gründen schichte ich temporär meine Freizeitaktivitäten gerne etwas um. Darum bin auch aus dem Kreis der IronbloggerInnen wieder raus. In Zukunft gibt es hier – wie auch schon in letzter Zeit – keine wöchentlichen Posts mehr sondern in unregelmäßigen Abständen neue Beiträge. Ganz einschlafen wird „Hatori Kibble“ aber auf keinen Fall.

Written by Peter

Januar 8, 2015 at 5:02 pm

Veröffentlicht in Allgemein

Tagged with

Neulich im Feedreader (Teil XV): Twitter Bots, eine API Suchmaschine und eine Satellitenbibliothek für die Menschheit

leave a comment »

In studying user behavior, we both are interested in how people discover, access, and use/reuse content.  In an early outline for our report we wrote “We want to know how people are getting their information, why they are making these choices, and what information or sources are meeting their needs.”

Written by Peter

November 23, 2014 at 9:54 pm

Veröffentlicht in Neulich im Feedreader, Programmierung

Tagged with , , ,

Britischer Humor: Dank der British Library jetzt auch mechanisch, viktorianisch…

leave a comment »

mechnaicalcomedienIch hatte ja schon einmal über die British Library Labs und deren Projektwettbewerb geschrieben. Gewinner 2014 war die „Victorian Meme Machine“ „Victorian Meme Machine“.

Auf einem Symposium Anfang November wurde nun der aktuelle Stand dieses Projekts berichtet (die Notizen zum Vortrag gibt es im Blog Overdue Ideas).

Interessanterweise gibt es bei der Textgattung „Witze“ ganz eigene Probleme bei der Arbeit mit Digitalisaten:

Some gags have been rendered more successfully than this, but many are substantially worse. Joke columns often appeared at the edge of a page, which makes them susceptible to fading and pge bending. They also make use of unusual punctuation, which tends to confuse the scanning software. Unlike newspaper archives, which remain functional even with relatively low-quality OCR, our project requires 100% accuracy (or something very close) in order to republish the jokes in new formats.

Für die Ergebnisse wurde ein Tumblr Blog eingerichtet: der „Mechanical Comedian“ (auch einen Twitter-Account gibt es, der wird aber anscheinend noch nicht bespielt). Mal sehen, ob man in der nächsten Session hier in Kölle olle Kamellen wie diese hört:

A gentleman sitting drinking alone, with three empty bottles, which had contained port wine, beside him, was asked: „Have you finished all that port without assistance?“ „No,“ replied the wine-bibber, „I had assistance of a bottle of Madeira“

Written by Peter

November 16, 2014 at 7:48 pm

Neulich im Feedreader (Teil XIV): Software und Homepages in Bibliotheken, Vorträge und Daten

leave a comment »

Und schon wieder naht die IronBlogger-Deadline bedrohlich…

Written by Peter

November 9, 2014 at 10:47 pm

Veröffentlicht in Google, koha, Neulich im Feedreader, Software

Tagged with , ,

Erste StipendiatInnenberichte zur IFLA Tagung in Lyon online

leave a comment »

Eine der Bedingungen für die Bewilligung eines Reisekostenstipendiums von BI International war die Bereitschaft einen Bericht über die Kongressteilnahme zu verfassen (auch von mir gab es – zusätzlich zu den Blogbeiträgen – einen kleinen Text).

Auf der Seite des IFLA-Nationalkomittees wurden diese Berichte zur heurigen IFLA-Tagung in Lyon unlängst online gestellt und können dort gelesen werden. Noch ist die Ausbeute etwas mager, aber ich bin sicher die Liste wird noch ergänzt werden.

Natürlich ist der August jetzt auch schon wieder lange her und die Berichterstattung dadurch nicht wirklich zeitnah. Daher fand ich das Experiment ziemlich vielversprechend auf die klassischen Berichte zu verzichten und die GewinnerInnen der Orientierungsstipendien per Blog von der Tagung berichten zu lassen. Diese Artikel waren eine gute Ergänzung zur Berichterstattung der KollegInnen vom (deutschsprachigen) IFLA Express.

Wahrscheinlich liegt dieses Format aber nicht jeder Stipendiatin/jedem Stipendiaten. Vielleicht könnten die Richtlinien so ergänzt werden, dass man selber entscheiden kann in welcher Form man berichtet? Wichtig ist ja der Inhalt und nicht so sehr das Format.

 

 

Written by Peter

Oktober 27, 2014 at 9:55 am

Veröffentlicht in Konferenzen, wlic2014

Tagged with ,