Das Kölner OK Lab: einfach mal in der Wikipedia sitzen, Bier trinken und programmieren
So, erst mal vorsichtig den Staub hier wegpusten…
Über ganz Deutschland verteilt gibt es OK Labs, regionale Gruppen von ProgrammiererInnen, DesignerInnen oder interessierten BürgerInnen, die sich für offene Daten und ihre Anwendungsmöglichkeiten interessieren.
Die Kölner Gruppe beschreibt sich so:
Das Kölner OK Lab ist eine regionale Gruppe von Designern, Entwicklerinnen, Journalisten und Anderen, die sich regelmäßig treffen, um an nützlichen Anwendungen rund um Offene Daten zu arbeiten.
Unser Treffen findet alle zwei Wochen statt. Schaut einfach in unserer Meetup Gruppe vorbei!
Wir entwickeln Anwendungen, die Kölner Spielplätze oder Denkmäler auf Karten zeigen, für Tiere aus Kölner Tierheimen per Twitter ein Zuhause suchen oder in 3D zeigen, wie viele junge Menschen wo in Köln wohnen.
Andere Projekte der Gruppe sind z.B.: „OpenAir Cologne“, ein Netzwerk selbstentwickelter Sensoren um die Stickstoffdioxid Belastung in der Stadt messen zu können, oder „KVB Fahrräder“, eine Webseite um die (errechnete) Nutzung der Fahrräder zu visualisieren.
Viele der Anwendungen nutzen auch Datensätze die über das Portal „Offene Daten Köln“ zur Verfügung gestellt werden. Für meine Projekte habe ich etwa folgende Quellen benutzt:
- Aktueller Pegelstand des Rheins, bereitgestellt von den Stadtentwässerungsbetrieben Köln
Mein Twitterbot @koelnpegelbot nutzt diese Schnittstelle um über den aktuellen Wasserstand zu informieren. Der Bot kredenzt dazu noch eine kölsche Lebensweisheit oder rechnet den Pegelstand lokalspezifisch in Kölschstangen um. (GitHub Repository)
Der Pegelbot twittert den Wasserstand des Rheins
- Diversity Kalender Köln
Dieser Kalender beinhaltet die Fest- und Feiertage der großen Religionsgemeinschaften sowie weltliche Fest- und Feiertage. Leider wurden die Daten nur als CSV publiziert, daher habe ich ein kleines Skript geschrieben, dass die Daten in eine ICS-Datei konvertiert, damit der Kalender einfach in gängige Software importiert werden kann. (GitHub Repository)
Um etwas Erfahrung mit der Programmiersprache Go und Mikroservice-Architekturen zu sammeln habe ich auch einen kleinen Webservice geschrieben, der die Feiertagsdaten nach Abfrage als JSON liefert. (GitHub Repository)
Auch das hat wieder zu einem neuen Twitterbot geführt: Der @feiertagbot informiert über die Feiertage und versucht auch über die Wikipedia mehr Informationen dazu zu liefern.
Ein TwitterBot mit Partyhütchen
Eine Besonderheit der OK Lab Treffen in Köln ist auch der Ort: Man trifft sich im „Lokal K“:
Das Lokal K wurde als Pilotprojekt für einen regionalen Stützpunkt von einer Gruppe in Köln und Umgebung ansässiger Wikipedianer gemeinsam mit dem Wikimedia Deutschland e. V. (WMDE) eingerichtet. Es wurde durch WMDE angemietet und laufende Kosten sowie weitere Kosten zur Einrichtung und zum Betrieb werden von WMDE getragen […].
Man sitzt also sozusagen physisch in der Wikipedia…
Neulich im Feedreader (Teil XIX): „Fernleihe ist toll, Daten ohnehin, aber nachrechnen sollte man trotzdem“
- What’s Mine is Yours: A Love Letter to Interlibrary Loan
Ein Eintrag aus dem „Hack Library School“ Blog, in dem die Autorin sich war als großer Fan der Fernleihe zu erkennen gibt, aber auch auf die Probleme hinweist
„We may soon be able to have a pizza delivered by drone to our front door in minutes. In this sort of environment, people won’t be willing to wait the three-to-six weeks I warn my patrons they might have to endure to get their ILL. They’ll want it instantaneously, and they’ll want it digitally – which is also nearly impossible in the current state of ILL. „
- A bot crawled thousands of studies looking for simple math errors. The results are concerning.
Ein Artikel über ein Programm, das statistische Berechnungen in 50 000 Artikeln aus dem Bereich Psychology automatisch auf Rundungsfehler überprüft hat.
(via Jason Griffey) - DataBasic
Eine Palette an Webanwendungen mit denen einfach CSV-Dateien und Texte analysiert werden können. Gleichzeitig stellt die Seite „Activity Guides“ (z.B. zum WordCounter) zur Verfügung mit denen der Umgang mit diesen Werkzeugen vermittelt werden kann.
(via Fotografiona)
InetBib-Listenarchiv als RSS-Feed
Viele LeserInnen die InetBib eher passiv konsumieren haben den RSS-Reed über Gmane genutzt.
Allerdings gab Ende Juli der Entwickler bekannt, diesen Dienst nicht weiter betreiben zu wollen:
So… it’s been 14 years… I’m old now. I almost threw up earlier tonight because I’m so stressed about the situation. I should retire and read comic books and watch films. Oh, and the day job. Work, work, work. Oh, and Gnus.
I’m thinking about ending Gmane, at least as a web site.
Als Alternative habe ich jetzt ein kleines Skript geschrieben, dass aus den Inhalten des Listenarchivs einen RSS-Feed baut.
Wer also will, kann ab sofort InetBib über https://200110.vs.webtropia.com/rss/inetbib.xml abonnieren. Das Perl-Skript dazu habe ich auf GitHub gestellt, es kann gerne weiterverwendet werden.
Neulich im Feedreader (Teil XVIII): Drohnen, bibliothekarische Angebote für Geflüchtete und Linked Data
- Drohnen zur Büchersuche
In Oslo wurde eine spannende Kinder- und Jugendbibliothek eröffnet:Biblo Tøyen. Da die Bücher dort als „floating collections“ organisiert sind, soll der genauer Standort nächtlich per Drohne erfasst werden:
All books have radio tags on their covers and every night a drone will fly over the bookshelves to scan and locate each book for easy access the next day.
- Webinar: Library Services to Immigrants and Refugees
IFLA und ALA haben Ende März gemeinsam ein Webinar zum Thema bibliothekarische Angebote für geflüchtete Menschen ausgerichtet. Die Videos zu den einzelnen Vorträgen sind jetzt generell zur Verfügung gestellt worden. - Ten years linked open data
Lukas Koster schaut zurück auf zehn Jahre linked data und den Einsatz im bibliothekarischen Systemen:
In 2016 the odds appear to be steadily turning in favour of a broader application of linked data in libraries and other heritage institutions, in any case in my own experience. […] And the term “linked data” appears more and more in official library policy documents.
Library Freedom Project Teil 2:Tor und Bibliotheken
Das Library Freedom Project kooperiert auch mit dem Tor Project. Ziel ist es, Bibliotheken dazu zu bringen, ein aktiver Teil des Anonymisierungsnetzwerk Tor zu werden. Die teilnehmenden Institutionen sollen dazu einen sogenannten Tor relay betreiben. Neben idealistischen Motiven (der Einsatz von Bibliotheken für freien Zugang zu Informationen und gegen Zensur) gibt es dafür auch praktische Gründe:
As public internet service providers, libraries are shielded from some of the legal concerns that an individual exit relay operator might face, such as trying to explain to law enforcement that the traffic leaving her exit is not her own. Furthermore, libraries are protected from DMCA takedowns by safe harbor provisions.
Pilotbibliothek war im Juli 2015 die Kilton Public Library, die einen sogenannten Tor middle relay betreibt.
Middle relays add to the speed and robustness of the Tor network without making the owner of the relay look like the source of the traffic. Middle relays advertise their presence to the rest of the Tor network, so that any Tor user can connect to them. Even if a malicious user employs the Tor network to do something illegal, the IP address of a middle relay will not show up as the source of the traffic. That means a middle relay is generally safe to run in your home, in conjunction with other services, or on a computer with your personal files.
Kurz danach bekam die Bibliothek gleich einmal einen unangenehmen Brief vom Department of Homeland Security. Die daraufhin einsetzende öffentliche Aufmerksamkeit führte aber schließlich dazu, dass in dem betreffenden Bundesstaat eine eigene gesetzliche Grundlage geschaffen wurde, die es Bibliotheken explizit erlaubt, aktiv am Tor Netzwerk teilzunehmen. 2016 folgte dann eine kanadische Universitätsbibliothek.
Das eigentliche Ziel auch „exit relays“ in Bibliotheken anzubieten, konnte aber nicht erreicht werden. Das Problem dabei ist, dass die IP-Adresse der Bibliothek nach außen mit dem über Tor geleiteten Datenverkehr verknüpft ist. Mehr Informationen zu den Auswirkungen und speziell der Situation in Deutschland finden sich etwa in diesem Artikel.
Library Freedom Project Teil 1: Privatsphäre aus dem Werkzeugkasten
Nun ja, dann will ich mal wieder vorsichtig den Zeh in die Blogosphäre tauchen…
Seit längerem möchte ich schon das Library Freedom Project (Wikipedia) kurz vorstellen.
In einem Video für die Knight Foundation beschrieb die Gründerin Alison Macrina das Projekt so:
As stewards of information and providers of Internet access, librarians are in a prime position to educate patrons about their digital rights. The Library Freedom Project aims to make real the promise of intellectual freedom in libraries by bringing together a coalition of librarians, technology experts and lawyers to scale a series of privacy workshops for librarians. The workshops will provide librarians and their patrons with tools and information to better understand technology, privacy and law related to use of the Internet.
Wie oben erwähnt, sind Schulungen für BibliothekarInnen ein wichtiger Teil des Library Freedom Projects, hier z. B. die Folien zur Präsentation “Digital Privacy Toolkits” bei einer Konferenz der Oregon Library Association.
Einerseits werden hier 20 Werkzeuge für mehr Sicherheit und Privatsphäre im Internet vorgestellt, andererseits gibt es aber auch Tipps und Erfahrungsberichte, wie man die eigenen BibliotheksnutzerInnen für die Thematik sensibilisieren kann.
Beispielsweise in dem man sich Partnerorganisationen für Veranstaltungen holt (in Deutschland etwa der CCC oder der lokale Hackerspace) oder auch so einfache Dinge, wie an den Bibliotheksrechnern HTTPS Everywhere zu installieren und zu bewerben. Weitere Materialien (unter anderem für Jugendliche) finden sich auf der Website.

„HTTPS Everywhere“ in der Watertown Library
Zuletzt war das “Library Freedom Project” in den Medien, weil es den “Award for Projects of Social Benefit” der Free Software Foundation gewann. Auch im Bibliothekswesen wird die Arbeit von Alsion Macrina gewürdigt: vom Library Journal wird sie zu den “Movers & Shakers 2015” gezählt.
Wer über dieses Projekt am Laufenden gehalten werden will, dem sei der Twitter Account @libraryfreedom oder die monatlichen Updates per Mailing-Liste empfohlen. Im zweiten Teil dieses Artikels wird es dann um Kooperationen zwischen Bibliotheken und dem Tor-Projekt gehen.
Neulich im Feedreader (Teil XVII): Lange Texte, freie Bilder und verbotene Bücher
- Library as Infrastructure
Wenn ein Artikel über Bibliotheken sogar in den Hacker News erwähnt wird, ist das erstmals eine Empfehlung. In diesem langen Artikel geht es um die vielfältigen und sich wandelnden Aufgaben von öffentlichen Bibliotheken:
I propose that thinking about the library as a network of integrated, mutually reinforcing, evolving infrastructures — in particular, architectural, technological, social, epistemological and ethical infrastructures — can help us better identify what roles we want our libraries to serve, and what we can reasonably expect of them. What ideas, values and social responsibilities can we scaffold within the library’s material systems — its walls and wires, shelves and servers?
- What is Code
OK, wenn ich den vorherigen Artikel schon als lang bezeichnet habe, dann ist dieser Text mit 30.000 Wörtern ein Monstrum. Das Lesen lohnt sich aber auf jeden Fall. Der Text beginnt aus der Perspektive eines altgedienten Managers dem ein Projektteam aus jungen, hippen ProgrammiererInnen für ein Webprojekt vor die Nase gesetzt. Aus dieser Ausgangssituation mäandert der Artikel durch die Geschichte des Programmierens, die Unterschiede und Entwicklungen der Programmiersprachen, Kultur und Entwicklungsansätze in der IT und so weiter und so fort…
In der Webversion gibt es auch noch einige interaktive Spielereien zum eigentlichen Text dazu. - Emacs for Data Science
Die Wahl des richtigen Texteditors kann ja durchaus eine Glaubensfrage sein. Dieser Blogpost beschreibt nun warum der gute alte Emacs im Werkzeugkasten der „data science“ (vgl. dazu auch meinen letzten Artikel) vorhanden sein sollte. - We Tried – And Failed – To Identify The Most Banned Book In America
Die Banned Books Week der ALA ist sicher eine wichtige Aktion. Leider ist die Rangliste der Bücher anscheinend mehr Marketingaktion als handwerklich saubere Untersuchung - I need to find a public domain image of _______. How do I do that?
Jessamyn West von librarian.net gibt Tipps.
Kursreihe „Data Science“ auf Coursera
Das neue Arbeitsfeld des „data librarian“ war ja hier im Blog schon öfter Thema. Aber wie geht man eigentlich mit diesen Daten um? Auf Coursera gibt es eine Reihe von verschiedenen MOOCs zum Thema:
Johns Hopkins University – Data Science
In this course you will learn:Formulate context-relevant questions and hypotheses to drive data scientific research
Identify, obtain, and transform a data set to make it suitable for the production of statistical evidence communicated in written form
Build models based on new data types, experimental design, and statistical inference
Die Reihe besteht aus 9 Modulen plus einem Abschlussprojekt. Den ersten Kurs habe ich bereits hinter mich gebracht:
In this course you will get an introduction to the main tools and ideas in the data scientist’s toolbox. The course gives an overview of the data, questions, and tools that data analysts and data scientists work with. There are two components to this course. The first is a conceptual introduction to the ideas behind turning data into actionable knowledge. The second is a practical introduction to the tools that will be used in the program like version control, markdown, git, GitHub, R, and RStudio.
Dieses Modul ist ein guter Einstieg in die Thematik und viele der angesprochenen Werkzeuge wie git und GitHub lassen sich ja auch in anderen Kontexten nutzen.
In this course you will learn how to program in R and how to use R for effective data analysis. You will learn how to install and configure software necessary for a statistical programming environment and describe generic programming language concepts as they are implemented in a high-level statistical language. The course covers practical issues in statistical computing which includes programming in R, reading data into R, accessing R packages, writing R functions, debugging, profiling R code, and organizing and commenting R code. Topics in statistical data analysis will provide working examples.
Auch das Erstellen von Statistiken und das Visualisieren von Daten betrifft einen größeren Kreis von Bibliothekarinnen. Die Programmiersprache R ist mir in letzter Zeit öfter untergekommen und dieser Kurs ist eine gute Gelegenheit da einmal reinzuschnuppern. Allerdings ist dieses Modul wesentlich anspruchsvoller als der vorherige. Ich bin gerade in Woche 3 und grüble über der Programmieraufgabe.
Mal sehen wie’s weitergeht und welche Module ich noch machen werde.
Ein wichtiger Tipp noch: Coursera versucht natürlich kostenpflichtige Zertifikate für diese Kurse zu verkaufen. Wenn man stattdessen mit einem „Statement of Accomplishment“ zufrieden ist, kann man die MOOCs auch gratis absolvieren.
Neulich im Feedreader (Teil XVI): Passkontrolle und Aktivismus in Bibliotheken, Daten und Detektivisches
Diese Rubrik eignet sich doch hervorragend um sich wieder vorsichtig ans Bloggen ranzutasten…
- „Academic libraries and social justice: A call to microactivism“
Ein Artikel aus den „College & Research Libraries News“. Analog zu dem Begriff der „Mikroagression“
the term microaggression gained momentum in academic scholarship about racism in the early 2000s to denote the small ways systemic racism plays out“
stellt die Autorin das Konzept des „Mikroaktivismus“ vor, kleine Aktivitäten (z.B. einfach mal feministische Beispiele bei Datenbankschulungen verwenden) mit denen sich BibliothekarInnen in der täglichen Arbeit gegen Diskriminierung und für benachteiligte Gruppen einsetzen können. (via @glaserti)
- Evaluating Web-Scale Discovery Services: A Step-by-Step Guide
Das Thema bewegt sicher im Moment so einige Bibliotheken, in „Information Technology and Libraries“ gibt es einen Artikel dazu. - A Forray into Publishing Open Data on GitHub
Eine kleine Anleitung im Blog der „Association of College and Research Libraries“ - FORENSIC BIBLIOGRAPHIC RECONSTRUCTION: tracking down troublesome citations and the problem of lost knowledge
Auch in unserer Fernleihabteilung gibt es oft detektivische Recherchen nach bibliographischen Nachweisen. (via @jessamyn)
- ‚Passports‘ To Vermont Libraries Encourage Literary Exploration
Erinnert mich zwar etwas an die „Goldene Wandernadel“ aus der Piefke-Saga, kann man aber durchaus machen. (via @jessamyn)


