Hatori Kibble

Jo eh…

Archive for April 2014

Schöne Projekte mit viel GLAM!

with 2 comments

Im Moment gibt es wieder spannende Initiativen aus dem GLAM-Bereich:

Coding Da Vinci

Letztes Wochenende begann in Berlin ein „Kultur-Hackathon“:

Nach dem Motto „Let them play with your toys!“ (Jo Pugh, National Archives UK) wollen wir im Rahmen von Coding da Vinci ergründen, was passiert, wenn Kulturinstitutionen mit der Entwickler-, Designer- und Gamescommunity ins Gespräch kommen und in kreativer Art und Weise das digitale Kulturerbe nutzbar machen.

Auf Basis von offenen Kulturdaten entstehen prototypische Anwendungen in einem gemeinsamen Dialog mit Kulturinstitutionen und Teilnehmer/innen aus ganz Deutschland.

Eine großartige Idee, um einmal zu schauen, was man denn mit unseren tollen bibliothekarischen Daten so alles anstellen kann.

Dokumentation

Hübsche Art der Dokumentation mit Sketchnotes

Erste Projektideen (von der Weltkriegsdokumentation bis zum Vogelstimmenwecker) kann man sich bereits ansehen, ich bin gespannt, was in den nächsten 10 Wochen noch so alles entstehen wird.

Eyes on the past

Tim Sherratt hatte ich ja im Zusammenhang mit dem TroveNewsBot schon einmal erwähnt. Nun gibt es ein neues Projekt von ihm:

Faces offer an instant connection to history, reminding us that the past is full of people. People like us, but different. People with their own lives and stories. People we might only know through a picture, a few documentary fragments, or a newspaper article.

On this site I’m exploring whether faces can provide a way to explore more than 120 million newspaper articles available on Trove.

Eyes on the past

„Eyes on the past“

Mir gefällt ja dieser verspielte Ansatz der digitalen Sammlung als „Wunderkammer“ sehr gut. Auf Twitter wurde das als „a poetic way to search library catalogues“ bezeichnet und in der Tat ist „Eyes on the past“ wohl die maximale Distanz zur Boole’schen OPAC-Suchmaske.

(Das Projekt läuft derzeit auf einem Testserver, falls der Link irgendwann nicht mehr funktioniert, findet man vielleicht auf der Homepage des Entwicklers noch mehr Informationen dazu.)

Written by Peter

April 28, 2014 at 9:18 pm

Mit offenen lobid-Daten raten!

with 3 comments

Für ein kleines Datenanalyseprojekt brauche ich die Gender-Verteilung einer Namensliste. Das manuelle Durcharbeiten und Anlegen einer Strichliste ist relativ öde, daher habe ich nach einer automatisierten Lösung gesucht und einen schönen Anwendungsfall für offene Daten gefunden…

Das hbz bietet ja mit lobid.org eine API für die Abfrage der „Gemeinsamen Normdatei“ an. In der GND-Ontologie ist ein Gender-Eintrag definiert und manchmal auch vergeben.

Jane Austen in der GND

Jane Austen in der GND

In weiterer Folge habe ich jetzt ein kleines Perl-Modul geschrieben, das die GND Personendaten durchsucht und für die ersten 100 Treffer die Gender-Einträge analysiert.  Daraus wird dann eine statistische Präferenz abgeleitet:

> perl guess.pl Peter
'Peter' is probably 'male'

 

Here's the statistics data that I've used: $VAR1 = {
          'GenderRatio' => {
                             'Female' => '8.33333333333333',
                             'Male' => '91.6666666666667'
                           },
          'GenderDistribution' => {
                                    'female' => 2,
                                    'male' => 22,
                                    'notKnown' => 43
                                  },
          'GenderCount' => 67,
          'TotalCount' => 100
        };
> perl guess.pl Sarah
'Sarah' is probably 'female'

 

Here's the statistics data that I've used: $VAR1 = {
          'GenderRatio' => {
                             'Female' => '95.4545454545455',
                             'Male' => '4.54545454545455'
                           },
          'GenderDistribution' => {
                                    'female' => 21,
                                    'male' => 1,
                                    'notKnown' => 41
                                  },
          'GenderCount' => 63,
          'TotalCount' => 100
        };

Aus den Statistikdaten wird klar, wie schlecht die Datenlage eigentlich ist, in den meisten Fällen wurde in der GND notKnown vergeben. Trotzdem ist das Ergebnis für „Standardnamen“ relativ eindeutig.

Schwieriger wird es für Vornamen, die sowohl weiblich als auch männlich besetzt sind (Uli, Kim, Andrea, etc..).

Bei „Andrea“ schlägt auch noch die automatische Trunkierung zu  und der Name wird zu 92 % als männlich klassifiziert.

Trotz dieser Schwächen ist dieses Verfahren aber immer noch eine pragmatische Lösung und ein schönes Beispiel für die (Nach-)Nutzung bibliothekarischer Arbeit.

Wer das Modul verwenden will, oder Bugreports oder Verbesserungsvorschläge hat: hier geht’s zum GitHub-Repository!

Written by Peter

April 26, 2014 at 5:26 pm

Veröffentlicht in Perl, Programmierung, Scripts, Software

Tagged with , , , , ,

Kleine Bot-Miszellen

leave a comment »

Bevor die IronBlogger-Deadline mahnt und die Heimreise zum God’ntag beginnt, noch ein paar kurze Notizen zu meinen Bots:

Darth Vader wohnt in Dörth

Der „Herr Kratochwil“ sucht ja mit deutschen Ortsnamen in der Deutschen Digitalen Bibliothek, mit dem Ortsnamen Dörth hat er da einen interessanten Fund gemacht, der etwas gegen die Suchqualität dieses Portals spricht:

Darth Vader in Dörth

Darth Vader in Dörth

Frühlingshaftes Hacken

Interessante Suchergebnisse gibt es auch beim EuropeanaBot:

Zu einem Guardian-Artikel über „Hacking“ wurde eine „kleine Gartenhacke aus Stahl gefunden“:

"Hacking" in der Europeana

„Hacking“ in der Europeana

Die beliebteste Katze ist ein Hund

Seit einiger Zeit kann ich für die Links in meinen Twitter-Bots Zugriffstatistiken abrufen. Dabei stellt sich heraus, dass die Aufrufe doch erheblich mehr sind, als die – doch etwas bescheidenen – Followerzahlen vermuten lassen.

Viele NutzerInnen scheinen auch über Hashtags und Suchen auf die Tweets aufmerksam zu werden.

Für die Posts meines KatzenBots habe ich mir einmal die Statistiken genauer angeschaut. Interessanterweise ist das beliebteste Katzenbild (mit aktuell 63 Aufrufen) ein Hund:

Hund statt Katze

Hund statt Katze

Written by Peter

April 16, 2014 at 8:59 pm

Neulich im Feedreader (Teil IX): Gut abgehangene Ratschläge, GitHub und literarische Rätsel…

leave a comment »

So, diese Rubrik gab es hier schon länger nicht mehr…

I play a bit of football in the park with my friends, and it’s not regulation NFL American Football or anything, but I’m curious if it’s cool when going for a punt to start a game, a friend of mine likes to pull the ball at the last possible second. She says it’s a big joke and my other friends laugh a bit too so maybe I’m just being too sensitive. Are there rules I can point her to showing this isn’t allowed?
posted by RoundHeadedKid to Sports, Hobbies, & Recreation at 17:04 – 13 answers  +
Long story short, I’ve been away a long time, but it’s time to go home. I need to get from Troy to Ithaca ASAP, but don’t trust my old map and my transportation is not always reliable either. Any tips for finding the best, most direct route and avoid annoying traffic snarls and other delays? Difficulty: No GPS. [more inside]
posted by Ody to Travel & Transportation at 21:10 – 28 answers +

 

 

 

Written by Peter

April 7, 2014 at 9:23 pm

Bibliothekarische Bots beehren bald Bath!

with one comment

Neben dem Vortrag in Bremen haben meine Bot-Projekte heuer auch zwei Auslandsgastspiele. In der Woche nach dem Bibliothekartag werde ich einen Vortrag auf der ELAG-Konferenz halten. Das Thema der diesjährigen Tagung der „European Library Automation Group“ lautet „Lingering Gold“ und meine Bots sind ja eine Möglichkeit das „versteckte Gold“ unserer digitalen Sammlungen zu heben und zu präsentieren.

EuropeanaBot – using open data and open APIs to present digital collections

Abstract: Twitter bots are a relatively new means to present digital objects. They allow  collections to “speak for themselves”, gain visibility in the Twittersphere and  aid serendipity effects. Current examples are e.g. the bots of the Digital Public Library of America or of the National Library of Australia.

An relatively new TwitterBot is “EuropeanaBot”: a program to present images
from the collections of Europe’s leading galleries, libraries, archives and museums by using Europeana’s Application Programming Interface (API).

EuropeanaBot not only tweets hourly about a random digital object, it also
enriches them. By using open data collections (e.g. place names, a list of of
Nobel prize winners, . . . ) or open APIs (e.g. Wikipedia, current news items) it
enhances the simple query results and puts them into new – often surprising and entertaining – contexts. In addition a kind of “digital persona” has been created to make it easier for the EuropeanaBot to blend in with “Twitter culture” and simplify interaction with other users.

The talk introduces this project and also covers the data flow and the connections to the services that have been used. Additionally the impact and resonance of EuropeanaBot is analyzed and some possible future developments are discussed.

Besonders gespannt bin ich auf einen Vortrag zu einem ähnlichen Projekt: The Surprising Adventures of the Mechanical Curator, and Other Tales“  (dazu gab es auch hier im Blog bereits einen Beitrag).

Insgesamt ist die ELAG ist eine eher technik-orientierte bibliothekarische Tagung. Das Programm fand ich schon in den letzten Jahren immer sehr interessant  und nun ergibt sich die Gelegenheit an dieser Veranstaltung teilzunehmen.

Eine kleine Werbeeinschaltung vielleicht noch für den Vortrag von zwei (Ex-)Kollegen: Felix Ostrowski (@literarymachine) und Jan Schnasse (@InspektorHicks) werden über „Regal – a Repository for Electronic Documents and Bibliographic Data“ sprechen.

 

Written by Peter

April 3, 2014 at 8:27 pm

Veröffentlicht in Konferenzen

Tagged with , ,