Hatori Kibble

Jo eh…

Posts Tagged ‘digital humanities

IFLA Tag 3: Auch BibliothekarInnen lesen die Vogue

with one comment

Dieser Tag begann mit der Session „Research in the big data era: legal, social and technical approaches to large text and data sets“.

Der erste Vortrag beschäftigte sich mit den Digital Humanities: „Mining large datasets for the humanities“. Der Redner hat seine Ausgangsfrage: „How can libraries support humanities scholars in making sense of large digitized collections of cultural material?“ in die einzelnen Bestandteile zerlegt:

  • humanities scholars
    Es gibt kein „Labor“ im traditionellen Sinn (und damit einen zentralen Ort des Austausches) in den Geisteswissenschaften. Für Bibliotheken besteht daher die Möglichkeit hier aktiv zu werden und die Zusammenarbeit zwischen FachreferentInnen („subject librarians“), „data librarians“ und WissenschaftlerInnen zu fördern.
  • making sense
    Bibliotheken konzentrieren sich zu stark auf die Anzeige von Information statt auf die Analyse. Als Beispiel für die Datenanalyse wurde das Vogue-Archiv herangezogen und eine zeitliche Auswertung des Vorkommens der Begriffe „girl“, „woman“, „lady“, bei der man schön sah, wie der Begriff „girl“ in den 70ern durch „woman“ ersetzt wurde. Dazu wurde eine Software namens „Bookworm“ erstellt.
    Das ist allerdings nur eine relativ primitive Analyse, bei der man nach Dingen sucht, von denen man weiß, dass sie vorhanden sind. Interessanter ist es, „die Daten sich selber organisieren zu lassen“. Eine Methode dazu ist „Topic Modeling“:
Topic Modeling discovers statistical patterns of words that occur near each other
and — with some help fine-tuning from a human with a basic understanding of the corpus
— it can produce uncannily interesting result
Damit wurde zum Beispiel eine Korrelation zwischen der Berichterstattung über Frauengesundheitsthemen und den einzelnen Chefredakteurinnen der Vogue herausgefunden.
  • large digitized collections from cultural material
    viele Daten lassen sich unter Umständen sogar im eigenen Keller finden (eigene Digitalisierungsprojekte, Datenlieferungen von Anbietern, etc.). Es lohnt sich aber auch Anbieter direkt um Daten zur Analyse zu fragen. Mit der Aufteilung „Analyse durch die Bibliothek“, „Darstellung durch den Anbieter“ lässt sich die Sichtbarkeit der Verlagsdaten steigern und beide Seiten profitieren somit.

Der nächste Vortrag „Do we need to believe Data/Tangible or Emotional/Intuition?“ war leider etwas deplatziert. Es ging um Empfehlungssysteme in E-Commerce Anwendungen. Es gab aber keine Übertragung auf Bibliothekssysteme und die mentalen/emotionalen Modelle von Kauf und Ausleihe halte ich jetzt nur bedingt für vergleichbar. (Zumindest der eine Redner hat immer den Glückszustand einer Shoppingerfahrung betont..)

Written by Peter

August 20, 2014 at 11:33 am

Veröffentlicht in Konferenzen, wlic2014

Tagged with ,

Serendip-o-matic: Der Automat für Zufallsfunde…

with 2 comments

In letzter Zeit habe ich mich ja durch die Arbeit am  EuropeanaBot ein bisschen mit dem Thema beschäftigt, wie man digitale Sammlungen über das Serendipidätsprinzip besser präsentieren kann.

Durch einen Tweet bin ich dann auf „Serendip-o-matic“ gestossen:

Serendip-o-matic

Serendip-o-matic

Eigentlich eine geniale Sache: man kann diese Seite mit eigenen Texten oder seiner Zotero-Literatursammlung füttern, das Programm extrahiert mögliche Suchbegriffe und fragt damit die DPLA, Europeana, Trove und Flickr Commons ab.

In der Presserklärung klingt das dann so:

Serendip-o-matic works for many different users. Students looking for inspiration can use one source as a springboard to a variety of others. Scholars can pump in their bibliographies to help enliven their current research or to get ideas for a new project. Bloggers can find open access images to illustrate their posts. Librarians and museum professionals can discover a wide range of items from other institutions and build bridges that make their collections more accessible. In addition, millions of users of RRCHNM’s Zotero can easily run their personal libraries through Serendip-o-matic.

Das Motto des „Serendip-o-matic“ ist „Let Your Sources Surprise You!„. Das allerdings funktionierte bei meinem ersten Test etwas zu gut:

Serendip-o-matic Suchergebnis zur Zotero-Bibliothek

Serendip-o-matic Suchergebnis zur Zotero-Bibliothek

Der Zusammenhang meiner Zotero-Bibliothek zu einem Filmplakat für „Auf ins blaukarierte Himmelbett“ erschliesst sich mir zumindest nicht auf Anhieb..

Bei längeren Texten funktioniert das aber etwas besser: Aus einem deutschsprachigen Paper zu unserem EVA-Projekt hat der Serendip-o-matic beispielsweise die Begriffe: „fernleihe, für, bibliothek, fernleihen, können, nutzer, fachreferenten, über, erwerbungsvorschläge, fernleihbestellungen, teilnehmenden, 2, abbildung, kriterien, potentielle“ ausgefiltert und danach gesucht. (Und bei einem klassischen geisteswissenschaftlichem Thema wären die Suchergebnisse wahrscheinlich auch noch etwas aufschlussreicher…)

Entstanden ist dieses Programm übrigens während eines Hackathons: Bei „One Week | One Tool“ hatten sich 12 WissenschaftlerInnen aus dem Bereich Digital Humanities getroffen um gemeinsam Software zu entwickeln.

Etwas mehr Hintergrundinformation zu diesem Projekt gibt es auch in diesem Youtube-Video:

Falls jemand auch daran mitarbeiten will oder etwas hinter die technischen Kulissen des „Serendip-o-matic“ schauen will: Das Projekt ist auch auf Github zu finden.

Written by Peter

August 5, 2013 at 8:00 am