Hurra, offene Forschungsdaten!
Für einen Kurs bin ich gerade auf der Suche nach Zahlen zur Nutzung von Literaturverwaltungssystemen. Die TIB/UB Hannover hatte vor einiger Zeit eine große Umfrage (n=1000) zu diesem Thema gestartet und die Ergebnisse dazu wurden im Jänner präsentiert.
Es gibt eine wahnsinnig schicke Ergebnisseite, auf der man sogar dynamisch eigene Filtersets erstellen kann. Aber eigentlich habe ich nur ganz einfache Fragen: „Welche Programme sind bekannt?“ und „Welche Programme werden verwendet?“.
Das Großartige ist nun, dass die Rohdaten der Umfrage auch auf E-LIS hochgeladen wurden und somit eigene Auswertungen ermöglicht werden. Mit Perl ist das sogar relativ einfach: mit Hilfe des Moduls DBD::CSV können SQL-Abfragen auf eine CSV-Datei durchgeführt werden. (Wahrscheinlich können das Excel-SpezialistInnen auch ohne den Umweg über Perl…)
Hier ein kleines Beispielprogramm um Herauszufinden, welche Literaturverwaltungsprogramme schon einmal benutzt wurden:
This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
#!/usr/bin/env perl | |
use strict; | |
use warnings; | |
use DBD::CSV; | |
use Data::Dumper; | |
# DBD::CSV normiert die Spaltennamen | |
my @programme = | |
qw (quellen_manager_in_microsoft_word_ endnote refworks jabref zotero bibtex___biblatex citavi citeulike mendeley); | |
my $dbh = undef; | |
my $sth = undef; | |
my $query = undef; | |
$dbh = DBI->connect( | |
"dbi:CSV:", | |
undef, undef, | |
{ | |
f_dir => ".", # im aktl Verzeichnis nach CSV Dateien schauen | |
csv_eol => "\r\n", # Windows | |
csv_sep_char => ";", | |
csv_quote_char => '"', | |
f_encoding => "iso-8859-1", | |
} | |
); | |
foreach my $prog (@programme) { | |
# "Habe … ausprobiert / ..damit geschrieben" -> schon mal verwendet | |
$query = <<"EOS"; | |
SELECT count(*) as anzahl FROM dbd.csv where $prog LIKE 'Habe\%'"; | |
EOS | |
$sth = $dbh->prepare($query); | |
$sth->execute(); | |
while ( my $row = $sth->fetchrow_hashref ) { | |
print "$prog: $row->{anzahl}\n"; | |
} | |
$sth->finish(); | |
} |
Mit dem Ergebnis lassen sich dann wieder Diagramme erstellen.
Also nochmals ein Dankeschön an die Kollegen in Hannover, die „open data“ jetzt nicht nur als Schlagwort sehen, sondern im praktischen Bibliotheksalltag auch umsetzen!
Hinterlasse einen Kommentar