Hurra, offene Forschungsdaten!

Jo eh…

Hurra, offene Forschungsdaten!

Für einen Kurs bin ich gerade auf der Suche nach Zahlen zur Nutzung von Literaturverwaltungssystemen. Die TIB/UB Hannover hatte vor einiger Zeit eine große Umfrage (n=1000) zu diesem Thema gestartet und die Ergebnisse dazu wurden im Jänner präsentiert.

Es gibt eine wahnsinnig schicke Ergebnisseite, auf der man sogar dynamisch eigene Filtersets erstellen kann. Aber eigentlich habe ich nur ganz einfache Fragen: „Welche Programme sind bekannt?“ und „Welche Programme werden verwendet?“.

Das Großartige ist nun, dass die Rohdaten der Umfrage auch auf E-LIS hochgeladen wurden und somit eigene Auswertungen ermöglicht werden. Mit Perl ist das sogar relativ einfach: mit Hilfe des Moduls DBD::CSV können SQL-Abfragen auf eine CSV-Datei durchgeführt werden. (Wahrscheinlich können das Excel-SpezialistInnen auch ohne den Umweg über Perl…)

Hier ein kleines Beispielprogramm um Herauszufinden, welche Literaturverwaltungsprogramme schon einmal benutzt wurden:

	#!/usr/bin/env perl

	use strict;
	use warnings;

	use DBD::CSV;
	use Data::Dumper;

	# DBD::CSV normiert die Spaltennamen
	my @programme =
	qw (quellen_manager_in_microsoft_word_ endnote refworks jabref zotero bibtex___biblatex citavi citeulike mendeley);

	my $dbh = undef;
	my $sth = undef;
	my $query = undef;

	$dbh = DBI->connect(
	"dbi:CSV:",
	undef, undef,
	{
	f_dir => ".", # im aktl Verzeichnis nach CSV Dateien schauen
	csv_eol => "\r\n", # Windows
	csv_sep_char => ";",
	csv_quote_char => '"',
	f_encoding => "iso-8859-1",
	}
	);

	foreach my $prog (@programme) {

	# "Habe … ausprobiert / ..damit geschrieben" -> schon mal verwendet
	$query = <<"EOS";
	SELECT count(*) as anzahl FROM dbd.csv where $prog LIKE 'Habe\%'";
	EOS

	$sth = $dbh->prepare($query);
	$sth->execute();

	while ( my $row = $sth->fetchrow_hashref ) {
	print "$prog: $row->{anzahl}\n";

	}
	$sth->finish();

	}

view raw

dbd_beispiel

hosted with ❤ by GitHub

Mit dem Ergebnis lassen sich dann wieder Diagramme erstellen.

„Welche Literaturverwaltungsprogramme sind bekannt?“/“Welche werden verwendet?“

Also nochmals ein Dankeschön an die Kollegen in Hannover, die „open data“ jetzt nicht nur als Schlagwort sehen, sondern im praktischen Bibliotheksalltag auch umsetzen!

Written by Peter

September 22, 2012 um 9:54 pm

Veröffentlicht in Literaturverwaltung, Perl, Programmierung, Scripts

Tagged with gist, Literaturverwaltung, Perl

M	D	M	D	F	S	S
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30

Hatori Kibble