Hatori Kibble

Jo eh…

Posts Tagged ‘wordpress

Kleiner „Making Of“-Post

with one comment

Im gestrigen Geburtstagspost gab es einige hübsche Wordclouds zu sehen. Diese Grafiken wurden mit Wordle erstellt. Dafür brauchte ich aber die Rohdaten zu meinen Posts aufgeteilt auf die einzelnen Jahre.

Glücklicherweise hat WordPress eine XML-RPC Schnittstelle, darüber lässt sich relativ einfach ein entsprechendes Script basteln:

wordpress_fetch.pl

usage:
 wordpress_fetch.pl [long options...]
 wordpress_fetch.pl --help

description:
 this script connects via the XMLRPC API to your WordPress blog, fetches
 your posts and saves them into the text file '<YEAR>_blog_output.txt'.
If textonly is set, then HTML tags and WordPress codes are stripped.
You can set the options via the command line or create a JSON config file
 and point the parameter --config to it. (See config.json_example)
options:
   --blog_url blog url, e.g. 'http://xyz.wordpress.com' [Required]
   --config Path to command config file
   --help -h --usage -? Prints this usage information. [Flag]
   --max_posts number of posts the script should fetch ideally
       bigger than your post count, to fetch all your
        posts in one go [Default:"250"; Integer]
   --password WordPress password [Required]
   --textonly strip HTML tags and WordPress codes, default is false [Flag]
   --username WordPress username [Required]

Ein Backup seiner eigenen Daten zu haben ist ja immer empfehlenswert. Wer das Skript nachnutzen oder weiterentwickeln will, kann sich den Quelltext aus dem GitHub-Repository holen.

Advertisements

Written by Peter

Januar 21, 2014 at 9:25 pm

Veröffentlicht in Perl, Programmierung, Scripts

Tagged with , , , ,

Herr Kratochwil schaut nach… (in der Deutschen Digitalen Bibliothek)

with one comment

Anfang November hat die Deutsche Digitale Bibliothek eine API veröffentlicht. Natürlich reizt das den Nerd in mir etwas damit herumzuspielen…

Im Moment interessiert mich das Thema „virtuelles Stöbern“ und das Präsentieren von digitalen Sammlungen. Der einfachste Anwendungsfall für diese API wäre also natürlich eine deutsche Variante des EuropeanaBot gewesen.

Spannender fand ich dann aber die Möglichkeit, ein Blog mit interessanten Digitalisaten zu bespielen, ähnlich wie The Mechanical Curator (vgl. auch diesen Artikel). Mit diesem Projekt haben die KollegInnen der British Library eine Art „digitale Persönlichkeit“ aufgebaut:

Such is the whim of our newest colleague, The Mechanical Curator. She plucks from obscurity, places all before you, and leaves you to work out the rest.

Als deutsche Entsprechung dazu hatte ich mir den „Herrn Kratochwil“ überlegt: ein älterer Kollege, der durch die digitalen Archive schlurft, plötzlich wieder vor einem auftaucht und irgendwelche tollen Funde präsentiert.

Herr Kratochwil schaut nach..

Herr Kratochwil schaut nach…

Im Moment ist das alles noch sehr primitiv, wie beim EuropeanaBot werden Ortsnamen als Suchterme verwendet und aus den Ergebnissen wird ein Blogpost erstellt. Die einzelnen Beiträge erhalten die Schlagwörter und Kategorien des Digitalisats. Im Prinzip entsteht dadurch so etwas wie ein WordPress OPAC (falls sich noch jemand daran erinnert..) aus ausgewählten Fundstücken.

Bei TwitterBots stehen die einzelnen Ergebnisse immer relativ isoliert für sich und sind flüchtig. Innerhalb eines Blogs würde sich jetzt die Möglichkeit ergeben, neue Zusammenhänge zwischen den Objekten zu erstellen und Suchergebnisse als Ausgangspunkte für neue Entdeckungen zu nehmen.

In diese Richtung soll sich dieses Blog entwickeln…

Technisch basiert das Projekt auf einem Perl-Dämon, der periodisch die Deutsche Digitale Bibliothek durchsucht und über eine XML-RPC Schnittstelle das Blog ansteuert. Der Quellcode steht auf GitHub und kann gerne weiter verwendet werden.

Written by Peter

Dezember 2, 2013 at 8:21 am