Hatori Kibble

Jo eh…

Posts Tagged ‘bot

Kleine Bot-Miszellen II: Die Katzen und der arrangierte Zufall

with one comment

Als kleine Vorkonferenz zum „Open Knowledge Festival“ gab es am 15. Juli eine Veranstaltung zu offenen Daten im Kulturbereich, den „OpenGLAM-Workshop“.

In einem Vortrag ging es um die Deutsche Digitale Bibliothek:

1 year in digital cultural heritage – what were the walls I ran into most often & how to tear them down – Stephan Bartholmei, Deutsche Digitale Bibliothek

und anscheinend hatte da auch mein Katzenbot einen Gastauftritt:

Aber auch der EuropeanaBot hatte kürzlich eine Erwähnung. Der Artikel „I’m feeling lucky: Can algorithms better engineer serendipity in research — or in journalism?“ beschäftigt sich mit Serendipitätseffekten in digitalen Sammlungen:

Some historical collections are aiming to enable serendipitous content discovery, peering beyond the current limitations of search to capture happy accidents.

Analog zur „Filter Bubble“ wird hier von der „Research Bubble“ gesprochen. Alternative Zugänge zu Informationen, die auf Serendipität setzen, können hier einen Ausweg bieten.

In dem Artikel wird besonders auf Twitter eingegangen und die verschiedenen „collection bots“:

This might suggest that Twitter might be a more serendipitous platform than Facebook or Google, which emphasize more targeted customization and personalization. It — along with the Twitter API’s ease of use — also might explain why many organizations take advantage of Twitter to create whimsical bots that inject a bit of randomness into your feed.

 

These tools (along with others, such as the EuropeanaBot) are primarily targeting digital humanists and historians who are in a rut, but they each have their own insights about what is serendipitous versus simply random. It is difficult to plan for unplanned discoveries, especially so for a computer. Events are only serendipitous in hindsight, consisting of varying levels of planning versus dumb luck. But it seems quite possible to design for serendipitous discoveries, and to help put a user in the mindset for it.

Advertisements

Written by Peter

Juli 21, 2014 at 9:19 am

Kleine Bot-Miszellen

leave a comment »

Bevor die IronBlogger-Deadline mahnt und die Heimreise zum God’ntag beginnt, noch ein paar kurze Notizen zu meinen Bots:

Darth Vader wohnt in Dörth

Der „Herr Kratochwil“ sucht ja mit deutschen Ortsnamen in der Deutschen Digitalen Bibliothek, mit dem Ortsnamen Dörth hat er da einen interessanten Fund gemacht, der etwas gegen die Suchqualität dieses Portals spricht:

Darth Vader in Dörth

Darth Vader in Dörth

Frühlingshaftes Hacken

Interessante Suchergebnisse gibt es auch beim EuropeanaBot:

Zu einem Guardian-Artikel über „Hacking“ wurde eine „kleine Gartenhacke aus Stahl gefunden“:

"Hacking" in der Europeana

„Hacking“ in der Europeana

Die beliebteste Katze ist ein Hund

Seit einiger Zeit kann ich für die Links in meinen Twitter-Bots Zugriffstatistiken abrufen. Dabei stellt sich heraus, dass die Aufrufe doch erheblich mehr sind, als die – doch etwas bescheidenen – Followerzahlen vermuten lassen.

Viele NutzerInnen scheinen auch über Hashtags und Suchen auf die Tweets aufmerksam zu werden.

Für die Posts meines KatzenBots habe ich mir einmal die Statistiken genauer angeschaut. Interessanterweise ist das beliebteste Katzenbild (mit aktuell 63 Aufrufen) ein Hund:

Hund statt Katze

Hund statt Katze

Written by Peter

April 16, 2014 at 8:59 pm

Herr Kratochwil schaut nach… (in der Deutschen Digitalen Bibliothek)

with one comment

Anfang November hat die Deutsche Digitale Bibliothek eine API veröffentlicht. Natürlich reizt das den Nerd in mir etwas damit herumzuspielen…

Im Moment interessiert mich das Thema „virtuelles Stöbern“ und das Präsentieren von digitalen Sammlungen. Der einfachste Anwendungsfall für diese API wäre also natürlich eine deutsche Variante des EuropeanaBot gewesen.

Spannender fand ich dann aber die Möglichkeit, ein Blog mit interessanten Digitalisaten zu bespielen, ähnlich wie The Mechanical Curator (vgl. auch diesen Artikel). Mit diesem Projekt haben die KollegInnen der British Library eine Art „digitale Persönlichkeit“ aufgebaut:

Such is the whim of our newest colleague, The Mechanical Curator. She plucks from obscurity, places all before you, and leaves you to work out the rest.

Als deutsche Entsprechung dazu hatte ich mir den „Herrn Kratochwil“ überlegt: ein älterer Kollege, der durch die digitalen Archive schlurft, plötzlich wieder vor einem auftaucht und irgendwelche tollen Funde präsentiert.

Herr Kratochwil schaut nach..

Herr Kratochwil schaut nach…

Im Moment ist das alles noch sehr primitiv, wie beim EuropeanaBot werden Ortsnamen als Suchterme verwendet und aus den Ergebnissen wird ein Blogpost erstellt. Die einzelnen Beiträge erhalten die Schlagwörter und Kategorien des Digitalisats. Im Prinzip entsteht dadurch so etwas wie ein WordPress OPAC (falls sich noch jemand daran erinnert..) aus ausgewählten Fundstücken.

Bei TwitterBots stehen die einzelnen Ergebnisse immer relativ isoliert für sich und sind flüchtig. Innerhalb eines Blogs würde sich jetzt die Möglichkeit ergeben, neue Zusammenhänge zwischen den Objekten zu erstellen und Suchergebnisse als Ausgangspunkte für neue Entdeckungen zu nehmen.

In diese Richtung soll sich dieses Blog entwickeln…

Technisch basiert das Projekt auf einem Perl-Dämon, der periodisch die Deutsche Digitale Bibliothek durchsucht und über eine XML-RPC Schnittstelle das Blog ansteuert. Der Quellcode steht auf GitHub und kann gerne weiter verwendet werden.

Written by Peter

Dezember 2, 2013 at 8:21 am

Ein bisschen was zu Twitterbots…

leave a comment »

In letzter Zeit beschäftige ich mich ja ein bisschen mehr mit TwitterBots. Vor kurzem gab es im New Yorker einen Artikel, der sich auch mit diesem Phänomen beschäftigt:

The Rise of Twitter Bots

Twitter bots are, essentially, computer programs that tweet of their own accord. While people access Twitter through its Web site and other clients, bots connect directly to the Twitter mainline, parsing the information in real time and posting at will; it’s a code-to-code connection, made possible by Twitter’s wide-open application programming interface, or A.P.I.

Neben den unvermeidlichen Spambots werden aber auch kreativere Exemplare vorgestellt:

Of greater interest—the signal to the spammers’ noise—is the growing population of creative bots that consume, remix, and contribute to the broader culture churn of the Internet. Many of them are remarkably productive: Adam Parrish’s everyword, for instance, has been chipping its way through the entire English language, tweeting one word at a time every thirty minutes since 2008. Ranjit Bhatnagar’s Pentametron scours Twitter every hour on the hour and retweets the first rhyming couplet that it can find. Darius Kazemi’s Professor Jocular takes a popular tweet, assumes it’s a joke, then tries to explain why people thought it was funny; the Professor’s more than twenty-three hundred attempts frequently outperform its source material.

Hier zum Beispiel ein vom Pentametron erstelltes automatisches Gedicht:

automatische Twitter Poesie

automatische Twitter Poesie…

In einem anderen Artikel wird dieser Bot schön beschrieben:

Pentametron uses an algorithm to find and retweet rhyming couplets in iambic pentameter — the ten-syllable alternating-stress meter used in Shakespeare’s plays and sonnets — and publish them in 14-line sonnets on Pentametron.com. Like most found poetry, Pentametron’s sonnets are semi-sensical, often funny, and sometimes profound, but I admire them even more as a response to the obscene amount of textual noise on the internet. If you’re trying to impose some degree of structure to the billions of words circulating throughout Twitter, why not start by enforcing an arbitrary and rigorous literary form dating to 13th century Italy?

Über Bots, die digitale Sammlungen präsentieren hatte ich ja schon öfters geschrieben, hier eine Liste von solchen bibliothekarischen Bots. In eine ähnliche Richtung geht der „Oil Painting“ Bot, der ebay-Auktionen nach Ölgemälden durchsucht und dann Links dazu twittert.

Und zum Abschluss noch ein Artikel über die seltsame Welt der Spambots:

Why Did 9,000 Porny Spambots Descend on This San Diego High Schooler?

This is the current state of play in the Internet economy. At the top of the heap, there are the Twitters and the Apples, the name technology companies that are creating billionaires.

Then, down at the bottom, there are the bots, simple pieces of code that do one thing and one thing only, but do it relentlessly.

Written by Peter

November 28, 2013 at 8:38 pm

Veröffentlicht in Scripts, Soziale Netzwerke

Tagged with ,

Die mechanische Kollegin aus der British Library

with 5 comments

The lion with the buful voice

The lion with the buful voice

Ich hatte ja schon mehrfach über verschiedene Projekte zur zufallsbasierten „resource discovery“ bei digitalen Sammlungen geschrieben.

Das neueste Projekt ist der „Mechanical Curator“ der British Library. Die Beschreibung ist so herrlich poetisch, da muss ich jetzt einfach mal ausführlich zitieren:

She plucks from obscurity, places all before you, and leaves you to work out the rest. Or not. For sometimes laughter is the only valid response: why illuminate the letter ‘O’ with a grumpy looking child; a grumpy illumination, an oxymoron? Well no, screams out the title of the host work from the metadata: ‘Face to Face with the Mexicans: the domestic life, educational, social, and business ways’. The Mechanical Curator has put us ‘face to face’ with a Mexican circa 1890, or an engraved portrait of a Mexican, or an American representations of a Mexican. And so as what at first seemed simple descends into complexity the Mechanical Curator achieves her peculiar aim: giving knowledge with one hand, carpet bombing the foundations of that knowledge with the other.

Die Beschreibung erinnert mich etwas an „Count Zero“ von William Gibson. In einem Handlungsstrang sucht eine Galeriebesitzerin dort den Hersteller mysteriöser Cornell-Boxen:

The box was a universe , a poem, frozen on the boundaries of human experience.
Gibson, W. (1987). Count Zero. New York: Ace Books. S. 15

Im Endeffekt stellt sich heraus, dass diese Kunstwerke von einer künstlichen Intelligenz geschaffen wurden (und dann auch noch auf einer Raumstation, aber das ist halt die 80er Jahre Science Fiction…)

Die „Mechanical Curator“ ist ein Projekt der British Library Labs. Jede Stunde wird automatisch ein zufälliges Bild aus deren digitalen Sammlungen in einem Tumblr-Blog gepostet (Darüber hinaus gibt es auch noch einen Twitter-Feed).

In einem weiteren Blogeintrag wird das Projekt näher erklärt: Hintergrund ist, dass zwischen 2005 und 2008 in einem großem Digitalisierungsprojekt in Zusammenarbeit mit Microsoft 65.000 Bände aus dem Bestand der British Library digitalisiert wurden. Das betraf Bücher aus dem 14. bis hinauf zum 20. Jahrhundert. Das Projekt nun soll den Zugriff auf diese Bestände über das Serendipitätsprinzip ermöglichen.

Allerdings ist auch hier der Zugang nicht nur zufallsbasiert. Bei meinem Bot hatte ich ja versucht, ihm eine digitale Persönlichkeit mit Vorlieben und Abneigungen zu verleihen. Die Mechanische Kuratorin interessiert sich für Bilder die einander ähneln und versucht auch Gesichter und Orte zu erkennen:

It adds its judgement to the posted image using tags, saying why it finds the images similar and whether or not it has detected a face or profile within the image and whereabouts it believes it is.

Das ist natürlich hochspannend, da es hier gleich zu einer Art automatischen Erschließung des Materials kommt. Bei einem Bild eines isländischen Fjords, gibt es etwa Tags, die darauf aufmerksam machen, dass dieses Bild in Verlagsort und Erscheinungsjahr anderen ähnelt. Das Programm geht aber über reine Metadaten hinaus und  findet im Bild auch eine Ähnlichkeit in „slantyness“.

Um zu vermeiden, dass das Programm in eine Endlosschleife von ähnlichen Bilder läuft wird dem Bot wird aber auch schnell langweilig und sie postet dann unter #new_train_of_thought wieder etwas Neues.

Also alles in allem wieder ein spannendes bibliothekarisches Projekt. Es lohnt sich auf jeden Fall das Experimentierlabor der britischen KollegInnen im Auge zu behalten!

Written by Peter

Oktober 13, 2013 at 2:21 pm

Ich hab da mal einen (österreichischen) Europeana-Bot geschrieben…

with 6 comments

Vor einigen Tagen bin ich auf Twitter über den @DPLABot gestolpert. Dieser Bot versucht, das ziellose „Stöbern“ auch für die digitalen Sammlungen der „Digital Public Library of America“ zu ermöglichen.

Das Programm fragt die DPLA mit zufälligen Suchbegriffen ab und präsentiert die Ergebnisse:

Eigentlich eine nette Idee und ein spannendes Programmierprojekt.

Die Europeana bietet ja auch eine Programmierschnittstelle und ich war schon länger auf der Suche nach einem halbwegs sinnvollen Projekt, um diese API einmal zu testen.

Europeana Bot

Europeana Bot

Meine erste Idee war, sich auf die „Trending Topics“ bei Twitter zu beziehen und dazu passende Europeana-Einträge zu präsentieren. Allerdings funktioniert das erstens nicht wirklich gut (auf Twitter trendet „friedrich“, der deutsche Innenminister ist gemeint, Europeana würde Bilder zum „Alten Fritz“ finden..) und natürlich ist es moralisch etwas fragwürdig als eine Art „kultureller Spambot“  die Trends zu kapern.

Also bin ich auf Ortsnamen umgeschwenkt: Die Statistik Austria bietet auf ihrer Homepage eine Liste der 2 376 österreichischen Gemeinden zum Download an. Zu einigen davon müsste es ja historische Aufnahmen, Pläne, Urkunden, etc. geben.

Mein Programm nimmt sich jetzt diese Liste, mischt einmal gut durch und sucht dann in Europeana nach Bildern, die den Ortsnamen im Titel der Aufnahme enthalten. Das erste Ergebnis wird dann jeweils bei Twitter mit Jahreszahl und gekürzter URL gepostet.

Nun denn, dann lade ich alle ganz herzlich ein, dem EuropeanaBot zu folgen!

Ajah, den Quellcode dazu gibt es natürlich auf meinem GitHub-Account!

Written by Peter

Juli 19, 2013 at 8:45 am

Veröffentlicht in Scripts, Software

Tagged with , , , , ,