Luis von Ahn (Update: Er hat nun einen Blog) hat eine coole Vision und beweist ein paar Aspekte davon gleich selbst. Das erste Mal habe ich über Luis im Rahmen des ESP-Games (Update: Original nicht mehr online, hier die Nachmache) geschrieben (vgl. Mensch oder Machine?).
Interessant ist, dass er sein ESP-Game bei Google im Rahmen eines TechTalks (sehenswert!) erklärt hat… und Google ein paar Wochen später einen fast identischen Dienst lancierte: Google Image Labeler. Evt. wegen Luis› Aussage im Talk, dass er dem ESP-Game auf einer populären Game-Site alle Bilder von Google Images mit 5000 Spielern innert «a few weeks» mit Metadaten beschreiben könnte.
Luis› Vision ist es, menschliche Rechenzeit — die bis anhin nicht oder schlecht genutzt ist — nutzbringend einzusetzen. Zur Illustration (er sagt nicht wie er die Zahlen schätzt): Im Jahr 2003 spielten Menschen (vor lauter Langeweile) 9 Milliarden Stunden Solitär auf dem Computer. Zum Vergleich: Das Empire State Building sei in 7 Mio. Stunden gebaut worden (= 6,8 Std. paralleles Solitär-Spiel) oder der Panama Kanal in 20 Mio. Stunden resp. einem Tag parallelen Soiltär etc. Und könnte man damit tun?
Das menschliche Gehirn kann Aufgaben lösen, die der Computer nicht beherrscht und wenn genügend Leute dran sind, ist die Menschheit (vor dem Computer am fast nichts tun) ein riesiger «Problemlösungcluster» etc. «Peekaboom«!
Die Idee ist wirklich cool. Zwei Menschen spielen gegeneinander: Peek und Boom. Boom wird ein (vollständiges) Bild gezeigt plus ein Stichwort zum Bild (welches mit dem ESP-Game ermittelt wurde). Zu diesem Zeitpunkt sieht Peek noch nichts. Boom klickt nun auf sein Bild und Peek wird gleichzeitig der geklickte Bereich mit einem Radius von 20 Pixels gezeigt. Ziel ist es, dass Peek möglichst schnell und mit einem möglichst kleinen aufgedeckten Bereich den Begriff erratet. Zudem noch ein paar weitere Funktionen wir «Pointing» oder Hinweis auf Nomen, Text, Verb etc.
Damit weiss der Computer a) ob der Begriff wirklich auf dem Bild vorkommt und b) wo auf dem Bild der Begriff ist. Beides für Computer unlösbare Aufgaben Aufgaben, die aber sehr wertvoll sind. Beispielsweise um Erkennungsalgorithmen für Bilder zu trainieren.
Fast erschreckend ist die Lust mit der das Spiel gespielt wird. So gibt es beim ESP-Game Sessions die über 15 Stunden dauern (!) und ein paar User spielten über 20 Stunden die Woche (aber einer .edu Domäne).
Hier das sehr spannende Paper: Peekaboom: A Game for Locating Objects in Images [pdf, 550KB]
Da wären wir ja wieder im 17. Jahrhundert angelangt:
Before mechanical and electronic computers, the term «computer», in use from the mid 17th century, meant a human undertaking mathematical calculations. Teams of people or human computers were used to undertake long and often tedious calculations. The work was divided so that this could be undertaken in parallel.
Alter Kaffee, gab’s das nicht schon bei Amazon Mechanical Turk? http://www.mturk.com/mturk/welcome
Die Idee von Luis ist spezifischer mit Bezug auf Annotation und Erkennung von Bildern und Bildbestandteilen. Der grosse Unterschied: Er lässt die Leute *gratis* «spielen». Zudem sind seine Detailargumentationen bzgl. Robustheit des Verfahrens sehr gut duchdacht.
The technique has been more recently applied for «cracking» captchas. Give people free porn and they’ll do almost anything — even think!