Digital sozialisiert, Denker, Macher und Angel Investor.

Wie mache ich Text zu Information?

W

Die Jungs und Mädels sind schlau und sie haben auch extrem viel Daten um statische valide Aussagen machen zu können.
Google macht (machte?) einfachen Textvergleich. Mein Suchbegriff wird 1:1 mit den Inhalten der Seiten auf der Trefferlisten verglichen. So kommen also Informationswissenschafter und kritisieren (berechtigt) die Grenzen dieses simplen Vorgehens (welches Google in Perfektion beherrscht). Nachdem ich heute über Google Music Trends (s.unten) gelesen habe, fallen mir ein paar Sachen dazu ein.
Ziel beim Finden ist es das aktuelle (subjektive) Informationsbedürfnis des Suchenden rauszufinden. Dazu gibt es verschiedenen Wege einer ist: Nachfragen. Ein einfaches Beispiel. Ich suche auf Wikipedia nach Läufer und treffe auf die folgenden Seite.
i-3b03a70701741e07362f1539d7e09971-wikipedia_laeufer-thumb.gif
Durch einen weiteren Klick weiss Wikipedia wonach ich suche. So was heisst Disambiguierung oder Suchassistenz. Und was hat das mit Google zu tun?
Suchen Sie auf www.google.ch nach «zürich bern»
i-5ea3607f86b143377b1ee61d76e9183a-google_zurich-bern-thumb.gif
Bei google.com gibt es zahlreiche sogenannte One Box Module (nicht alle dokumentiert). Beispielsweise:
Suche nach «goog» (Börsenkurs über Symbol)
«flight zrh nyc» (Flugplan pber Keyword)
«weather boston» (Wetterprognose über Keyword)
«9101150134711320079261» (UPS Tracking über Checksumme)
«movies 94040» (Kinoprogramm in der PLZ 9404 über Keyword)
«movie: superman» (Filminformationen über Keyword)
U.s.w. hier ein paar mehr bei Google, Bei Yahoo heisst diese Funktion Shortcuts und kann auch von der Community mitgestaltet werden: Yahoo Open Shortcuts.
Die letzen Beispiele lassen klar erkennen wie diese entstanden sind. So auch der Läufer bei Wikipedia, aber Google will alles algorithmisch lösen? Ein Beispiel (und somit bin ich beim Thema): Google Music Trends. Hier weiss Google nicht nur wer (statistisch gesehen) welche Musik wie häufig hört aber auch, dass gewisse Texte Titel von Musikstücken sind, zu welchem Album sie gehören und welchem Stil diese zugeordnet werden können.
i-9342cbd7fc89cc584f6b07266561fe01-google_music-trends-thumb.gif
Wie geht das? Ein Blick in die Hilfe und dort steht:

How do I participate in Music Trends?
The first step is to download and install Google Talk, if you haven’t done so already. You can then opt in to Music Trends from Google Talk’s Settings menu (learn more). After that, anytime you share your music status using iTunes ® , Winamp, Windows Media ® Player, or Yahoo Music Engine ™ , you’ll be voting on Google Music Trends.

Hier sieht man das mächtige Zusammenspiel. Ich machen einen Chat-Client und denke aber von Anfang an dran, welche Daten ich sammeln kann, damit ich für meine Kernanwendung Statistik-Daten habe. Ziemlich gut (aber auch eine bedrohliche Perspektive auch Datenschutzsicht).

kommentieren

Von Jürg Stuker
Digital sozialisiert, Denker, Macher und Angel Investor.