«Swisscom IT Services wird Partner von Google» sagt die Pressemitteilung. Das ist eine schöne Sache. Kern der Abmachung seien die Google Enterprise Search Produkte. Soweit gut.
Und nun den Teil der Meldung, den ich kommentieren muss:
«Mit der Google Search Appliance bieten wir unseren Kunden die gleiche einfache und leistungsstarke Suchqualität, wie sie jeder von Google.com kennt», sagt Beat Häberli, Head of Product Management bei Swisscom IT Services.
Ich bin noch ein paar Informationen über die Verbesserung der subjektiven Relevanz schuldig aber hier ein kurzer Abriss.
Der öffentliche Google basiert seine Rangierung ursprünglich (und auch heute noch im Kern) auf die Verlinkung zwischen Webinhalten d.h. einem sogenannten «off page» Kriterium. Den Algorithmus dazu nennen sie Page Rank und die Idee entspricht der Reputation von wissenschaftlichen Papieren (je öfters zitiert desto besser), oder auch einem zufälligen Surfer (dort wo er häufiger vorbeikommt ist wohl wichtiger). Damit dieser funktioniert muss eine massive Anzahl von guten (aussagekräftigen) Links und Link-Texten vorhanden sein.
Weil auch dieses System Grenzen hat, sammelt Google.com im grossen Stil zusätzlich Nutzungsdaten zur dauernden Optimierung. So meldet die Google Toolbar oder Deskbar das Browseverhalten der Nutzer an Google.com zurück. Zusätzlich werden bei Suchanfragen die geklickten Treffer auf der Rangliste (als Stichprobe) getracked und bei angemeldeten Users wird gar die ganze Suchhistorie gespeichert.
All das kann und macht die Google Appliance nicht. Mutmasslich basiert die Relevanzgewichtung der Treffer nur auf «on page» Kriterien (im Stil von Tf-idf oder BM 25) und somit sind die Dinger «normale» Suchsysteme der ersten Generation und nicht so wie Google.com, welcher hochgradig durch Nutzungsdaten optimiert wird.
In allen Ehren: Intranet-Suche ist komplett unterschiedlich von Internet-Suche. Sowohl die Kollektion (Menge, Dokumenttypen) wie auch die Verlinkung (Menge, Aussagekraft) wie auch das Suchbedürfnis (Popularität versus Recall). Und dann nutzt die Google Appliance keine Nutzungstatiken. Einen massiven Unterschied zwischen der Trefferqualität einer Google Appliance und Google.com liess sich in einer wissenschaftlichen Evaluation in der Schweiz, deren Resultate ich kenne, sehr gut nachweisen.
Kurz: Partnerschaft toll, Google hat sehr gute Produkte aber ein Vergleich Appliance <> Google.com und Internet == Intranet entbehrt jeder Grundlage.
klassisch – mit Sales unterwegs beim Kunden und dann kommt der Spruch «Unsere Search Engine ist schneller als Google!» – ach ja – wer hat dir den das erzählt! Beruhigend ist wohl das mit dem Hardware Budget von Google wohl jede Search Engine schnell zu machen ist (ob sie dann auch relevante Resultate liefert ist ein anderes Kapitel)