Digital sozialisiert, Denker, Macher und Angel Investor.

Einzigartig: Canonical URLs

E

Das Problem kennen wir als Anbieter von Informationen, als Consultat auf Projekten und von der Konzeption von Suchlösungen. Identische Inhalte/Seiten werden an verschiedenen Orten gezeigt. Dies obschon Links eindeutig und für immer stabil sein sollten.
Suchtrefferlisten werden „verunreinigt“ (mehrfache Treffer, die keine zusätzliche Information einbringen), unterschiedliche Links zeigen auf inhaltlich vergleichbare Ziele oder identische Seiten, die über verschiedene Domänen zu erreichen sind, werden als Spam klassifiziert. Die Erkennung identischer Inhalten (Duplikate) und fast identischer Inhalten (Similikate) ist ein aufwändiger Job für Suchmaschinenbetreiber. Also kommt Google und überträgt die Aufgabe den Menschen die Inhalte anbieten: Specify your canonical.
Ein Link-Tag in der -Sektion gibt an, welches die richtige/autoritäre Adresse des gezeigten Inhaltes ist. Als Anbieter kann ich überflüssige Parameter entfernen und zusammenhängende Seite auf eine Adresse zurückführen. Praktisch.
Als Beispiel soll der Bilder-Dienst Flickr dienen. Da die Zugehörigkeit zu „Sets“, „Groups“ etc. in REST-URLs codiert wird, gibt es viele Links zu einem einzelnen Bild (welches in einem anderen Kontext gezeigt wird). Im Quellcode steht aber die eineindeutige Quellangabe mit dem Link-Tag.
> Unser Visitenkartenbild in verschiedenen Kontexten
http://www.flickr.com/photos/jstuker/3612838135/in/photostream/
http://www.flickr.com/photos/jstuker/3612838135/in/set-72157619315980060/
http://www.flickr.com/photos/jstuker/3612838135/in/pool-namics
http://m.flickr.com/#/photos/jstuker/3612838135/
(Die URls bei Flickr sind vorbildlich gut gemacht. Dennoch: Wie soll der Suchcrawler wissen, welcher Link die „beste“ ist?)
> Der Link-Code im header

<link rel=»canonical» href=»http://www.flickr.com/photos/jstuker/3612838135/» />

> Die kanonische URL ist also:
http://www.flickr.com/photos/jstuker/3612838135/
3-2-1-los an die Konzeption 😉
PS: Auch funktionieren tut http://flic.kr/p/6vfJUF aber jetzt ist das Ding wieder nicht mehr kanonisch 😉 Und hier der Trick dafür.

1 Kommentar

  • Zwei weitere Möglichkeiten um das gleiche zu bezwecken: Sende Status-Code 303 zusammen mit der Canonical URL oder sende Status Code-200 zusammen mit der Canonical-URL als Content-Location im Header wenn eine nicht-kanonische URL angefragt wird.

Digital sozialisiert, Denker, Macher und Angel Investor.