Nach Thomann.de, Conrad.de und Bonprix.de kommt heute Otto.de in den SEO-Schraubstock. Dabei
Session-IDs
Bei Online-Shops sind Session-IDs – als Hinweis auf Duplicate Content – natürlich das Erste, wonach geschaut wird. Die Suchanfrage
inurl:sid site:otto.de
zeigt dann auch ca. 300 URLs, die eine Session-ID beinhalten, z. B.
http://www.otto.de/Schnaeppchen/Haushalt/shop-de_bc_sh12198968/;sid=DaqCLT1Pb9YDLXHbdy7rRFFFg5tT5UsJ679ycSJFSKz90Q7mkecH7oJsSKz90UlZHFqAlL-e
Die Session-ID ist hier aber leider kein CGI-Parameter (also “?sid=…” oder “?…&sid=…”). Man kann “sid” hier also nicht einfach über die Google Webmaster Tools als auszuschließenden Parameter setzen.
Das ist in diesem Fall aber auch nicht unbedingt nötig, weil es eben nur ca. 300 URLs mit Session-IDs gibt. Das Problem wird dadurch abgemildert, dass alle Seiten ein Canonical-Tag haben. Wenn Google also die beiden Seiten
http://www.otto.de/Schnaeppchen/Haushalt/shop-de_bc_sh12198968/;sid=DaqCLT1Pb9YDLXHbdy7rRFFFg5tT5UsJ679ycSJFSKz90Q7mkecH7oJsSKz90UlZHFqAlL-e
und
http://www.otto.de/Schnaeppchen/Haushalt/shop-de_bc_sh12198968/
indexiert, weiß Google mithilfe des Canonical-Tag (in diesem Fall <link rel=”canonical” href=”http://www.otto.de/Schnaeppchen/Haushalt/shop-de_bc_sh12198968/” />), hinter welcher der beiden Seiten sich die “richtige” Seite befindet.
An dieser Stelle sei aber nochmal auf zwei grundlegende Probleme von Canonical-Tags hingewiesen:
- Diese werden von Suchmaschinen nicht alle gleichermaßen gut unterstützt. Insbesondere Bing (was wohl die einzig noch relevante Suchmaschine außer Google ist) kann damit derzeit noch nicht so gut umgehen wie Google.
- Das Canonical-Tag funktioniert aktuell nur dann, wenn sich auch alle Varianten einer URL im Index befinden. Genau das will man aber im Allgemeinen verhindern, wenn man eine sehr große Site hat und Google eine extrem hohe Anzahl an Dubletten permanent überprüfen muss. In diesem Fall ist das bei 300 URLs nicht so schlimm.
Das Mittel der Wahl wäre also sicherlich eine URL-Normalisierung: Wenn eine Anfrage vom User-Agent “Googlebot” kommt und sich eine Session-ID in der URL befindet, sollte per 301-Umleitung auf die URL ohne Session-ID weitergeleitet werden.
Ob Otto das auf diesem Wege macht, lässt sich übrigens über Tools wie www.urivalet.com überprüfen. Man kann dort eine Anfrage mit einem bestimmten User-Agent abschicken – in diesem Fall aber mit dem Ergebnis, dass die URL nicht umgeleitet wird:
Top-Navigation
Wenn sich mal der Mauszeiger über die Top-Navigation bewegt, klappt schnell eine Fly-Out-Navigation heraus. Dank der Vielzahl an Oberrubriken kommen so schnell 200 Links auf Unterrubriken zusammen. Das erinnert schnell an die Diskussion zur Fly-Out-Navigation bei Bonprix.de.
In diesem Fall kann aber Entwarnung gegeben werden. Die Links sind nicht im HTML-Code enthalten und auch für Google unsichtbar. Das lässt sich leicht überprüfen, indem man z. B. nach einer Komponente aus der Fly-Out-Navigation sucht. Da es dort einen Link “Staubsaugen & Reinigen” gibt, kann dieser auch direkt gesucht werden:
“staubsaugen & reinigen” site:otto.de
Google zeigt zwar ca. 10.900 Ergebnisse, aber das sind eben die Seiten, bei denen das auch in der linken Navigation vorkommt. Die Top-Navigation ist für Google anscheinend nicht zu erkennen – ein gutes Ergebnis.
Rubrikenseiten
Während es bei den letzten beiden Punkten eher Lob für Otto gibt, haben die Rubrikenseiten immer noch sehr viel Potenzial. So werden die Seitentitel einfach aus den Navigationspunkten heraus gebildet.
Ein Beispiel:
Die Seite der Rubrik “Kinder > Jungen (Gr. 92 – 188) > Hosen & Jeans” hat den Seitentitel:
“Hosen & Jeans / Jungen (Gr. 92 – 188) / Kinder – OTTO-Online-Shop”
Für die Suchanfrage “jeans jungen” wird diese Seite dann auch recht weit oben bei Google gefunden – vor allem, weil die Wörter in der richtigen Reihenfolge und Schreibweise im Seitentitel vorkommen.
Der Mechanismus, dass der Seitentitel aus den Rubriken gebildet wird, sorgt also erst einmal dafür, dass tiefere Rubriken auch viele potenzielle Suchbegriffe im Seitentitel erhalten. Das mag in dieser Rubrik sinnvoll sein, aber in anderen Rubriken sorgt es eben dafür, dass unnötig viele Wörter im Seitentitel stehen und damit Potenzial verschenkt wird. Denn: Die Relevanz eines Wortes im Seitentitel fällt mit der Anzahl der Wörter im Seitentitel.
So gibt es die Oberrubrik “Baumarkt”, die dafür sorgt, dass in jeder Unterrubrik auch das Wort Baumarkt vorkommt. Die Rubrik “Tischleuchten” hat dann diesen Seitentitel:
“Tischleuchten / Beleuchtung / Haus & Wohnen / Baumarkt – OTTO-Online-Shop”
Da aber wohl niemals oder bestenfalls sehr selten nach “tischleuchten wohnen” oder “tischleuchten baumarkt” gesucht wird, verschenkt Otto hier Möglichkeiten.
Wie sähe hier also eine Lösung aus?
- Am besten wäre es natürlich, wenn man jeder Rubrikenseite einen individuellen Seitentitel mitgeben könnte. Eine Rubrik wie “Landhausleuchten” sollte dann auch noch Synonyme wie “Landhauslampen” oder “Leuchten Landhausstil” aufnehmen. Das erfordert sicherlich jede Menge Recherche, aber das Ergebnis sollte diesen Aufwand rechtfertigen – zumal sich hier auch priorisiert vorgehen lässt. So könnte Otto mit den umsatzstärksten Rubriken beginnen oder auch automatisierte Lösungen suchen, bei denen z. B. die Suchvolumina der Rubrikennamen herangezogen werden.
- Wenn das nicht möglich oder gewollt ist, könnte man den alternativen Weg gehen und Rubriken als suchmaschinenrelevant oder -irrelevant definieren. Wenn es also eine Rubrik wie “Jungen” gibt, die dann dafür sorgt, dass in allen tieferen Rubrikenseiten das Wort “Jungen” im Seitentitel vorkommt, ist das sicherlich gewollt, weil eben oft z. B. nach “hosen jungen” gesucht wird. Eine solche Rubrik würde also als suchmaschinenrelevant definiert werden, was dann dazu führt, dass diese Rubrik in den Seitentiteln der Unterrubriken erscheint. Auf der anderen Seite gäbe es dann aber suchmaschinenirrelevante Rubriken wie “Baumarkt” oder “Weihnachtsshop”, bei denen diese Bestandteile nicht mehr im Seitentitel erscheinen.
Das beste Gegenargument gegen Lösung 2 wäre wohl die Usability, weil die Seitentitel nicht einheitlich wären – was aber hier nicht schlimm ist, weil Lösung 1 ohnehin die wahrscheinlich bessere wäre.
Faceted Navigation
Etwas enttäuscht war ich auf jeden Fall von der Faceted Navigation:
Prinzipiell ist Faceted Navigation eine hervorragende Möglichkeit, um auf bestimmte Suchbegriffskombinationen abzuzielen, z. B. “Marke + Produktkategorie”.
Die Filterseiten befinden sich allerdings nicht im Google Index, was daran liegt, dass Crawler die Links hinter den Filtern nicht erkennen können, da diese per JavaScript eingeblendet werden. Explizit gesperrt hat Otto die Seiten aber auch nicht. Weder in der robots.txt finden sich entsprechende Anweisungen noch gibt es ein Meta-Robots-Tag “noindex” auf den Filterseiten, um diese aus dem Index zu verbannen. Otto.de hat hier eher einen recht indirekten Weg gewählt: Die JavaScript-Dateien sind für Suchmaschinen gesperrt – was Google aber nicht aufhalten sollte. Besser wäre es also, explizit die Filterseiten zu sperren.
Meta Descriptions
Bei Otto lässt sich auch gut erkennen, wie Google derzeit mit zu langen Meta Descriptions umgeht. In der Vergangenheit wurden diese eigentlich immer hinten gekürzt (endet auf “…”). Mittlerweile ist Google aber besser geworden.
Die Seite http://www.otto.de/Baumarkt/shop-de_bc_sh1573558/ hat z. B. die folgenden Meta Description:
“OTTO Baumarkt hat die Marken und die Heimwerker-Auswahl rund ums Bauen, Renovieren und Wohnen. Ob für das Haus, den Garten oder die Werkstatt: Ein riesiges Angebot an Baumarkt-Angeboten sowie alles für den Heimtier-Bedarf jetzt bequem im OTTO-Online-Shop auswählen und bestellen.”
In den Google-Ergebnissen zeigt Google dann das folgende Snippet an:
“OTTO Baumarkt hat die Marken und die Heimwerker-Auswahl rund ums Bauen, Renovieren und Wohnen. … jetzt bequem im OTTO-Online-Shop auswählen und bestellen.”
Wer also sicherstellen möchte, dass Google das Richtige anzeigt, sollte einfach darauf achten, dass die Meta Description die richtige Länge (ca. 140 Zeichen) hat.
Fazit
Otto.de ist eine sehr große Website, bei der es natürlich schwierig ist, immer den Blick fürs Detail zu behalten. So ist es verständlich, dass für die Seitentitel der Rubrikenseiten ein Mechanismus gewählt wurde, der oftmals recht gute Ergebnisse bringt.
Dennoch: Die Potenziale liegen oft im Detail. Diese Analyse hätte noch deutlich länger ausfallen können, weil mir noch viel mehr kleine und mittlere Potenziale aufgefallen sind. Dabei darf aber eines niemals vergessen werden: Manchmal gibt es eben auch die üblichen begrenzenden Faktoren wie Zeit, Geld und Entwickler-Ressourcen.