Google Sitemaps für Webshops

27. September 2005

Google Sitemaps ist ein Dienst von Google, über den Webmaster Informationen über den Aufbau einer Website an Google senden können, anstatt darauf zu vertrauen, dass Google die Struktur der Site selbständig beim Durchforsten der Links entziffert.

Bisher waren Webmaster darauf angewiesen, dass jede Seite ihrer Site, die in den Index einer Suchmaschine aufgenommen werden sollte, über einen Link erreichbar war. Für Websites mit statischem Aufbau war das leicht erreichbar, indem der Webmaster eine Sitemap mit Verweisen auf alle Seiten der Website als normales HTML-Dokument anlegte.

Bei dynamischen Seiten enthalten solche Sitemaps meist Parameter in der URL, die Google unter Umständen davon abhalten, den Links zu folgen. Google selbst dokumentiert das für URLs, in denen &id= als Parameter vorkommt. Weiters rät Google davon ab, URLs zu verwenden, die viele und lange Parameter enthalten.

Google bestellt nicht bei CD-Universe

Manchmal hat man aber einfach keine Wahl, da die eingesetzte Verwaltungssoftware für die Website eine bestimmte Art von URLs vorgibt. Schöne Negativbeispiele dafür findet man oft bei Webshops.

Lösung: Google wird aktiv auf Seiten hingewiesen, die durchsucht werden dürfen.

Google Sitemaps, ganz einfach

cleaning-parts.com, ein Händler für Hochdruckreiniger und dazu passenden Ersatzteilen, war genau in dieser Lage: Fast die gesamte Website besteht aus den Artikelseiten eines Webshops, Google indiziert nur einen geringen Teil davon.

Das Protokoll der Google-Sitemaps erlaubt die Übermittlung von Sitemaps in zwei Varianten:

  • Als XML-Datei Google erhält so die Seiten-URL, die relative Priorität der angemeldeten Seiten untereinander und das Aktualisierungsdatum.
  • Als einfache Textdatei, die URLs zeilenweise anführt.

Da cleaning-parts.com ein weitgehend unveränderliches Sortiment führt, reicht eine Textdatei aus.

Open Office Calc baut Google Sitemaps

Die Voraussetzungen waren günstig:

  • Die Artikeldatenbank ist in einer tabulator-getrennten Textdatei vorhanden, eine der Spalten beinhaltet die eindeutige Artikelnummer.
  • Die eingesetzte Webshop-Software erlaubt den direkten Zugriff auf die Einzelartikelseite über eine einfache URL, die als einzigen Parameter die Artikelnummer beinhaltet.

Als Werkzeug für das Erstellen der Sitemap ist Open Office Calc (oder eine andere Tabellenkalkulation) gut geeignet. Eine Spalte wird mit den Artikelnummer gefüllt, in der zweiten Spalte wird über die einfache Textverkettungsfunktionen die endgültige URL erzeugt:

Artikelnummer Zieladresse
2354017 http://www.cleaning-parts.com/…&artnr=2354017
2354835 http://www.cleaning-parts.com/…&artnr=2354835

Über die Zwischenablage wandert der Inhalt der zweiten Spalte in eine Textdatei, die per FTP auf den Webspace hochgeladen wird. Deren Name ist irrelevant.

Google holt Sitemaps immer von der Website ab, die mit der Sitemap beschrieben wird. Damit stellt Google sicher, dass Websites nur durch autorisierte Personen beschrieben werden und niemand auf diesem Weg Unsinn anstellen kann.

Nach der Registrierung und Anmeldung teilt man Google die URL der Sitemap mit. Google fordert dann noch dazu auf, eine HTML-Datei mit einem von Google vorgegebenen Namen am Webhost abzulegen: Das ist als zusätzliche Sicherheitsmaßnahme gedacht, um Missbrauch auszuschließen und sicherzustellen, dass die Website unter der Kontrolle des Sitemap-Anmelders steht.

Erfolgskontrolle und Fehlerbehebung

In der Verwaltungsoberfläche gibt Google ab nun darüber Auskunft, ob und wann die Sitemap gelesen werden konnte. Im Fall von cleaning-parts.com vergingen zwischen Anmeldung und erstem Zugriff weniger als acht Stunden.

Ab wann die so bei Google angemeldeten Seiten in den Suchresultaten erscheinen, hängt von etlichen anderen Faktoren ab. Das Vorhandensein einer Sitemap hat laut Google und auch meinen Beobachtungen keinen Einfluss auf die Reihung in den Suchtrefferlisten. Google Sitemaps ist also nur eine Methode, um Wegweiser zu den Seiten einer Website aufzustellen, nicht mehr.