Searchmetrics Glossar: das Lexikon für SEO und Content Marketing

Sitemap

Eine Sitemap ist eine schematische Auflistung aller Webseiten oder URLs einer Website. In der Praxis wird zwischen HTML-Sitemap und der sitemap.xml unterschieden.

Die HTML-Sitemap wird vorwiegend als Übersicht mit Informationen für Besucher einer Website verwendet. Die XML-Sitemap hingegen ist eine maschinenlesbare URL-Liste für Suchmaschinen. Mit ihrer Hilfe kann die Indexierung und das Crawling einer Website gesteuert werden. Aus diesem Grund spielt die sitemap.xml für SEO eine wichtige Rolle. Sie wird auch Google Sitemap genannt, weil sie in der Google Search Console hinterlegt werden kann.

Der Nutzen einer HTML-Sitemap

Google empfiehlt in den Webmaster Guidelines, eine HTML-Sitemap zu erstellen. Sie wird auch „Site Index“, „Inhaltsverzeichnis“ oder „Seitenübersicht“ genannt:

„Provide a sitemap file with links that point to the important pages on your site. Also provide a page with a human-readable list of links to these pages (sometimes called a site index or site map page).”

Eine solche Seite ist primär für Nutzer gedacht. Sie erhalten mit einer solchen Sitemap eine Übersicht über alle wichtigen Kategorien und Unterseiten. Meist sieht eine solche Sitemap aus wie ein aufgeklapptes Navigationsmenü. Sie muss nicht zwingend alle Unterseiten enthalten und kann die wichtigsten Zielseiten zum Beispiel nach Thema sortieren.

Searchmetrics Glossar: Sitemap - Beispiel Hornbach

HTML-Sitemap von Hornbach, abrufbar unter
https://www.hornbach.de/cms/de/de/seitenuebersicht.html

Die HTML-Sitemap hat auch einen Nutzen für die Suchmaschinenoptimierung. Webmaster haben damit die Möglichkeit, Linkjuice an Unterseiten weiterzugeben. Deshalb ist die HTML-Sitemap meist von der Startseite aus verlinkt, die in der Regel die meiste Linkkraft vererbt.

Warum eine XML-Sitemap erstellen?

Viele Webmaster fragen sich, ob man unbedingt eine Sitemap benötigt, um bei Google gefunden zu werden. Da der Googlebot neue Websites automatisch crawlt, ist eine Sitemap nicht zwingend für die Indexierung erforderlich. Allerdings bietet die XML-Sitemap die Möglichkeit, Google wichtige URLs einer Domain gezielt vorzuschlagen. Primär ist das Einreichen der Sitemap in der Google Search Console ein Vorschlag. Eine Garantie auf eine Indexierung der in der Sitemap angelegten URLs besteht nicht.

Neben Google bietet auch die Microsoft-Suchmaschine Bing Webmastern die Möglichkeit, eine XML-Sitemap hochzuladen. Hierfür werden die Bing Webmastertools verwendet.

Aufbau einer XML-Sitemap

Eine XML-Sitmap ist immer ähnlich aufgebaut. Damit der Inhalt der Datei von Suchmaschinen erkannt wird, muss in der Datei zuerst die XML Version sowie die Codierung angegeben werden.

<?xml version=”1.0″ encoding=”UTF-8″?>

Danach folgt mit <urlset>…</urlset> der Hinweis zum verwendeten XML-Sitemap-Protokoll.

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

Im Folgenden werden alle relevanten URLs aufgeführt. Hier besteht die Möglichkeit, weitere Attribute einzufügen:

Mit <loc></loc> wird die URL markiert, mit <lastmod></lastmod> die letzte Aktualisierung der entsprechenden URL angegeben. Mit <changefreq></changefreq> erhält die Suchmaschine einen Hinweis darauf, wie oft der Content der URL geändert wird. Zum Schluss besteht die Möglichkeit, die Priorität der URL mit <priority></priority> zu markieren.

Eine Sitemap.xml kann dann so aussehen:

<?xml version=”1.0″ encoding=”UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>https://www.searchmetrics.com/</loc>
<lastmod>2017-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>1.0</priority>
</url>
</urlset>

In diesem Fall weiß die Suchmaschine, dass die URL “https://www.searchmetrics.com” am 1. Januar 2017 das letzte Mal aktualisiert wurde und die Aktualisierungen monatlich erfolgen. Die Seite hat höchste Priorität.

Wichtige Fragen zur Sitemap-Erstellung:

Kann eine XML-Sitemap gesplittet werden?

Eine Sitemap kann auch gesplittet werden. Dies ist insbesondere dann notwendig, wenn die Domain sehr viele Unterseiten hat. Google empfiehlt, dass eine Sitemap unkomprimiert maximal 10 Megabyte groß sein und 50.000 URLs enthalten sollte. Die gesplitteten Sitemaps lassen sich in einer Sitemap-Index-Datei bündeln.

Ist eine sitemap.xml mit & und % von Google auslesbar?

Eine XML-Sitemap muss im UTF-8-Format codiert werden. Aus diesem Grund müssen bestimmte Zeichen in der URL wie “&” oder “%” in Escape-Codes umgewandelt werden. Ansonsten besteht die Gefahr, dass die Suchmaschine die Datei nicht korrekt auslesen kann.

Müssen Canonical Tags oder hreflang-Annotationen in der XML-Sitemap angegeben werden?

Canonical Tags müssen nicht in der Sitemap hinterlegt werden. Gibt es jedoch übersetzte Versionen einer Website und wird auf diese per hreflang verwiesen, sind diese auch in der Sitemap Pflicht. Gleiches gilt für AMP-Versionen oder alternative mobile Webseiten, auf die per rel=”alternate” im Quellcode der Webseite verwiesen wird.

Können relative URLs in der Sitemap hinterlegt werden?

Jede XML-Sitemap muss konsistente und vollständig qualifizierte Pfade zu Unterseiten enthalten. Auch Sitzungs-IDs sollten nicht in der Sitemap übernommen werden.

Gibt es Sitemaps für verschiedene Dateitypen?

Für Video- und Bilddateien lassen sich separate Sitemaps einreichen. Diese Sitemaps werden einzeln erstellt und separat hochgeladen. Es ist möglich, die darin aufgeführten Bilder oder Videos mit zusätzlichen Attributen zu versehen.

Eine Sitemap.xml erstellen und hochladen

Eine Sitemap.xml ist mit gängigen CMS wie WordPress, Joomla! oder Typo3 in der Regel über systemeigene Tools zu erstellen. Alternativ gibt es eine große Zahl an Drittanbietern, die kostenlose wie kostenpflichtige Tools zur Sitemap-Erstellung bereitstellen. Üblicherweise wird für diese Tools keine Installation benötigt. Sie werden als Software-as-a-Service online angeboten.

Nachdem die sitemap.xml erstellt wurde, müssen Webmaster sie herunterladen und speichern. Anschließend wird sie in das Root-Verzeichnis der eigenen Domain hochgeladen. Je nach Umfang der Seite kann es wenige Minuten bis mehrere Stunden dauern, bis eine komplette XML-Sitemap erstellt wurde. Wie schnell die Sitemap erstellt werden kann, hängt auch von der Geschwindigkeit des verwendeten Programms sowie den möglichen Serververbindungen ab.

Beispiel: www.meinedomain.de/sitemap.xml

Diese URL wird anschließend in der Google Search Console oder den Bing Webmastertools hinterlegt. So können Suchmaschinen die Datei abrufen und die angezeigten URLs an die Crawler übermitteln.

Alternativ oder zusätzlich kann der Link zur Sitemap auch in die robots.txt-Datei eingefügt werden. Der Eintrag sieht so aus:

Sitemap: http://www.meinedomain.de/sitemap.xml

Der Googlebot kann die Datei dann vor dem Crawling abrufen. Tools wie die Google Search Console oder die Bing Webmastertools erleichtern den Umgang mit der sitemap.xml. Sie helfen Nutzern, die Inhalte der Datei auf Fehler zu prüfen und geben entsprechendes Feedback bei Änderungen. Kostenpflichtige Webanalysetools können diese Aufgabe ebenfalls übernehmen.

Die Sitemap für Google-News

Während die XML-Sitemap für SEO nicht obligatorisch ist, zählt sie zu den Aufnahmevoraussetzungen, wenn eine Website in den Google-News gelistet werden möchte. In diesem Fall werden an die Sitemap-Erstellung zusätzliche Anforderungen gestellt. So dürfen beispielsweise nur Seiten aufgeführt werden, die in den letzten zwei Tagen veröffentlicht wurden. Ebenso ist die Kapazität der News-Sitemap auf 1.000 URLs beschränkt.

F