Die Sitemap ist eine xml-Datei, die auf dem Server einer Website abgespeichert wird und eine Übersicht über alle URLs der Seite präsentiert.
In der Sitemap werden somit alle Einzelseiten einer Website, aber auch Bilddateien oder Videos aufgeführt. Die Sitemap wird genutzt um Webcrawlern zu kommunizieren, welche Seiten gecrawlt, d.h. durchsucht werden sollen.
Die Sitemap ist ein wichtiges Element in der Suchmaschinenoptimierung. Im Idealfall werden in der Sitemap nur die URLs aufgeführt, die auch indexiert werden sollten, d.h. von denen man möchte, dass sie in den Suchergebnissen von Google & Co. aufgeführt werden.
In der Regel wird die sitemap.xml direkt im Hauptverzeichnis einer Website abgelegt. Sie kann jedoch - anders als die robots.txt - theoretisch überall platziert werden. Damit Webcrawler sie finden, ist es sinnvoll den Ort der Sitemap in der robots.txt zu verlinken.
Die XML-Sitemap kann auch mittels der Google Search Console (oder auch den Bing Webmaster Tools) direkt bei der Suchmaschine eingereicht werden und gibt dem Webcrawler hier eine erste Orientierung.
Best Practices
XML Websites sollten in der Regel nicht mehr als 50.000 URLs beinhalten und auch nicht größer als 50 MB sein. Google selbst empfiehlt eine maximale Größe von 10 MB. Um die Größe der Datei zu reduzieren, können Sitemaps auch komprimiert werden.
Sollte eine Website mehr als 50.000 URLs beinhalten, kann es sinnvoll sein die URL-Auflistung zu splitten und mehrere Sitemaps zu erstellen und diese in einer Index-Sitemap zu verlinken.
Ein XML-Sitemap muss stets vollständige URLs enthalten, d.h. relative URLs haben in einer Sitemap nichts zu suchen.
Spezial-Sitemaps
Neben der Standard-XML-Sitemap gibt es spezialisierte Typen. Die News Sitemap ist relevant für Anbieter, die Google Discover-Traffic generieren möchten: Sie enthält nur Artikel der letzten 48 Stunden und hilft Google, aktuelle Inhalte schneller zu erfassen. Die Video Sitemap ermöglicht es, Videoinhalt inklusive Metadaten wie Titel, Beschreibung und Thumbnail direkt zu melden - was die Chance auf Rich Results in der Videosuche erhöht.
Priority und Changefreq
Innerhalb der XML-Sitemap lassen sich für jede URL die optionalen Attribute "priority" und "changefreq" angeben. Google behandelt diese Werte als Hinweise, nicht als verbindliche Anweisungen. Zu viele als "high priority" markierte URLs verlieren an Signalwert. Eine bewusste Priorisierung der wirklich relevanten Seiten ist sinnvoller als Standardwerte für alle URLs.