Eine XML-Sitemap ist eine Datei, die alle wichtigen Seiten deiner Website in einem strukturierten Format auflistet, das Suchmaschinen leicht lesen können. Stell sie dir als Inhaltsverzeichnis deiner Seite vor. Suchmaschinen-Crawler werden die meisten deiner Seiten irgendwann über Links entdecken, aber eine Sitemap beschleunigt den Prozess und stellt sicher, dass nichts Wichtiges übersehen wird, besonders bei großen Seiten mit Hunderten oder Tausenden von Unterseiten.
Was eine Sitemap tatsächlich enthält
Im Kern ist eine XML-Sitemap eine Liste von URLs mit optionalen Metadaten für jeden Eintrag. Hier ist die Bedeutung der einzelnen Felder:
<loc>: Die vollständige URL der Seite. Dies ist das einzige Pflichtfeld.<lastmod>: Das Datum der letzten Änderung. Google nutzt dies, um zu entscheiden, ob die Seite erneut gecrawlt werden soll. Wenn du einen Blogbeitrag aktualisierst, sollte das lastmod-Datum diese Änderung widerspiegeln.<changefreq>: Wie oft sich die Seite voraussichtlich ändert (always, hourly, daily, weekly, monthly, yearly, never). In der Praxis ignoriert Google dieses Feld weitgehend und verlässt sich stattdessen auf eigene Crawl-Daten.<priority>: Ein Wert zwischen 0.0 und 1.0, der die relative Wichtigkeit der Seite innerhalb deiner Website angibt. Wie changefreq wird auch dieses Feld von Google heute größtenteils ignoriert.
Sitemap-Struktur und Sitemap-Index-Dateien
Eine einzelne Sitemap-Datei kann bis zu 50.000 URLs enthalten und darf unkomprimiert nicht größer als 50 MB sein. Für die meisten kleinen bis mittleren WordPress-Seiten reicht eine Datei völlig aus. Größere Seiten (WooCommerce-Shops mit Tausenden Produkten, Nachrichtenseiten mit jahrelangen Archiven) stoßen aber schnell an dieses Limit.
Die Lösung ist eine Sitemap-Index-Datei. Anstatt URLs direkt aufzulisten, verweist die Index-Datei auf mehrere kleinere Sitemaps:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://example.com/post-sitemap.xml</loc>
<lastmod>2025-03-15</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/page-sitemap.xml</loc>
<lastmod>2025-02-20</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/product-sitemap.xml</loc>
<lastmod>2025-03-18</lastmod>
</sitemap>
</sitemapindex>
Sowohl Yoast SEO als auch Rank Math teilen deine Sitemap automatisch in kleinere Dateien auf, organisiert nach Inhaltstyp (Beiträge, Seiten, Kategorien, Produkte etc.).
Ein einfaches Sitemap-Beispiel
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/</loc>
<lastmod>2025-03-15</lastmod>
<priority>1.0</priority>
</url>
<url>
<loc>https://example.com/about/</loc>
<lastmod>2025-01-10</lastmod>
<priority>0.8</priority>
</url>
</urlset>
Wie Google Search Console deine Sitemap nutzt
Das Einreichen deiner Sitemap bei Google Search Console ist eines der ersten Dinge, die du nach dem Start einer WordPress-Seite tun solltest. Nach der Übermittlung zeigt dir die Search Console, wie viele URLs Google in der Sitemap gefunden hat und wie viele davon tatsächlich indexiert sind. Das ist unglaublich nützlich für die Fehlerdiagnose. Wenn deine Sitemap 500 Seiten auflistet, aber nur 300 indexiert sind, weißt du, dass es ein Problem gibt, das untersucht werden sollte. Vielleicht sind einige Seiten dünn, dupliziert oder liefern Fehler.
Google Search Console zeigt dir auch, wann die Sitemap zuletzt vom Googlebot gelesen wurde, sodass du bestätigen kannst, dass Google regelmäßig nach Aktualisierungen sucht.
WordPress und Sitemaps
Seit Version 5.5 generiert WordPress automatisch eine einfache XML-Sitemap unter /wp-sitemap.xml. Diese eingebaute Sitemap ist funktional, aber recht einfach gehalten. Sie enthält Beiträge, Seiten und benutzerdefinierte Beitragstypen, bietet aber nicht die Funktionen, die SEO-Plugins mitbringen.
Die meisten Seitenbetreiber verwenden stattdessen ein SEO-Plugin, weil die Plugins mehr Kontrolle bieten:
- Yoast SEO: Generiert Sitemaps unter
/sitemap_index.xml, teilt sie nach Beitragstyp auf, fügt Bildreferenzen innerhalb jedes URL-Eintrags ein und schließt automatisch noindexierte Inhalte aus. - Rank Math: Ähnliche Funktionalität, erreichbar unter
/sitemap_index.xml. Unterstützt zusätzlich News-Sitemaps und Video-Sitemaps für Seiten mit solchen Inhalten.
Wenn du ein SEO-Plugin aktivierst, das Sitemaps generiert, deaktiviert es typischerweise die WordPress-Core-Sitemap, um Konflikte zu vermeiden.
Was rein sollte und was nicht
Deine Sitemap sollte eine kuratierte Liste von Seiten sein, die du tatsächlich von Suchmaschinen indexiert haben möchtest. Das bedeutet, selektiv zu sein:
- Aufnehmen: Veröffentlichte Blogbeiträge, wichtige Seiten (Über uns, Kontakt, Leistungen), Produktseiten, Kategorieseiten mit sinnvollem Inhalt.
- Ausschließen: Seiten mit noindex, Seiten mit dünnem Inhalt (Tag-Archive mit nur einem oder zwei Beiträgen), paginierte Archivseiten (/page/2/, /page/3/), interne Suchergebnisseiten, Login- oder Registrierungsseiten, Danke-Seiten nach Formulareinsendungen.
Eine aufgeblähte Sitemap voller minderwertiger URLs kann deiner SEO sogar schaden. Google hat ein begrenztes Crawl-Budget für jede Seite, und wenn es Zeit damit verbringt, Seiten zu crawlen, die nicht indexiert werden sollten, werden deine wichtigen Seiten möglicherweise seltener gecrawlt.
Die Sitemap-Direktive in der robots.txt
Deine robots.txt-Datei sollte eine Zeile enthalten, die auf deine Sitemap verweist:
Sitemap: https://example.com/sitemap_index.xml
Das hilft Suchmaschinen, deine Sitemap zu finden, auch wenn du sie nicht über die Search Console eingereicht hast. Die meisten SEO-Plugins fügen diese Zeile automatisch hinzu. Wenn du eine benutzerdefinierte robots.txt-Datei hast, stelle sicher, dass die Sitemap-Direktive vorhanden ist und auf die richtige URL verweist.
Häufige Sitemap-Fehler
Ein paar Stolperfallen tauchen bei WordPress-Sitemaps regelmäßig auf:
- Noindexierte URLs einschließen: Wenn eine Seite ein noindex-Meta-Tag hat, aber in der Sitemap erscheint, sendest du Google widersprüchliche Signale. Die Seite sagt „indexiere mich nicht", während die Sitemap sagt „bitte indexiere mich." SEO-Plugins handhaben das normalerweise korrekt, aber manuell erstellte Sitemaps können dieses Problem haben.
- Veraltete lastmod-Daten: Manche Setups aktualisieren den lastmod-Zeitstempel nie. Wenn jede Seite in deiner Sitemap das gleiche Datum von vor drei Jahren zeigt, hört Google auf, den lastmod-Daten zu vertrauen, und fällt auf seinen eigenen Crawl-Zeitplan zurück.
- Vergessen, nach einer Migration zu aktualisieren: Nach dem Umzug auf eine neue Domain oder einer Änderung der URL-Struktur enthält die Sitemap oft noch alte URLs. Das führt zu einer Flut von 404-Fehlern in der Search Console.
- Mehrere widersprüchliche Sitemaps: Sowohl die WordPress-Core-Sitemap als auch eine Plugin-Sitemap gleichzeitig betreiben. Das ist zwar nicht schädlich, kann aber beim Debuggen von Indexierungsproblemen verwirrend sein.
Was InspectWP prüft
InspectWP prüft, ob deine WordPress-Seite eine zugängliche XML-Sitemap hat. Es sucht die Sitemap-URL in deiner robots.txt-Datei und probiert gängige Pfade wie /sitemap.xml, /sitemap_index.xml und /wp-sitemap.xml. Wenn eine Sitemap gefunden wird, bestätigt InspectWP, dass sie erreichbar und gültig ist. So kannst du Probleme wie defekte Sitemap-URLs oder fehlende Sitemap-Direktiven erkennen, bevor sie deine Suchsichtbarkeit beeinträchtigen.