Een XML-sitemap is een bestand dat alle belangrijke pagina's van uw website opsomt in een gestructureerd formaat dat zoekmachines eenvoudig kunnen lezen. Beschouw het als een inhoudsopgave voor uw site. Hoewel zoekmachine-crawlers de meeste van uw pagina's uiteindelijk via links zullen ontdekken, versnelt een sitemap dit proces en zorgt ervoor dat niets belangrijks over het hoofd wordt gezien, vooral op grote sites met honderden of duizenden pagina's.
Wat een sitemap daadwerkelijk bevat
In de kern is een XML-sitemap een lijst met URL's met optionele metadata per vermelding. Hier is wat elk veld betekent:
<loc>: de volledige URL van de pagina. Dit is het enige verplichte veld.<lastmod>: de datum waarop de pagina voor het laatst is gewijzigd. Google gebruikt dit om te bepalen of de pagina opnieuw moet worden gescand. Werkt u een blogartikel bij, dan dient de lastmod-datum die wijziging te weerspiegelen.<changefreq>: hoe vaak de pagina waarschijnlijk wijzigt (always, hourly, daily, weekly, monthly, yearly, never). In de praktijk negeert Google dit veld grotendeels en vertrouwt op zijn eigen scangegevens.<priority>: een waarde tussen 0,0 en 1,0 die het relatieve belang van de pagina binnen uw site aangeeft. Net als changefreq wordt dit tegenwoordig grotendeels door Google genegeerd. Het was relevanter in de begintijd van sitemaps.
Sitemap-structuur en sitemap-indexbestanden
Eén sitemapbestand kan tot 50.000 URL's bevatten en mag in ongecomprimeerde vorm niet groter zijn dan 50 MB. Voor de meeste kleine tot middelgrote WordPress-sites is één bestand ruim voldoende. Maar grotere sites (WooCommerce-winkels met duizenden producten, nieuwssites met jarenlange archieven) bereiken die limiet snel.
De oplossing is een sitemap-indexbestand. In plaats van URL's direct op te sommen, wijst het indexbestand naar meerdere kleinere sitemaps:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://example.com/post-sitemap.xml</loc>
<lastmod>2025-03-15</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/page-sitemap.xml</loc>
<lastmod>2025-02-20</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/product-sitemap.xml</loc>
<lastmod>2025-03-18</lastmod>
</sitemap>
</sitemapindex>Zowel Yoast SEO als Rank Math splitsen uw sitemap automatisch op in kleinere bestanden, georganiseerd per inhoudstype (berichten, pagina's, categorieën, producten enzovoort).
Een eenvoudig sitemap-voorbeeld
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/</loc>
<lastmod>2025-03-15</lastmod>
<priority>1.0</priority>
</url>
<url>
<loc>https://example.com/about/</loc>
<lastmod>2025-01-10</lastmod>
<priority>0.8</priority>
</url>
</urlset>Hoe Google Search Console uw sitemap gebruikt
Het indienen van uw sitemap bij Google Search Console is een van de eerste dingen die u moet doen na de lancering van een WordPress-site. Eenmaal ingediend laat Search Console u zien hoeveel URL's Google in de sitemap heeft gevonden en hoeveel daarvan daadwerkelijk zijn geïndexeerd. Dit is bijzonder nuttig voor het diagnosticeren van problemen. Vermeldt uw sitemap 500 pagina's maar zijn er slechts 300 geïndexeerd, dan weet u dat er een probleem is dat onderzoek verdient. Misschien zijn sommige pagina's te dun, gedupliceerd of geven ze fouten terug.
Google Search Console laat u ook zien wanneer de sitemap voor het laatst door Googlebot is gelezen, zodat u kunt bevestigen dat Google regelmatig op updates controleert.
WordPress en sitemaps
Sinds versie 5.5 genereert WordPress automatisch een eenvoudige XML-sitemap op /wp-sitemap.xml. Deze ingebouwde sitemap is functioneel maar vrij basaal. Hij bevat berichten, pagina's en aangepaste berichttypen, maar mist functies die SEO-plug-ins bieden.
De meeste site-eigenaren gebruiken in plaats daarvan een SEO-plug-in, omdat plug-ins meer controle bieden:
- Yoast SEO: genereert sitemaps op
/sitemap_index.xml, splitst ze op per berichttype, neemt afbeeldingsverwijzingen op binnen elke URL-vermelding en sluit automatisch noindex-inhoud uit. - Rank Math: vergelijkbare functionaliteit, toegankelijk op
/sitemap_index.xml. Ondersteunt ook nieuwssitemaps en videositemaps voor sites met dat type inhoud.
Wanneer u een SEO-plug-in activeert die sitemaps genereert, wordt de WordPress-core-sitemap doorgaans uitgeschakeld om conflicten te voorkomen.
Wat op te nemen en wat uit te sluiten
Uw sitemap dient een zorgvuldig samengestelde lijst te zijn van pagina's die u daadwerkelijk door zoekmachines wilt laten indexeren. Dat betekent selectief zijn:
- Opnemen: gepubliceerde blogartikelen, belangrijke pagina's (over ons, contact, diensten), productpagina's, categoriepagina's met betekenisvolle inhoud.
- Uitsluiten: pagina's met noindex, dunne inhoudspagina's (tagarchieven met slechts één of twee berichten), gepagineerde archiefpagina's (/page/2/, /page/3/), interne zoekresultaatpagina's, login- of registratiepagina's, bedankpagina's na formulierinzendingen.
Een opgeblazen sitemap vol URL's van lage kwaliteit kan uw SEO juist schaden. Google heeft per site een beperkt scanbudget, en als het tijd besteedt aan het scannen van pagina's die geen indexering verdienen, kunnen uw belangrijke pagina's minder vaak worden gescand.
De Sitemap-richtlijn in robots.txt
Uw robots.txt-bestand dient een regel te bevatten die naar uw sitemap verwijst:
Sitemap: https://example.com/sitemap_index.xmlDit helpt zoekmachines uw sitemap te vinden, zelfs als u deze niet via Search Console heeft ingediend. De meeste SEO-plug-ins voegen deze regel automatisch toe. Heeft u een aangepast robots.txt-bestand, zorg er dan voor dat de Sitemap-richtlijn aanwezig is en naar de juiste URL verwijst.
Veelvoorkomende sitemap-fouten
Een aantal valkuilen komt regelmatig voor bij WordPress-sitemaps:
- Noindex-URL's opnemen: heeft een pagina een noindex-metatag maar staat hij in de sitemap, dan stuurt u Google tegenstrijdige signalen. De pagina zegt "indexeer mij niet" terwijl de sitemap zegt "indexeer mij alstublieft". SEO-plug-ins gaan hier doorgaans correct mee om, maar handmatig aangemaakte sitemaps kunnen dit probleem vertonen.
- Verouderde lastmod-datums: sommige opzetten werken het lastmod-tijdstempel nooit bij. Als elke pagina in uw sitemap dezelfde datum van drie jaar geleden toont, vertrouwt Google de lastmod-data niet meer en valt terug op zijn eigen scanrooster.
- Bijwerken na migratie vergeten: na verhuizing naar een nieuw domein of wijziging van uw URL-structuur bevat de sitemap vaak nog oude URL's. Dit leidt tot een vloed aan 404-fouten in Search Console.
- Meerdere conflicterende sitemaps: tegelijk de WordPress-core-sitemap en een plug-in-sitemap actief hebben. Hoewel dit op zich niet schadelijk is, kan het voor verwarring zorgen bij het oplossen van indexeringsproblemen.
Wat InspectWP controleert
InspectWP controleert of uw WordPress-site een toegankelijke XML-sitemap heeft. Het zoekt naar de sitemap-URL in uw robots.txt-bestand en probeert gangbare paden zoals /sitemap.xml, /sitemap_index.xml en /wp-sitemap.xml. Wordt een sitemap gevonden, dan bevestigt InspectWP dat deze bereikbaar en geldig is, zodat u problemen zoals defecte sitemap-URL's of ontbrekende sitemap-richtlijnen kunt opsporen voordat ze uw zichtbaarheid in zoekresultaten beïnvloeden.