Glossaire

Qu'est-ce qu'un sitemap XML ?

8 février 2026 Mis à jour le 19 avr. 2026

Un sitemap XML est un fichier qui répertorie toutes les pages importantes de votre site web dans un format structuré que les moteurs de recherche peuvent facilement lire. Considérez-le comme une table des matières pour votre site. Bien que les robots des moteurs de recherche finissent par découvrir la plupart de vos pages en suivant les liens, un sitemap accélère le processus et garantit que rien d'important n'est oublié, en particulier sur les grands sites comportant des centaines ou des milliers de pages.

Ce que contient réellement un sitemap

À la base, un sitemap XML est une liste d'URL avec des métadonnées optionnelles pour chaque entrée. Voici ce que signifie chaque champ :

  • <loc> : l'URL complète de la page. C'est le seul champ obligatoire.
  • <lastmod> : la date à laquelle la page a été modifiée pour la dernière fois. Google l'utilise pour décider s'il faut réexplorer la page. Si vous mettez à jour un article de blog, la date lastmod doit refléter ce changement.
  • <changefreq> : la fréquence à laquelle la page est susceptible de changer (always, hourly, daily, weekly, monthly, yearly, never). En pratique, Google ignore largement ce champ et s'appuie plutôt sur ses propres données d'exploration.
  • <priority> : une valeur entre 0,0 et 1,0 indiquant l'importance relative de la page au sein de votre site. Comme changefreq, ce champ est aujourd'hui largement ignoré par Google. Il était plus pertinent aux débuts des sitemaps.

Structure du sitemap et fichiers d'index de sitemap

Un seul fichier sitemap peut contenir jusqu'à 50 000 URL et ne doit pas dépasser 50 Mo une fois décompressé. Pour la plupart des sites WordPress de petite à moyenne taille, un seul fichier suffit largement. Mais les sites plus grands (boutiques WooCommerce avec des milliers de produits, sites d'actualités avec des années d'archives) atteignent rapidement cette limite.

La solution est un fichier d'index de sitemap. Au lieu de répertorier directement les URL, le fichier d'index pointe vers plusieurs sitemaps plus petits :

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://example.com/post-sitemap.xml</loc>
    <lastmod>2025-03-15</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://example.com/page-sitemap.xml</loc>
    <lastmod>2025-02-20</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://example.com/product-sitemap.xml</loc>
    <lastmod>2025-03-18</lastmod>
  </sitemap>
</sitemapindex>

Yoast SEO et Rank Math divisent automatiquement votre sitemap en fichiers plus petits organisés par type de contenu (articles, pages, catégories, produits, etc.).

Un exemple de sitemap basique

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>https://example.com/</loc>
    <lastmod>2025-03-15</lastmod>
    <priority>1.0</priority>
  </url>
  <url>
    <loc>https://example.com/about/</loc>
    <lastmod>2025-01-10</lastmod>
    <priority>0.8</priority>
  </url>
</urlset>

Comment Google Search Console utilise votre sitemap

Soumettre votre sitemap à Google Search Console est l'une des premières choses à faire après le lancement d'un site WordPress. Une fois soumis, Search Console vous indique combien d'URL Google a trouvées dans le sitemap et combien d'entre elles sont réellement indexées. C'est extrêmement utile pour diagnostiquer les problèmes. Si votre sitemap répertorie 500 pages mais que seules 300 sont indexées, vous savez qu'il y a un problème à investiguer. Peut-être que certaines pages sont peu fournies, dupliquées ou retournent des erreurs.

Google Search Console vous indique également quand le sitemap a été lu pour la dernière fois par Googlebot, vous pouvez ainsi confirmer que Google vérifie régulièrement les mises à jour.

WordPress et les sitemaps

Depuis la version 5.5, WordPress génère automatiquement un sitemap XML basique à /wp-sitemap.xml. Ce sitemap intégré est fonctionnel mais assez basique. Il inclut les articles, pages et types de contenus personnalisés, mais manque de fonctionnalités fournies par les extensions SEO.

La plupart des propriétaires de sites utilisent plutôt une extension SEO, car les extensions offrent plus de contrôle :

  • Yoast SEO : génère des sitemaps à /sitemap_index.xml, les divise par type d'article, inclut les références d'images dans chaque entrée d'URL et exclut automatiquement le contenu en noindex.
  • Rank Math : fonctionnalités similaires, accessibles à /sitemap_index.xml. Prend également en charge les sitemaps d'actualités et les sitemaps vidéo pour les sites disposant de ce type de contenu.

Lorsque vous activez une extension SEO qui génère des sitemaps, elle désactive généralement le sitemap du cœur de WordPress pour éviter les conflits.

Ce qu'il faut inclure et ce qu'il faut exclure

Votre sitemap doit être une liste sélectionnée de pages que vous souhaitez réellement voir indexées par les moteurs de recherche. Cela signifie être sélectif :

  • À inclure : articles de blog publiés, pages importantes (à propos, contact, services), pages de produits, pages de catégories ayant un contenu significatif.
  • À exclure : pages définies en noindex, pages de contenu peu fourni (archives de tags avec seulement un ou deux articles), pages d'archives paginées (/page/2/, /page/3/), pages de résultats de recherche internes, pages de connexion ou d'inscription, pages de remerciement après l'envoi de formulaires.

Un sitemap surchargé rempli d'URL de faible qualité peut en fait nuire à votre SEO. Google a un budget d'exploration limité pour chaque site, et s'il passe du temps à explorer des pages qui ne méritent pas d'être indexées, vos pages importantes pourraient être explorées moins fréquemment.

La directive Sitemap dans robots.txt

Votre fichier robots.txt doit inclure une ligne pointant vers votre sitemap :

Sitemap: https://example.com/sitemap_index.xml

Cela aide les moteurs de recherche à trouver votre sitemap même si vous ne l'avez pas soumis via Search Console. La plupart des extensions SEO ajoutent cette ligne automatiquement. Si vous avez un fichier robots.txt personnalisé, assurez-vous que la directive Sitemap est présente et pointe vers la bonne URL.

Erreurs courantes liées aux sitemaps

Quelques pièges reviennent régulièrement avec les sitemaps WordPress :

  • Inclure des URL en noindex : si une page possède une balise meta noindex mais apparaît dans le sitemap, vous envoyez à Google des signaux contradictoires. La page dit « ne m'indexe pas » tandis que le sitemap dit « indexe-moi s'il te plaît ». Les extensions SEO gèrent généralement cela correctement, mais les sitemaps créés manuellement peuvent avoir ce problème.
  • Dates lastmod obsolètes : certaines configurations ne mettent jamais à jour l'horodatage lastmod. Si chaque page de votre sitemap affiche la même date d'il y a trois ans, Google cesse de faire confiance aux données lastmod et se rabat sur son propre calendrier d'exploration.
  • Oublier la mise à jour après une migration : après le déplacement vers un nouveau domaine ou la modification de votre structure d'URL, le sitemap contient souvent encore les anciennes URL. Cela entraîne un flot d'erreurs 404 dans Search Console.
  • Plusieurs sitemaps en conflit : exécuter à la fois le sitemap du cœur de WordPress et un sitemap d'extension en même temps. Bien que ce ne soit pas nuisible en soi, cela peut prêter à confusion lors du débogage des problèmes d'indexation.

Ce que vérifie InspectWP

InspectWP vérifie si votre site WordPress dispose d'un sitemap XML accessible. Il recherche l'URL du sitemap dans votre fichier robots.txt et essaie des chemins courants comme /sitemap.xml, /sitemap_index.xml et /wp-sitemap.xml. Si un sitemap est trouvé, InspectWP confirme qu'il est accessible et valide, vous aidant à détecter des problèmes comme des URL de sitemap cassées ou des directives de sitemap manquantes avant qu'elles n'affectent votre visibilité dans les recherches.

Vérifiez votre site WordPress dès maintenant

InspectWP analyse votre site WordPress pour détecter les problèmes de sécurité, de SEO, de conformité RGPD et de performance — gratuitement.

Analyser votre site gratuitement