Une balise canonique (<link rel="canonical">) est un élément HTML placé dans la section <head> d'une page web. Son rôle est simple : elle indique aux moteurs de recherche quelle URL doit être traitée comme la version « maîtresse » de cette page. Si le même contenu existe à plusieurs adresses, la balise canonique pointe vers celle que vous voulez voir indexée et classée.
Ce que signifie le contenu dupliqué pour le référencement
Le contenu dupliqué ne déclenche pas de pénalité Google au sens traditionnel, mais il crée de réels problèmes. Lorsque les moteurs de recherche trouvent le même texte sur plusieurs URL, ils doivent choisir une version à afficher dans les résultats. S'ils choisissent la mauvaise, votre page préférée perd en visibilité. Pire, les backlinks et signaux de classement se trouvent répartis sur toutes les URL dupliquées au lieu d'être concentrés sur une seule page. Avec le temps, cette dilution peut discrètement faire descendre votre contenu dans les résultats de recherche.
Dans WordPress, le contenu dupliqué se produit plus souvent que la plupart des propriétaires de sites ne le réalisent. Les paramètres de pagination, les identifiants de session, les paramètres de suivi comme utm_source, les variations www vs non-www, les différences de barre oblique finale et HTTP vs HTTPS peuvent tous créer des URL distinctes qui servent un contenu identique. Les archives de catégories et de tags chevauchent parfois aussi les articles.
Comment les moteurs de recherche gèrent les doublons sans balises canoniques
Lorsqu'aucune balise canonique n'est présente, les moteurs de recherche tentent de déterminer la « meilleure » URL par eux-mêmes. Google considère des facteurs comme la version qui a le plus de liens entrants, l'URL qui apparaît dans le sitemap et le format utilisé par les liens internes. Mais c'est un jeu de devinettes. Google pourrait choisir une URL avec des paramètres de requête disgracieux plutôt que votre permalien propre. Il pourrait consolider les signaux sur une version que vous n'aviez pas prévue. En laissant le moteur de recherche deviner, vous perdez le contrôle sur la façon dont vos pages apparaissent dans les résultats de recherche.
L'élément link rel="canonical" expliqué
La balise canonique est un élément <link> qui se trouve à l'intérieur du <head> HTML. Sa syntaxe ressemble à ceci :
<link rel="canonical" href="https://example.com/page/" />Cette ligne dit : « Quelle que soit la variante d'URL qui a amené l'utilisateur ici, veuillez traiter https://example.com/page/ comme la version définitive. » Les moteurs de recherche consolident alors les signaux de classement sur cette URL et l'affichent typiquement dans les résultats de recherche.
Vous pouvez également définir des URL canoniques via l'en-tête HTTP Link, ce qui est utile pour les ressources non-HTML comme les PDF. Le format de l'en-tête est : Link: <https://example.com/page/>; rel="canonical".
Canoniques auto-référentielles
Une canonique auto-référentielle est une balise canonique qui pointe vers la même URL sur laquelle elle apparaît. Par exemple, la page à https://example.com/about/ a une balise canonique pointant vers https://example.com/about/. Cela peut sembler redondant, mais c'est considéré comme une bonne pratique. Les canoniques auto-référentielles protègent vos pages d'être accidentellement dupliquées par des paramètres de requête ou des variations d'URL dont vous pourriez ne pas avoir conscience. La plupart des extensions SEO ajoutent des canoniques auto-référentielles à chaque page par défaut, et il n'y a aucun inconvénient à les inclure.
Balise canonique vs redirection : quand utiliser laquelle
Les balises canoniques et les redirections 301 résolvent toutes deux le problème du contenu dupliqué, mais elles fonctionnent différemment et conviennent à différentes situations.
- Balise canonique : À utiliser lorsque vous voulez garder les deux URL accessibles aux utilisateurs mais consolider les signaux de recherche sur une seule. C'est idéal pour les pages avec des paramètres de suivi, les versions imprimables ou les listes de produits triés/filtrés qui doivent rester fonctionnelles.
- Redirection 301 : À utiliser lorsqu'une URL ne devrait plus exister du tout. La redirection envoie physiquement les utilisateurs et les moteurs de recherche vers la nouvelle URL. C'est le bon choix après la migration vers un nouveau domaine, le changement d'une structure de permalien ou la fusion de deux pages en une.
Une règle simple : si les utilisateurs ont encore besoin d'accéder aux deux URL, utilisez une canonique. Si l'ancienne URL n'a plus aucune utilité, redirigez-la.
Erreurs courantes avec les balises canoniques
Les balises canoniques sont faciles à implémenter mais aussi faciles à mal configurer. Voici les erreurs qui apparaissent le plus souvent :
- Pointer vers une page noindex : Si votre URL canonique a une balise meta
noindex, vous envoyez des signaux contradictoires. Vous dites à Google d'indexer l'URL canonique tout en lui disant simultanément de ne pas le faire. Google peut ignorer les deux directives. - URL canoniques cassées ou inexistantes : Si l'URL canonique renvoie une 404 ou redirige ailleurs, les moteurs de recherche ne peuvent pas l'honorer. Assurez-vous toujours que la cible canonique existe réellement et renvoie un statut 200.
- Canoniques inter-domaines sans configuration appropriée : Les balises canoniques entre différents domaines peuvent fonctionner, mais Google les traite comme un indice plutôt qu'une directive. Si les domaines ne semblent pas liés, Google ignore souvent la canonique inter-domaines.
- Utilisation d'URL relatives : Les balises canoniques devraient toujours utiliser des URL absolues (commençant par
https://). Les chemins relatifs peuvent causer un comportement inattendu selon la configuration de l'URL de base. - Canonicaliser les pages paginées vers la page 1 : Si vous avez un article ou une liste de produits paginé, ne faites pas pointer les pages 2, 3, 4 vers la page 1. Chaque page paginée a un contenu unique et devrait avoir soit une canonique auto-référentielle, soit faire partie d'une configuration de pagination correctement structurée.
WordPress et les balises canoniques
WordPress génère des balises canoniques de base automatiquement depuis la version 2.9 via l'action wp_head. Cependant, l'implémentation intégrée est minimale. Les extensions SEO offrent un bien meilleur contrôle :
- Yoast SEO : Génère automatiquement des balises canoniques pour toutes les pages et vous permet de définir des canoniques personnalisées par article, page ou terme de taxonomie via l'éditeur d'article.
- Rank Math : Fonctionnalité similaire avec l'option supplémentaire de définir des URL canoniques en masse via son interface.
- The SEO Framework : Génère des canoniques avec des valeurs par défaut sensées et une configuration minimale nécessaire.
Ces extensions gèrent les cas particuliers comme les archives paginées, les pages de pièces jointes et les pages de résultats de recherche, qui nécessitent toutes des traitements canoniques différents des articles standard.
Pagination et balises canoniques
Le contenu paginé est un cas particulier. Si votre archive de blog a des pages à /blog/, /blog/page/2/ et /blog/page/3/, chaque page affiche des articles différents. Canonicaliser toutes vers /blog/ dirait à Google que les pages 2 et 3 sont des doublons de la page 1, ce qu'elles ne sont pas. Chaque page devrait avoir une canonique auto-référentielle. Google recommandait auparavant les balises rel="prev" et rel="next" pour la pagination, mais a annoncé en 2019 qu'il n'utilisait plus ces signaux. Les canoniques auto-référentielles sur chaque page paginée restent l'approche recommandée.
Comment Google gère les signaux contradictoires
Google traite la balise canonique comme un indice fort, pas une règle absolue. Si d'autres signaux contredisent votre balise canonique, Google peut choisir une URL différente. Par exemple, si votre sitemap liste l'URL A, vos liens internes pointent tous vers l'URL B et votre balise canonique pointe vers l'URL C, Google a trois signaux contradictoires et utilisera son propre jugement. Pour rendre vos balises canoniques efficaces, alignez tous les signaux : assurez-vous que votre sitemap, vos liens internes, vos balises hreflang et vos balises canoniques pointent tous vers la même URL préférée.
Ce que vérifie InspectWP
InspectWP vérifie si vos pages WordPress incluent une balise canonique et signale l'URL canonique qu'il trouve. Les balises canoniques manquantes sont signalées comme un problème de référencement car elles laissent la gestion de votre contenu dupliqué aux suppositions des moteurs de recherche. InspectWP détecte également si l'URL canonique diffère de l'URL de la page actuelle, ce qui vous aide à vérifier que les canoniques inter-pages sont intentionnelles et correctement configurées.