Qu’est ce qu’une URL canonique ?
Apparue en 2009, l’URL canonique vise à apporter une solution aux problématiques d’indexation liées au duplicate content. Elle donne la possibilité de distinguer facilement la source originale de la copie d’une page web. Découvrez tous les secrets de la balise canonical avec Ad’s up.
Apparue en 2009, l’URL canonique vise à apporter une solution aux problématiques d’indexation liées au duplicate content. Elle donne la possibilité de distinguer facilement la source originale de la copie d’une page web. Découvrez tous les secrets de la balise canonical avec Ad’s up.
Différence entre une URL canonique et une balise canonical
Les notions d’URL canonique et de balise canonical sont souvent considérées comme des synonymes. Pourtant, elles n’ont pas exactement la même signification. Nous vous expliquons la différence entre les deux termes.
Définition d’une balise canonical
Une balise canonical est une balise HTML insérée dans le <head> du code source d’une page web. Elle fait partie des méthodes utilisées pour définir une URL canonique. Elle se présente sous cette forme :
<link rel=”canonical” href=”https://www.exemple.fr/“>
La balise canonical SEO spécifie à Googlebot l’URL à considérer comme canonique, donc prioritaire, parmi un ensemble de pages en double. Elle aide les développeurs et les robots d’indexation des moteurs de recherche à déterminer quelle version dupliquée est la version « officielle ». La balise canonical SEO facilite le travail d’indexation des URL par Google. En amenant directement les robots de crawl sur les pages importantes, elle réduit leur temps de présence sur le site.
Définition d’une URL canonique
Google considère les pages accessibles à partir de multiples URL ayant un contenu identique ou similaire comme des versions dupliquées. Définir une URL canonique permet d’indiquer à Googlebot, le robot d’indexation de Google, de ne pas considérer ces pages comme des contenus en double. La balise canonical précise l’URL sous laquelle le moteur de recherche doit indexer la version « officielle » de la page.
Si vous n’intégrez pas de balise canonical sur vos pages en double, Google sélectionne lui-même l’URL canonique. Il choisit la page la plus représentative, parmi l’ensemble des pages dupliquées sur le site. Cette page est explorée plus régulièrement par les robots d’exploration. Les pages en double sont quant à elles analysées moins souvent.
L’URL canonique limite donc la consommation de votre Crawl Budget ou budget d’exploration en français. Ce dernier correspond au nombre limité de pages parcourues chaque jour par Googlebot.
Pourquoi les utiliser ?
Indiquer à Google la page à privilégier
La balise canonical permet de préciser à Google l’URL à afficher dans les résultats de recherche. Attention, l’URL canonique donne seulement une indication à Google. S’il juge l’un des doublons plus pertinent ou répondant mieux à la requête d’un utilisateur, il peut l’afficher à la place.
Pour choisir la page canonique, le moteur de recherche se base sur des informations comme les performances, le contenu, la qualité de la page ou encore le protocole utilisé (HTTP ou HTTPS).
Bon à savoir : comment connaître la page considérée comme canonique par Google ?
Google met à disposition un outil d’inspection d’URL pour identifier la page explorée par Googlebot, parmi les pages en double de votre site.
L’utilisation d’une balise canonical facilite l’exploration de votre site par Googlebot. Elle lui évite de perdre du temps à visiter des pages en double. Grâce aux balises canonical, vous simplifiez le suivi des statistiques sur un contenu spécifique.
Prévenir le contenu dupliqué
Le duplicate content est détecté par Google lorsque des pages aux URL différentes affichent un contenu similaire. Il peut entraîner des conséquences néfastes sur le positionnement SEO d’un site. L’URL canonique réduit les risques relatifs au contenu dupliqué.
Indiquer des versions d’appareil différentes
L’apparence et le code d’un site web adaptatif sont paramétrés pour évoluer selon la taille de l’écran de l’utilisateur. L’objectif est d’offrir une expérience utilisateur (UX) optimale, quel que soit l’appareil utilisé : écran de Home Cinema, PC, Smartphone ou encore tablette.
Même si l’affichage diffère, le contenu reste le même, peu importe l’appareil. Il s’adapte donc, et cela induit la création de dupliqués. L’URL canonique permet d’empêcher Googlebot d’explorer les pages dupliquées.
Où implémenter les balises canonical ?
Vous souhaitez savoir comment spécifier à Google une URL canonique ? Faisons un tour d’horizon des quatre méthodes pour définir une page canonique.
Dans le code HTML
La première méthode consiste à insérer une balise <link> dans le code source de la page, entre les balises <head> et </head>.
Prenons un exemple avec l’URL canonique suivante : https://example.com/communication/affiches.
Pour faire de cette URL une URL canonique, vous devez suivre ces trois étapes :
- Intégrez une balise <link> avec l’attribut rel= »canonical » dans la partie supérieure de l’élément <head> de chaque page en double, redirigeant vers l’URL canonique. Par exemple :
<link rel= »canonical » href= »https://www.exemple.com/communication/affiches » />
- La page canonique dispose d’une variante pour mobile ? Dans ce cas, vous devez ajouter dans le code HTML une balise link rel= »alternate », redirigeant vers la version mobile de la page :
<link rel= »alternate » media= »only screen and (max-width: 640px) » href= »http://m.example.com/communication/affiches »>
- Au besoin, insérez des attributs appropriés pour la page comme l’attribut hreflang :
<link rel= »alternate » hreflang= »lang_code »… >
Il vous permet d’indiquer à Google les variations linguistiques et régionales de la page canonique.
Bon à savoir : URL absolue ou relative : laquelle privilégier ?
Avec la balise link rel= »canonical », Google conseille d’utiliser des chemins d’accès absolus1. Les URL absolues contiennent l’URL complète : protocole (http:// ou https://) nom de domaine du site Internet, répertoire, sous-dossier et nom de page. Entrées dans la barre de recherche de votre navigateur, elles vous redirigent automatiquement vers la page demandée. Les URL relatives sont quant à elles utilisées pour les liens internes. Elles incluent uniquement le nom d’un répertoire où une page spécifique.
Plus | Moins |
Vous pouvez mettre en correspondance un nombre illimité de pages ayant un contenu similaire ou proche. | L’ajout de la balise canonical peut augmenter la taille de la page.La balise <link> fonctionne uniquement pour les pages HTML. Vous ne pouvez pas l’utiliser pour les fichiers comme les PDF.La définition des URL canoniques peut s’avérer complexe dans deux cas : Votre site est volumineux ;Les URL sont régulièrement modifiées. |
Dans un sitemap
Deuxième possibilité, utiliser un sitemap XML. Ce fichier recense l’ensemble des informations sur les pages, vidéos, images, articles d’actualité et autres contenus présents sur votre site web. Il est utilisé par les bots de Google pour explorer plus efficacement les sites. Dans un sitemap, il est possible d’intégrer des éléments comme les :
- Relations entre les fichiers ;
- Dernières dates de mise à jour d’une page ;
- Fréquences de modification du contenu ;
- Versions existant dans une autre langue ;
- Degrés d’importance des fichiers ;
- Durées des vidéos ;
- Titres d’articles.
Une fois les URL canoniques choisies pour l’ensemble des pages de votre site, il convient de les envoyer dans un sitemap. Attention, seules les pages canoniques doivent être répertoriées dans le fichier. Une page dispose de deux versions ? Dans ce cas, mentionnez dans le sitemap celle devant apparaître dans les résultats de recherche.
Nous vous recommandons cette méthode si votre site est volumineux. Le sitemap peut également vous servir à indiquer à Google les pages les plus importantes de votre site.
Plus | Moins |
Facilité de mise en œuvre.Gestion simplifiée des URL canoniques pour les sites volumineux. | Googlebot doit trouver l’ensemble des pages en double associées aux pages canoniques désignées dans le sitemap.Méthode moins efficace que le code HTML pour faciliter le travail d’indexation de Googlebot. |
Dans l’en-tête HTTP
Vous avez la main sur la configuration de votre serveur ? Dans ce cas, utilisez les en-têtes HTTP rel= »canonical », au lieu des balises HTML. Depuis juin 2011, les en-têtes HTTP vous permettent d’identifier l’URL canonique de l’ensemble des documents pris en charge par la recherche Google.
Contrairement aux balises HTML, cette méthode fonctionne avec les formats non HTML, comme les fichiers PDF. Vous avez intégré un fichier PDF dans plusieurs URL de votre site ? Pour indiquer à Googlebot l’URL canonique du fichier, il vous suffit de lui renvoyer un en-tête rel=« canonical ».
Plus | Moins |
N’a pas d’incidence sur la taille de la page.Possibilité de faire correspondre un nombre infini de pages en double. | Tout comme pour la balise canonique HTML, l’intégration d’en-têtes HTTP peut être complexe sur un site volumineux, ou dont les URL évoluent régulièrement. |
Des redirections 301
Les redirections 301 sont utilisées pour les URL redirigées. Elles permettent de rediriger de manière fluide des pages en double sur un site. Vous pouvez y avoir recours pour mettre une évidence la meilleure version d’une page : ce sera votre URL canonique. Les redirections 301 renvoient le trafic des autres versions vers l’URL sélectionnée.
La redirection 301 est la meilleure méthode pour orienter les internautes et les moteurs de recherche vers la bonne page. Elle les informe du déplacement définitif d’une URL vers un autre emplacement sur le site. Attention, la redirection 301 a pour effet de “masquer” la page en double. Avant de réaliser l’opération, mieux vaut donc s’assurer de ne plus en avoir besoin.
Plus | Moins |
Méthode simple à mettre en place pour se débarrasser d’une page précise. | La redirection 301 s’utilise dans un cas de figure restreint : lorsque vous décidez d’abandonner une page en double. |
Les erreurs à éviter
Découvrez nos conseils pour gérer dans les règles de l’art les URL en double.
Mettre les balises vers la version HTTP
Un site Internet peut fonctionner sous deux protocoles :
- HTTP : Hypertext Transfer Protocol ou protocole de transfert hypertexte ;
- HTTPS : Hypertext Transfer Protocol Secure ou protocole de transfert hypertexte sécurisé.
Le protocole HTTPS permet aux internautes de surfer sur un site web en toute sécurité, quel que soit son contenu. Le protocole Transport Layer Security (TLS) sécurise les données envoyées à l’aide du protocole HTTPS. Il offre trois niveaux de protection :
- Le chiffrement : utilisé pour protéger les données échangées ;
- L’intégrité des données : pour empêcher leur modification ou corruption durant leur transfert ;
- L’authentification : pour protéger les internautes contre les attaques man in the middle (MTIM)2.
Pour définir une page comme URL canonique, Google préconise de privilégier le HTTPS au HTTP. Dans certains cas de figure, il peut être plus judicieux d’avoir recours au HTTP. Nous vous présentons ci-dessous les critères empêchant d’intégrer une balise canonique dans une page HTTPS :
- Le certificat électronique Secure Sockets Layer SSL incorrect ;
- La redirection des visiteurs vers ou via une page sous protocole HTTP ;
- Les dépendances non sécurisées ;
- La balise link rel= »canonical » vers la page HTTP à conserver.
Pour empêcher Googlebot de définir une page HTTP comme URL canonique, vous pouvez :
- Mettre en place des redirections entre la page HTTP vers la page HTTPS ;
- Insérer une balise canonical link rel= »canonical » sur la page HTTP vers la page HTTPS ;
- Utiliser l’instruction HTTP Strict Transport Security (HSTS). Elle permet de rendre un site uniquement accessible via une connexion HTTPS.
Différentes URL canoniques pour la même page
Une des mauvaises pratiques régulièrement observées consiste à définir plusieurs URL canoniques pour une seule et même page. Dans ce cas, Google peut être amené à retenir une seule de ces URL comme URL canonique. Problème : il ne va pas forcément sélectionner la version la plus optimisée de votre contenu.
Même si vous utilisez des méthodes différentes pour définir une URL canonique, il est préférable d’intégrer une seule balise canonical sur une seule page.
Optimiser les balises canonical pour les différents CMS
Les balises canonical sur WordPress
Pour paramétrer une URL canonique WordPress, vous devez utiliser des plugins SEO WordPress. Nous vous présentons les deux plugins les plus populaires :
- Yoast : pour définir une URL canonique Yoast :
- Ouvrez les options SEO du plugin, accessibles sur n’importe quelle page ou n’importe quel post ;
- Développez l’onglet « Avancé » ;
- Précisez dans le champ « Canonical URL » l’URL canonique de la page.
- RankMath : l’intégration d’une balise canonique SEO suit la même logique :
- Ouvrez l’onglet « Avancé » de l’encadré RankMath ;
- Complétez le champ « Canonical URL » avec l’URL canonique désirée.
Les balises canonical sur PrestaShop
Vous souhaitez implémenter des balises canonical sur PrestaShop ? Vous allez devoir passer par des add-ons. Les deux principaux sont :
- Simple canonical URL : ce module vous permet d’intégrer une balise link rel= »canonical » avec une URL propre entre les balises <head> et </head> de votre site PrestaShop ;
- Canonical SEO : grâce à ce module, ajoutez facilement une balise canonical dans l’en-tête de vos pages.
L’URL canonique fait partie des notions à maîtriser pour améliorer l’optimisation SEO de votre site web. Elle vous permet d’éviter les pénalités liées au duplicate content. En parallèle, elle facilite l’indexation de vos contenus dans les moteurs de recherche. Code HTML, sitemap, en-tête HTML, redirection 301 : il existe plusieurs méthodes pour implémenter une balise canonical sur une page. Pour choisir la bonne, nous vous conseillons de faire appel à une agence SEO.
Les 3 points clés à retenir :
- Une URL canonique permet d’identifier une page « officielle » parmi un ensemble de pages en double ;
- Il existe quatre méthodes pour définir une URL canonique : code HTML, sitemap, en-tête HTML ou redirection 301 ;
- Des plugins sur WordPress et Add-ons sur PrestaShop permettent d’intégrer facilement une balise canonical SEO à une page web.
1re agence SEA indépendante de France, Ad’s up consulting vous accompagne tout au long de l’élaboration de votre stratégie SEO. Ses experts imaginent des dispositifs 100 % personnalisés, adaptés à vos besoins. Ils vous aident à atteindre tous vos objectifs business : trafic, leads, ventes.
1 https://developers.google.com/search/docs/advanced/crawling/consolidate-duplicate-urls?hl=fr
2 https://developers.google.com/search/docs/advanced/security/https?hl=fr
Définitions et lexique du SEO
Bienvenue dans notre lexique sur les termes autour du référencement naturel (SEO). Nous avons rassemblé diverses définitions qui vous permettront de maîtriser le jargon SEO et faire progresser votre site !
- Trust flow
- PBN (Private Blog Network)
- Pagerank
- Duplicate content
- Featured snippet
- Google MyBusiness (GMB)
- Google page experience
- Google discover
- SXO
- Reporting SEO
- Erreur 404
- Fil d'ariane web
- Recherche universelle
- Sitelinks
- Google BERT
- Google Panda
- Google Penguin
- Trust flow
- Linkbaiting
- Sitelinks
- Keyword Stuffing
- Sitelinks
- Negative SEO
- Le cloaking SEO décrypté : référencement controversé et à risque
- Données structurées
- Backlink SEO
- Recherche organique
- Rédacteur SEO
- SEO (Search Engine Optimization)
- Référencement naturel
- Sitelinks
- Longue traîne
- Rich snippet
- Balise title
- Metadescription
- Balise H1
- Consultant SEO
- Noindex
- Lien nofollow
- Lien Dofollow
- Netlinking
- Maillage interne
- Redirection 301
- Ancre de lien
- Black hat SEO
- Position zéro
- People also ask
- URL canonique