Définition de la noindex
La commande noindex est utilisée pour ne pas afficher des données ou informations spécifiques dans les résultats de recherche. Le recours à une URL envoyée désignée comme « noindex » permet de gérer l’indexation dans les bases de données Google. Découvrez le rôle de la balise meta robots noindex et comment l’intégrer à vos pages.
Qu’est-ce que la noindex ?
La balise meta robots noindex permet de bloquer l’indexation d’une page ou d’une autre ressource dans les résultats de recherche Google. Elle empêche Googlebot, le robot d’exploration du moteur de recherche, d’accéder aux ressources, de les indexer et de les présenter aux utilisateurs dans SERP (Search Engine Results Pages).
Quand utiliser la noindex ?
Lorsqu’un robot crawler de Google arrive sur un site, il visite l’intégralité des pages. S’il ne détecte aucune balise meta robots noindex, il indexe l’ensemble des ressources.
Sur un site web, toutes les pages ne présentent pas d’intérêt en matière de référencement naturel ou de SEO. Si la commande noindex n’est pas utilisée, Googlebot les prend toutes en compte pour évaluer le site. Votre classement dans les résultats de recherche Google peut en pâtir.
Pour pallier le risque, il est préférable de privilégier l’indexation des pages présentant un contenu riche et pertinent à Google et aux internautes. C’est pourquoi, la balise noindex est idéale pour focaliser l’analyse des spiders vers les ressources les plus qualitatives de votre site internet. Le rôle d’un spider est de crawler. Autrement dit, parcourir et indexer l’ensemble des pages sur le web.
Moteur de recherche interne
Un moteur de recherche interne facilite l’accès au contenu et au catalogue produits sur un site web. Il est particulièrement utile pour les sites e-commerce possédant un assortiment large et complexe de produits. La probabilité de conversion est 3 fois plus élevée pour les utilisateurs utilisant un moteur de recherche interne1.
Pour chaque requête tapée par l’internaute, une page de résultats est affichée. Ces multiples pages ne permettent pas toujours d’améliorer le référencement naturel de votre site. Pour éviter d’alourdir inutilement le Crawl Budget, il est conseillé de les désindexer en y intégrant une balise noindex.
Contenu pauvre ou dupliqué
L’objectif de Google est d’offrir aux internautes du contenu qualitatif. Le moteur de recherche pénalise le contenu en double ou duplicate content et les pages de faible qualité : navigation à facettes, page panier, filtres de tri, etc.
Pour indiquer à Google de ne pas les indexer, vous pouvez utiliser une balise meta robots noindex. Vous pouvez aussi choisir une URL canonique, c’est-à-dire la plus représentative de l’ensemble de pages en double sur votre site.
Fichier PDF
Dans certains cas de figure, il peut être pertinent d’utiliser la commande noindex google pour les fichiers PDF :
- La ressource est protégée par des droits d’auteur (Google limite la promotion de ce type de contenus) ;
- Il a peu d’intérêt SEO ;
- Le fichier PDF est réservé à vos prospects (livres blancs).
Bon à savoir : Les fichiers PDF sont des documents sans HTML
Ce type de contenu nécessite l’intégration d’une valeur noindex dans un en-tête de réponse HTTP X-Robots-Tag. L’ajout d’une balise meta dans la section
n’est pas approprié.Connexion et compte client
Les pages liées au compte client (mot de passe oublié, connexion, création de comptes, etc.) ont un intérêt pour les utilisateurs réguliers, mais pas pour les autres internautes. Mieux vaut donc ne pas les afficher dans les SERPs de Google.
Comment ajouter une noindex sur sa page ?
L’instruction noindex peut être intégrée de deux manières à une page web : balise <meta> ou en-tête de réponse HTTP.
Header de la page
Pour empêcher l’indexation d’une page de votre site web par la plupart des moteurs de recherche, ajoutez la balise meta robots noindex ci-dessous dans la section <head> :
<meta name= « robots« content= « noindex« >
En-tête HTTP
L’autre option consiste à afficher un en-tête X-Robots-Tag avec une valeur noindex dans la réponse HTTP :
HTTP/1.1 200 OK
(…)
X-Robots-Tag: noindex
(…)
Cette technique peut être utilisée pour les ressources non HTML : fichiers PDF, images, vidéos, etc.
Directives Follow et NoFollow
Les balises noindex nofollow n’ont pas la même fonction. Comme vous le savez, les liens ont une importance cruciale pour le référencement naturel d’un site web. Les attributs HTML indiquent si un lien doit être suivi (Do Follow) ou non (No Follow) par les moteurs de recherche.
Pour évaluer l’efficacité de votre stratégie de netlinking, n’hésitez pas à réaliser un audit technique SEO.
Sur les CMS ? (WordPress, Prestashop, etc)
Pour masquer une page sur WordPress, vous pouvez :
- Installer et activer le plugin d’optimisation des moteurs de recherche « Yoast SEO » ;
- Paramétrer le fichier robots.txt en lui donnant l’instruction de ne pas indexer certaines ressources.
Différence entre no-index et disallow (robots.txt)
Les directives allow et disallow sont utilisées pour paramétrer le crawl via le fichier robots.txt. A contrario, les balises meta index et noindex permettent de gérer l’indexation dans les bases de données Google. Elles n’ont donc pas le même objectif.
Intégrer une directive noindex sur une page stratégique de votre site web peut avoir de lourdes conséquences sur votre stratégie SEO. L’utilisation de cette commande doit être étudiée avec précision pour optimiser votre Crawl Budget ou budget d’exploration. Pour tirer profit de manière optimale de cette fonctionnalité, nous vous conseillons de vous faire accompagner par un cabinet de conseil en performances digitales comme Ad’s up.
Les 3 points clés à retenir sur la Noindex :
- La balise meta robots noindex permet aux webmasters d’influencer l’indexation des pages d’un site web.
- La commande noindex est utilisée pour éviter le crawling de contenus pénalisants pour le SEO.
- Il existe deux solutions pour intégrer la directive dans une page web : balise meta et en-tête HTTP.
1 https://www.definitions-marketing.com/definition/moteur-de-recherche-interne/
Définitions et lexique du SEO
Bienvenue dans notre lexique sur les termes autour du référencement naturel (SEO). Nous avons rassemblé diverses définitions qui vous permettront de maîtriser le jargon SEO et faire progresser votre site !
- Trust flow
- PBN (Private Blog Network)
- Pagerank
- Duplicate content
- Featured snippet
- Google MyBusiness (GMB)
- Google page experience
- Google discover
- SXO
- Reporting SEO
- Erreur 404
- Fil d'ariane web
- Recherche universelle
- Sitelinks
- Google BERT
- Google Panda
- Google Penguin
- Trust flow
- Linkbaiting
- Sitelinks
- Keyword Stuffing
- Sitelinks
- Negative SEO
- Le cloaking SEO décrypté : référencement controversé et à risque
- Données structurées
- Backlink SEO
- Recherche organique
- Rédacteur SEO
- SEO (Search Engine Optimization)
- Référencement naturel
- Sitelinks
- Longue traîne
- Rich snippet
- Balise title
- Metadescription
- Balise H1
- Consultant SEO
- Noindex
- Lien nofollow
- Lien Dofollow
- Netlinking
- Maillage interne
- Redirection 301
- Ancre de lien
- Black hat SEO
- Position zéro
- People also ask
- URL canonique