Qu’est ce que la Noindex ? | Ad's up
Fermer

Aidez-nous à préparer notre rendez-vous

    Votre nom*
    Votre prénom
    Votre adresse email*
    Votre numéro de téléphone
    Votre site internet
    Votre société*
    Projet, leviers à développer, ambitions ,objectifs, historique

    Les données saisies ci-dessus seront traitées par Ad’s up Consulting aux fins d’analyser votre demande et d’y répondre. Les champs marqués d’un * sont obligatoires. Vous disposez d’un droit d’accès, de rectification, d’effacement, d’opposition, consultez notre Politique de confidentialité ici pour en savoir plus.

    Ce site est protégé par reCAPTCHA et les Règles de confidentialité (https://policies.google.com/privacy) et les Conditions d'utilisation (https://policies.google.com/terms) de Google s'appliquent.

    Fermer Menu
    ×
    Home / Agence SEO / Définitions et lexique du SEO

    Définition de la noindex

    En savoir plus sur notre expertise Agence SEO 04/12/2021 5 min. de lecture mm Sylvain

    La commande noindex est utilisée pour ne pas afficher des données ou informations spécifiques dans les résultats de recherche. Le recours à une URL envoyée désignée comme « noindex » permet de gérer l’indexation dans les bases de données Google. Découvrez le rôle de la balise meta robots noindex et comment l’intégrer à vos pages.

    Qu’est-ce que la noindex ?

    La balise meta robots noindex permet de bloquer l’indexation d’une page ou d’une autre ressource dans les résultats de recherche Google. Elle empêche Googlebot, le robot d’exploration du moteur de recherche, d’accéder aux ressources, de les indexer et de les présenter aux utilisateurs dans SERP (Search Engine Results Pages). 

    Quand utiliser la noindex ?

    Lorsqu’un robot crawler de Google arrive sur un site, il visite l’intégralité des pages. S’il ne détecte aucune balise meta robots noindex, il indexe l’ensemble des ressources. 

    Sur un site web, toutes les pages ne présentent pas d’intérêt en matière de référencement naturel ou de SEO. Si la commande noindex n’est pas utilisée, Googlebot les prend toutes en compte pour évaluer le site. Votre classement dans les résultats de recherche Google peut en pâtir.

    Pour pallier le risque, il est préférable de privilégier l’indexation des pages présentant un contenu riche et pertinent à Google et aux internautes. C’est pourquoi, la balise noindex est idéale pour focaliser l’analyse des spiders vers les ressources les plus qualitatives de votre site internet. Le rôle d’un spider est de crawler. Autrement dit, parcourir et indexer l’ensemble des pages sur le web.

    Moteur de recherche interne

    Un moteur de recherche interne facilite l’accès au contenu et au catalogue produits sur un site web. Il est particulièrement utile pour les sites e-commerce possédant un assortiment large et complexe de produits. La probabilité de conversion est 3 fois plus élevée pour les utilisateurs utilisant un moteur de recherche interne1

    Pour chaque requête tapée par l’internaute, une page de résultats est affichée. Ces multiples pages ne permettent pas toujours d’améliorer le référencement naturel de votre site. Pour éviter d’alourdir inutilement le Crawl Budget, il est conseillé de les désindexer en y intégrant une balise noindex

    Contenu pauvre ou dupliqué

    L’objectif de Google est d’offrir aux internautes du contenu qualitatif. Le moteur de recherche pénalise le contenu en double ou duplicate content et les pages de faible qualité : navigation à facettes, page panier, filtres de tri, etc. 

    Pour indiquer à Google de ne pas les indexer, vous pouvez utiliser une balise meta robots noindex. Vous pouvez aussi choisir une URL canonique, c’est-à-dire la plus représentative de l’ensemble de pages en double sur votre site. 

    Fichier PDF

    Dans certains cas de figure, il peut être pertinent d’utiliser la commande noindex google pour les fichiers PDF : 

    • La ressource est protégée par des droits d’auteur (Google limite la promotion de ce type de contenus) ;
    • Il a peu d’intérêt SEO ;
    • Le fichier PDF est réservé à vos prospects (livres blancs).

    Bon à savoir : Les fichiers PDF sont des documents sans HTML

    Ce type de contenu nécessite l’intégration d’une valeur noindex dans un en-tête de réponse HTTP X-Robots-Tag. L’ajout d’une balise meta dans la section n’est pas approprié.

    Connexion et compte client 

    Les pages liées au compte client (mot de passe oublié, connexion, création de comptes, etc.) ont un intérêt pour les utilisateurs réguliers, mais pas pour les autres internautes. Mieux vaut donc ne pas les afficher dans les SERPs de Google.

    Comment ajouter une noindex sur sa page ?

    L’instruction noindex peut être intégrée de deux manières à une page web : balise <meta> ou en-tête de réponse HTTP.

    Header de la page

    Pour empêcher l’indexation d’une page de votre site web par la plupart des moteurs de recherche, ajoutez la balise meta robots noindex ci-dessous dans la section <head> :

    <meta name= « robots«  content= « noindex« >

    En-tête HTTP

    L’autre option consiste à afficher un en-tête X-Robots-Tag avec une valeur noindex dans la réponse HTTP : 

    HTTP/1.1 200 OK

    (…)

    X-Robots-Tag: noindex

    (…)

    Cette technique peut être utilisée pour les ressources non HTML : fichiers PDF, images, vidéos, etc.

    Directives Follow et NoFollow

    Les balises noindex nofollow n’ont pas la même fonction. Comme vous le savez, les liens ont une importance cruciale pour le référencement naturel d’un site web. Les attributs HTML indiquent si un lien doit être suivi (Do Follow) ou non (No Follow) par les moteurs de recherche. 

    Pour évaluer l’efficacité de votre stratégie de netlinking, n’hésitez pas à réaliser un audit technique SEO.

    Sur les CMS ? (WordPress, Prestashop, etc)

    Pour masquer une page sur WordPress, vous pouvez : 

    • Installer et activer le plugin d’optimisation des moteurs de recherche « Yoast SEO » ;
    • Paramétrer le fichier robots.txt en lui donnant l’instruction de ne pas indexer certaines ressources.

    Différence entre no-index et disallow (robots.txt)

    Les directives allow et disallow sont utilisées pour paramétrer le crawl via le fichier robots.txt. A contrario, les balises meta index et noindex permettent de gérer l’indexation dans les bases de données Google. Elles n’ont donc pas le même objectif. 

    Intégrer une directive noindex sur une page stratégique de votre site web peut avoir de lourdes conséquences sur votre stratégie SEO. L’utilisation de cette commande doit être étudiée avec précision pour optimiser votre Crawl Budget ou budget d’exploration. Pour tirer profit de manière optimale de cette fonctionnalité, nous vous conseillons de vous faire accompagner par un cabinet de conseil en performances digitales comme Ad’s up. 

    Les 3 points clés à retenir sur la Noindex : 

    • La balise meta robots noindex permet aux webmasters d’influencer l’indexation des pages d’un site web.
    • La commande noindex est utilisée pour éviter le crawling de contenus pénalisants pour le SEO.
    • Il existe deux solutions pour intégrer la directive dans une page web : balise meta et en-tête HTTP. 

    1 https://www.definitions-marketing.com/definition/moteur-de-recherche-interne/ 

    À propos de l'auteur

    Sylvain
    Sylvain
    Responsable SEO international
    En tant que Team Leader SEO, Sylvain accompagne les entreprises dans l'élaboration et la mise en place de stratégies SEO afin de les rendre visibles aux yeux de Google ainsi que des prospects.