Google BERT : Comment l'algorithme révolutionne le SEO | Ad's up
Fermer

Aidez-nous à préparer notre rendez-vous

    Votre nom*
    Votre prénom
    Votre adresse email*
    Votre numéro de téléphone
    Votre site internet
    Votre société*
    Projet, leviers à développer, ambitions ,objectifs, historique

    Les données saisies ci-dessus seront traitées par Ad’s up Consulting aux fins d’analyser votre demande et d’y répondre. Les champs marqués d’un * sont obligatoires. Vous disposez d’un droit d’accès, de rectification, d’effacement, d’opposition, consultez notre Politique de confidentialité ici pour en savoir plus.

    Ce site est protégé par reCAPTCHA et les Règles de confidentialité (https://policies.google.com/privacy) et les Conditions d'utilisation (https://policies.google.com/terms) de Google s'appliquent.

    Fermer Menu
    ×
    Home / Agence SEO / Définitions et lexique du SEO

    Google BERT : quel impact pour le SEO ?

    En savoir plus sur notre expertise Agence SEO 12/01/2024 6 min. de lecture mm Tanguy

    Depuis son développement par Google en 2018, l’algorithme BERT a progressivement été déployé sur le moteur de recherche. Bien qu’il ne s’agisse pas de la dernière mise à jour en date, BERT continue d’impacter les résultats de recherche grâce à ses capacités en matière de compréhension du langage naturel.

    Qu’est-ce que Google BERT ?

    Google BERT (pour Bidirectional Encoder Representations from Transformers) est un algorithme de traitement automatique du langage naturel (Natural Language Processing ou NLP) développé par Google.

    L’objectif de BERT est d’améliorer la pertinence des résultats affichés sur les SERPs (les pages de résultats de recherche). Pour cela, il utilise une technique d’apprentissage automatique appelée « apprentissage profond » (deep learning) pour mieux comprendre le sens précis des requêtes des internautes. 

    Contrairement aux algorithmes qui l’ont précédés, BERT analyse le texte dans son intégralité plutôt que mot par mot. Il prend en compte le contexte linguistique dans lequel les mots apparaissent pour en déduire le sens. Cette approche bidirectionnelle (d’où son nom) lui permet de mieux comprendre les subtilités du langage humain.

    Concrètement, BERT est entraîné à prédire les mots manquants dans des phrases, ce qui lui permet d’acquérir une compréhension fine des notions de grammaire et de sémantique. Il peut ainsi déterminer si une phrase est cohérente ou non. 

    Cette nouvelle capacité à interpréter le langage naturel a conféré à Google un avantage considérable pour fournir des résultats plus pertinents aux requêtes des utilisateurs. Elle marque une étape majeure dans l’évolution des moteurs de recherche au sens général.

    Comment fonctionne BERT ?

    L’algorithme BERT, on l’a vu, repose sur l’apprentissage profond, une branche de l’intelligence artificielle où des réseaux de neurones artificiels sont entraînés sur de très grandes quantités de données. 

    Plus précisément, BERT utilise un type de réseau de neurones appelé Transformers. Ces modèles sont constitués de deux mécanismes : un encodeur qui lit le texte en entrée, et un décodeur qui prédit les mots manquants. 

    Lors de la phase d’entraînement, BERT analyse des milliards de mots issus de livres et d’articles du web. Son encodeur lit le texte mot après mot dans deux directions : de gauche à droite puis de droite à gauche. Cette lecture bidirectionnelle permet de mieux comprendre le contexte linguistique de chaque mot.

    Le décodeur quant à lui masque certains mots du texte et essaie de deviner lesquels selon le contexte. C’est en comparant ses prédictions aux mots réels que BERT affine progressivement ses capacités linguistiques.

    Au final, BERT produit des plongements lexicaux, c’est-à-dire qu’il associe chaque mot à un vecteur de nombres reflétant ses relations sémantiques avec les autres mots. 

    Cette modélisation vectorielle du langage permet à Google d’interpréter beaucoup plus finement le sens des requêtes pour fournir des résultats optimisés.

    Par ailleurs, grâce à cela, BERT est capable d’identifier les entités présentes dans les requêtes des utilisateurs. Par exemple, pour la recherche « Qui a écrit Le Petit Prince ? », BERT comprendra que « Le Petit Prince » fait référence au célèbre conte d’Antoine de Saint-Exupéry.

    Le moteur de recherche pourra alors directement afficher la réponse « Antoine de Saint-Exupéry » dans un encadré (Knowledge Graph) sur la page des résultats.

    Quel est l’impact de Google BERT sur le SEO ?

    Au vu de son fonctionnement, on se doute que l’arrivée de l’algorithme BERT a eu des implications importantes pour le référencement naturel des sites web. Et pour cause, en comprenant mieux les requêtes, BERT modifie en profondeur la manière dont les pages sont classées par Google.

    Tout d’abord, la sémantique et la contextualisation des mots-clés deviennent primordiales avec BERT. Il ne suffit plus d’optimiser son contenu seulement pour certains termes. Il faut avant tout prendre en compte leur signification selon le sujet traité sur la page.

    Par exemple, le mot « Jaguar » n’aura pas la même interprétation sur un site automobile ou un site sur les animaux. BERT est capable de faire cette distinction.

    Ensuite, BERT accorde plus d’importance à la cohérence globale des contenus. Les textes doivent répondre précisément à l’intention derrière la requête avec une structure logique et un développement fluide entre les paragraphes.

    Enfin, les sites trop optimisés avec du contenu peu naturel risquent d’être moins bien classés. La qualité rédactionnelle est fondamentale pour répondre aux exigences linguistiques complexes de BERT.

    Cette évolution majeure nécessite donc pour les référenceurs d’adapter leurs stratégies éditoriales et techniques aux nouvelles capacités de compréhension de Google. Il s’agissait déjà d’un véritable changement de paradigme dans l’univers du SEO en 2018, et l’impact de BERT est encore aujourd’hui toujours plus prégnant sur les résultats de recherche Google.

    Comment éviter d’être pénalisé par BERT ?

    Pour éviter d’être pénalisé par l’algorithme BERT, les référenceurs doivent adapter leurs stratégies de contenu à plusieurs niveaux.

    Des contenus humains

    Tout d’abord, il est essentiel de produire des contenus de qualité avec une rédaction soignée et des textes cohérents. L’optimisation sémantique autour des mots-clés doit se faire naturellement au sein de phrases bien construites. Cela passe par :

    • La rédaction de contenus de qualité orthographique, grammaticale et sémantique.
    • Relier directement les questions et les réponses dans les contenus.
    • Jouer sur les champs lexicaux.
    • Utiliser un vocabulaire simple, mais riche et des tournures concises.
    • Éviter l’accumulation excessive de mots-clés.

    L’importance de l’intention utilisateur

    Les contenus doivent répondre précisément à l’intention derrière la requête de l’internaute. On distingue plusieurs types d’intentions :

    • Les requêtes informationnelles, où l’utilisateur cherche à obtenir une information précise. Par exemple « quelle est la capitale de la Suède ? ».
    • Les requêtes commerciales, où l’utilisateur veut effectuer une action en ligne. Par exemple « réserver un billet de train ».
    • Les requêtes transactionnelles, où l’utilisateur souhaite acheter un produit. Par exemple « acheter une trottinette électrique ».
    • Les requêtes navigationnelles, où l’utilisateur recherche un site web spécifique.

    Pour optimiser son référencement, il est essentiel de déterminer l’intention derrière la requête et d’y répondre précisément dans ses contenus.

    Par exemple, pour un article sur la fabrication du pain, BERT détectera si le texte répond spécifiquement à des requêtes informationnelles du type « comment faire son pain ». Le contenu doit alors fournir un tutoriel détaillé.

    En cernant précisément l’intention de l’utilisateur, on s’assure de fournir le bon contenu au bon moment dans le parcours utilisateur. C’est indispensable pour obtenir de bons classements avec BERT.

    Une structure saine

    L’arborescence du site doit être logique et facile à appréhender par les visiteurs, mais aussi par les robots d’indexation. Elle doit refléter la stratégie éditoriale globale.

    Le balisage des pages (titre, méta-description, intertitres Hn…) doit être soigné en utilisant les balises HTML de manière stratégique pour la SEO. Ces balises doivent décrire précisément le contenu des pages.

    Le maillage interne entre les différentes pages doit être renforcé grâce à des liens contextuels. Par exemple, des pages traitant d’un même sujet peuvent se relier entre elles pour mieux illustrer le propos.

    Cette structure saine guide l’algorithme BERT pour explorer le site de manière optimale et comprendre les relations entre les contenus. Elle permet également une meilleure expérience utilisateur.

    Des mises à jour régulières

    Enfin, les mises à jour régulières des contenus sont indispensables pour prendre en compte l’évolution constante de BERT. Cela passera notamment par l’intégration de nouveaux mots clés pertinents.

    En suivant ces recommandations, il est possible d’éviter d’être pénalisé par l’algorithme BERT et de continuer à améliorer son référencement naturel.

    Les 3 points clés à retenir :

    • BERT est un algorithme révolutionnaire de compréhension du langage naturel, permettant à Google d’interpréter finement les requêtes.
    • Son arrivée a fortement impacté le référencement naturel en renforçant l’importance de la sémantique et de la qualité des contenus. 
    • Pour optimiser son positionnement, il faut miser sur des contenus de qualité, naturels, contextuels, et structurer son site de manière cohérente.

    À propos de l'auteur

    Tanguy
    Tanguy
    Consultant SEO
    Tanguy est consultant SEO et améliore la visibilité des sites de ses clients en travaillant les aspects techniques, sémantiques et de popularité. Passionné par l’évolution des moteurs de recherche et de Google en particulier, il adapte ses stratégies SEO en conséquence.