Lancée en 2015, la fonction de Google « People Also Ask » permet aux utilisateurs de découvrir de nouvelles questions associées à leur sujet. Dès son apparition, elle s’est profondément enracinée dans l’arsenal de toute personne qui s’occupe du contenu web, car elle permet très vite d’avoir des idées de nouvelles pages à créer ou d'enrichir les pages existantes. Dans cette série de deux articles, nous allons nous plonger dans l’univers des questions « People Also Ask ». On abordera leur origine et particularités du fonctionnement, leur taux de pénétration dans les résultats de recherche en français et les techniques efficaces pour s’y positionner.
Questions & SEO
Tous les jours, on s’adresse aux moteurs de recherche pour avoir des réponses à nos questions. Nos requêtes peuvent prendre des formes d’interrogations grammaticalement correctes (questions explicites), mais aussi rester assez concises, les questions étant formulées uniquement dans nos têtes (questions implicites).
- Exemple d’une question explicite : Où faire le plein d’essence ?
- Exemple d’une question implicite : Essence.
Du point de vue d’un moteur de recherche, toute requête d’un utilisateur peut être considérée comme une question autour d’un besoin particulier. Mais certains internautes ont l’habitude de formuler des requêtes plus précises que d’autres. Et cela crée un vrai défi pour le moteur de recherche : répondre au besoin précis en se basant sur des requêtes de recherche très génériques.
En quête éternelle de pertinence, les moteurs modernes munissent en continu leurs pages de recherche d’éléments permettant aux internautes de préciser leur besoin. C’est là qu’ont vu le jour les fonctionnalités de suggestions de recherche, recherches associées et d’autres systèmes du même type.
Toutes les verticales de recherche œuvrent également pour le même objectif : Google Actualités (Quelles sont les dernières actualités liées à l’essence ?), Google Local Pack (Quelles sont les stations d’essence à proximité ?) etc.
« People Also Ask » ou « Autres questions posées »
Déployés aux Etats-Unis en 2015 et en France fin 2017, les widgets « People Also Ask » (que nous appellerons ensuite PAA dans l’article) ou « Autres questions posées » en français, continuent ce travail de recherche de précision de requêtes d’internautes. En réponse à un mot-clé saisi, le widget affiche par défaut une liste de 4 questions associées. La liste est dynamique sous forme d’un accordéon : de nouvelles questions apparaissent avec chaque clic sur une question.
Au moment de leur lancement, les boîtes à questions PAA s’intégraient uniquement dans la partie supérieure des résultats de recherche :
Affichage du bloc PAA dans la partie supérieure des résultats de Google.
Si on interagit avec une des questions PAA et va vers la fin de la page de Google,
un nouveau bloc PAA apparaît avant la pagination.
Les PAA peuvent également figurer dans la fenêtre déroulante à côté des suggestions de Google au moment de la saisie d’une requête :
Exemple d’affichage de PAA à côté des suggestions de recherche.
Le module a très rapidement gagné en popularité auprès de tous ceux qui sont liés d'une manière ou d'une autre à la création de contenu web, dont les responsables SEO.
Ce module présente un certain nombre d'avantages indéniables :
- Intention de recherche claire et univoque.
Nous n'avons pas besoin de nous casser la tête pour comprendre les besoins de l'utilisateur. Les questions sont simples, précises et concrètes.
- Prêtes à l’emploi.
Les questions sont des idées de contenu toutes faites, pour les pages nouvelles comme existantes.
- Pertinentes (on trouve toujours des questions utiles).
Quel que soit le domaine d'activité dans les blocs de questions PAA, vous trouverez toujours celles qui vous conviennent, à vous et à votre entreprise.
- Moins concurrentielles que les requêtes génériques.
Très souvent (mais pas toujours), il y a moins de concurrence dans les blocs de questions que dans les principaux résultats de recherche. Les blocs de questions-réponses sont ainsi des portes d'entrée dans les résultats de recherche hautement compétitifs.
- Double affichage dans Google (contrairement aux « Featured snippets »).
Contrairement aux extraits optimisés, une même page peut être positionnée simultanément dans le bloc PAA et les principaux résultats dans les résultats de recherche.
Exemple d’un double affichage d’une page de Routard dans People Also Ask et résultat organique classique.
Avec tous ces avantages importants, il y a néanmoins un point qui met souvent en difficulté beaucoup de ceux qui souhaitent utiliser les questions PAA dans leurs campagnes éditoriales : si on soumet les questions récupérées dans Google Adwords, quasiment toutes les questions renvoient zéro en termes de volume de recherche mensuel.
Dans le cadre de la présente étude, nous avons récupéré un échantillon de 120 000 questions issues des blocs PAA et avons vérifié leurs volumes de recherche (Google Adwords). Pour 83% de questions Google Adwords n’a retourné aucune data, et pour 8% il a signalé un volume de recherche égal à 10.
Questions People Also Ask et leurs volumes de recherche basés sur l’étude de 120 000 questions.
Cette lacune en données nous amène aux questionnements tout à fait logiques sur la nature des questions proposées par Google :
- Sont-elles des questions réellement posées par les internautes ?
- Ou bien sont-elles générées automatiquement ?
- Si on n’a pas de volume de recherche, comment pondérer les questions récupérées ?
Comment Google construit-il ses widgets PAA ?
L’origine des questions présentes dans les blocs PAA reste obscure au niveau de la documentation officielle de Google, tout comme au niveau des prises de paroles des représentants de Google.
Néanmoins, avec nos moyens du bord, nous sommes capables d’essayer d’investiguer nous-mêmes leur origine et particularités de fonctionnement et répondre à la question existentielle : d’où viennent-elles ?
Pour cela, nous allons utiliser 3 sources d’informations à notre disposition :
- Brevets déposés par Google.
- Observations dans les résultats de recherche.
- Données et statistiques pour confirmer ou infirmer nos hypothèses.
Brevets Google
Tous les moteurs de recherche majeurs dont Google ou Bing se précipitent pour protéger toutes leurs trouvailles les plus importantes sous formes de brevets. Et parmi une multitude de brevets déposés par Google, on en trouve un qui se rapproche de notre sujet.
S’intitulant « Generating related questions for search queries », il présente le concept des related questions (questions associées) et apporte un nombre de détails et réflexion sur le fonctionnement de cette fonctionnalité de recherche.
Malgré le fait qu’il ne mentionne jamais le terme « People Also Ask », les schémas proposés illustrent le module qui nous intéresse :
Schéma d’affichage du module « Related Questions » (questions associées)
dans les résultats d’un moteur de recherche.
Le brevet présente un module complémentaire sur le moteur de recherche principal. A côté de l’index de recherche principal, le moteur qui permet de classer les résultats web, on retrouve deux nouvelles composantes : un index et moteur spécifique pour les questions.
Une surcouche du moteur de recherche principal dédiée aux questions.
L'index de questions récupère depuis le flux de requêtes de recherche saisies précédemment par les utilisateurs celles qui ont la forme de questions sur les critères explicites comme le fait qu'elles commencent par des mots interrogatifs, se terminant par le point d’interrogation (« ? »).
Les auteurs du brevet ajoutent également que l’index peut inclure les questions extraites du contenu d’autres sites, par exemple des sites de questions-réponses (de type Quora).
Mais il ne suffit pas uniquement de collecter les questions, il est aussi important de servir les bonnes questions sur chaque requête d’utilisateurs. C’est l’objectif principal du moteur de questions.
Sur la requête de l’internaute, le moteur de recherche prépare les résultats de recherches les plus pertinents. Le moteur de questions reçoit 1 ou plusieurs pages les mieux classées et détermine pour chacune les « topic sets » ou plus simplement parlant les sujets couverts.
Il est intéressant, de noter que les topic sets ne se basent pas sur le traitement du contenu des pages sélectionnées, mais sur les requêtes ayant eu des clics sur chacune des pages.
Une fois que les topic sets sont identifiées, le moteur peut servir les meilleures questions appartenant aux topic sets. Pour cela il classe les questions en partie par volume de recherche.
Le moteur fait également d’autres tâches, dont une suppression de questions très similaires afin d’éviter les doublons sémantiques dans les questions proposées.
A côté de l’utilisation de requêtes réelles d’internautes, le moteur peut également générer des questions supplémentaires autour d’un sujet :
« Optionnellement le système peut également générer des questions additionnelles utilisant des templates de questions. Ainsi, le système peut appliquer un ou plusieurs templates prédéterminés aux sujets traités pour générer des questions additionnelles associées. Par exemple, si le sujet est le nom d’une maladie A, le template « Quel traitement pour [maladie] » peut être utilisé pour générer la question « Quel traitement pour A ? ».
Ainsi, le moteur de recherche se laisse le droit de prédire les questions attendues par les internautes autour d’un sujet en se basant sur son expérience antérieure. C’est l'une des raisons pour lesquelles on ne trouve pas beaucoup de questions dans les statistiques de Google Adwords.
Observations
Passons maintenant à la pratique, notamment aux observations des questions dans les blocs PAA dans la recherche de Google et voyons si on peut y découvrir certaines particularités de leur fonctionnement.
- Tout d’abord, les questions PAA ont un format fixe et prédéfini. Elles commencent toujours par un mot interrogatif (qui, quoi, comment, est-ce que etc.) et se terminent par un point d’interrogation. Bien sûr, les internautes n'utilisent pas toujours une syntaxe grammaticalement correcte, on est ainsi devant une normalisation de la forme des questions.
Les questions PAA ont un format prédéfini et fixe.
- Nous avons vu dans le brevet que le moteur tente de détecter les questions en utilisant un masque « mot interrogatif … ? ». Parfois cette méthode donne des faux-positifs. Sur l’exemple ci-dessous, le moteur a détecté le mot « quand » dans le flux de requêtes et l’a considéré comme le début d’une question. Mais en fait, il ne s’agit pas d’un mot interrogatif, mais d’un adverbe qui introduit une proposition subordonnée :
Exemple d’une détection erronée d’une question sur les indices formelles.
- Les PAA proposent souvent des erreurs grammaticales. Malgré les efforts de Google, les erreurs grammaticales sont encore très présentes dans les questions PAA. La présence d’erreurs confirme la nature humaine des questions :
Exemples d’erreurs dans les questions « People Also Ask ».
- Les PAA proposent souvent des fautes de frappe. A côté des erreurs grammaticales, les questions PAA contiennent souvent des fautes de frappe.
Dans cette question « People Also Ask », Google affiche le terme Alexia, mais donne la réponse sur « Alexa ».
Dans cette question « People Also Ask », Google affiche le terme « Mason », mais donne la réponse sur « Maçon ».
- On rencontre des questions étranges. Les tentatives de Google de générer les questions engendre parfois des combinaisons bizarres :
Exemple d’une questions absurde générée par le moteur de questions.
- Majuscules et minuscules dans tous les sens. Chaque utilisateur des questions « People Also Ask » a certainement remarqué cette particularité : certains mots communs au milieu de la question commençant par une majuscule.
Exemple d’utilisations étranges de majuscules au milieu des questions.
En vrac, les cas d’utilisations de majuscules semblent être aléatoires : « Lave-linge », « Fait-il », « Economique », « Appelle », « Qualité »...
Mais en essayant de les organiser, on trouve 2 cas d’utilisation de majuscules par Google : Réécriture orthographique et réécriture syntaxique.
Lorsqu’un mot ou une expression saisi par les utilisateurs connait différentes variantes d’écriture, Google va choisir une forme canonique et la commencer par une majuscule.
La réécriture syntaxique est une adaptation de la forme d’une question aux exigences des règles locales de grammaire. On le voit très clairement en langue française, quand Google introduit une inversion de verbe pour qu’une question ait une forme grammaticale correcte.
Les utilisations des majuscules peuvent être expliquées par une réécriture orthographique et syntaxique.
C’est également une autre explication pour les questions qui sont absentes dans les bases de Google Adwords : une question qui a subi une réécriture, n’est plus la requête utilisée par internaute.
Un autre aspect intéressant est la différence d’utilisation des majuscules-minuscules sur mobile et desktop :
L’utilisation des majuscules est différente sur Desktop et Mobile.
Les plus longues questions « People Also Ask ».
En moyenne une question PAA fait 40 caractères, mais il existe des cas particuliers où elles sont très développées.
Si les questions proviennent des requêtes précédemment utilisées par les internautes, les questions de cette longueur paraissent irréelles. Il est probable que celles-ci font parties de quiz ou d’autres questionnaires et sont copiées-collées par les internautes dans le champ de recherche de Google.
La plus longue question « People Also Ask » identifiée fait 145 caractères.
Quelle pénétration des People Also Ask dans les SERP françaises ?
Les PAA font partie des widgets les plus fréquents dans les résultats de recherche de Google. Mais cette présence dépend fortement de thématique et types de mots-clés visés.
Pour l’étudier, nous avons constitué des clusters de 3k à 500k mots-clés, chacun autour d’un mot-clé principal. Ci-dessous le haut et le bas de la liste :
Taux de présence de widgets People Also Ask par clusteurs de mots-clés
Par exemple, les widgets « People Also Ask » apparaissent sur 84% de mots-clés contenant « permis de conduire » et sur 79% sur les mots-clés contenant « impôt ».
Si on parcourt les clusters de mots-clés en bas de la liste, on remarquera une tendance très claire : les PAA sont quasi absents sur les requêtes qui génèrent des résultats géolocalisés, où ces questions sont expulsées par le pack local de Google Maps.
Les questions sont pertinentes là où il y a une intention prononcée d’en savoir plus. Dans le cas de la recherche locale, c’est l’intention de recherche de résultats de proximité qui prime.
La même logique s’applique dans le domaine de sujets d’actualités. Plus le sujet est chaud, plus rares sont les blocs de questions. Pour les sujets réchauffés par l’actualité, l’intention de recherche passe très vite de « je veux en savoir plus » à « qu’est-ce qu’il y a de nouveau sur le sujet ? ».
Voyons cela sur l’exemple de mots-clés liés à l’électricité. Depuis l’octobre 2021, le taux de résultats de recherche contenant le module « People Also Ask » ne cessait de croître. Tout jusqu’au mois d’août 2022 quand la crise en Ukraine a commencé faire parler d’inévitables hausses de tarifs d’électricité.
Sur le mois d’août et septembre, la présence de blocs de questions à baissé drastiquement de 80% à 61%.
Baisse de présence de widgets PAA dans le cluster de mots-clés contenant « électricité » quand le sujet devient tendance.
Conclusion
Au vu de la pénétration, de la diversification d’emplacements et de l’évolution du moteur, les widgets « People Also Ask » ont visiblement bien prouvé leur efficacité en termes d’usage et vont certainement se développer les prochaines années.
Nous avons vu dans cette première partie que ces questions proviennent majoritairement des requêtes réellement posées par les internautes qui sont ensuite retraitées et réadaptées au niveau de la forme pour être conformes aux règles linguistiques de chaque langue.
A côté de cela, nous avons confirmé sur différents exemples que Google procédait également à la génération et prédiction de questions en se basant sur son expérience antérieure.
Le module est omniprésent sur tous les mots-clés où il existe une intention prononcée pour en savoir plus sur un sujet particulier. En même temps, complètement absent quand l’intention change, par exemple dans la recherche locale ou les mots-clés liées à l’actualité chaude.
Le mois prochain, dans la seconde partie de l'article, nous parlerons de techniques pour s’y positionner, des différents types de questions et réponses et pourquoi c’est important de les prendre en compte.
Nous verrons comment on peut pondérer les questions si celles-ci retournent zéro volume de recherche, évaluer la difficulté de se positionner et sur combien de questions une seule et même page peut se positionner et grâce à quoi. Et nous finirons par les techniques du SEO programmatique basées sur l’exploitation de People Also Ask et l’impact des dernières mises à jour de Google sur ce genre de sites. rendez-vous le mois prochain !
Alexis Rylko, directeur technique SEO chez iProspect (https://www.iprospect.com/ & https://alekseo.com/)