Depuis de nombreuses années, les moteurs de recherche tentent d'affiner leurs réponses en utilisant des informations contextuelles liées à l'utilisateur : géolocalisation, historique de recherche, profil personnel, etc. L'avènement du smartphone, terminal plus ouvert que le desktop, a fait progresser cette stratégie de personnalisation et de contextualisation des résultats de recherche. Cela va-t-il changer nos habitudes de recherche et les techniques SEO actuellement employées ?

Par Philippe Yonnet


C’est Marissa Meyer, à l’époque où elle était à la tête de Yahoo, qui a popularisé le concept de « moteur de recherche contextuel » en le présentant comme le cheval de bataille chez Yahoo ! pour réaliser des outils de recherche innovants capables de remettre sa société dans la course.

De quoi s’agit-il ? Tout simplement d’un moteur qui est capable de deviner, en fonction des données de contexte dont il dispose, ce que l’utilisateur recherche, et donc de délivrer une page de résultats plus pertinente. Poussée à l’extrême, cette approche permet de créer des moteurs de recherche qui fonctionnent sans que l’internaute exprime de requêtes, et surtout, sans requêtes sous forme de mots clés.

Nous allons voir dans cet article que les moteurs traditionnels essaient d’embarquer de plus en plus de fonctionnalités contextuelles. Et que des outils de recherche « contextuels » ont vu le jour. Nous nous intéresserons ensuite aux techniques qui permettent à ces moteurs de fonctionner et aux problèmes qui restent encore à résoudre. Pour finalement essayer de répondre à la question suivante : comment fait-on du SEO sur un moteur contextuel ?

La prise en compte du contexte : un rêve longtemps jugé inaccessible

Les technologies à l’œuvre dans les moteurs de recherche ont mis une trentaine d’années à mûrir, de la fin des années 60 à la fin des années 90. A l’époque du lancement d’Altavista (le moteur le plus populaire avant l’apparition de Google en 1998), on peut considérer que tous les problèmes théoriques que pose la création d’un outil de recherche avaient été posés.
Parmi ces problèmes, le plus ardu était de « comprendre » la requête de l’utilisateur. Si l’utilisateur tape le mot « jaguar », que veut-il exactement ? Acheter une voiture de marque « Jaguar » ? Ou des informations sur un félidé d’Amérique du Sud ? Dans les moteurs de recherche de l’époque, c’était impossible à déterminer. Les chercheurs savaient que pour résoudre ce problème, la solution consistait à exploiter des informations de contexte :

  • Qui pose la question ?
  • Quelles sont ses préférences ? Ses habitudes ?
  • Où pose-t-il la question ?
  • Qu’a-t-il fait auparavant ? Qu’est-il en train de faire ?
  • Quelles ont été ses précédentes requêtes ?

Exploiter le contexte permet donc de désambiguïser une requête à multiple sens. C’est la première utilisation que l’on peut faire du contexte.


Fig. 1. Désambiguïser une requête comme "Jaguar" sans le contexte est un casse-tête.
Une solution traditionnelle est de suggérer des requêtes plus précises à l’internaute.
Ici un exemple avec la fonctionnalité de suggestions de requêtes de Bing.

On peut aussi faire ce que l’on appelle une « expansion de requête » c’est-à-dire étendre la requête à d’autres termes voisins, que l’on sait être pertinents car on dispose du contexte de la question. On peut aussi augmenter la précision de la réponse, en complétant la requête. Dans notre exemple du mot « jaguar », la requête réellement effectuée devient alors « faire réparer une Jaguar », parce qu’on sait que l’utilisateur :

  • Possède une Jaguar ;
  • a cherché des infos sur une panne ;
  • est en train de chercher des réparateurs…

Plus prosaïquement, si on connait le profil de l’utilisateur, on peut personnaliser les réponses fournies. Et si on connait le contexte de la question posée, on peut aussi mieux apprécier les réponses qui seront perçues comme utiles ou pertinentes, et donc améliorer la qualité des résultats. Sauf qu’accéder à des informations de contexte est longtemps resté un rêve inaccessible pour les concepteurs de moteurs de recherche.

L’arrivée des smartphones a permis d’accéder au contexte

En effet, pendant de nombreuses années, les moteurs de recherche n’ont pas pu exploiter grand-chose comme informations de contexte en raison des préoccupations de protection des données personnelles. De nombreux outils ont essayé de convaincre leurs utilisateurs d’indiquer des préférences, ou de créer un compte permettant de les identifier et de stocker leur historique de recherche, mais sans grand succès.

Mais avec le succès populaire des smartphones, les utilisateurs ont accepté (souvent sans en être réellement conscients) d’envoyer de nombreuses informations de contexte qu’ils refusaient de communiquer volontairement sur les versions desktop. En effet, les utilisateurs sont le plus souvent « connectés » à leur compte (sur Android, vous êtes en plus connecté à votre compte… Google), ce qui fait que tous vos faits et gestes sur votre téléphone sont connus de la firme de Mountain View.


Fig. 2. Votre smartphone communique votre position en permanence : Google connait donc tous vos déplacements. Vous pouvez vous faire une idée de ce que Google connait de vos habitudes en consultant cette page : https://www.google.fr/maps/timeline?authuser=0&pb.

D’un seul coup, le contexte utilisable est passé de l’information assez pauvre stockée dans un cookie, à un profil riche, qui contient en particulier :

  • Des informations sur votre identité ;
  • Votre géolocalisation précise et vos déplacements ;
  • Votre historique de recherche ;
  • Mais aussi, l’historique d’utilisation d’autres applications ;
  • Votre agenda ;
  • Votre boîte mail ;
  • Vos contacts et les métadonnées associés ;
  • Etc.

Avec les objets connectés, la connaissance de votre profil s’étend même … à votre état de santé !

En clair, c’est dans un contexte d’utilisation sur smartphone que le moteur de recherche contextuel prend tout son sens. Et c’est dans ce cas d’utilisation que l’on voit ce concept être mis en œuvre le plus souvent.

Les fonctionnalités contextuelles ont envahi Google et Bing

Le concept a été à l’origine de plusieurs fonctionnalités ou applications nouvelles chez Google ou Bing.

Google Now

Google Now est sans doute l’application la plus aboutie. L’application réutilise tout ce qu’elle connait de vous et de vos habitudes, ainsi que les données fournies par votre agenda (Google Agenda), votre messagerie (Gmail), votre historique de recherche, mais aussi votre géolocalisation et les données de nombreuses applications tierces. Et grâce à ces informations, Google Now est en mesure de vous pousser les informations utiles au moment où vous consultez l’application.


Fig. 3. Un exemple des informations poussées par Google Now : les « cartes » d’information sont personnalisées, et dépendent du contexte : une carte donnant des informations sur le vol que vous avez réservé s’affiche parce que l’heure du départ approche, et le système a deviné que l’utilisateur va en fait à Paradise, à côté de Las Vegas, et donne la météo de cette ville.

La recherche latente chez Google

En usage smartphone, plusieurs types d’information de contexte sont utilisés pour « enrichir » la requête sur Google, sans que l’utilisateur ait besoin de le préciser. Ces fonctionnalités sont particulièrement impressionnantes lorsqu’on utilise une recherche locale.

C’est vrai en particulier pour la géolocalisation. Par exemple, une requête de type « quelle est ce monument en face ? » permettra (parfois) d’obtenir une réponse, même si aucune information sur la géolocalisation n’est donnée dans la requête.


Fig. 4. Une recherche contextuelle sur Google. A gauche, l’utilisateur a formulé une requête en langage naturel, en mode « recherche vocale » : « montre-moi des restaurants dans les environs de mon hôtel ». Au moment de la requête, Google utilise plusieurs informations de contexte, qui lui permettent de savoir à quoi correspond « mon hôtel », sa géolocalisation et donc de savoir quels résultats sont réellement à proximité de cet hôtel. approche, et le système a deviné que l’utilisateur va en fait à Paradise, à côté de Las Vegas, et donne la météo de cette ville.
A droite, la requête est « donne-moi la route à suivre pour aller à mon hôtel depuis ici », et les résultats sont personnalisés en fonction de la géolocalisation, donnée par le GPS du smartphone, et la géolocalisation de l’hôtel, également identifié de manière implicite.

    
Ce type de fonctionnalités est également appelée « recherche latente » ou « recherche implicite ». Bing a implémenté également des possibilités de recherche latente dans son application de recherche.

Quelques exemples d’outils de recherche contextuels

Le concept de moteur contextuel commence à être exploité de manière plus poussée par certaines startups qui ont développé des applications ou des outils pour smartphones.

Yahoo ! Aviate Launcher

Aviate Launcher est une application dont Yahoo! a fait l’acquisition. Aviate analyse votre façon d’utiliser votre smartphone au quotidien, pour permettre de vous pousser l’information la plus pertinente et les apps dont vous avez besoin dans un contexte donné. Aviate se positionne comme un concurrent de Google Now.


Fig. 5. Yahoo ! Aviate.

Vurb

Vurb se présente comme l’archétype du moteur de recherche contextuel. Il s’agit d’une application de recherche, conçue avant tout pour un usage sur smartphone, qui sélectionne les résultats et les informations à vous pousser en fonction de votre profil, de vos habitudes ou de votre géolocalisation. Le principal intérêt de Vurb est de vous faciliter les réservations de restaurants, et l’organisation de sorties.

Vurb a été racheté par Snapchat en 2016.


Fig. 6. Les suggestions contextuelles de Vurb dans le cas d’une recherche.


Fig. 7. Après avoir choisi de consulter des infos sur "Captain America", Vurb a envoyé les coordonnées du cinéma le plus proche qui diffuse le film. On peut accéder à des « actions associées » comme réserver un restaurant à proximité ou des informations sur le chemin pour aller dans cette salle.

Comment fonctionne un moteur contextuel ?

Pour être capable de fournir des résultats sélectionnés en fonction d’un contexte, il faut réussir à :

  • Modéliser le profil de l’utilisateur ;
  • Et/ou modéliser les informations de contexte.

« Modéliser » ici signifie transformer les données de base du profil ou du contexte, pour les stocker sous une forme qui soit réutilisable au sein de l’algorithme du moteur de recherche.

Plusieurs approches sont possibles, mais en général la solution qui est privilégiée consiste à convertir les informations sous une forme facile à employer : des vecteurs de coordonnées.

Un exemple de vecteurs de personnalisation en fonction de profils : l’utilisation du TSPR

Pour personnaliser les résultats en fonction d’un profil d’utilisateurs, une approche simple a été proposée par des chercheurs travaillant pour Google.

Le principe est de calculer pour les pages non pas un PageRank, mais autant de PageRanks que de thématiques à analyser : c’est le Topic Sensitive PageRank (TSPR). Pour calculer ces notes, on utilise un algorithme du PageRank « biaisé ». On attribue une note maximale à des pages appartenant clairement à chacune des thématiques, et le PageRank transmis par liens entre ces pages et la page à noter permet de calculer un PR thématique, qui donne la popularité de cette page en fonction de la thématique.


Fig. 8. Schema de fonctionnement simplifié d’un moteur de recherche utilisant le Topic Sensitive Pagerank.

Une fois que l’on a calculé tous les PageRanks thématiques, ils sont indexés avec les autres informations sur la page. L’ensemble des TSPR constitue un vecteur qui stocke les coordonnées de la page dans un espace vectoriel « thématique » qui a autant de dimensions que de thématiques analysées.

La modélisation du contexte

Pour personnaliser les résultats, il faut également calculer les coordonnées de la requête dans ce contexte thématique : ce n’est pas trivial du tout, mais il existe plusieurs méthodes pour y parvenir.

La plupart des outils contextuels cherchent à établir ces coordonnées en exploitant les informations permettant de comprendre le « sens » de la question : analyse syntaxique et désambiguisation à l’aide du contexte. Une fois qu’on a pu associer un « sens » (un contexte sémantique) à la question, on va chercher à indentifier une catégorie sémantique proche. Plusieurs méthodes cherchent à utiliser une catégorisation thématique de type « ontologie » pour identifier la proximité d’une requête avec une catégorie de l’ontologie, pour ensuite essayer de renvoyer des résultats classés en tenant compte de leur positionnement par rapport à la même ontologie.


Fig. 9. Graphe illustrant une méthode d’analyse de l’historique de recherches et du contexte terminologique et sémantique pour en extraire, en fonction de la proximité de ces contextes avec une ontologie, un profil d’utilisateur sous la forme d’un modèle numérique décrivant les sujets d’intérêt pour un utilisateur.

Comment fait-on du SEO sur un moteur contextuel ?

Un moteur de recherche contextuel crée plusieurs obstacles spécifiques qui empêchent de réaliser des optimisations « classiques ».

Déjà, on ne peut plus se baser sur des requêtes : le moteur fonctionne avec des expansions ou des extensions de requêtes, des reformulations de requêtes, et même dans des cas extrêmes… des requêtes dépourvues de mots clés. Dans ces conditions, les optimisations habituelles, qui cherchent à positionner le contenu d’un site sur une expression-clé donnée sont d’un faible recours, car on ne sait plus identifier clairement quelles recherches sont effectuées.

Les chances d’apparaître sur une requête, avec des moteurs contextuels, dépendent plus de la correspondance sémantique (le sens) entre ce que recherche l’internaute et la réponse, que des termes contenus sur la page.

Par ailleurs, l’exploitation des informations de profil et de contexte de recherche créent des résultats qui sont différents pour chaque utilisateur (et au moins pour chaque type d’utilisateur), et des résultats qui pour un même utilisateur peuvent évoluer dans le temps et/ou en fonction du contexte.

Face à un tel niveau de sophistication, faire du « reverse engineering » devient très vite très difficile.
Optimiser un contenu pour un moteur contextuel consiste à créer la meilleure réponse possible dans un cas d’utilisation donné, à un endroit donné, pour un groupe d’utilisateurs donné. C’est une approche possible, mais on va commencer à naviguer dans des eaux inconnues…

Heureusement, les moteurs comme Google ou Bing n’utilisent aujourd’hui le contexte et les informations de profil que de façon marginale, pour « améliorer » les résultats. Et cette situation où les fonctionnalités contextuelles restent un appoint plutôt que quelque chose de central est appelé à durer, pour des raisons pratiques et économiques…

Il ne faut donc pas en conclure que les moteurs contextuels vont tuer le SEO. Mais contribuer à enterrer les anciennes méthodes, et à en faire naître de nouvelles : c’est une certitude… Pour dans quelques années.
 


Phlippe Yonnet
Directeur Général de l'agence Search-Foresight, groupe My Media (http://www.search-foresight.com)