Jusqu'à maintenant, les moteurs de recherche comme Google, Yahoo! ou Bing fonctionnaient sur la base d'un système d'index inversé : les mots contenus dans les pages web sont alors détectés avec, pour chacun d'eux, la liste des pages dans lesquelles ils apparaissent, accompagnés d'un certain nombre d'informations complémentaires. Mais de nouvelles méthodes se mettent en place, autour de l'indexation des syntagmes ou groupes de mots (contrairement aux mots isolés analysés jusqu'à maintenant), ce qui pourrait profondément changer le paysage du référencement dans les années qui viennent. Cet article tente d'expliquer comment ces systèmes fonctionnent et leur incidence en termes de SEO à moyen terme...

Cet article fait partie de la Lettre Réacteur #116 du mois de juin 2010

Début de l'article :

Un brevet publié par Google récemment a mis en lumière un changement potentiel que beaucoup de spécialistes du SEO subodoraient : le passage d'un index à base de mots clés, à un index dont les entrées sont composés de groupes de mots (ou syntagmes). Nous allons expliquer dans la suite de cet article pourquoi un tel changement représente une évolution fondamentale dans les moteurs de recherches et pourquoi la structure de l'index joue un rôle important dans le fonctionnement d'un moteur.

Nous verrons également que l'indexation des syntagmes a des conséquences potentielles importantes sur les stratégies de SEO.

L'indexation des phrases : attention au faux ami !

Les linguistes anglo saxons emploient facilement le terme anglais "phrase" pour décrire un groupe de mots. Le terme "phrase" en français se traduit mieux par "sentence" en anglais. Pour éviter toute ambiguïté, on emploiera plutôt dans cet article, soit le terme "groupe de mots", soit le terme technique "syntagme". Un syntagme constitue l'étape intermédiaire entre le mot et la phrase : c'est un groupe de mots qui forme une unité par son sens et par sa fonction, à l'intérieur de la phrase.

Par exemple dans la phrase "Le chien du voisin a aboyé toute la nuit" on pourra isoler les syntagmes "Le chien du voisin" "a aboyé" et "toute la nuit".

Donc il faut faire attention lorsqu'on lit des articles en anglais sur ce sujet : quand les auteurs parlent d'indexer des phrases, en réalité leurs ambitions sont bien plus modestes et ils cherchent à indexer des groupes de mots, parfois très réduits en nombre.


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).