C'est l'une des grandes tendances actuelles dans le petit monde du référencement : le Data SEO. Dans cet article, nous tenterons de décrypter cette nouvelle orientation de notre métier, de vous fournir quelques clés pour prendre le train en marche et de vous donner envie d'aller plus loin dans une discipline qui est en train de se révéler réellement indispensable dans le domaine du référencement naturel.
L'explosion cambrienne de la donnée
Les biologistes parlent de l'explosion cambrienne pour désigner cette période (courte à l'échelle géologique), il y a environ 540 millions d'années, durant laquelle la vie sur Terre s'est considérablement développée. Elle est passée d'organismes simples, souvent unicellulaires, aux premiers animaux à taille métrique.
Un phénomène très comparable se déroule ces dernières années avec le big data : la quantité de données générées ne cesse d'augmenter. Ainsi IBM estimait en 2013 que 90% des données disponibles dans le monde avaient été créées au cours des deux années précédentes. Le rythme n'a fait que s'accélérer depuis.
Cette explosion peut être rattachée à plusieurs facteurs. Tout d'abord, le stockage de ces données coûte de moins en moins cher (voir par exemple la figure 1), ce qui encourage à conserver parfois tout et n'importe quoi. De même, la puissance de calcul a considérablement augmenté au fil des années, rendant possibles des traitements sur des datasets de plusieurs millions de lignes, même sur un ordinateur personnel. Enfin, la mode du big data a permis de populariser les outils et méthodes de traitement de données, et de les appliquer à des sujets de plus en plus variés.
Machine Learning, Data Science, NLP, Intelligence artificielle : ces termes qui passaient auparavant pour des buzzwords constituent aujourd'hui un domaine de compétences reconnu, avec à la clé de vraies applications… et de vrais emplois !
Fig. 1. Evolution du prix du Go de disque dur à l'achat d'après Backblaze.
Le petit monde du SEO n'est pas en reste : nous avons accès à toujours plus de données : suivi de positions, trafic, liens externes, crawl, logs serveurs, analyse sémantique… Toujours plus d'outils nous proposent toujours plus de données, et des analyses de plus en plus pertinentes. L'une des illustrations les plus parlantes de ce phénomène est l'augmentation du nombre de requêtes monitorées par les outils de suivi de visibilité (voir fig. 2).
Fig. 2. Le nombre de mots-clés surveillés chaque mois par Semrush dans le monde a été multiplié par 10 en 2 ans. Source : Semrush.
Parallèlement à cette montée en gamme des outils, un nouveau terme est apparu : le Data SEO. L'idée ? Appliquer les techniques de Data Science au domaine du référencement naturel, et prendre des décisions rationnelles en s'appuyant sur l'analyse des données.
Une extension du SEO technique ?
Cette volonté d'améliorer et d'approfondir les analyses n'est pas nouvelle pour la plupart des référenceurs, en particulier pour ceux qui travaillent sur des sites à forts volumes de pages ou de trafic : les fameux « SEO techniques ».
En pratique, l'utilisation des méthodes de Data Science ouvre la porte à des analyses croisées, permettant de mettre en relation des indicateurs issus de sources différentes à une échelle bien plus importante que par le passé.
Cela permet ainsi de couvrir des sujets plus éloignés des aspects purement techniques du SEO, et de s'intéresser aux liens externes ou à la qualité du contenu.
Mêler ces différents indicateurs offre par exemple la possibilité d'estimer les facteurs de rankings utilisés par les moteurs de recherche, voire de prédire le positionnement d'une page. Vous pouvez notamment calculer les corrélations entre les KPI dont vous disposez sur un ensemble de pages, et la position que chacune obtient pour une requête donnée, afin de déterminer les critères les plus importants à travailler selon votre thématique (voir fig. 3).
Fig. 3. Exemple de calcul de corrélations entre différents indicateurs et la position obtenue,
pour une sélection de pages dans l'univers des chaussures en langue anglaise.
Voir cette présentation lors du SEO Camp'Us Paris 2019 pour davantage de détails.
Par ailleurs, la Data Science donne la faculté d'aller au-delà des simples analyses. Par exemple, les solutions de Natural Language Processing ou NLP (en français : traitement du langage naturel) permettent de générer automatiquement du contenu. Voir à ce sujet les expérimentations de Vincent Terrasi pour créer des meta descriptions en analysant le contenu des pages, à découvrir sur son blog.
Si la qualité des résultats n'est pas encore très satisfaisante, c'est une branche du Machine Learning qui progresse très vite.
Vous l'aurez compris, le Data SEO ne se limite pas simplement aux problématiques techniques du référencement naturel, mais il autorise à traiter des sujets bien plus variés.
Les bénéfices du Data SEO
La démarche de Data SEO a également des avantages indirects, qui vont au-delà du métier de référenceur.
S'intéresser aux algorithmes de Machine Learning permet de mieux comprendre le fonctionnement des moteurs de recherche. Au-delà du PageRank et de ses dérivés, les moteurs de recherche regorgent de Machine Learning et d'intelligence artificielle : connaître et comprendre les concepts et les procédés utilisés par Google et ses concurrents vous donnera un avantage substantiel pour savoir comment obtenir de meilleures positions dans les SERP. C'est là le réel enjeu du Data SEO : mêler théorie et pratique, comme l'explique Guillaume Peyronnet.
De plus, les méthodes utilisées par les moteurs de recherche ressemblent fortement à celles utilisées dans d'autres situations. Par exemple, qu'il s'agisse de vous indiquer des produits similaires à vos achats, ou de choisir les prochains films à vous proposer, les algorithmes d'Amazon et de Netflix reposent sur les mêmes logiques de recommandation (voir fig. 4).
Concevoir votre propre système de recommandation devient tout à fait abordable : vous trouverez sur le Web des exemples assez concrets, à adapter à vos problématiques.
Fig. 4. Principe d'un algorithme de recommandation basé sur le filtrage collaboratif :
si les clients A et B ont apprécié le même produit, lorsque le client A aime un nouveau produit,
nous pouvons le suggérer au client B.
De la même manière, rien ne vous empêche de fourbir vos armes de Data Scientist sur des problématiques liées au référencement naturel, puis d'appliquer votre savoir-faire à des métiers différents : que l'on cherche à identifier les pages à optimiser sur un site web ou à choisir le prochain placement financier à réaliser, un arbre de décision fonctionne toujours de la même façon.
Enfin, même si les outils du marché sont de plus en plus accessibles et faciles d'utilisation, il reste bien souvent nécessaire de mettre les mains dans le code pour personnaliser les analyses. Cela peut paraître rébarbatif, mais devenir autonome sur un langage de programmation est un réel atout, quel que soit votre métier.
En effet, que ce soit en R, en Python ou dans n'importe quel langage, apprendre à développer vous donne la possibilité d'automatiser les tâches répétitives.
Pour aller plus loin
Si ce plaidoyer pour le Data SEO vous a donné envie d'aller plus loin, de très nombreuses ressources sont à votre disposition. Les livres, billets de blog et formations en ligne généralistes sur la Data Science foisonnent sur le Web.
De même, les ressources spécifiques au SEO sont de plus en plus nombreuses. Nous avons en particulier la chance en France d'avoir deux cycles de formation de grande qualité, avec les Data SEO Labs et les Ix-Labs.
Cette abondance de possibilités vous assure de trouver l'approche qui vous conviendra, que vous soyez attiré en priorité par la théorie ou par la pratique.
Il convient toutefois d'insister sur quelques points essentiels :
- Commencez par passer du temps sur les notions théoriques, cela vous évitera bien des écueils par la suite. En particulier, certains algorithmes nécessitent une quantité de données suffisante pour donner des résultats représentatifs : sachez les identifier.
- Comme abordé précédemment, apprenez un langage de programmation : ce sera un vrai avantage dans une démarche de Data SEO. Si Python et R sont les plus pratiqués parmi les référenceurs, de nombreux autres langages vous proposeront un écosystème adéquat pour la Data Science.
- Enfin, travailler la DataViz est également essentiel : nous pratiquons un métier pour lequel la communication est souvent clé, aussi faut-il trouver les bonnes manières de représenter les données, de façon à ce que le message à transmettre soit compris le plus naturellement possible par vos interlocuteurs. De nombreux livres existent sur le sujet, et vous pouvez également consulter les exemples proposés sur Python Graph Gallery, R Graph Gallery ou encore ceux de la librairie D3js.
En conclusion
Le Data SEO n'est pas une simple mode, c'est une véritable nouvelle façon d'appréhender le référencement naturel. Cette approche ne remet pas en question les méthodes plus traditionnelles, mais elle permet d'agir de façon sereine : le doigt mouillé est remplacé par des indicateurs concrets.
Il faut le prendre comme une opportunité d'améliorer vos procédures, et d'élargir le champ des sujets que vous pouvez traiter.
Finalement, le fonctionnement des moteurs de recherche devenant de plus en plus complexe, il est fort probable qu'il soit vite indispensable de pratiquer le Data SEO pour rester compétitif dans les SERP. Autant se pencher au plus vite sur ces nouvelles voies...
Julien Deneuville
Consultant SEO & Data indépendant chez Databulle et co-organisateur de Web In Reims – Data Party.