Nous continuons notre approche du monde du data SEO avec cette troisième et dernière partie qui aborde les différents types d'organisations et d'équipes qu'il est possible de mettre en place lorsqu'on s'intéresse au sujet. Après les outils et les métiers dans nos précédents articles, voici qui clôture ce dossier sur la Data Science et le SEO !
Cet article est le dernier d’une série de trois articles portant sur l’utilisation du Data SEO. Dans les deux articles précédents, nous avons vu les outils et les métiers qui aident à faire du Data SEO. Désormais, la clé du succès se joue dans l’exécution. En donnant de nombreuses formations sur le sujet, j’ai pu mesurer les progrès des participants mais surtout, au fil du temps, voir des projets de plus en plus élaborés.
Dans ce dernier article, je vous dévoile les organisations qui fonctionnent le mieux pour faire du Data SEO avec les meilleurs projets des 3 dernières années.
Comme vous le devinez, l’équipe est l’élément le plus important car les difficultés peuvent se produire dans l’obtention et la cohérence des données, mais aussi dans le choix des modèles de Machine Learning et enfin dans les analyses associées. À chaque fois, comme vous l’avez lu dans l’article 2, il faudra faire collaborer des profils très divers pour solutionner ces différentes problématiques.
Cet article présente les trois grands types d’équipes et les meilleurs projets que j’ai vu sur les 5 dernières années.
Démarrons le sujet pour les “équipes d’une personne” !
Le Solitaire
L’équipe “d’une personne” ou la “one-person team” en anglais est souvent la réalité dans les petites et grandes structures. Je connais beaucoup de personnes très polyvalentes qui gèrent à la fois la partie SEO et la partie Data avec leurs moyens.
En effet, il existe d’excellentes formations qui permettent à un passionné de SEO d’apprendre la data science, mais aussi à un data scientist d’apprendre le SEO. La seule limite reste seulement la motivation d’apprendre de nouvelles choses.
Mais comme dit le proverbe: « Seul on va plus vite, ensemble on va plus loin ». Même si les projets sont rapidement menés, étant donné les moyens, ils restent moins aboutis.
Le solitaire peut se décrire en général comme un expert SEO qui a décidé de suivre des cours avancés en informatique pour se tourner vers un SEO plus technique. Il maîtrise au moins un langage de programmation (comme R ou Python) et utilise des algorithmes de Machine Learning. Il a d’ailleurs suivi de près les mises à jour de Google comme Rankbrain et BERT dernièrement, où Google a injecté de plus en plus de Machine Learning dans son algorithme.
Dans les exemples concrets que j’ai envie de citer, je pense notamment à l’automatisation des process SEO. Sebastien Moity m’a montré il y 5 ans un script qui permet de récupérer tous les domaines expirés pour faire du SEO et de façon complètement automatisée.
Ensuite, il y a bien sûr les travaux pratiques que nous partageons lors de nos formations, comme le calcul de son CTR moyen pour les 10 premières positions de Google à partir des données de la Search Console et la détection des intentions de recherche en scrappant les résultats des moteurs de recherche.
Désormais, avec la sortie du premier laboratoire de recherche d’OnCrawl, vous pouvez trouver de nombreux process SEO qui peuvent être automatisés :
- Indexation automatique des nouvelles URL dans Bing ;
- Création de sitemaps avec les nouvelles URL pour Google ;
- Génération de texte avec GPT-2 ;
- Détection d’anomalies dans tous les rapports SEO ;
- Prédiction du trafic de la longue traîne.
À chaque fois, les use cases SEO sont partagés sous la forme d’un Jupyter Notebook (cf article 1) mais il est facile de les automatiser pour les lancer chaque jour avec Papermill (https://github.com/nteract/papermill). Il existe un très bon tutoriel ici si vous êtes intéressé(e)s : https://towardsdatascience.com/introduction-to-papermill-2c61f66bea30
Maintenant, quittons les équipes solitaires pour passer aux équipes de 2 personnes...
La MVT (Minimum Viable Team)
Vous avez peut-être déjà entendu parler de MVP pour Minimum Viable Product. Ce format est très utilisé dans les méthodes agiles où le projet commence par un prototype qui évolue au fil des itérations de une à trois semaines.
La MVT, c’est un équivalent pour l’équipe qui permet de minimiser les risques et les coûts du projet. Il s’agit de créer une équipe avec seulement 2 profils complémentaires sur une période limitée à souvent 6 semaines.
Il existe pas mal de littérature sur le sujet mais chaque entreprise peut l’adapter à ses propres équipes.
Minimally Viable Team selon Allan Kelly. Source: https://www.slideshare.net/allankellynet/noprojects-teams-over-projects
Si nous allons plus dans le détail, la MVT est une équipe de 2 personnes : souvent un expert SEO qui comprend bien les enjeux SEO et les mécanismes du Machine Learning, qui travaille avec un développeur qui, lui, teste des idées.
Cette approche est idéale pour mettre en place une solution viable en peu de temps. Si nous prenons une catégorisation de contenu, souvent une personne va tester une méthode et mettre en place la plus efficace. Pourtant, la meilleure approche est souvent de tester plusieurs modèles en simultané, de conserver la catégorisation qui revient le plus de fois et de coupler cela avec la catégorisation de l’image pour un site e-commerce. Cela peut se faire de façon automatique avec tous les modèles qui existent. L'état de l’art permet d’atteindre 95% de bons résultats, ensuite tout va se jouer dans la granularité des résultats.
Il existe un site génial qui donne l’état de l’art dans chaque domaine (la génération de texte par exemple) mais surtout le code source. Si vous ne le connaissez pas encore, voici le lien : https://paperswithcode.com/
Dans les projets et les exemples prometteurs, l'entreprise Campel & Co est par exemple en train de mettre en place le résumé automatique de texte en français où de nombreuses approches sont en train d’être testées. L’idée est de paraphraser des textes en français car tous les modèles existent en anglais avec le modèle BART par exemple : https://mc.ai/introducing-bart-combining-the-power-of-bert-and-gpt/
Désormais, nous pouvons nous intéresser à l’équipe la plus onéreuse mais qui a le plus de chance d’atteindre ses objectifs :
La Task force
Revenons un peu en arrière avec une équipe de choc de la série “Agence Tous Risque” qui a marqué les années 80. Ici, chacun avait un rôle précis et ils ont réussi toutes leurs missions avec brio. Certes, il n’y a pas eu d’épisodes sur le SEO ! 😉
Une célèbre Task Force des années 80.
Revenons aux choses sérieuses, la task force se constitue d’un expert SEO qui travaille avec un data scientist et un développeur qui vont tout superviser, préparer les données et utiliser les algorithmes de Machine Learning. L'expert SEO se place généralement en maître d’ouvrage et/ou chef de projet et gère la communication avec la direction. Dans les grands groupes, il peut y avoir des rôles dédiés pour le manager et le chef de projet de l’équipe.
Dans nos formations, nous donnons souvent des interviews pour suivre nos apprentis. Nicolas Plantelin, lorsqu’il était chez Oui.sncf, a pu mettre en place plusieurs sujets :
- Mise en place d’un Entreprise Data Warehouse (entrepôt de données prêt à l’emploi qui converge les données Business, Popularité, Technique, Contenu) ;
- Identification et traitement des « pages Zombies” ;
- Détection de nouvelles requêtes ;
- Prédiction de trafic/CA suite à certaines actions.
Si vous souhaitez en savoir plus, voici l’interview au complet https://dataseolabs.com/fr/interview-nicolas-plantelin/
Enfin l’interview de VirtualExpo permet de montrer la capacité d’action d’une task force bien en place. Des dizaines de projets ont été mis en place pour suivre les changements de positions autour des updates de Google et les attributs on-site et off-site des pages concernées. Des comités de pilotage SEO sont réalisés mensuellement pour présenter la météo SEO des sites avec des graphiques issus de Dataiku et des données consolidées automatiquement par les différents outils. Ainsi, la task force se concentre sur les tâches avec la plus forte valeur ajoutée, car de nombreuses tâches sont complètement automatisées.
Envie de continuer la lecture ? C’est ici: https://dataseolabs.com/fr/interview-lionel-levy/
Next steps
Cette série de trois articles vous a présenté les outils, métiers et équipes impliqués dans la Data SEO. L’idée est de permettre au plus grand nombre de mettre en place des projets Data Science et SEO.
Bien sûr, si vous n’avez aucune connaissance en data science, il existe des formations basiques et avancées comme les Data SEO Labs qui ont lieu dans de nombreuses villes de France. Les formations basiques ne nécessitent aucun pré-requis mais de bonnes connaissances en SEO. Je vous renvoie également vers les formations d’Olivier Andrieu que tous nos élèves connaissent.
Enfin, il existe une notion “Data-SEO compliant” pour les logiciels, et là je pense qu’il y a trois principes à suivre de près pour éviter d’utiliser des outils black-box qui vous fournissent des résultats sans expliquer les méthodologies et algorithmes.
- Le premier principe est d’avoir accès à une documentation qui explique parfaitement les algorithmes et les paramètres du modèle de Machine Learning.
- Le second principe est de pouvoir reproduire soi-même sur un jeu de données les résultats pour valider la méthodologie. En aucun cas, un logiciel ne sera copié car toutes les difficultés se trouvent dans les performances, la sécurité, la fiabilité et l’industrialisation des modèles de Machine Learning.
- Le dernier principe est que l’outil doit avoir suivi une démarche scientifique en communiquant sur son contexte, ses objectifs, les méthodes testées et les résultats finaux.
Merci d’avoir suivi ces trois articles, le Data SEO est une approche scientifique du SEO qui s’appuie sur l’analyse des données et l’utilisation de la data science pour prendre des décisions. Quel que soit votre budget, il est possible de faire de la Data Science et la tendance est de rendre les concepts utilisés par les Data Scientists de plus en plus accessibles.
À vous désormais de vous approprier ces projets data science avec les bons outils (cf article 1), les bons métiers (cf article 2) et les bonnes équipes que nous avons vu dans ce article.
Vincent Terrasi, formateur (Data Marketing Labs) et Directeur Produit OnCrawl (https://fr.oncrawl.com/)