Comme vu dans l’article de la lettre Recherche et référencement du mois de d’Octobre 2017, il est nécessaire de faire une analyse préalable de l’existant dans le cadre d’une refonte de site web avant de procéder à la mise en place d’une table de redirections (en cas de changement des URL d’un site). Nous allons voir dans cet article la méthodologie à utiliser pour créer cette table de redirections, et faire les correspondances entre les nouvelles et les anciennes URL.
Qualifier les URL
Une fois que les URL sont priorisées par rapport à leur potentiel trafic/SEO, il est nécessaire de pouvoir les associer avec les nouvelles URL si leur format a été modifié. Afin de faciliter ces mises en relation, il peut être utile de récupérer le fil d’Ariane de chaque page afin de connaître leur emplacement dans l’arborescence du site. Cela peut être effectué via des crawlers comme Screaming Frog SEO Spider avec sa fonction d’extraction par exemple.
Si certaines URL ne sont plus conservées sur le nouveau site comme nous le verrons par la suite, le fil d’Ariane vous permettra de déterminer plus facilement les pages à faire correspondre avec vos anciennes URL, comme la mise en place de redirections vers des pages parentes ou de catégories supérieures.
Fig. 1. Table de redirection avec qualification des URL.
Redirections dynamiques
Dans certains cas, la mise en place de redirections dynamiques est possible (ex : modification du nom d’un répertoire) au niveau du serveur. Ce sont les premiers types de redirection à identifier, car elles peuvent prendre en compte un ensemble d’URL, et ainsi éviter la création de nombreuses lignes inutiles dans la configuration du serveur. Voici une redirection dynamique dans le cas d’un site qui verrait son répertoire /product/ renommé en /nos-produits/ lors d’une refonte (sans modification de la deuxième partie de l’URL) :
Sur Apache :
Sur Nginx :
Une URL du type /product/mon-produit-123.html serait donc redirigée vers /nos-produits/mon-produit-123.html avec la règle ci-dessus.
Il vous sera donc nécessaire d’identifier au préalable les différents changements d’URL et le type de page impactées (catégorie, pagination, etc.) par la refonte, afin de pouvoir mettre en place ces redirections dynamiques en priorité.
Redirections page à page
C’est souvent la tâche la plus fastidieuse, car en fonction des sites web, cela peut comprendre un nombre élevé de pages. Sur un site e-commerce avec plusieurs milliers de produits en catalogue, une modification complète de la structure des URL demandera la mise en place d’une importante table de redirections.
La meilleure solution, quand cela est possible, est la création d’une clé unique pour chaque URL, qui sera générée à l’export de la base de données des URL actuelles.
Lors de l’importation des contenus sur la nouvelle structure du site, la clé unique correspondant à chaque URL préalablement générée devra être importée par les équipes techniques, afin qu’une association soit possible avec les nouvelles URL qui auront été générées, via cette clé commune. Exemple :
Fig. 2. Mise en relation des URL via la création d'un ID par URL.
Cette méthodologie n’étant pas toujours possible en fonction des contraintes techniques, il sera nécessaire d’identifier les points communs entre une ancienne page et une nouvelle page, pour mettre en relation les deux formats d’URL.
En fonction des typologies de sites, ces correspondances peuvent être effectuées via différents éléments on-page :
- Balise <title> (ex : titres des pages actualités qui ne changeraient pas lors de la refonte) ;
- Balises <h1> (ex : nom d’un produit sur un site de e-commerce) ;
- Chapô (ex : texte descriptif d’une page ou balise meta description) ;
- Elément spécifique sur une page (ex : référence produit) ;
- Etc.
Quel que soit l’élément identifié pour faire ces correspondances, deux crawls devront être effectués pour récupérer (via une extraction sur un crawl ou des langages comme Xpath) ce qui permettra de faire « matcher » les URL : le site actuel et le futur site en préproduction (seulement une fois que ce dernier aura été contribué et sera complet en terme de contenu).
L’utilisation de la fonction RECHERCHEV d’Excel vous permettra ensuite de mettre en relation les URL afin de créer les redirections. Exemple :
Fig. 3. Plan de redirection avec une clé commune entre les pages des 2 sites.
Avec dans l’onglet « crawl nouveau site » la référence produit en première colonne, et l’URL de la nouvelle page en deuxième colonne :
Fig. 4. Crawl du nouveau site avec extraction de la référence produit.
Des clés communes peuvent également être trouvées via les images des contenus, si elles ne sont pas renommées lors de la refonte. On pourra ainsi extraire le nom de l’image principale de chaque contenu, pour faire les correspondances entre les URL des deux versions du site.
Redirections larges
Il arrive parfois que certains contenus ne soient pas repris sur la nouvelle version du site refondu, en cas de réorganisation des contenus ou de l’arborescence. Dans ce cas, que faire des anciennes URL ? Encore une fois, la qualification et priorisation faite au préalable vous permettra de mieux définir ce qu’il adviendra de ces URL.
Dans la majeure partie des cas, une redirection 301 vers la page parente (catégorie mère sur une page produit) sera la solution la plus adaptée afin de conserver de la popularité de vos URL non reprises, pour la rediffuser sur les pages du nouveau site.
Cependant, en fonction de la quantité de redirections 301 effectuées, ça n’est pas toujours la meilleure solution. En effet, des redirections massives de plusieurs centaines d’URL vers une seule et même page pourraient être détectées comme étant une tentative de manipulation de l’algorithme par Google, et avoir l’effet inverse que celui escompté.
Nous avons déjà constaté la baisse de visibilité d’une page d’accueil à cause de redirections excessives d’URL d’un site vers sa page d’accueil (site qui n’était plus qu’en 5ème position sur la requête Marque principale, alors qu’il était 1er avant la migration).
Fig. 5. Attention aux redirections massives peu pertinentes.
Il convient donc de mettre en place des redirections 301 vers les pages ayant le plus de visibilité dans les SERP en priorité (historique SEO, trafic, liens externes, etc.), et de rester cohérent lors de vos redirections. Google est en effet capable de voir les différences entre 2 pages, et certaines redirections pourraient ne pas avoir d’effet dans le cas où vos deux pages seraient trop éloignées (d’un point de vue contenu et sémantique) : pensez à l’utilisateur pour déterminer la pertinence de vos redirections.
Tout n’est pas bon à rediriger
Il n’est pas toujours pertinent de tout rediriger : il vaut mieux une bonne erreur 404 qu’une mauvaise redirection 301. Toutes les erreurs 404 ne sont pas néfastes.
Si vous ne redirigez pas l’une des URL ayant généré le plus de trafic sur votre site, cela pourra avoir un impact très négatif sur votre trafic. A l’inverse, ne pas rediriger une page qui n’a jamais généré de visite, qui ne reçoit pas de liens, et qui ne remonte pas dans les pages de résultats n’aura strictement aucun impact sur votre trafic. Cela pourra éventuellement réduire la transmission de sémantique faite via votre maillage interne, mais uniquement si le nombre de pages de ce type est important.
Pour faire une analogie avec un grand magasin de livres : Si un vendeur enlève de ses rayons un livre qui n’est pas visible, et qui n’est jamais demandé par la clientèle, cela n’aura pas d’impact sur ses ventes….
Il faut garder à l’esprit que Google continuera de crawler l’ensemble de vos redirections dans le temps. Plus vous aurez de redirections sur votre serveur, plus cela pourra affecter vos performances (fichier .htaccess trop lourd). Vous devez donc mesurer l’importance et l’impact de chaque redirection, pour éviter de surcharger votre plan de migration.
Gestion des paramètres d’URL
Les URL que vous allez rediriger peuvent parfois comporter des paramètres d’URL liés au tracking, à la pagination, etc. Certains serveurs transmettent par défaut les chaînes de paramètres lors des redirections, ce qui pourrait potentiellement provoquer l’apparition de contenu dupliqué sur votre nouveau site.
Fig. 6. Penser à traiter les chaînes de paramètres lors d'une refonte.
Prenons l’exemple de l’URL suivante : /tv/samsung/tv-led?page=2
Supposons que sur le nouveau site, le paramètre de pagination soit sous cette forme : ?p=2.
Si aucun traitement n’est appliqué à la chaîne de paramètres (query_string) lors des redirections, vous pourrez vous retrouver avec l’URL suivante sur votre nouveau site : /televiseurs/samsung/tv-led?page=2
Le problème est que sur la nouvelle plateforme, le paramètre page=2 ne correspond à rien et ne fera que générer de la duplication. Bien qu’une balise Canonical puisse palier ce problème, cela ne fera que gonfler le pool d’URL que Google devra crawler dans le temps, et impactera de façon négative votre crawl budget.
Il est donc très important d’identifier tous les paramètres d’URL pouvant se trouver sur votre site actuel, afin de définir l’utilité de chacun d’entre eux, et la nécessité éventuelle de les conserver, les adapter, ou les supprimer lors des redirections vers les nouvelles URL.
L’ajout d’une colonne supplémentaire dans votre table de correspondances vous permettra de préciser les actions à entreprendre, en fonction de la présence de paramètres dans l’URL, en vue de l’intégration des redirections.
Exemple :
Fig. 7. Prise en compte des paramètres d'URL dans le plan de redirection.
Sur des sites utilisant de nombreux paramètres d’URL, il peut être utile d’identifier les différentes combinaisons de paramètres présents dans l’URL (page&id, id&xtor, xto&id&page, etc.), afin de pouvoir définir les actions à entreprendre par rapport aux différentes combinaisons de paramètres connues.
Plan de redirection OK
Une fois que votre plan de redirection est correctement établi, vous pourrez transmettre ces différents éléments à vos équipes techniques ; ou intégrer vous-même les redirections sur votre serveur si vos compétences vous le permettent. Nous verrons dans un prochain article la façon dont ces redirections sont à intégrer sur votre plateforme, et les erreurs à éviter afin d’avoir une migration efficace. Bon plan de redirections, en attendant !
Aymeric Bouillat
Consultant SEO Senior, SEO Hackers (https://seohackers.fr/)