Résumé de l'article :
Tout éditeur de site web de contenu a eu, a, ou aura un jour à faire avec la notion de "duplicate content" sur les moteurs de recherche. En d'autres termes, la prise en compte par Google et consorts d'une seule version d'une page proposant un contenu qui est dupliqué à l'identique - ou presque - dans un autre document se trouvant sur le même site ou sur une autre source d'information. Quelles sont les différentes formes (nombreuses) de "duplicate content" ? Quelles solutions apporter pour éviter ce type de souci ? Cette série d'articles tente d'y voir plus clair sur cette problématique que nous avons initiée il y a deux mois de cela... Ce mois-ci, nous tentons de comprendre pourquoi certaines pages, au contenu éditorial pourtant différent, sont parfois interprétées comme du "duplicate content" par les moteurs de recherche...
Début de l'article :
Duplicate content, acte 3
En août dernier, nous avons exploré le concept de "Duplicate Content" et la problématique du contenu canonique dupliqué sur des pages d'autres sites, qu'ils soient partenaires ou non. Le mois dernier, c'était le fait qu'une même page web soit accessible par des urls différentes sur un même site qui était évoqué...
Pour terminer cette série d'articles, nous allons voir ce mois-ci le cas de pages web proposant un contenu éditorial différent les unes des autres mais pouvant cependant tomber dans les affres des filtres de "Duplicate content", chez Google et ses concurrents.
Commençons par un exemple. La plupart du temps, on comprend vite les risques que l'on court en tapant sur Google (et les autres moteurs) la requête "site:" suivie du nom de domaine de son site. Si les résultats ressemblent à ce que l'on peut voir ci-dessous, vous pouvez commencer à vous faire un peu de mourron :
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).