Résumé de l'article :

Tout éditeur de site web de contenu a eu, a, ou aura un jour à faire avec la notion de "duplicate content" sur les moteurs de recherche. En d'autres termes, la prise en compte par Google et consorts d'une seule version d'une page proposant un contenu qui est dupliqué à l'identique - ou presque - dans un autre document se trouvant sur le même site ou sur une autre source d'information. Quelles sont les différentes formes (nombreuses) de "duplicate content" ? Quelles solutions apporter pour éviter ce type de souci ? Cette série d'articles tente d'y voir plus clair sur cette problématique que nous avons initiée, dans la lettre précédente, par une explication générale du phénomène de "duplicate content" et la problématique du contenu "canonique" dupliqué par des sites partenaires ou "pirates"... Ce mois-ci, nous tentons de comprendre pourquoi une même page accessible depuis des urls différentes pose problème aux moteurs de recherche et à votre référencement...

Début de l'article :

Duplicate content, acte 2

Le mois dernier, nous avons exploré le concept de Duplicate Content et la problématique du contenu canonique dupliqué sur des pages d'autres sites, qu'ils soient partenaires ou non. Mais il ne s'agit pas là de la seule problématique gravitant autour du phénomène de Duplicate Content, loin de là...

En effet, les webmasters sont souvent confrontés au fait qu'une même page web, unique – proposant strictement le même code HTML - , soit accessible par des urls différentes sur un même site, bien évidemment. Cette situation est dommageable pour un référencement et nous allons tenter d'expliquer pourquoi.

Duplicate interne, quelle incidence sur le référencement ?

On le sait, les algorithmes de pertinence des moteurs de recherche majeurs sont fortement influencés par l'analyse des liens externes et internes qui pointent vers une page et les notions de popularité (quantité et qualité des liens entrants) et réputation (textes des liens pointant vers la page). Pour prendre un premier exemple simple, chaque lien vers votre page d'accueil est une pierre de plus à ajouter à la qualité de votre référencement.

Ainsi, imaginez que votre page d'accueil (www.votresite.com) redirige l'internaute, à l'aide d'une redirection JavaScript ou 302, vers une page pour les internautes francophones disponible à l'adresse www.votresite.com/fr/accueil.php. La plupart des liens, sur le Web, pointeront pourtant vers l'adresse www.votresite.com, qui n'a pas de contenu puisqu'elle redirige automatiquement l'internaute. La "vraie" page d'accueil (www.votresite.com/fr/accueil.php), recevant peu de liens (les redirections JavaScript et 302 ne transférant pas la popularité d'une page à l'autre), elle sera très peu populaire, réduisant donc d'autant sa capacité à être bien positionnée. La page certainement la plus populaire de votre site n'a donc ici aucune utilité en termes de référencement. Rageant, non ?? Il en serait, bien sûr, autrement si une redirection 301 (qui transfère le PageRank) avait été utilisée...


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).