Résumé de l'article :

Tout éditeur de site web de contenu a eu, a ou aura un jour à faire avec la notion de "duplicate content" sur les moteurs de recherche. En d'autres termes, la prise en compte par Google et consorts d'une seule version d'une page proposant un contenu qui est dupliqué à l'identique - ou presque - dans un autre document se trouvant sur le même site ou sur une autre source d'information. Quelles sont les différentes formes (nombreuses) de "duplicate content" ? Quelles solutions apporter pour éviter ce type de souci ? Cette série d'articles tente d'y voir plus clair sur cette problématique en commençant par une explication générale du phénomène de "duplicate content" et par l'exploration d'un premier volet sur le contenu "canonique" dupliqué par des sites partenaires ou "pirates"...

Début de l'article :

Introduction : le Duplicate Content, c'est quoi ?

Depuis de nombreuses années, on entend parler, en termes de référencement, de problèmes dûs au concept de "Duplicate Content". De quoi s'agit-il exactement ? Quels types de problèmes ce phénomène pose-t-il et quels sont les remèdes possibles ? Nous allons essayer, dans cet article, de répondre à toutes ces questions et de voir comment faire en sorte que le duplicate content ne soit plus qu'un mauvais souvenir pour vous si vous souffrez actuellement de ce type de problème...

Mais tout d'abord, qu'est-ce que le duplicate content ? En fait, il s'agit d'une situation assez simple en soi : imaginons que Google (et les autres moteurs, bien sûr) ait, à un moment donné, indexé une ou plusieurs pages (sur le même site ou sur des sites différents) qui, selon lui, proposent un contenu identique ou, tout du moins, très proche, très similaire :
...


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).