Le contenu dupliqué : un cauchemar pour les moteurs ou pour les webmasters ?

Le contenu dupliqué, ou « duplicate content », est l’un des soucis principaux des webmasters s’intéressant au référencement. Les moteurs de recherche ont fait d’énormes progrès dans la détection des différents contenus similaires, proches ou identiques sur le Web, mais sans obtenir encore des résultats parfaits dans la pratique. Mais c’est également oublier qu’il existe différentes formes de duplicate content, et donc, en fonction de celles-ci, différentes façons de les combattre. Petite revue d’effectif des différents contenus dupliqués identifiés par les moteurs de recherche actuels sur le Web et des remédes à y apporter…

Cet article fait partie de la Lettre Réacteur #121 du mois de décembre 2010

Début de l’article :

Beaucoup de webmasters évoquent régulièrement sur les forums de discussion leur crainte de recevoir une pénalité pour « contenu dupliqué ». En réalité, nous le verrons dans cet article, il n’existe aucune raison pour qu’un moteur de recherche « pénalise » un site pour ce motif. Cela ne veut pas dire que la présence de contenu dupliqué n’est pas pénalisante pour un site. Mais cela n’a rien de systématique, car, point primordial, tout dépend de ce que l’on appelle un « contenu dupliqué »…

Comment définir le contenu dupliqué ?

En effet, il est important de bien définir les différentes formes de contenu dupliqué, car chaque forme a une origine différente et pose des problèmes différents.

Dans un premier temps, il faut distinguer trois cas différents :
– les documents dupliqués (qui se retrouvent en double sur la Toile, sous différences URL, mais code, textes, images, autres contenus sont identiques) ;
– les documents quasi dupliqués (near duplicates en anglais : le contenu peut-être légèrement différent, et/ou le code qui présente ces contenus est différent) ;
– les documents partiellement dupliqués (seule une partie du contenu se retrouve dans d’autres pages).

Les documents parfaitement dupliqués tirent souvent leur origine d’un problème ou d’une maladresse technique. On peut citer les cas suivants, qui créent effectivement des situations dans lesquelles la même page est accessible avec des URL différentes :

1. Les cas de DUST (Duplicate URL Same text) : le même contenu est accessible par des URL différentes au sein du même domaine/sous domaine. Nous reviendrons en détail plus loin sur les causes de DUST, qui sont essentiellement techniques.
2. Les sites miroirs : le même contenu est accessible depuis différents domaines, ou sous domaines. Tous ces « hôtes » peuvent appartenir à la même personne ou à la même organisation, ou constituer des miroirs gérés par d’autres webmasters pour assurer une meilleure disponibilité des contenus.
3. Les marques blanches : le même contenu est proposé à l’identique par d’autres sites, dans leur domaine, avec l’accord du producteur de contenu.
4. Le contenu copié : le résultat est le même que pour une marque blanche, sauf que ce contenu est copié sans autorisation.
…

La suite est réservée à nos abonnés. Déjà abonné ? Se connecter

Envie de lire la suite ?

-10% sur nos Abonnements de 6 mois et + avec le code :

JEVEUXPASPAYERPLEINPOT

Apprenez auprès des meilleurs experts, grâce à leurs partages de connaissances et leurs retours d’expérience.

Le contenu dupliqué : un cauchemar pour les moteurs ou pour les webmasters ?

Cliquez ici pour annuler la réponse.

L'automatisation des recherches protège-t-elle juridiquement les moteurs ?

Revue de moteurs (janvier 2011)

Les articles du moment

Etude : Stack technique des sites e-commerce Français en 2025

Statistiques SEO 2024 : les meilleures pratiques sont-elles toujours les mêmes ? (NON)

Copyright Trolling en France : comprendre et contrôler les abus d’une pratique controversée [Partie 2]

Copyright Trolling en France : comprendre et contrôler les abus d’une pratique controversée [Partie 1]

Google Discover : une (r)évolution pour Google et le SEO?

Les coulisses de la création de Position 0, le podcast SEO

Website flipping : comment faire x30 sur son investissement ?