Le content spinning, déjà évoqué dans nos colonnes, est une méthode utilisée par de nombreux référenceurs pour obtenir des textes pertinents, vraisemblables et originaux pour leur site web. Mais il peut s'agir de méthodes dangereuses si elles sont détectées par les moteurs de recherche (Google a d'ailleurs clairement indiqué dans le passé que le spinning était interdit). Mais comment font ces moteurs pour détecter le content spinning ? Retour sur les travaux de trois chercheurs américains à ce sujet...
Cet article fait partie de la Lettre Réacteur #155 du mois de janvier 2014
Début de l'article :
Chers lecteurs et lectrices de la lettre R&R, vous savez très certainement déjà ce qu'est le spin, car plusieurs articles vous en ont parlé par le passé (voir articles de la lettre d'avril et mai 2013). Nous n'allons donc pas vous faire l'affront de vous le (ré)expliquer en détail. Cependant, pour s'assurer que nous parlons très exactement de la même chose, nous allons dans un premier temps définir le vocabulaire que nous allons utiliser dans cet article.
Pour de nombreuses tâches liées à nos métiers de référenceurs ou webmaster, nous avons besoin de disposer de contenus textuels. Que ce soit pour faire de l'acquisition de liens et ainsi apporter de l'information contextuelle, ou tout simplement agrandir facilement la taille d'un site web, ou bien encore pour créer de la valeur ajoutée sur des pages à faible intérêt (listing, catégories), on a toujours besoin de contenus, parfois même de plus en plus de contenus.
Disposer de nombreux textes est donc un atout non négligeable dans une optique de référencement. Mais pas n'importe quels textes ! En effet, ceux-ci doivent pouvoir répondre à quelques exigences fondamentales :
- être pertinents pour les requêtes ciblées (n'oublions pas que l'enjeu final est d'obtenir un bon positionnement) ;
- être vraisemblables (sinon on parle de spam) ;
- être originaux (les textes dupliqués ou quasi-dupliqués peuvent être détectés et donc pénalisés, cf. lettre R&R de décembre 2013).
Pour obtenir ces textes de façon peu onéreuse et rapide, trois options sont généralement possibles :
- Acheter du contenu offshore. La qualité est variable et selon le pays où sont sous-traités les textes, on peut avoir des soucis de ciblages (certains termes ont des fréquences d'usage différents, certaines expressions n'existent pas ou au contraire sont sur-utilisées).
- Copier le contenu d’un site tiers. Nous l'avons vu, ce n'est pas une option si l'on souhaite éviter d'être repéré par les filtres de détection des contenus dupliqués ou quasi-dupliqués.
- Utiliser des méthodes de réécriture de contenu. Le content spinning est une technique de réécriture de contenu qui vise à remplacer des mots d’un texte ou à modifier la structure de ce texte (ou les deux à la fois) pour créer un texte différent du premier, mais qui porte la même information.
...
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).