Google propose de plus en plus dans ses rĂ©sultats des extraits de pages web, comme il l'a montrĂ© rĂ©cemment en reprenant purement et simplement des tutoriels directement dans ses SERP sans demander l'avis des Ă©diteurs les ayant crĂ©Ă©s sur leurs sites respectifs. A-t-il juridiquement le droit de mettre en place de telles pratiques ? Peut-il ĂȘtre attaquĂ© pour "vol de contenu", ce Ă quoi peut ĂȘtre assimilĂ© le "scraping" ? RĂ©ponses dans cet article...
DĂ©but de l'article :
Le post de Matt Cutts, en dĂ©cembre 2013, sur le scraping et la mise Ă disposition dâun formulaire de signalement de ce type de cas (http://www.abondance.com/actualites/20131205-13450-matt-cutts-et-le-scraping-de-textes.html) a rouvert le dĂ©bat autour de cette pratique. Et ce, dâautant plus Ă©trangement que, concomitamment et de plus en plus, Google recopie quelques lignes de contenu de certains sites (comme WikipĂ©dia) dans le cadre de la fourniture de rĂ©sultats naturels (http://www.abondance.com/actualites/20140626-14037-knowledge-graph-commence-afficher-tutoriels-scrape-web-vergogne.html). La nature et les risques juridiques de cette pratique sont pourtant prĂ©cis et ne souffrent pas de discussion. Les exemples de procĂšs perdus par Google ActualitĂ©s dans le cadre de la reprise de filets dâactualitĂ©s, sont lĂ pour en tĂ©moigner.
Le concept de « scraping »
Le terme « scraping » vient de lâanglais et peut signifier « racler » ou « prĂ©lever ». Ce terme est notamment utilisĂ© dans un sens mĂ©dical.
Il semble exister plusieurs cas de scraping :
- Selon Wikipedia (http://fr.wikipedia.org/wiki/Web_scraping), le Web scraping (parfois appelé Harvesting) est une technique d'extraction du contenu de sites Web, via un script ou un programme, dans le but de le transformer pour permettre son utilisation dans un autre contexte, par exemple le référencement ;
- Le scraping peut concerner uniquement les images ou vidĂ©os, voire des Ă©crans dâimpression de sites ;
- Le scraping peut viser une technique dâaspiration de donnĂ©es structurĂ©es, dans une base de donnĂ©es, qui peut ĂȘtre rĂ©alisĂ©e entre deux applications (par exemple, en cas de clusterisation de donnĂ©es).
...
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).