Résumé de l'article :
Dans le cadre d'un processus de veille, on a souvent besoin d'ĂȘtre averti lorsqu'une page web, se trouvant sur un site distant, est modifiĂ©e. Il existe ainsi de nombreux outils permettant de gĂ©nĂ©rer un flux RSS ou d'envoyer un e-mail Ă chaque modification ainsi constatĂ©e. Certains de ces outils sont trĂšs performants et permettent, de façon gratuite ou peu onĂ©reuse, de mettre en place des procĂ©dures de surveillance trĂšs pointues. Chacun a cependant ses avantages et ses inconvĂ©nients... Voici 10 exemples de sites web qui ont pour ambition de faciliter vos travaux de veille, dĂ©crits avec prĂ©cision pour vous permettre de faire votre choix...
DĂ©but de l'article :
Le principe des outils que nous allons présenter dans cet article est de vous avertir dÚs qu'un changement est intervenu sur un document visible sur le Web. D'une part, ils vous permettent de générer une alerte e-mail ou de créer un flux RSS à partir de pages web ou de sites qui n'en proposent pas. D'autre part, ils permettent de resserrer les alertes à une portion spécifique d'une page web. Ils fonctionnent donc à mi-chemin entre agents de veille et applications de Web scrapping. Rappelons que ce terme désigne toute sorte de moyens permettant d'extraire un contenu web afin de l'utiliser à d'autres fins. On peut distinguer différentes fonctions qui vont nous permettre de les différencier :
- L'existence ou non d'une fonction d'alerte ;
- Le type d'alerte générée : contenu web, e-mail, flux RSS ;
- La fréquence des alertes ;
- La taille maximale des fichiers qu'il est possible de surveiller ;
- La possibilitĂ© de simuler des requĂȘtes en mode Post ou en mode Get et donc de surveiller un formulaire ;
- La possibilité d'archiver les différentes versions des pages à surveiller ;
- La possibilité de filtrer le contenu de la page cible ;
- La possibilité de tracer des modifications intervenus sur des documents non HTML ;
- La possibilité de faire de la surveillance de pages en FTP, nécessitant l'utilisation de protocoles SSL ou HTPPS ;
- La possibilité d'utiliser des adresses URL contenant des variables ;
- La possibilité de modifier le type d'agent utilisateur qui sera envoyé ;
- L'utilisation d'un mode Proxy.
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).