Résumé de l'article :

Dans le cadre d'un processus de veille, on a souvent besoin d'être averti lorsqu'une page web, se trouvant sur un site distant, est modifiée. Il existe ainsi de nombreux outils permettant de générer un flux RSS ou d'envoyer un e-mail à chaque modification ainsi constatée. Certains de ces outils sont très performants et permettent, de façon gratuite ou peu onéreuse, de mettre en place des procédures de surveillance très pointues. Chacun a cependant ses avantages et ses inconvénients... Voici 10 exemples de sites web qui ont pour ambition de faciliter vos travaux de veille, décrits avec précision pour vous permettre de faire votre choix...

Début de l'article :

Le principe des outils que nous allons présenter dans cet article est de vous avertir dès qu'un changement est intervenu sur un document visible sur le Web. D'une part, ils vous permettent de générer une alerte e-mail ou de créer un flux RSS à partir de pages web ou de sites qui n'en proposent pas. D'autre part, ils permettent de resserrer les alertes à une portion spécifique d'une page web. Ils fonctionnent donc à mi-chemin entre agents de veille et applications de Web scrapping. Rappelons que ce terme désigne toute sorte de moyens permettant d'extraire un contenu web afin de l'utiliser à d'autres fins. On peut distinguer différentes fonctions qui vont nous permettre de les différencier :
- L'existence ou non d'une fonction d'alerte ;
- Le type d'alerte générée : contenu web, e-mail, flux RSS ;
- La fréquence des alertes ;
- La taille maximale des fichiers qu'il est possible de surveiller ;
- La possibilité de simuler des requêtes en mode Post ou en mode Get et donc de surveiller un formulaire ;
- La possibilité d'archiver les différentes versions des pages à surveiller ;
- La possibilité de filtrer le contenu de la page cible ;
- La possibilité de tracer des modifications intervenus sur des documents non HTML ;
- La possibilité de faire de la surveillance de pages en FTP, nécessitant l'utilisation de protocoles SSL ou HTPPS ;
- La possibilité d'utiliser des adresses URL contenant des variables ;
- La possibilité de modifier le type d'agent utilisateur qui sera envoyé ;
- L'utilisation d'un mode Proxy.


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).