On entend souvent dire que les fils RSS sont morts et qu'ils ne servent plus Ă rien, qu'ils ont disparu de la surface du Web. Mais ceux qui disent cela ne savent peut-ĂȘtre pas bien les utiliser et les chercher, car les flux RSS sont bien prĂ©sents Ă l'heure actuelle sur la Toile et peuvent s'avĂ©rer extrĂȘmement intĂ©ressants Ă utiliser. Voici comment les identifier au mieux dans une dĂ©marche de veille.
Â
Les flux RSS ont Ă©tĂ© pendant longtemps faciles Ă trouver puisquâils Ă©taient par dĂ©faut prĂ©sents sur chaque blog. Une simple recherche dans Technorati, Blog Pulse ou Google Blogs permettait de repĂ©rer des blogs thĂ©matiques et de sây abonner, mais, dâune part, le phĂ©nomĂšne des blogs sâest tassĂ© et dâautre part, beaucoup de ceux qu'on appelait Ă l'Ă©poque "blogs" se sont transformĂ©s en sites web traditionnels, mettant de cĂŽtĂ© les spĂ©cificitĂ©s qui les en distinguaient initialement : prĂ©sentation par ordre antĂ©chronologique, possibilitĂ© de commentaires, trackbacks, blogroll et⊠flux RSS ! On aurait alors pu penser que les flux allaient disparaĂźtre, dâautant quâĂ partir de 2015, les GAFAM les avaient presque totalement banni de leurs plateformes. Ce ne fĂ»t pourtant pas le cas et lâune des raisons de leur rĂ©sistance est liĂ©e Ă la transformation dâun outil trĂšs populaire de crĂ©ation de blogs - WordPress - en un CMS capable de crĂ©er tout type de sites web. Or WordPress dispose nativement de trĂšs nombreux flux RSS (plus dâune trentaine) et il est Ă©galement le CMS le plus utilisĂ© dans le monde. Des chiffres publiĂ©s trĂšs rĂ©cemment par le cabinet dâĂ©tudes W3techs indiquent quâil reprĂ©sente 40% des sites crĂ©Ă©s, loin devant Shopify (3%), Joomla (2,2 %) ou Drupal (- de 2%). Une information intĂ©ressante dans le contexte de la veille puisquâelle nous assure quâa minima, 40% des sites quâon dĂ©couvrira lors dâune phase de sourcing pourront ĂȘtre surveillĂ©s via leur flux RSS.
Comment identifier les sites sous WordPress ?
La dĂ©marche consiste dans un premier temps Ă identifier si le site que lâon souhaite surveiller a Ă©tĂ© bĂąti avec WordPress. Rien de plus simple pour cela. Il suffit dâinstaller lâextension Wappalyzer et de cliquer dessus lorsquâon est sur la page cible :
Â
Détection du CMS de création du site Réacteur avec Wappalyzer
Il ne reste plus ensuite quâĂ repĂ©rer le flux dans la page et Ă lâajouter Ă son agrĂ©gateur. Des extensions dâaide Ă la dĂ©tection de flux RSS existent dâailleurs afin dâaller plus vite :
Pour Chrome :
Pour Firefox :
Il est Ă©galement possible dâutiliser le modĂšle de structure de flux (cf. article sur le site coderevolution.com citĂ© ci-dessus) pour les « recrĂ©er » de maniĂšre plus prĂ©cise directement dans son agrĂ©gateur. Si par exemple vous souhaitez obtenir le flux de lâensemble des commentaires dĂ©posĂ©s sur le site RĂ©acteur, vous pouvez crĂ©er votre flux ainsi :
Création d'un flux spécifique aux commentaires d'un blog WordPress dans l'agrégateur Inoreader
Â
Les annuaires de blogs ou de flux RSS
Ceci Ă©tant dit, il existe dâautres moyens dâidentifier des flux RSS ou, a minima, les blogs susceptibles de les accueillir. Il sâagit des (antiques) annuaires qui nâont pas totalement disparu et sont encore actifs sur une niche liĂ©e au rĂ©fĂ©rencement. Notre objectif sera ici dâobtenir soit :
- Une liste de blogs produisant du contenu sur une thématique spécifique ;
- Une liste de flux RSS produisant du contenu sur une thématique spécifique.
Ce qui exclut les services qui agrĂšgent eux-mĂȘmes des flux et permettent ensuite de rechercher des articles par mots-clĂ©s sans donner accĂšs Ă leur liste de flux. En effet, mĂȘme sâils peuvent ĂȘtre utiles, ils sont chronophages dans une phase de sourcing car ils impliquent de remonter Ă chaque fois au blog pour en dĂ©duire sâil est pertinent ou non sur notre thĂ©matique.
Blogarama, un agrégateur générique sans annuaire de sources
Â
Commençons ce tour dâhorizon par un comparatif des annuaires de blogs :
Nom | Type | RequĂȘtage / navigation | Remarques | IntĂ©rĂȘt pour le sourcing |
Wingee http://www.wingee.com/ |
Annuaire de flux RSS classés par catégories | Moteur interne ou navigation par catégories | Corpus anglo-saxon.
Flux peu nombreux. |
â |
1001rss https://1001rss.com/sites/ |
Répertoire et agrégateur générique de flux RSS | Moteur de recherche interne limité.
 Utiliser Google : |
Corpus de sources France. Pas de recherche ou navigation par catégories. |
ââ |
Best of the Web Blogs | Annuaire de flux RSS classés par catégories | Moteur interne inefficace ou navigation par catégories
 Utiliser Google : site:https://blogs.botw.org « mot-clé » |
Corpus anglo-saxon. | âââ |
FeedDigest | Répertoire et agrégateur générique de flux RSS | Moteur interne
TrÚs complet. La recherche par mots-clés remonte des flux thématiques (voir « Related channels » en bas à gauche des résultats). |
Corpus anglo-saxon.
 GĂ©nĂšre un flux RSS par requĂȘte. |
ââââ |
Bloggernity | Annuaire de flux RSS classés par catégories | Moteur interne ou navigation par catégories.
La recherche par mots-clés remonte les résultats par ordre chronologique. Donc démarrer la consultation par la derniÚre page⊠|
Beaucoup de sources blogs.
 Interface désuÚte. |
âââ |
Bloglovinâ | Annuaire et agrĂ©gateur de flux RSS | Moteur interne ou navigation par catĂ©gories (https://www.bloglovin.com/blogs) | Rechercher un mot-clĂ© ou une expression dans le moteur puis choisir lâonglet « Blogs » pour accĂ©der aux sources. | âââ |
Atlas des flux RSS | Annuaire de flux RSS classés par catégories | Moteur interne ou navigation par catégories | Corpus France.
PossibilitĂ© dâimporter tous les flux dâune catĂ©gorie dans un fichier OPML, XML ou CSV. Mises Ă jour rĂ©guliĂšres. |
âââ |
Blogs Collection | Annuaire de flux RSS classés par catégories | Navigation par catégories.
Moteur interne limité.  Utiliser Google : site:https://www.blogs-collection.com/tag/* "mot-clé" |
Corpus anglo-saxon
 Peu ergonomique.  |
ââ |
Â
Si ces annuaires ont le mĂ©rite dâexister et de continuer Ă ĂȘtre mis Ă jour, ils sâavĂšrent globalement limitĂ©s, tant dans la maniĂšre dây rechercher des sources (requĂȘtage et navigation), que dans leur graphisme souvent trĂšs datĂ©.
Page de résultats de FeedDigest avec flux thématiques ("Related channels")
Â
En pratique, notre choix se portera sur FeedDigest, pour son importante base de flux, ainsi que sur lâAtlas des flux RSS, lĂ aussi pour sa base de flux en français, ainsi que pour la possibilitĂ© quâil offre dâimporter lâensemble des flux dâune catĂ©gorie afin de les ajouter rapidement Ă son agrĂ©gateur. Une bonne surprise donc.
Â
Les annuaires des agrégateurs de flux RSS
Il existe une autre catĂ©gorie dâannuaire Ă prendre en compte. Il sâagit de ceux mis Ă disposition par les agrĂ©gateurs de flux RSS en ligne. Ils ne sont gĂ©nĂ©ralement accessibles quâaprĂšs que lâon ait crĂ©Ă© un compte gratuit, mais bĂ©nĂ©ficient de la puissance de ce qui enregistrent leurs utilisateurs. Lâautre intĂ©rĂȘt ici est que lâon accĂšde ici directement Ă des flux RSS et non sur des blogs quâil faut ensuite explorer pour trouver le flux.
Bien sĂ»r, tous les agrĂ©gateurs nâen proposent pas (ou parfois uniquement en version Premium comme Feedly), mais nous en avons tout de mĂȘme repĂ©rĂ© quatre exploitables Ă partir dâun compte gratuit :
Nom | RequĂȘtage | Remarques | IntĂ©rĂȘt pour le sourcing |
Feeder | Navigation par catégories. Moteur de recherche peu pertinent.Utiliser Google : site:https://feeder.co/discover/* "mot-clé" |
Les flux dĂ©tectĂ©s sont protĂ©gĂ©s afin dâĂȘtre enregistrĂ©s directement dans Feeder. Les rĂ©cupĂ©rer pour les ajouter Ă un autre agrĂ©gateur peut-ĂȘtre chronophage. | ââ |
Inoreader | Recherche par mots-clĂ©s (pas dâannuaire).
Choisir lâonglet « Flux »  |
Le moteur de recherche proposĂ© est puissant et permet lâusage des boolĂ©ens, notamment des guillemets.
Son corpus de résultats est conséquent. |
ââââ |
Feedspot | Recherche par mots-clés ou par catégories.
  |
Cliquer sur le bouton rouge « Add new site » pour accéder aux catégories (à gauche) ou au moteur de recherche par mots-clés (guillemets non utiles)
 |
ââââ |
Feedreader | Ni moteur de recherche ni annuaireâŠ
Utiliser Google:  site:https://feedreader.com/observe/* intitle:"mot-clé" -inurl:index.php -inurl:article -inurl:thread -inurl:view |
ââ |
Â
Dans cette catĂ©gorie, Inoreader et Feedspot nous semblent ĂȘtre les deux services Ă privilĂ©gier.
Â
Les moteurs de recherche
Reste enfin les moteurs de recherche gĂ©nĂ©ralistes que sont Google et Bing. Commençons par ce dernier qui, une fois nâest pas coutume, dĂ©passe ici les possibilitĂ©s offertes par le leader du marchĂ©. En effet, Bing propose depuis longtemps deux opĂ©rateurs permettant de rechercher spĂ©cifiquement des flux RSS ou des pages qui en disposent.
Le premier est « feed: », quâon utilise ainsi dans une requĂȘte :
feed:mot-clé
Par exemple :
feed:"intelligence artificielle" pour trouver des flux relatifs Ă ce sujet
Il est important de comprendre quâici Bing ne recherche pas les items (articles, billets, posts,âŠ) issus de flux RSS et dans lesquels votre mot-clĂ© est citĂ© mais bien des flux encapsulĂ©s dans des pages web comportant ce mot-clĂ© dans leur titre (donc des sources potentielles). Ce qui leur donne toutes les chances dâĂȘtre pertinents :
Résultats de Bing avec l'opérateur "feed:"
Â
Quoique moins directement utile, la syntaxe « hasfeed: » peut Ă©galement ĂȘtre utilisĂ© en complĂ©ment. A la diffĂ©rence du premier, cet opĂ©rateur nâouvre pas directement des flux RSS dans votre navigateur, mais des pages web qui en contiennent (« has feed ») et oĂč votre mot-clĂ© est prĂ©sent. On peut donc penser quâil sâagit de flux en lien avec cette mĂȘme thĂ©matique mais il faudra bien entendu sâen assurer avant de sây abonner. On lâutilise ainsi :
hasfeed:"intelligence artificielle" pour trouver des pages web oĂč l'expression "intelligence artificielle" est citĂ©e et qui comportent un flux RSS.
Résultats de Bing avec l'opérateur "hasfeed:"
Â
Comme on peut le voir dans les rĂ©sultats, lâexpression « intelligence artificielle » est bien prĂ©sente dans le texte et/ou le titre des pages. Par ailleurs, les vĂ©rifications que nous avons effectuĂ©es montrent que des flux RSS sont bien prĂ©sents dans chacune dâelles.
Si Google nâoffre pas dâopĂ©rateurs de ce type, on peut toutefois utiliser le classique « filetype: » (ou « ext: » ).
Ainsi on peut lancer la requĂȘte suivante :
filetype:rss "intelligence artificielle"
ou encore :
filetype:atom "intelligence artificielle"
Les rĂ©sultats sont nettement moins pertinents que ceux fournis par Bing et nous suggĂ©rons dâutiliser plutĂŽt ces requĂȘtes dans Google Alerts, afin de complĂ©ter ses sources au fil de lâeau avec les nouveautĂ©s dĂ©tectĂ©es par les robots dâindexation de Google.
Â
Conclusion : faire les choses dans le bon ordre pour des résultats plus efficaces
Le dĂ©ploiement dâune stratĂ©gie de sourcing de flux RSS rapide et efficace nous semble donc devoir ĂȘtre effectuĂ© dans le bon ordre et avec les outils suivants :
- RequĂȘte dans Bing avec lâopĂ©rateur « feed: » ;
- Interrogation des annuaires de flux dâInoreader et de Feedspot ;
- Interrogation des annuaires de flux RSS FeedDigest et Atlas des flux RSS.
On pourra ensuite complĂ©ter ces sources au fils de lâeau via des alertes Google utilisant la syntaxe « filetype:rss » ainsi quâavec des flux de requĂȘtes Bing (cf. cet article pour apprendre Ă les crĂ©er).
Comme on le voit, les flux RSS restent une valeur sûre de la veille et il serait dommage de ne pas continuer à les exploiter.
Â
Christophe Deschamps, Consultant-formateur : veille stratégique, intelligence économique, social KM, e-réputation, mindmapping, IST (http://www.outilsfroids.net/)
Â
Â