On entend souvent dire que les fils RSS sont morts et qu'ils ne servent plus Ă  rien, qu'ils ont disparu de la surface du Web. Mais ceux qui disent cela ne savent peut-ĂȘtre pas bien les utiliser et les chercher, car les flux RSS sont bien prĂ©sents Ă  l'heure actuelle sur la Toile et peuvent s'avĂ©rer extrĂȘmement intĂ©ressants Ă  utiliser. Voici comment les identifier au mieux dans une dĂ©marche de veille.

 

Les flux RSS ont Ă©tĂ© pendant longtemps faciles Ă  trouver puisqu’ils Ă©taient par dĂ©faut prĂ©sents sur chaque blog. Une simple recherche dans Technorati, Blog Pulse ou Google Blogs permettait de repĂ©rer des blogs thĂ©matiques et de s’y abonner, mais, d’une part, le phĂ©nomĂšne des blogs s’est tassĂ© et d’autre part, beaucoup de ceux qu'on appelait Ă  l'Ă©poque "blogs" se sont transformĂ©s en sites web traditionnels, mettant de cĂŽtĂ© les spĂ©cificitĂ©s qui les en distinguaient initialement : prĂ©sentation par ordre antĂ©chronologique, possibilitĂ© de commentaires, trackbacks, blogroll et
 flux RSS ! On aurait alors pu penser que les flux allaient disparaĂźtre, d’autant qu’à partir de 2015, les GAFAM les avaient presque totalement banni de leurs plateformes. Ce ne fĂ»t pourtant pas le cas et l’une des raisons de leur rĂ©sistance est liĂ©e Ă  la transformation d’un outil trĂšs populaire de crĂ©ation de blogs - WordPress - en un CMS capable de crĂ©er tout type de sites web. Or WordPress dispose nativement de trĂšs nombreux flux RSS (plus d’une trentaine) et il est Ă©galement le CMS le plus utilisĂ© dans le monde. Des chiffres publiĂ©s trĂšs rĂ©cemment par le cabinet d’études W3techs indiquent qu’il reprĂ©sente 40% des sites crĂ©Ă©s, loin devant Shopify (3%), Joomla (2,2 %) ou Drupal (- de 2%). Une information intĂ©ressante dans le contexte de la veille puisqu’elle nous assure qu’a minima, 40% des sites qu’on dĂ©couvrira lors d’une phase de sourcing pourront ĂȘtre surveillĂ©s via leur flux RSS.


Comment identifier les sites sous WordPress ?

La dĂ©marche consiste dans un premier temps Ă  identifier si le site que l’on souhaite surveiller a Ă©tĂ© bĂąti avec WordPress. Rien de plus simple pour cela. Il suffit d’installer l’extension Wappalyzer et de cliquer dessus lorsqu’on est sur la page cible :

 

Détection du CMS de création du site Réacteur avec Wappalyzer

Il ne reste plus ensuite qu’à repĂ©rer le flux dans la page et Ă  l’ajouter Ă  son agrĂ©gateur. Des extensions d’aide Ă  la dĂ©tection de flux RSS existent d’ailleurs afin d’aller plus vite :

Pour Chrome :

Pour Firefox :

Il est Ă©galement possible d’utiliser le modĂšle de structure de flux (cf. article sur le site coderevolution.com citĂ© ci-dessus) pour les « recrĂ©er » de maniĂšre plus prĂ©cise directement dans son agrĂ©gateur. Si par exemple vous souhaitez obtenir le flux de l’ensemble des commentaires dĂ©posĂ©s sur le site RĂ©acteur, vous pouvez crĂ©er votre flux ainsi :

Création d'un flux spécifique aux commentaires d'un blog WordPress dans l'agrégateur Inoreader

 

Les annuaires de blogs ou de flux RSS

Ceci Ă©tant dit, il existe d’autres moyens d’identifier des flux RSS ou, a minima, les blogs susceptibles de les accueillir. Il s’agit des (antiques) annuaires qui n’ont pas totalement disparu et sont encore actifs sur une niche liĂ©e au rĂ©fĂ©rencement. Notre objectif sera ici d’obtenir soit :

  • Une liste de blogs produisant du contenu sur une thĂ©matique spĂ©cifique ;
  • Une liste de flux RSS produisant du contenu sur une thĂ©matique spĂ©cifique.

Ce qui exclut les services qui agrĂšgent eux-mĂȘmes des flux et permettent ensuite de rechercher des articles par mots-clĂ©s sans donner accĂšs Ă  leur liste de flux. En effet, mĂȘme s’ils peuvent ĂȘtre utiles, ils sont chronophages dans une phase de sourcing car ils impliquent de remonter Ă  chaque fois au blog pour en dĂ©duire s’il est pertinent ou non sur notre thĂ©matique.

Blogarama, un agrégateur générique sans annuaire de sources

 

Commençons ce tour d’horizon par un comparatif des annuaires de blogs :

Nom Type RequĂȘtage / navigation Remarques IntĂ©rĂȘt pour le sourcing
Wingee
http://www.wingee.com/
Annuaire de flux RSS classés par catégories Moteur interne ou navigation par catégories Corpus anglo-saxon.

Flux peu nombreux.

⭐
1001rss
https://1001rss.com/sites/
Répertoire et agrégateur générique de flux RSS Moteur de recherche interne limité.

 

Utiliser Google :
site:https://1001rss.com/sites/ « mot-clé »

Corpus de sources France.
Pas de recherche ou navigation par catégories.
⭐⭐
Best of the Web Blogs

https://blogs.botw.org

Annuaire de flux RSS classés par catégories Moteur interne inefficace ou navigation par catégories

 

Utiliser Google :

site:https://blogs.botw.org « mot-clé »

Corpus anglo-saxon. ⭐⭐⭐
FeedDigest

http://terms.feeddigest.com/

Répertoire et agrégateur générique de flux RSS Moteur interne

TrĂšs complet.

La recherche par mots-clés remonte des flux thématiques (voir « Related channels » en bas à gauche des résultats).

Corpus anglo-saxon.

 

GĂ©nĂšre un flux RSS par requĂȘte.

⭐⭐⭐⭐
Bloggernity

http://www.bloggernity.com/

Annuaire de flux RSS classés par catégories Moteur interne ou navigation par catégories.

La recherche par mots-clés remonte les résultats par ordre chronologique. Donc démarrer la consultation par la derniÚre page


Beaucoup de sources blogs.

 

Interface désuÚte.

⭐⭐⭐
Bloglovin’

https://www.bloglovin.com/

Annuaire et agrĂ©gateur de flux RSS Moteur interne ou navigation par catĂ©gories (https://www.bloglovin.com/blogs) Rechercher un mot-clĂ© ou une expression dans le moteur puis choisir l’onglet « Blogs » pour accĂ©der aux sources. ⭐⭐⭐
Atlas des flux RSS

http://atlasflux.saynete.net/

Annuaire de flux RSS classés par catégories Moteur interne ou navigation par catégories Corpus France.

PossibilitĂ© d’importer tous les flux d’une catĂ©gorie dans un fichier OPML, XML ou CSV.

Mises à jour réguliÚres.

⭐⭐⭐
Blogs Collection

https://www.blogs-collection.com/

Annuaire de flux RSS classés par catégories Navigation par catégories.

Moteur interne limité.

 

Utiliser Google :

site:https://www.blogs-collection.com/tag/* "mot-clé"

Corpus anglo-saxon

 

Peu ergonomique.

 

⭐⭐

 

Si ces annuaires ont le mĂ©rite d’exister et de continuer Ă  ĂȘtre mis Ă  jour, ils s’avĂšrent globalement limitĂ©s, tant dans la maniĂšre d’y rechercher des sources (requĂȘtage et navigation), que dans leur graphisme souvent trĂšs datĂ©.

Page de résultats de FeedDigest avec flux thématiques ("Related channels")

 

En pratique, notre choix se portera sur FeedDigest, pour son importante base de flux, ainsi que sur l’Atlas des flux RSS, lĂ  aussi pour sa base de flux en français, ainsi que pour la possibilitĂ© qu’il offre d’importer l’ensemble des flux d’une catĂ©gorie afin de les ajouter rapidement Ă  son agrĂ©gateur. Une bonne surprise donc.

 

Les annuaires des agrégateurs de flux RSS

Il existe une autre catĂ©gorie d’annuaire Ă  prendre en compte. Il s’agit de ceux mis Ă  disposition par les agrĂ©gateurs de flux RSS en ligne. Ils ne sont gĂ©nĂ©ralement accessibles qu’aprĂšs que l’on ait crĂ©Ă© un compte gratuit, mais bĂ©nĂ©ficient de la puissance de ce qui enregistrent leurs utilisateurs. L’autre intĂ©rĂȘt ici est que l’on accĂšde ici directement Ă  des flux RSS et non sur des blogs qu’il faut ensuite explorer pour trouver le flux.

Bien sĂ»r, tous les agrĂ©gateurs n’en proposent pas (ou parfois uniquement en version Premium comme Feedly), mais nous en avons tout de mĂȘme repĂ©rĂ© quatre exploitables Ă  partir d’un compte gratuit :

Nom RequĂȘtage Remarques IntĂ©rĂȘt pour le sourcing
Feeder

https://feeder.co/

Navigation par catégories.
Moteur de recherche peu pertinent.Utiliser Google : site:https://feeder.co/discover/* "mot-clé"
Les flux dĂ©tectĂ©s sont protĂ©gĂ©s afin d’ĂȘtre enregistrĂ©s directement dans Feeder. Les rĂ©cupĂ©rer pour les ajouter Ă  un autre agrĂ©gateur peut-ĂȘtre chronophage. ⭐⭐
Inoreader

https://www.inoreader.com/

Recherche par mots-clĂ©s (pas d’annuaire).

Choisir l’onglet « Flux »

 

Le moteur de recherche proposĂ© est puissant et permet l’usage des boolĂ©ens, notamment des guillemets.

Son corpus de résultats est conséquent.

⭐⭐⭐⭐
Feedspot

https://www.feedspot.com/

Recherche par mots-clés ou par catégories.

 

 

Cliquer sur le bouton rouge « Add new site » pour accéder aux catégories (à gauche) ou au moteur de recherche par mots-clés (guillemets non utiles)

 

⭐⭐⭐⭐
Feedreader

https://feedreader.com/

Ni moteur de recherche ni annuaire


Utiliser Google:

 

site:https://feedreader.com/observe/* intitle:"mot-clé" -inurl:index.php -inurl:article -inurl:thread -inurl:view

⭐⭐

 

Dans cette catĂ©gorie, Inoreader et Feedspot nous semblent ĂȘtre les deux services Ă  privilĂ©gier.

 

Les moteurs de recherche

Reste enfin les moteurs de recherche gĂ©nĂ©ralistes que sont Google et Bing. Commençons par ce dernier qui, une fois n’est pas coutume, dĂ©passe ici les possibilitĂ©s offertes par le leader du marchĂ©. En effet, Bing propose depuis longtemps deux opĂ©rateurs permettant de rechercher spĂ©cifiquement des flux RSS ou des pages qui en disposent.

Le premier est « feed: », qu’on utilise ainsi dans une requĂȘte :

feed:mot-clé

Par exemple :

feed:"intelligence artificielle" pour trouver des flux relatifs Ă  ce sujet

Il est important de comprendre qu’ici Bing ne recherche pas les items (articles, billets, posts,
) issus de flux RSS et dans lesquels votre mot-clĂ© est citĂ© mais bien des flux encapsulĂ©s dans des pages web comportant ce mot-clĂ© dans leur titre (donc des sources potentielles). Ce qui leur donne toutes les chances d’ĂȘtre pertinents :

Résultats de Bing avec l'opérateur "feed:"

 

Quoique moins directement utile, la syntaxe « hasfeed: » peut Ă©galement ĂȘtre utilisĂ© en complĂ©ment. A la diffĂ©rence du premier, cet opĂ©rateur n’ouvre pas directement des flux RSS dans votre navigateur, mais des pages web qui en contiennent (« has feed ») et oĂč votre mot-clĂ© est prĂ©sent. On peut donc penser qu’il s’agit de flux en lien avec cette mĂȘme thĂ©matique mais il faudra bien entendu s’en assurer avant de s’y abonner. On l’utilise ainsi :

hasfeed:"intelligence artificielle" pour trouver des pages web oĂč l'expression "intelligence artificielle" est citĂ©e et qui comportent un flux RSS.

Résultats de Bing avec l'opérateur "hasfeed:"

 

Comme on peut le voir dans les rĂ©sultats, l’expression « intelligence artificielle » est bien prĂ©sente dans le texte et/ou le titre des pages. Par ailleurs, les vĂ©rifications que nous avons effectuĂ©es montrent que des flux RSS sont bien prĂ©sents dans chacune d’elles.

Si Google n’offre pas d’opĂ©rateurs de ce type, on peut toutefois utiliser le classique « filetype: » (ou « ext: » ).

Ainsi on peut lancer la requĂȘte suivante :

filetype:rss "intelligence artificielle"

ou encore :

filetype:atom "intelligence artificielle"

Les rĂ©sultats sont nettement moins pertinents que ceux fournis par Bing et nous suggĂ©rons d’utiliser plutĂŽt ces requĂȘtes dans Google Alerts, afin de complĂ©ter ses sources au fil de l’eau avec les nouveautĂ©s dĂ©tectĂ©es par les robots d’indexation de Google.

 

Conclusion : faire les choses dans le bon ordre pour des résultats plus efficaces

Le dĂ©ploiement d’une stratĂ©gie de sourcing de flux RSS rapide et efficace nous semble donc devoir ĂȘtre effectuĂ© dans le bon ordre et avec les outils suivants :

  1. RequĂȘte dans Bing avec l’opĂ©rateur « feed: » ;
  2. Interrogation des annuaires de flux d’Inoreader et de Feedspot ;
  3. Interrogation des annuaires de flux RSS FeedDigest et Atlas des flux RSS.

On pourra ensuite complĂ©ter ces sources au fils de l’eau via des alertes Google utilisant la syntaxe « filetype:rss » ainsi qu’avec des flux de requĂȘtes Bing (cf. cet article pour apprendre Ă  les crĂ©er).

Comme on le voit, les flux RSS restent une valeur sûre de la veille et il serait dommage de ne pas continuer à les exploiter.

 

Christophe Deschamps, Consultant-formateur : veille stratégique, intelligence économique, social KM, e-réputation, mindmapping, IST (http://www.outilsfroids.net/)

 

Â