La vidéo est désormais partout sur le web et nous accompagne au quotidien. Il est donc très important, dans une démarche de veille, de les intégrer pour obtenir des informations capitales sur son organisation et les acteurs de son environnement. Mais comment être efficace dans ces recherches ? Cette série d'articles a pour vocation de vous aider dans cette démarche. Après la description des différents outils disponibles le mois dernier, voici un article très complet sur la façon de les utiliser afin de mettre en place un monitoring efficace dans le cadre d'une surveillance automatisée.

 

Nous avons vu le mois dernier plusieurs techniques et outils permettant de rechercher des vidéos en ligne. Nous allons maintenant détailler comment transformer ces recherches en surveillance automatisées venant alimenter une veille quotidienne. Pour cela, nous reprendrons les différentes familles de services que sont :

  • Les moteurs de recherche ;
  • Les services d’hébergement de vidéos ;
  • Les réseaux sociaux.

Pour ce qui est de l’outil permettant de collecter ces éléments, nous utiliserons l’agrégateur de flux RSS Inoreader qui, de par ses nombreuses fonctionnalités avancées, est devenu incontournable pour qui veut mener une veille sans plateforme spécialisée (Digimind, KB Crawl, Sindup…).

Notre objectif sera donc de transformer les requêtes testées dans le précédent article en flux RSS que l’on pourra centraliser pour consultation dans un seul et même outil.

En termes de méthodologie, nous avons privilégié dans l’ordre les solutions suivantes :

  1. Les flux RSS natifs.
  2. Les flux RSS générés par des services dits HTML2RSS qui permettent, comme leur nom l’indique, de créer des flux pour des pages qui n’en ont pas initialement. Deux de ces services sont simples à utiliser (cf. tutoriels ci-dessous) et proposent des versions gratuites intéressantes :
    1. politepol.com: il faut créer un compte gratuit pour que les flux créés soit pérennes. On peut créer jusqu'à 20 flux gratuitement.
    2. feedfry.com: un service qui vous permet de créer plusieurs versions de flux en fonction des éléments qu’il trouve sur la page afin que vous choisissiez le bon. Il faut créer un compte gratuit pour l’utiliser. Le nombre de résultats par flux est limité à 10 items/24h.
  3. La création d’une alerte Google de type « site:www.nomdusite.com mot-clé » que nous récupérerons au format RSS (cf. tutoriel ci-dessous).

Les moteurs de recherche

Google Vidéos

Le moteur de recherche de vidéos de Google ne produit pas de flux RSS. On pourrait avoir l’idée de passer par les alertes Google en filtrant sur « Vidéos » lors du choix des sources. Malheureusement, cette possibilité ne fonctionne plus depuis quelques mois déjà. Idem si vous souhaitez surveiller Youtube en utilisant le service RSS Bridge (cf. ci-dessous). Il s’agit probablement d’une action de blocage de Google pour éviter le scraping de ses vidéos. Quelle solution utiliser alors ? Les tests que nous avons menés ont montré que Politepol était ici le meilleur choix.

Surveiller Google Vidéos avec Politepol :

  1. Allez sur Google Vidéos (google.com/videohp) et lancez votre requête.
  2. Filtrez les résultats sur « Moins de 24 heures »

Fig. 1. Création d'une requête dans Google Vidéos

  1. Copiez l’URL de la barre d’adresse et supprimez toute la partie indiquée barrée ici (pas indispensable mais préférable) : https://www.google.com/search?tbm=vid&hl=fr-AE&source=hp&biw=&bih=&q=%22intelligence+artificielle%22&oq=%22intelligence+artificielle%22&gs_l=video-hp.3..0l10.1900.7400.0.7600.27.21.0.0.0.0.300.2200.0j4j6j2.12.0....0...1ac.1.34.video-hp..16.11.2100.N35YC7SILEU
  2. Collez la dans PolitePol et cliquez sur « Go »
  3. La page de résultats apparaît alors dans une frame.
  4. Cliquez sur le bouton « Title » puis cliquez dans la page sur le texte qui constituera le titre des vidéos dans votre futur flux RSS. Vous constatez qu’en choisissant un élément Title, Politepol l’applique ce choix à tous les autres.


Fig. 2. Sélection des éléments d'un flux RSS en construction dans PolitePol

  1. Procédez de même pour le champ « Description » qui vous permettra par exemple d’ajouter la date et le début du résumé accompagnant la vidéo dans votre flux RSS.
  2. Cliquez sur le bouton « Create ».
  3. PolitePol affiche une prévisualisation de votre flux RSS.
  4. S’il vous convient, cliquez sur le bouton « Copy ».

Fig. 3. Flux RSS généré par PolitePol

  1. Ajoutez-le à votre agrégateur de flux RSS

Bing Vidéos

Bing Vidéos ne produit pas de flux RSS natifs et n’est pas simple à surveiller du fait de la technologie utilisée dans ses pages. Il faut donc contourner le problème en passant par Yahoo Vidéos qui propose le même contenu dans un environnement technologique plus simple à transformer en flux.

Ici Politepol ne fonctionne pas et il faut donc passer par Feedfry.

Surveiller Yahoo Vidéos avec Feedfry :

  1. Allez sur Yahoo Vidéos (https://video.search.yahoo.com/) et lancez votre requête.
  2. Filtrez les résultats sur « 24 heures ».

Fig. 4. Création d'une requête dans Yahoo Vidéos

  1. Copiez l’URL de la requête (barre d’adresse).
  2. Collez-la dans Feedfry et cliquez sur « Create a feed ».
  3. Choisissez parmi les flux proposés celui qui comporte vos éléments. Ici c’est le premier, « Main version » > Cliquer sur « Create a feed from this version »

Fig. 5. Présentation de différentes versions de flux proposées par Feedfry

  1. Copiez le flux RSS proposé (clic-droit/copier l’adresse du lien)

Fig. 6. Flux RSS généré par Feedfry, à récupérer.

  1. Ajoutez-le à votre agrégateur de flux RSS

Fig. 7 Flux de la requête intégré à Inoreader

 

Yandex Vidéos

Yandex Vidéos (www.yandex.com/video/)  ne propose pas de flux RSS. Feedfry a bien fonctionné ici mais sa « Main version » n’était pas la sélection attendue, que nous avons trouvé en Version 3 :

Fig. 8. Version de flux à choisir (la bonne version peut changer selon la requête)

Google Vidéos

 

www.google.com/videohp

Bing Vidéos / Yahoo Videos

https://video.search.yahoo.com/

Yandex Videos

 

www.yandex.com/video/

Flux RSS natif Non Non Non
HTML2RSS PolitePol Feedfry

 

Feedfry (pas nécessairement la « Main version »)
Alerte Google X X X
Problèmes rencontrés Supprimer la partie inutile de l’URL

Les vidéos ne sont pas incluses dans le flux RSS.

Passer par Yahoo ! Vidéos

Les vidéos ne sont pas incluses dans le flux RSS.

Les vidéos ne sont pas incluses dans le flux RSS.

Fig. 9. Récapitulatif des solutions à utiliser par moteur

 

Les services d’hébergement de vidéos

On peut vouloir surveiller ici l’arrivée de nouvelle vidéos par chaînes (veille cible) ou par mots-clés (veille radar). Nous verrons quels moyens utiliser pour chacune des ces possibilités.

Youtube

Les flux cachés des chaînes Youtube 

Surveiller des chaînes Youtube est simple, à condition de savoir qu’il existe des flux natifs mais cachés. Ces flux ne sont pas directement visibles, ni toujours détectables via les extensions spécifiques des navigateurs. Il faut donc en connaître la structure afin de pouvoir les utiliser et il y a alors une seconde subtilité. En effet, en 2014, Youtube a modifié ses structures d’URL qui peuvent donc être identifiées par un « username » (avant 2014) ou un « channel id » (après 2014) :

Une fois que l’on a identifié à quelle version on a à faire, il faut modifier les URL (via le bloc-notes Windows, Wordpad ou directement dans l’agrégateur) en leur ajoutant la partie ci-dessous en rouge.

  • Version username: https://www.youtube.com/feeds/videos.xml?user=portailIE
  • Version channel id: https://www.youtube.com/feeds/videos.xml?channel_id=UCLpqZb1q09kIWuZvrgY2DGg

Il ne reste plus alors qu’à ajouter ces flux à l’agrégateur :

Fig. 10 Exemple de flux de chaîne Youtube

 

Surveiller des mots-clés dans Youtube

Ici, la solution passe par les alertes Google qui, après un test de plusieurs semaines, s’avèrent étonnamment efficaces.

On va utiliser ici l’opérateur « site: » afin de cibler le site Youtube et plus spécifiquement le répertoire « watch » où il stocke les vidéos. La requête ressemblera alors à :

  • site:www.youtube.com/watch " intelligence artificielle"

D’expérience, il vaut mieux rester sur les sources automatiques lorsqu’on crée l’alerte sur Google (et surtout pas « Vidéos » qui ne fonctionne plus).

Fig. 11. Création de la requête dans Google alertes

 

Vous pouvez choisir de recevoir les nouveautés sous forme de flux RSS plutôt que par email. Attention! Pour que cette option soit disponible dans l’interface, il faut que vous soyez connecté à votre compte Google. Par ailleurs, si le flux ne semble par produire de résultats, n’hésitez pas à utiliser l’astuce publiée ici : https://www.outilsfroids.net/2021/03/astuce-de-veilleur-vos-alertes-google-au-format-rss-ne-fonctionnent-pas-essayez-ca/

Fig. 12. Surveillance de vidéos comportant l'expression "covid 19" sur Youtube

Dailymotion

Dailymotion dispose lui aussi de flux RSS cachés que l’on utilisera pour suivre des chaînes et des mots-clés.

S’abonner aux flux cachés des chaînes Dailymotion :

  1. Aller sur la page d’accueil d’un utilisateur/organisation (en cliquant sur son nom). Par exemple : http://www.dailymotion.com/Europe1fr
  2. Ajoutez « rss/user » à cet URL de cette manière :
    1. http://www.dailymotion.com/rss/user/Europe1fr
  3. Copiez la formule complète et ajoutez la dans votre agrégateur de flux RSS.

Fig. 13. Exemple de chaîne Dailymotion ajoutée à Inoreader

 

S’abonner à des mots-clés dans Dailymotion :

  1. Copiez l'URL suivante dans votre agrégateur : http://www.dailymotion.com/rss/search/
  2. Ajoutez-y un mot-clé à rechercher, par exemple : http://www.dailymotion.com/rss/search/veille
  3. S’il s’agit d’une expression, écrivez-la ainsi : http://www.dailymotion.com/rss/search/%22intelligence+économique%22
  4. Enregistrez-le flux dans votre agrégateur pour qu’il commence à produire des résultats.

Fig. 14. Exemple de recherche par mot-clé ajouté à l'agrégateur.

 

Vimeo

Les nombreux flux RSS que proposait cette plateforme (chaîne, tags, requête) et qui fonctionnaient il y a encore quelques semaines sont désormais inutilisables.

Surveiller une chaîne Vimeo

Nous avons essayé de très nombreuses solutions pour mettre en place une surveillance de chaîne sur Vimeo,mais aucune d’entre elles n’a donné de résultats satisfaisants. L’on pourra éventuellement passer par le logiciel de web monitoring Website Watcher (https://www.aignes.com/), mais cela implique que l’on ne centralise plus sa veille dans un seul service.

Surveiller des mots-clés sur Vimeo

Ici les possibilités sont limitées, mais existent. La solution consiste de nouveau à passer par une alerte Google du type :

site:https://vimeo.com "covid 19"

Comme on peut le voir ci-dessous, elle produit des résultats. Reste à voir s’ils ne sont pas trop limités par rapport à la globalité de ce qui est publié sur la plateforme.

Fig. 15. Exemple d'alerte par mot-clé créée sur Vimeo

 

Youtube
www.youtube.com
Dailymotion

www.dailymotion.com

Vimeo
www.vimeo.com
Flux RSS natif Oui > chaîne Youtube Oui > Chaîne Dailymotion

Oui > recherche par mots-clés

Non > chaîne Vimeo
HTML2RSS X  

X

 

Non > chaîne Vimeo
Alerte Google Oui > recherche par mots-clés X Non > chaîne Vimeo

Oui > recherche par mots-clés

Problèmes rencontrés Flux RSS cachés

Les vidéos ne sont pas inclues dans le flux RSS.

Flux RSS cachés Impossible de surveiller une chaîne

Les vidéos ne sont pas inclues dans le flux RSS.

Fig. 16. Récapitulatif des solutions à utiliser pour les services d'hébergement de vidéos

 

Les réseaux sociaux

Pour terminer, nous allons voir comment mettre sous surveillance les vidéos publiées sur Twitter, Facebook et Linkedin.

Twitter

Twitter est le service le plus facile à surveiller des trois, mais il faut pour cela passer par un service tiers qui s’appelle Bridge. Il s’agit d’un outil open source à installer sur serveur et dont on peut trouver de nombreuses instances actives en ligne. Par exemple :

Surveiller les vidéos publiées sur un compte Twitter spécifique :

  1. Rendez vous sur Bridge proposée ci-dessus. Par exemple : https://rss-bridge.cheredeprince.net/
  2. Descendez jusqu’à l’entrée « Twitter Bridge ».
  3. Choisissez « By keyword or hashtag ».
  4. Tapez la requête suivante : « filter:videos » et « from:NomduCompte ». Par exemple : « filter:videos from:abondance_com » pour obtenir toutes le vidéos diffusées par ce compte.
  5. Il est possible d’affiner encore la requête par un mot-clé et/ou un hashtag. Par exemple : « filter:videos from:abondance_com Google ».

Fig. 17. Exemple de requête Twitter dans RSS Bridge

  1. Cliquez sur ATOM ou MRSS pour générer un flux.
  2. Copiez le flux RSS (URL de la nouvelle page).
  3. Ajoutez-le à votre agrégateur.

Fig. 18. Flux RSS de la requête Bridge intégré à Inoreader

Surveiller par mots-clés les vidéos publiées sur Twitter

Il suffit pour cela de ne pas utiliser l’opérateur « from:NomduCompte » afin de ne pas cibler un compte en particulier.

On pourra par exemple lancer la requête suivante pour rechercher des vidéos sur le thème de l’intelligence artificielle :

filter:videos « intelligence artificielle »

Facebook

Facebook ne propose plus de flux RSS depuis longtemps et il faut donc contourner le problème.

Surveiller une page Facebook

Là encore c’est Bridge qui nous apporte la solution.

  1. Rendez vous sur https://rss-bridge.cheredeprince.net/
  2. Descendez jusqu’à l’entrée « Facebook Bridge».
  3. Tapez ici le nom de l’identifiant de la page à surveiller : https://www.facebook.com/outilsfroids
  4. Dans le menu « Media type » choisissez « Video ».
  5. Cliquez sur « ATOM » ou « MRSS ».

Fig. 19 Création d'un flux RSS pour une page Facebook

  1. Copiez le flux RSS (URL de la nouvelle page).
  2. Ajoutez le à votre agrégateur de flux RSS.

 

Surveiller par mots-clés des vidéos publiés sur Facebook

Les services d’HMTL2RSS sont bloqués par Facebook et Bridge ne propose pas cette possibilité. Il faut donc passer une nouvelle fois par les alertes Google. La requête à utiliser va nous permettre de cibler le répertoire de vidéos de Facebook :

site:facebook.com/*/videos/ mot-clé

Par exemple, dans le but de surveiller des vidéos traitant d’intelligence artificielle, on lancera l’alerte suivante :

site:facebook.com/*/videos/ "intelligence artificielle"

Fig. 20. Exemple d'alerte de surveillance d'une requête dans Facebook

Là encore, cette technique testée depuis plusieurs semaine se montre étonnamment efficace même s’il est bien sûr impossible d’en mesurer le degré d’exhaustivité.

Linkedin

Comme nous l’avons vu le mois dernier, Linkedin n’offre aucun moyen de rechercher spécifiquement des vidéos dans ses pages. Nous avons pourtant constaté qu’il était possible d’en trouver sur :

Et l’on notait qu’une seule requête de type :

  • site:www.linkedin.com/ "intelligence artificielle"

donnait finalement le même nombre de résultats qu’une recherche cumulée sur les trois précédentes mais ne nous permettait pas de n’obtenir que des vidéos.

Une alerte Google est bien sûr possible ici mais ne nous sera pas plus utile puisque le filtre « videos » ne fonctionne plus.

Voici donc une solution possible à ce problème :

  1. Lancer cette requête directement dans Google : site:linkedin.com/ « intelligence artificielle »
  2. Filtrer les résultats sur l’onglet Vidéos.
  3. Ajoutez éventuellement un filtre par période (attention de ne pas choisir une période trop courte afin d’être sûr d’obtenir des résultats).

Fig. 21. Exemple de requête dans Linkedin via Google

  1. Utilisez PolitePol (cf. tutoriel ci-dessus) pour transformer cette page de résultats en un flux RSS.
  2. Ajoutez le flux à votre agrégateur.

 

Twitter

 

Facebook

 

Linkedin

 

Flux RSS natif Non Non Non
HTML2RSS RSS Bridge > surveillance de vidéos sur profils

RSS Bridge > surveillance de vidéos par mots-clés

RSS Bridge > surveillance de pages

 

Non
Alerte Google X > surveillance de mots-clés Non > chaîne Vimeo

Oui > recherche par mots-clés

Problèmes rencontrés Les vidéos ne sont pas inclues dans le flux RSS Les vidéos ne sont pas inclues dans le flux RSS Les vidéos ne sont pas inclues dans le flux RSS.

Fig. 22. Récapitulatif des solutions à utiliser pour les réseaux sociaux

Conclusion

On voit donc qu’il est possible grâce aux flux RSS et à une bonne connaissances des services d’HTML2RSS, de surveiller toutes les sources prises en compte à l’exception des chaînes Vimeo (mais d’autres techniques existent). On peut donc se créer facilement une veille sur les vidéos qui bien sûr ne sera jamais exhaustive (500 heures de nouvelles vidéos sont téléchargées chaque minute uniquement sur Youtube…) mais permettra néanmoins de sonder efficacement ces sources dont on voit ici toute la richesse. Cela peut paraître complexe du fait du nombre de services pris en compte, mais ce sont finalement toujours les mêmes gestes simples que l’on répète.

Afin de compléter notre dispositif, nous verrons le mois prochain comment mettre en place une analyse collaborative afin de tirer parti de cette veille et comment retranscrire les éléments audio présents dans ces vidéos en texte (speech to text).

 

Christophe Deschamps, Consultant-formateur : veille stratégique, intelligence économique, social KM, e-réputation, mindmapping, IST (http://www.outilsfroids.net/)