Twitter représente une manne d'information énorme, notamment pour mettre en place des processus de veille. Mais, pour cela, il est nécessaire de se servir d'outils permettant de traiter les données disponibles dans ce réseau social. En voici deux, assez peu connus, mais qui peuvent vous rendre bien des services en étant complémentaires des mastodontes du domaine...

Cet article fait partie de la Lettre Réacteur #157 du mois de mars 2014

Début de l'article :

TwitterCe mois-ci nous vous proposons de découvrir deux moteurs permettant d'exploiter Twitter de deux manières : en recherchant dans les contenus qui y sont partagés en mode « text mining » ou en identifiant des utilisateurs intéressants à suivre.

TwXplorer

TwXplorer (http://twxplorer.knightlab.com/) a été lancé au printemps 2013 par Knightlab, un laboratoire de recherche de l'Université américaine de Northwestern composée d'ingénieurs et de journalistes dont l'objectif est de proposer des outils susceptibles de donner du sens à l'information ainsi que d'assurer un meilleur « storytelling ». On leur doit par exemple Timeline JS (http://timeline.knightlab.com/), un service gratuit permettant de raconter de manière visuelle le déroulement d'un évènement (il est possible de découvrir leurs (nombreux) autres projets à cette adresse : http://projects.knightlab.com/).

TwXplorer a pour objectif de permettre à chacun de rechercher par mots-clés et d'exploiter les listes thématiques que l'on s'est constitué. Il est nécessaire afin d'accéder au service de disposer soi-même d'un compte Twitter.

La recherche par mots-clés se fait en haut à gauche de la page et il est nécessaire d'indiquer la langue utilisée.

Le service utilise en effet des listes de « stop words » (le, la , les,…) pour n'extraire que les mots-clés importants des résultats qu'il remonte. Ceux-ci sont présentés de quatre manières différentes :
- Tweets récents : il s'agit du corpus qui sera utilisé pour extraire les données ci-dessous et qui ne dépasse pas 500 tweets (limitations liées à l'API Twitter).
- Terms : mots-clés statistiquement les plus fréquents dans les tweets remontés.
- Hashtags : hashtags statistiquement les plus fréquents dans les tweets remontés.
- Links : adresses web vers lesquelles pointent le plus les tweets remontés.

...


Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).