Newssift, un nouvel outil de détection et de traitement des entitées nommées

Résumé de l’article :

Dans la lignée de notre article du mois précédent sur iSeek, voici un nouvel outil permettant de traiter les entités nommées (noms de personnes, d’organismes, de lieux, etc.) dans les contenus du Web. Lancé par le Financial Times il y a peu, NewsSift permet d’explorer de nombreuses sources d’information et, par exemple, de mettre en place une veille sur l’e-réputation d’une entreprise. Exploration…

Début de l’article :

Nous évoquions le mois dernier l’outil iSeek (http://www.iseek.com/), un moteur de recherche généraliste qui innovait en détectant les entités nommées et en permettant de les croiser entre elles afin d’en faire émerger des résultats pertinents. Il n’aura pas fallu longtemps pour qu’un second moteur du même type, tout aussi intéressant en terme de fonctionnalités et d’ergonomie, apparaisse. A croire que l’idée était dans l’air…

Ce nouvel arrivant s’appelle Newssift (http://www.newssift.com/). Il a été lancé le mois dernier par le Financial Times et permet, comme son nom l’indique, de rechercher dans l’actualité. Il ne se contente toutefois pas des seules informations proposées par le FT (déjà conséquentes), mais indexe, d’après ses concepteurs, plusieurs millions d’articles en provenance de sources d’actualités « business » internationales.

A l’instar d’iSeek, Newssift traite cette actualité grâce à un filtre sémantique qui lui permet de détecter des entités nommées telles que :
– les organisations ;
– les lieux ;
– les personnes ;
– les thèmes ;
– le vocabulaire « business » (ex : « executive structure », « board of directors », « workforce employement »,…)

Toutefois le traitement automatique n’est pas tout, puisque ce moteur est également paramétré par des consultants experts et des membres de l’équipe éditoriale qui aident, semble t-il, à détecter, évaluer et valider les sources à prendre en compte.

Concrètement, vous lancez une recherche dans Newssift comme dans n’importe quel autre moteur. C’est ensuite que la différence se fait…

Envie de lire la suite ?

Les articles Reacteur en intégralité à partir de 14,90 €/mois.

Apprenez auprès des meilleurs experts, grâce à leurs partages de connaissances et leurs retours d’expérience.

Canalplus
Saint-Gobain
Radio France
Orange
Inserm
CCI Paris
Cultura
Harmonie Mutuelle
Quechua
Ajouter un commentaire Ajouter un commentaire

Article précédent

Référencement : faut-il coder les lettres accentuées dans les urls ?

Article suivant

Liens sponsorisés, référencement naturel et élections : quelles implications ?