Yves Simon, responsable de l'activité "moteurs de recherche" pour la société Hemisphere Intelligence Informatique est également responsable du déploiement commercial de Fast en France. Une bonne occasion pour faire un point avec lui sur l'avenir du "search" tel qu'il l'envisage selon trois mots clés principaux : usages, pertinence, intelligence. Voici ses réponses à nos questions.
Responsable du déploiement commercial de Fast en France et expert en recherche d'information depuis de nombreuses années, Yves Simon nous confie son sentiment : l'avenir du Search passera par une prise en compte croissante de la dimension d'usage fondée sur une pertinence augmentée, qui transformera nos outils de recherche en véritables moteurs d'accès à l'information intelligents au service de l'utilisateur.... Laissons-lui la parole...
Pouvez-vous vous présenter en quelques mots ?
Bonjour, je suis aujourd'hui responsable de l'activité Moteurs de recherche pour la société Hemisphere Intelligence Informatique depuis plus d'un an et donc du partenariat avec l'éditeur Fast Search&Transfer. J'interviens ponctuellement sur des missions de spécifications fonctionnelles autour des technologies Moteurs de recherche.
Je suis issu d'un parcours dans le monde des services à l'international et d'un programme de MBA (IMHI 96') cofondé par l'ESSEC et Cornell University USA. J'ai cofondé en 2000 la société Amoweba, porteuse du projet de moteur de recherche distribué et parallèle Human-Links qui a ensuite absorbé Novadis-Services et Voyez-Vous (Mapstan) avant de m'impliquer dans Social Computing en 2004. Mon profil est accessible sur Viaduc.
Dans votre white paper publié sur le site de social-computing, vous évoquez la position centrale acquise par les moteurs de recherche. Pouvez-vous nous en dire plus ?
Oui, une position centrale acquise grâce à la très forte volumétrie de contenus rendant l'exploration systématique impossible et ouvrant donc le chemin à un usage dominant des outils de restitution faisant appel à des traitements automatiques et de plus en plus sophistiqués pour interpréter les requêtes des utilisateurs (que j'appelle alors consultants).
Il existe en réalité deux types de moteurs de recherche : les moteurs de recherche internet qui proposent des index issus d'un travail de crawl. Ces moteurs amènent les utilisateurs sur des sites où ils vont naviguer et être de nouveau amenés à rechercher de l'information en fonction de leurs besoins et de la typologie des services proposés. L'autre type de moteur de recherche est donc celui que l'on trouve sur un site web, un portail d'entreprise ou un intranet. Les premiers indexent le web, les seconds une base de contenus finis.
Sur le Web le calcul de pertinence est majoritairement généré à l'aide d'un ranking défini en fonction de l'autorité des résultats qui est concrétisée par des hyperliens pondérés en fonction du contenu. L'accent est mis sur la capacité de traiter une multitude de requêtes en temps quasi réel (inférieur à la seconde). L'approche de traitement du contenu est généralement moins développée car le volume des informations à traiter est très important et donc coûteux en ressources machine...
Que font de plus les moteurs d'entreprise ?
Les moteurs d'entreprise fédèrent généralement des sources de contenus hétérogènes résidant dans l'intranet, sur des bases de données externes et sur le web. Ils doivent pouvoir identifier les formats d'origine du document et normaliser ces informations pour les restituer à différents publics. Les traitements envisageables dans ce contexte permettent une normalisation des contenus plus fine, définissant ainsi un environnement d'indicateurs de pertinence plus précis que celui (souvent unique) dont disposent les moteurs qui indexent le web. Cette normalisation génère un contexte de pertinence qui permet d'affiner considérablement la restitution en fonction de différents publics.
Certains moteurs web utilisent des traitements linguistiques tout comme c'est le cas pour certains moteurs d'intranets. Quelle est alors la différence de traitement ?
Il est vrai que sur internet comme sur un intranet on peut également procéder à une expansion de la requête utilisateur sur la base de traitements linguistiques ce qui permet alors d'augmenter le rappel et d'apporter une réponse à toute requête formulée par un utilisateur.
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).