Directeur du Laboratoire d'Ingénierie de la Connaissance Multimedia Multilingue (CEA) et à l'origine notamment du moteur de recherche Spirit, Christian Fluhr travaille depuis plus vingt ans sur la recherche d'information intelligente. En 2004 il a créé la société New Phenix qui commercialise aujourd'hui une solution de recherche d'images utilisant à la fois les avancées technologiques de la recherche sémantique et de la reconnaissance automatique de formes... Il nous parle de sa vision de la recherche d'images sur le Web.
Directeur du LIC2M, Laboratoire d'Ingénierie de la Connaissance Multimedia Multilingue du CEA et à l'origine notamment du moteur de recherche Spirit, Christian Fluhr travaille depuis plus vingt ans sur la recherche d'information intelligente. En 2004 il a créé New Phenix (http://www.new-phenix.com/), entreprise privée issue d'un essaimage du LIC2M. En étroite collaboration avec le laboratoire, New Phenix commercialise aujourd'hui une solution de recherche d'images qui utilise à la fois les avancées technologiques de la recherche sémantique et de la reconnaissance automatique de formes. D'autres applications à la pointe du web 2.0 sont à venir. Une belle promesse d'avenir pour une technologie française qui a le vent en poupe...
Il a accepté de répondre à nos questions et nous l'en remercions.
Pouvez-vous vous présenter en quelques mots ?
Je suis Directeur de recherches au CEA et travaille depuis 1971 sur la recherche d'information et en particulier sur l'utilisation de technologies linguistiques pour la recherche d'information. J'ai notamment fait partie des chercheurs à l'origine du système Spirit.
Au début de l'année 2002 j'ai créé au CEA un laboratoire qui mixte le traitement linguistique et le traitement de l'image. Il s'agit du LIC2M, Laboratoire d'Ingénierie de la Connaissance Multimedia Multilingue. Ce laboratoire a pour but de traiter de l'information multimedia et multilingue, en combinant des technologies de détection automatique, qu'elles aient comme support le media texte, le media son ou le media image. Nous faisons travailler de manière étroite les spécialistes de ces différents domaines qui auparavant s'ignoraient, ce qui permet une bonne fertilisation croisée de leurs compétences. Il est également vrai que l'expérience des ingénieurs qui travaillent sur le texte est beaucoup plus longue que celle des ingénieurs qui travaillent sur l'indexation automatique d'images, qui est une discipline plus récente et qui a moins de dix ans. La fertilisation croisée a cela de positif qu'elle permet de capitaliser sur les expériences des différents spécialistes.
Vous avez participé à un essaimage ?
J'ai été en quelque sorte un pionnier de l'essaimage puisque le moteur de recherches Spirit, dont le cœur de technologie était issu de mon laboratoire, a été créé par la société Systex en 1979. Il est toujours commercialisé aujourd'hui par la société Technologies SA. C'est l'un des produits de recherche d'information ayant eu la plus longue vie.
Début 2004 les recherches menées au LIC2M ont permis de redévelopper complètement une nouvelle technologie basée sur les mêmes concepts, pour les parties son et image. Pour la partie parole nous travaillons en partenariat avec le LIMSI. Nous avons alors créé une Start-up nommée New Phoenix. Cette start-up a pour but d'industrialiser et de commercialiser à l'international les technologies issues du laboratoire. New Phoenix a un accord de licence exclusive mondiale pour la diffusion des technologies issues du LIC2M. Le CEA par sa filiale de capital-risque possède une participation dans la société et inversement la société finance des activités de recherche dans le laboratoire.
Cette société travaille-t-elle exclusivement sur la recherche d'images ou sur l'ensemble des technologies développées au sein du laboratoire ?
Elle travaille sur l'ensemble des technologies, sachant que les technologies de recherche d'images sont plus faciles à mettre au point que les technologies linguistiques et étaient donc prêtes avant. Les premières ventes se sont donc faites sur la recherche d'images. Mais très vite le marché de la recherche d'images a fait émerger un besoin dans le domaine de la recherche linguistique. Les clients en effet avaient deux besoins : en premier lieu il leur fallait, pour des questions de droits, un moteur qui permette de trouver une image semblable à une image donnée. Par ailleurs comme la plupart de nos clients font de la vente d'images sur Internet et qu'il s'agit d'un marché mondial, ils avaient aussi besoin de comprendre la langue dans laquelle les images avaient été décrites.
Donc il faut du multilingue ?
Jusqu'à ce qu'ils s'équipent avec notre technologie, c'était très coûteux pour les sociétés qui étaient obligées de traduire en anglais toutes les descriptions. Avec les technologies interlingues, les descriptions demeurent dans la langue d'origine et chacun interroge le moteur dans sa propre langue.
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).