Pour indexer les contenus internes à un site Web, vous avez le choix entre une solution de recherche en mode ASP, une application sur serveur ou un boîtier de recherche intégré. Différentes solutions d'analyse des résultats sont également proposées. Quelle solution choisir ? Nombreux sont les webmasters qui se sont posés ou se posent actuellement cette question. Chaque type de solution a bien entendu des avantages et des inconvénients. Petit tour d'horizon des offres des principaux acteurs. Ce panorama vient compléter celui, plus général, qui était consacré le mois dernier au marché de la recherche intra-site.
Les fournisseurs de solutions de recherche sont si nombreux qu'il est parfois extrêmement difficile de s'y retrouver (voir la première partie de cet article dans la Lettre R&R de mars 2006). Faut-il opter pour une solution en mode hébergé (ou ASP), pour une application à installer sur serveur ou plutôt adopter un boîtier "tout-en-un" de type "Google Appliance" ? Quel que soit le type de solution retenue, une attention particulière doit être portée aux fonctionnalités de recherche, et notamment aux modes de recherche syntaxiques, sémantiques ou statistiques.
"Le choix est toujours délicat, explique Laurent Baleydier, co-fondateur de la société Kartoo (http://www.kartoo.com/). Tout dépend de la volumétrie du site et de la façon dont l'information est organisée. Il faut également réfléchir à la manière la plus adaptée pour organiser et qualifier l'information". Les moyens financiers et humains à votre disposition sont un autre paramètre à prendre en compte, bien entendu.
Solutions serveurs ou solutions en ASP ?
Caractéristiques des principaux moteurs
Nous avons volontaire écarté ici les solutions open source et celles qui sont intégrées à des gestionnaires de contenus en open source comme SPIP (http://www.spip.net/). Pour toute information sur les solutions libres de recherche, voir la Lettre R&R de juillet 2005. Voici un tableau regroupant les principaux éditeurs de solutions :
Mode | Editeur | Nationalité | Exs de clients / utilisateurs |
ASP | Atomz | US | Lego, palmOne… |
Synomia | FR | Libération, Renault… | |
Verticrawl | FR | 123-emploi, FraGGo.com… | |
Licence | Exalead | FR | Groupe Afnor, Danone… |
Go Albert | FR | Unesco, BNP Paribas... | |
Sinequa | FR | Le Monde, Cdiscount… | |
Spirit | FR | MMA, Cour des Comptes… | |
Verity | UK/US | Les Echos… | |
Mixte (licence ou ASP) | Antidot | FR | Journal du Net, TF1… |
Fast | Norvège | Priceminister, Strategies.fr | |
Appliance | US | Banque mondiale, Nokia… | |
Open source | Lucene | US | Bibliothèque de Rouen, Keljob.com… |
Ht://Dig | US | Oxford University, Yale University Library... | |
ASPseek | US | Jabber, Mississippi State University... |
Applications hébergées chez le client
Les solutions sous licence sont de loin les plus répandues. Hébergées sur un serveur chez le client, elles sont plus chères que les solutions en mode ASP. Elles sont le plus souvent mises en avant par les fournisseurs pour la possibilité de personnalisation et de contrôle offerte au client et pour leur interopérabilité avec les différents silos de données présents dans l'entreprise.
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).