COMPARATIF : 12 moteurs de recherche d'entreprise au crible

  • 13-03-2009
  • Par Jean-Claude Streicher

Pas de business intelligence et de réactivité sans un bon moteur de recherche. Il faut désormais pouvoir tirer parti de toutes les sources de données de l'entreprise : PGI, CRM, Ged, intranets, système de collaboration... Denis Lafont, responsable du pôle de compétences Enterprise Search de Capgemini, a testé et comparé 11 concurrents de Google Search Appliance.

  • Moteurs de recherche d'entreprise

Pas de business intelligence et de réactivité sans un bon moteur de recherche. Il faut désormais pouvoir tirer parti de toutes les sources de données de l'entreprise : PGI, CRM, Ged, intranets, système de collaboration... Denis Lafont, responsable du pôle de compétences Enterprise Search de Capgemini, a testé et comparé 11 concurrents de Google Search Appliance.

Sommaire
1 - Le marché des moteurs
2 - Exalead et Vivisimo, la nouvelle génération
3 - Google, le moteur dans une appliance rackable
4 - Fast et Autonomy au-dessus de la mêlée
5 - IBM, Oracle, SAP entrent dans la course
6 - Sinequa, l’autre français
7 - Lucene, Nutch et Solr, la suite open source
8 - Conclusion : tester avant de choisir
9 - Tableau comparatif

11 moteurs de recherche d'entreprise passés au crible

Comparatif de 11 moteurs de recherche d'entreprise
Points forts Points de vigilance Note
0-5
Autonomy
IDOL K2
- Couverture fonctionnelle très large

- Grande expérience et expertise de l’entreprise, leader du marché

- Bonne intégration avec les autres solutions d’Autonomy (archivage en particulier)

- Gestion de la sécurité très fine

- Indexation du rich media (video, audio)

- Nombreux connecteurs
- Solution très riche, nécessitant de fortes compétences pour le paramétrage tout au long du cycle de vie.

- Les algorithmes d’IDOL nécessitent un apprentissage et sont plus à l’aise sur les gros volumes
4,5
Exalead - Peu gourmand en infrastructure

- Fonctionnalités avancées

- Ergonomie « out of the box » très appréciée des utilisateurs

- Qualité du support
- Gestion du multi-langue à améliorer

- Traitement sémantique encore faible
4,5
Endeca - Très adapté au mode d’exploration multi-paramètre

- Grande souplesse pour adapter le classement des résultats en fonction de règles métiers
- Nécessite un temps d’indexation élevé pour tirer parti de la solution

- Peu de retour d’expérience sur des gros volumes avec une gestion de la sécurité fine

- Gestion du multi-langue à améliorer
4
Fast
Search &
Transfert
ESP
- Grande richesse fonctionnelle

- Très adapté pour les sites Internet (e-commerce en particulier)

- Très réactif sur les gros volumes

- Grande paramétrisation possible lors de l’indexation et lors du requêtage
- Assez gourmand en ressources

- Architecture intégrant des composants très différents (CORBA, python,..) pouvant amener une difficulté de prise en main lors de la mise en opération

- La bonne intégration avec l’offre de Microsoft reste à démontrer
4,5
Google
Search
Appliance
- Mise en œuvre en quelques jours

- Nombreuses solutions partenaires (connecteurs, extensions, etc.)
- Vérifier l’adéquation du modèle économique avec les types de contenus indexés, en particulier pour l’indexation de bases de données

- Ne propose pas tous les types de gestion de la sécurité
- Difficulté à garantir performance sur gros volumes et gestion de la sécurité avancée
4
IBM
Omnifind
- Nombreux connecteurs

- Très bonne gestion du multi-langue
- Architecture complexe

- Produit très intégré au reste de l’offre IBM (WebSphere en particulier)
3,5
Lucid
Imagination
Lucidworks
- Dynamisme de la communauté Lucene

- Très adapté à l’indexation de sites Internet très volumineux
- Pas de gestion de la sécurité

- Pas de présence en Europe
3
Oracle
Secure
Enterprise
Search
- Mise en œuvre rapide

- Fonctionnalités intéressantes pour cette gamme de produits
- Solution encore peu déployée, retours d’expérience faibles comparés aux solutions concurrentes, en particulier sur les gros volumes. 3,5
Sinequa
CS
- Approche sémantique très intéressante lorsque le corpus est assez homogène

- Equipe dirigeante très expérimentée, comprenant bien les problématiques de la recherche d’entreprise
- Peu de retour d’expérience sur la mise en opération sur des gros volumes 4,5
SAP
Enterprise
Search
- Dans un contexte SAP, grande richesse fonctionnelle apportée par la connaissance fine du modèle de données SAP - Encore peu ouvert aux modèles de sécurité hors SAP

- Fonctionnalités encore pauvres comparées à la concurrence
3,5
Vivisimo
Velocity
- Fonctionnalités très appréciée des utilisateurs, comme la catégorisation à la volée, le tagging social)

- Mise en œuvre et maintenance très simples

- Fonctionnalités avancées de gestion de la scalabilité

- Intégration très simple des thésaurus et ontologies

- Qualité du support
- Nombre de connecteurs disponibles à ce jour

- Structure européenne encore peu développée
4,5

  • Moteurs de recherche d'entreprise

Commentaires des lecteurs


Posté par : EL KAIM William, March 19, 2009

Pas vraiment d'accord avec les resultats

Bonjour

Nous avons mené une étude il y a environ un an et nous n'avons pas vraiment obtenu les meme résultats.

- Autonomy et IBM sont des usines à gaz très longue à mettre en oeuvre.
- Google offre des appliance qui ne sont pas toutes extensibles, donc après deux ans, il faut les jeter ...
- Exalead est un excellent moteur avec un rapport qualité prix excellent. Par contre ils ont un service consulting "leger", une API XML pas très évoluée et peu d'add-in externe.
- Sinequa est un excellent produit, mais vien en complément d'un moteur de recherche. l'objectif etant d'avoir moins de résultat mais très pertinents.
- l'outil qui m'a le plus impressioné sur le papier (à la lecture des reponses au RFP) étaient Endecca. Je n'ai pas pu le tester!

Posté par : Fabrice, March 20, 2009

Microsoft SharePoint

Heu ce comparatif a juste oublie la solution de recherche la plus utilisee en entreprise : Microsoft SharePoint ...

Posté par : Jean Ferré, March 20, 2009

Correctif SINEQUA

Bonjour, je suis le PDG de Sinequa ; l'article comporte quelques informations inexactes, certainement du fait de notre changement récent d'agence de Relation Presse. J'espère que certaines de ces informations pourront être reprises dans le texte.

L'actionnaire majoritaire de Sinequa est ses dirigeants accompagnés par X-Ange la structure d'investissement de La Poste. La Revue Fiduciaire n'est qu'un client parmi d'autres depuis 2005.

Le principal secteur d'activité de Sinequa en revenus et en terme de focus produit est le moteur de recherche pour entreprise, autour de notre vision d'Enterprise Search Bus. L'OEM, la presse et le e-commerce sont minoritaires.
Notre plus gros client est la DGA.

Sinequa Search Bus est un moteur particulièrement adapté aux gros volumes, aux environnements hétérogènes et sécurisés, aux besoins fonctionnels de type Entreprise 2.0 (détection d'expertise). En termes de volumétrie, nous couvrons dores et déjà entre 10 et 50 Millions de documents chez plusieurs clients comme par exemple EADS Innovation Works. Un projet est actuellement en cours de déploiement sur près de 250 millions de documents. Notre solution gère aisément un milliards de documents d'entreprise, ou plusieurs milliards d'éléments de bases de données ou de pages html. En performances, les Pages Jaunes européennes servent actuellement avec Sinequa de l'ordre de 400 requêtes par seconde


Bouygues Construction, Arkema, la DGA (qui ne sont pas des clients d'Exalead mais des clients de Sinequa) ou encore Saint Gobain ont choisi Sinequa comme moteur de recherche unifié après revue de plus de dix produits, et des tests approfondis comparatifs incluant tous les produits mentionnés dans cet article, et en particulier à chaque fois Exalead.

Sinequa propose plus de 50 connecteurs applicatifs et a par exemple déployé le Connecteur SAP chez SFR.

On peut tester la technologie Sinequa sur www.lesechos.fr, www.figaro.fr, www.lemonde.fr, www.culture.gouv.fr, www.wikio.com, www.pixmania.com, www.europages.com qui, ici encore ont choisi la technologie Sinequa après test etc...

Enfin, les call centers de Verizon ne sont pas des clients d'Exalead mais de Sinequa, tout comme ceux de Beeline en Russie ou ceux d'Europe Assistance, ou comme encore Salesforce.com. En revanche, Les 3 Suisses, La Redoute, AlloCiné ne sont pas des clients de Sinequa.

Plus d'information sur Sinequa et les performances du moteur sur mon blog: http://jean-ferre.blogspot.com

J'espère que chacun comprendra que ce rectificatif n'est pas polémique mais que l'écart informationnel m'obligeait à prendre la parole. Je ne souhaite pas ici dénigrer mes concurrents mes concurrents mais simplement ;

Jean Ferré

PS: M. El Kaim, architecte de Carlson Wagon Lit, et client d'Exalead, n'a pas à ma connaissance testé notre solution Sinequa CS et doit nous confondre avec Lingway:).

Posté par : Marc Louis, September 16, 2009

Quelques points

@ Fabrice: l'article parle de moteur de recherche d'entreprise, donc Sharepoint Server est très loin derrière les solutions citées. Mais gageons qu'avec le rachat de FAST Microsoft détienne la clé d'accès à ce marché

@ William: Endeca? Hum il faut tester sur un cas proche de ce que tu as. La techno est super prometeuse, géniale pour du site ecommerce ou Internet travel. Dans un contexte Entreprise, attention à la perf au regard du volume.