Je suis entrain de tester la prochaine version du moteur de recherche MSN. Cette version s'appelera "Windows Live Search" et elle à été developpé pour (enfin) concurrencer Google. Pour les chanceux qui, comme moi, ont il y a très longtemps demandé à faire parti des béta-testeurs des produits web de windows live, il est possible de tester cette version. Et donc, je me suis employé à mettre à l'épreuve la pertincence des résultats de Windows Live Search.
Tout d'abord, le lancement de la recherche est un choc visuel. Elle apparait déja dans une page très esthétique, avec une certaine sobriété qui font dire que MSN à compris la claque "google". Ensuite, les connaisseurs auront reconnu la présence de AJAX, nouveau moteurs du web 2.0. Les résultats apparaissent dans une "page défilante", avec plus d'interaction possible. Bref, une grande sobriété mélangé à une beaucoup de sofistication. Le résultat est plutot bien fait, même si on peut regrétter qu'il y ai un chouia trop de "clic moi par ici".
Ensuite, vient le plus interessant: les résultats en eux même. Et, la moindre des choses qu'on puisse dire, c'est que Google n'atteindra sans doute jamais le degrée de pertinence de Windows Live Search. Et, croyez-moi, c'est peu dire.
Pour tester, j'ai commencé par un classique que je fais tout le temps: une recherche sur Stargate. Vous devez sans doute tous avoir entendu parlé de cette série de science fiction avec des gars qui se ballade de monde en monde pour tuer les méchants qui veulent détruire la Terre? (non, pas Sliders, rhoo !). Vi, cette même série qui passe samedi soir. Oui, vous y êtes ! même avant y'avait Mac Gyver. Bah oui, tout le monde connait cette série, c'est évident !! Et ben, faut croire que MSN vient de la découvrir. Il y a a peine quelques mois, lorsque l'on tapait "stargate", il nous renvoyait sur beaucoup de site (le site
www.stargate.ca/ apparaissant en première position) mais presque aucun sur la série que l'on connait (du moins, pas sur la première page). Avec windows Live Searche, le problème... est parti ! on tombe enfin sur des sites qui ont un rapport avec la série dès les premiers résultats. Des sites qui utilise une conotation plus CONNUE du terme "Stargate". Cependant, un rapide tour sur " l'ancienne" version MSN search nous montre qu'en fait, MGM (qui produise la série) à simplement du gueuler sur Microsoft pour qu'il mette de l'ordre à tout ca.
Bon, donc, preuve est faite que money money est toujours derrière MSN Search et restera sans doute présent chez son succésseur. Comme ont dit le proverbe, on ne change pas une équipe qui... heu, non, on ne dit pas le proverbe.
Donc, passons au choses sérieuses. La pertinence à proprement dit. Il est difficile de pouvoir juger de la pertinence d'un moteur de recherche. Après tout, quels termes choisirs? Quels sont ceux qui seront succeptibles de pouvoir mettre à l'épreuve un moteur de recherche? Et puis, ces termes seront choisi exprès pour le mettre à l'épreuve et donc ne seront pas forcément significatif. Bref.
Je suis parti d'un principe simple. Un internaute moyen cherchera des informations sur un sujet. Il essayera de cerner le sujet, d'en savoir plus. Il utilisera pour sa recherche des termes qui sont en rapport. Il me fallait me mettre dans la peau d'un tel internaute (je fais très rarement des recherches thématiques). Pour ce faire, j'ai prit un sujet que j'affectionne particulièrement: la biologie de la cellule, et plus précisément tout ce qui touche autour de l'ADN.
Première recherche: cellule.
1/ Cellule MathDoc
Fournit un accès aux ressources documentaires en mathématiques en France (catalogues de bibliothèques...
2/ La cellule : index
La cellule est l'unité de base du vivant. Tout organisme, du plus simple au plus perfectionné est ... et il les acquierts tous quand il infecte une cellule; ...
3/ Portail Documentaire Mathématique - Mathdoc
Bienvenue sur le portail documentaire de la Cellule MathDoc ! English version. Pour faciliter la navigation, le site "Portail" contient des menus écrits en ...
4/ Dossier SagaScience - Cellule
Dossiers scientifiques. Contact CNRS • © CNRS.
5/ Détection et Redirection
Qu'est-ce qu'une cellule? > version pop-up < > version plein écran <
6/ ...
Résultats Windows Live Search:
1/ Dossier SagaScience - Cellule
Dossiers scientifiques...
2/ Provence Technologies - Organic Solutions
Provence Technologies est une cellule d'itudes chimiques fonctionnant comme un viritable centre externalisi de R&D et de Contrtle. Son iquipe intervient dans tous les domaines de la chimie : synthèse ...
3/ La Cellule Economique de Bretagne
Présente des statistiques et des informations conjoncturelles et prévisionnelles sur le secteur de la construction en Bretagne. Accessibles à partir de trois rubriques : publications, tableau de ...
4/ La Cellule Informatique de l'IMB
L’IMB tient à la disposition des organisateurs de colloques différents matériels gérés par la Cellule Informatique :
5/ Cellule psychologique
Dans le cadre de la prise en charge des victimes d'accidents de la route, S.V.R.33 a mis en place une cellule d'écoute et de soutien psychologique dont la permanence ...
6/ Conseils aux voyageurs
Créée en septembre 1997 à la demande du Ministre des affaires étrangères, la cellule de veille, composée de 8 agents, assure une veille permanente sur les situations pouvant affecter la ...
7/ Laboratoire de Biologie Moléculaire et Cellulaire
Laboratoire de Biologie Mol culaire et Cellulaire, ENS Lyon
8/ Expositions temporaires - Projections de films
Voyage dans la Cellule. Un film en images de synthèse et en relief : Réalisation : Laurent LARSONNEUR . Auteurs
9/ SimImmuno: SimImmuno.Cellule Class Reference
The documentation for this class was generated from the following file: C:/Documents and Settings/Sebeuh/Mes documents/Visual Studio Projects/SimImmuno/base/ Cellule.cs
10/ CELLULE ECONOMIQUE DES BTP DU CENTRE CELLULE ECONOMIQUE DES BTP DU CENTRE
Observatoire regional du BTP - region centre - cellules economiques regionales de la ...
Et là, c'est le drame. Certe, la recherche google n'est pas pertinente. Mais, on trouve beaucoup plus souvent des références à la cellule biologique que sur MSN (même s'il faut avouer que le premier résultat retourné par google n'était pas franchement celui attendu). Et, le pire n'est pas encore venu. J'ai cherché ensuite les termes ADN, ARN, protéines, etc... Pour l'ADN, on tombe sur tout et n'importe quoi. Des sites d'impressions, des sociétés informatiques, ect... Tiens, un site sur les test ADN. On regarde...: "Vous êtes un laboratoire spécialisé en test adn ? Cet espace vous est réservé. Avec
www.test-adn.com, vous bénéficierez d'un outil de prospection commerciale sur le Web, pour proposer vos tests adn." Et là, on se rend compte que, dans l'image de fond du site, il y a marqué "Espace à loué". Et là, on déprime. C'était le troisième résultat retourné. Le meilleur résultat qu'on pourra trouvé avant longtemps arrive juste après, avec une page du palais de la découverte. Après, il faut s'attendre à des solutions d'entreprise, des sociétés de conseil, de vente d'analyseur à ADN. Et pour peux que vous vouliez vraiment savoir ce qu'est l'ADN, il vous faudra attendre ce liens d'une page perso de lycos qui n'arrivera qu'en 20ème position. Et, puis les pages défilent, encore et toujours. Solution d'entreprise, site d'université, et... Louis XVII (?!), des entreprise de design, etc... Wikipedia n'arrivera qu'en 200ème position... Heureusement qu'il s'agit de la version français. Tiens, la version... espagnole arrive quelques liens plus tard. Il est bien connu que wikipédia espagnol est bien plus developpé que la version américaine (s'il faut prendre dans les langues étrangères).
Et, le "moteur de recherche" ne s'améliore pas lorsque je tape ARN (là, on est encore plus mort de rire tellement les sujets sont sans rapport). Protéine n'est pas mieux. Enfin, sauf si vous cherchez des solutions minceurs (payantes): elles vous sont toute listées içi. Et, c'est en faisant une recherche sur google que je m'apercoit que... wikipédia arrive en premier dans chacuns des résultats et que je n'ai toujours pas vu Encarta apparaitre dans les résultats de windows live search alors qu'il appartient à microsoft.
Pour les biologistes, amusez vous avec PCR, polymérase, phage (ola, celui là, faite le, il vaut franchement le coup). Allez sur le site MSN.fr. C'est les mêmes résultats mais dans un ordre différent.
Bref. Comme je l'ai dit plutot, google n'atteindra jamais le degrée de pertinence de MSN. Même altavista, pourtant moins réputé, arrive à redonner des résultats corrects (en tout cas, on est pas obligé d'attendre le 200ème résultat pour avoir la définition de wikipédia...).
Dans un sens, MSN et maintenant Windows Live Search sont des modèles. Des modèles d'impertinence.