-> Nouveaux index et annuaire pour Altavista
Altavista a fait de nouvelles annonces concernant son moteur de recherche :
- Il récupère ("crawle") sur le Web aujourd'hui près de 1,2 milliards de pages Web pour n'en garder que 350 millions, ce qui en fait le plus gros index actuel devant celui d'All The Web. Il propose également 30 millions de fichiers multimédia (sons, images, vidéos).
- Un nouvel algorithme de classement des pages est également mis en place (un article spécial sur ce sujet est disponible dans la zone"abonnés" du site Abondance à l'adresse http://abonnes.abondance.com/articles/criteres-av.html).
- Un nouvel annuaire, dérivé de Looksmart et de l'Open Directory, proposant plus de 2 millions de sites Web.
- Altavista a également indiqué que son moteur répondait à 40 millions de requêtes par jour.
Source :
Altavista
Altavista recherche les produits
Altavista (version américaine) a rajouté, en collaboration avec son site Shopping.com (8 millions de produits chez 700 vendeurs), une possibilité de recherche sur les produits, au travers du bouton radio "Products" sur sa page d'accueil. Cette possibilité est doublée du programme "AltaVista Rewards" (les "récompenses d'Altavista") qui vous fait gagner des points pour chaque achat ou recherche effectués sur le site. Un grand concours permettant de gagner notamment une Mercedes SLK 230 est également mis en place pour fêter ces nouvelles possibilités.
Source :
Altavista
Lycos abandonne son index et passe chez Inktomi
Il était de notoriété publique que Lycos USA (comme Excite, d'ailleurs) n'avait quasiment plus indexé un nouveau site dans son index depuis octobre 1999. L'explication est peut- être connue aujourd'hui : Lycos vient d'abandonner son "vieil" index pour passer chez Inktomi. Les résultats de type "Web sites" sur le moteur américain seront donc proposés maintenant par Inktomi et non plus au travers de l'index propre à Lycos qui semble cependant encore utilisé par Lycos France (à la fois dans ses recherches "web français" et "web mondial"). Plus pour longtemps, certainement. Les résultats de Lycos USA semblent en tout cas encore instables au niveau des index employés. Il semble bien que cela soit celui d'Inktomi pour certaines requêtes, mais pas pour d'autres... Après plusieurs tests, il semblerait que les résultats d'Alltheweb (qui fournissait déjà les résultats de la recherche avancée de Lycos) et d'Inktomi soient mélangés. Nous continuons nos investigations. Rendez-vous le mois prochain pour une analyse de ces phénomènes étranges dignes de X- Files.
Filtre familial pour Google
L'annonce était attendue, c'est maintenant chose faite : Google va proposer un filtre familial en collaboration avec SurfWatch, l'un des leaders du domaine. La technologie de SurfWatch permettra d'éliminer des résultats de Google les pages traitant de pornographie, haine, racisme, violence, alcool et drogues si l'internaute le désire.
http://www.google.com/safesearch_help.html
D'autre part, il est possible, par la fonction cache:, d'obtenir la version d'une page dans la version "sauvegardée" par Google, au moment où il a indexé le document, et non pas dans sa version actuelle. La date de dernière indexation est également fournie. Essayez cache:www.abondance.com, par exemple :
http://www.google.com/search? q=cache%3Awww.abondance.com&meta=lr%3D%26hl%3Den
Enfin, Google a signé un accord avec Yahoo! Maps pour proposer des cartes lorsque le nom d'une rue d'une ville américaine est demandé. essayez la requête "100 independence avenue washington dc" par exemple : http://www.google.com/search?q=100+independence+avenue+washington+dc &num=10&meta=hl%3Den%26lr%3D&safe=off&btnG=Google+Search
Noeud papillon
Altavista, Compaq et IBM ont réalisé une étude conjointe sur le "web déconnecté". Les scientifiques des centres de recherche IBM, Compaq et altaVista ont donc achevé la représentation graphique d'une carte topographique complète du Web mondial, après le webmap d'Inktomi (l'annonce successive des deux études n'est peut-être pas d'ailleurs un hasard) et ont découvert l'existence de division entre différentes zones d'Internet, pouvant rendre la navigation sur le Web difficile, voire impraticable.
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).