Vous en avez certainement entendu parler (la nouvelle a fait grand bruit...), Google indexe depuis peu de nouveaux formats de fichiers, dont notamment :
- PDF (.pdf), mais c'était déjà le cas depuis pas mal de temps (à ce jour, 22 millions de documents sont indexés par Google sous ce format). - Word (.doc)
- Excel (.xls)
- Powerpoint (.ppt)
- Rich Text Format (.rtf) - Postscript (.ps)
Ainsi, il est possible de visualiser des documents autres qu'au format HTML grâce à Google. Ces documents sont visualisés de deux façons différentes par le moteur :
- Soit en indiquant, entre crochets, le format en question, à gauche du titre : [PDF] Investment Strategy
ou :
[PPT] $6 Million Common Stock Offering
- Soit sous la forme d'une phrase affichée sous la ligne du titre : File Format: PDF/Adobe Acrobat - View as HTML
ou :
File Format: Unrecognized - View as HTML
Cette dernière indication ("View as HTML") est intéressante : elle permet de lire un fichier Powerpoint, par exemple, au format HTML, car Google les
convertit auparavant en HTML, comme les fichiers PDF et autres.
Google permet, par la fonction "filetype:", d'effectuer une recherche spécifique sur un format donné. Exemple :
secret filetype:pdf confidential filetype:ppt
Bien entendu, si vous désirez restreindre votre recherche uniquement aux fichiers HTML, tapez : faq filetype:html
Fichier PDF téléchargeable ici (la lettre Réacteur n'était à cette époque-là disponible que sous cette forme).