Un point sur les brevets : Google

Nous en avons parlĂ© sur le site Abondance (http://actu.abondance.com/2003-09/google-brevet.html), Google a dernièrement obtenu un brevet auprès de l’ESPTO, organisme gĂ©rant les brevets aux Etats-Unis. L’occasion nous a semblĂ© intĂ©ressante de faire le point, mois après mois, sur les diffĂ©rents brevets dĂ©tenus par les acteurs importants de la recherche d’information sur le Web, car ceux-ci pourraient s’avĂ©rer très importants, stratĂ©giquement parlant, Ă  l’avenir. A tout seigneur tout honneur, nous commençons donc ce mois-ci avec Google. Selon nos recherches, la base de donnĂ©es de l’USPTO contient deux brevets spĂ©cifiquement au nom de Google :

« Ranking search results by reranking the results based on local inter-connectivity »

Brevet # 6,526,440

Appl. No.: 771677

30 janvier 2001

URL : http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&p=1&u=/netahtml/search-bool.html&r=2&f=G&l=50&co1=AND&d=ptxt&s1=google.ASNM.&OS=AN/google&RS=AN/google

Ce brevet prĂ©sente un concept venant complĂ©ter celui du PageRank, utilisĂ© actuellement par le moteur de recherche comme critère majeur de « ranking », par une pondĂ©ration du classement initial des pages (qui est effectuĂ© indĂ©pendamment de la requĂŞte, en combinant des informations lexicales et le PageRank), par un deuxième classement local, dans le contexte de la requĂŞte. Il s’agit d’amĂ©liorer le score de pertinence d’un document en analysant l’inter-connectivitĂ© de ce dernier Ă  l’intĂ©rieur d’un sous-index de documents reconnus eux-mĂŞmes comme pertinents.

Dans un premier temps, un sous-index « local » est créé, regroupant des documents rĂ©pondant globalement Ă  une requĂŞte par la prĂ©sence du mot demandĂ© dans leur texte. A l’intĂ©rieur de cet index local, un « score local » est calculĂ© pour chaque page en tenant compte de l’interconnectivitĂ© des pages entre elles. Le score de pertinence, par rapport Ă  la requĂŞte demandĂ©e intialement, est alors recalculĂ© en fonction du « score local » obtenu par l’analyse de l’interconnexion des liens. Pour simplifier, la mĂ©thode proposĂ©e utilise 2 « PageRank » : l’un est calculĂ© au niveau de l’index global, l’autre au niveau d’un index local, regroupant les pages rĂ©pondant Ă  la requĂŞte. Le classement final utilise une combinaison des 2 PageRank.

« Methods and apparatus for using a modified index to provide search results in response to an ambiguous search query »

Brevet # 6,529,903

Appl. No.: 748833

26 décembre 2000

URL : http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=/netahtml/search-adv.htm&r=1&p=1&f=G&l=50&d=ptxt&S1=google.ASNM.&OS=an/google&RS=AN/google

Ce brevet a trait notamment aux interrogations d’un index Ă  l’aide d’un terminal « non adapté » Ă  une interrogation alphanumĂ©rique. Exemple : un clavier de tĂ©lĂ©phone portable. Actuellement, pour saisir une phrase (par exemple, pour taper un SMS), l’utilisateur doit Ă©ventuellement frapper successivement la mĂŞme touche pour arriver Ă  la bonne lettre. Exemple donnĂ© par le brevet : pour taper « ben smith », le possesseur d’un tĂ©lĂ©phone GSM doit taper :

b : 22

e : 33

n : 66

espace : 0

s : 7777

m : 6

i : 444

t : 8

h : 44

Le but du brevet est de décrire une solution qui permettrait de décrire, au prix de quelques approximations, chaque lettre uniquement par le chiffre qui la représente, et donc ici :

b : 2

e : 3

n : 6

espace : 0

s : 7

m : 6

i : 4

t : 8

h : 4

L’avantage est qu’on ne saisit que 9 chiffres (236076484) au lieu de 18 (223366077776444844) dans le cas prĂ©cĂ©dent.

Le but est de faire en sorte que, statistiquement, le mot ainsi obtenu, mĂŞme s’il est imprĂ©cis (« car » est dĂ©fini, de façon numĂ©rique, de la mĂŞme façon que « bar »), soit comparĂ© Ă  un index, transformĂ© d’alphanumĂ©rique en numĂ©rique de la mĂŞme façon, afin de pouvoir effectuer des recherches sur le Web rapidement. Si « bar » et « car » sont dĂ©crits de la mĂŞme façon et donneront des rĂ©sultats approximatifs, « wine », par exemple, ne propose aucune ambiguĂŻtĂ© (9463) selon Google. Le moteur de recherche indique, dans le brevet, que cette mĂ©thode de recherche peut ĂŞtre Ă©tendu Ă  d’autres formats, notamment phonĂ©tique et audiovisuel.

Fichier PDF tĂ©lĂ©chargeable ici (la lettre RĂ©acteur n’Ă©tait Ă  cette Ă©poque-lĂ  disponible que sous cette forme).

Ajouter un commentaire Ajouter un commentaire

Article précédent

Le cloaking : spam ou pas spam ? (1ère partie)

Article suivant

Premiers procès pour Google France ?