|
Nel marzo 1996, Page puntò il crawler di BackRub – la primissima versione del futuro Google - soltanto su una pagina: la sua home page di Stanford (molti studenti di informatica ne avevano una), e lo lasciò libero. Il crawler lavorò verso l'esterno a partire da là. Questo è il bello del Web: non importa da dove parti, alla fine arriverai praticamente ovunque si possa andare.
Setacciare l'intero Web per scoprire la somma dei suoi link è un'impresa rilevante, ma la semplice attività di crawl non era il vero elemento innovativo di BackRub. Page ovviamente conosceva il concetto di graduatoria nell'editoria accademica, e teorizzò che la struttura a grafo avrebbe rivelato non soltanto chi si collegava a chi, ma più significativamente, l'importanza di chi era collegato a chi, basata su varie qualità del sito che ospitava il link. Come osservato in precedenza, questi elementi – il testo àncora che circonda il link, per esempio – sono critici nel determinare graduatoria e rilevanza.
Ispirandosi all'analisi delle citazioni, Page teorizzò che un semplice calcolo dei link verso pagina sarebbe stata un'utile guida per individuarne la ovazione in graduatoria. Ipotizzò anche che ogni link avesse bisogno di una sua propria classificazione, basata sul calco-i link della pagina da cui proveniva. Ma un simile approccio costituisce una difficile sfida matematica ricorsivi: non solo si devono contare i link di una particolare pagina, ma anche quelli associati a ogni link. Rapidamente i calcoli diventano tosto complicati.
Fortunatamente, il prodigioso talento matematico di Brin risolse il problema. Brin, nato in Russia, figlio di scienziato della NASA (sua madre) e di un professore universitario di matematica (suo padre), era emigrato negli Stati Uniti con la sua famiglia all'età di sei anni. Quando era studente di scuola media, Brin già conosciuto come un genio in matematica. 91
Insieme, Page e Brin crearono un sistema di classificazione che premiava i link provenienti da fonti importanti, e penalizzava gli altri. Per esempio, molti siti hanno link verso Ibm.com. Quei link spaziano dai partner industriali – Intel, forse – a siti come quello di un programmatore teenager in una città di provincia dell'Illinois che ha messo un collegamento a IBM perché ha appena ricevuto un nuovo computer per Natale. Come poteva un algoritmo determinare una graduatoria fra queste due situazioni? Per un osservatore umano, il partner industriale è più importante, se si tratta di comprendere il ruolo di IBM nel mondo. Ma come poteva un algoritmo capire questo?
La svolta di Page e Brin fu creare un algoritmo – chiamato PageRank, dal nome di Page – che riesce a tenere in considerazione sia il numero di link verso un particolare sito, sia il numero di link verso ognuno dei siti che sono collegati al primo. Questo rispecchiava il rudimentale approccio del calcolo delle citazioni accademiche e, come fu subito evidente, funzionava. Nell'esempio appena citato, supponiamo che soltanto pochi siti fossero collegati a quello del teenager. Supponiamo poi che i siti che ospitavano link verso quello del teenager fossero similmente poveri di link. Invece, migliaia di siti sono collegati a quello di Intel, e quei siti hanno mediamente migliaia di siti a loro collegati. Con PageRank, il sito del teenager sarebbe meno importante di quello di Intel nella graduatoria. In questo esempio, dunque, la metodologia di classificazione giudicherebbe il sito di Intel più importante di quello di un teenager di provincia, almeno in relazione all'IBM.
Page e Brin videro subito che i risultati di BackRub erano superiori rispetto a quelli dei motori di ricerca tradizionali come AltaVista e Excite, che spesso fornivano risultati non pertinenti. "Pensammo, perché producono questi risultati che sono palesemente insignificanti? – ricorda Page –. Semplice, si limitavano a considerare il testo, trascurando questo nuovo segnale. Una volta che ce l'hai, è piuttosto logico che questo segnale sia utile per la ricerca."
Il segnale – oggi meglio noto come PageRank – diventò il cuore della tanto decantata ricetta segreta di Google. Per verificare se PageRank funzionava bene applicato alla ricerca, Brin e Page misero insieme uno strumento basato su BackRub. Cercava soltanto le parole nei titoli degli URL e utilizzava PageRank per classificare i risultati sulla base della loro rilevanza, ma quei risultati erano così superiori rispetto ai motori di ricerca tradizionali– per la gran parte in grado di classificare esclusivamente per parole chiave – che Page e Brin capirono di avere per le mani qualcosa di grosso.
Battelle J., “Google e gli altri”, Raffaello Cortina Editore, pag. 93
|