MOTORI di RICERCA
POSIZIONAMENTO su GOOGLE
Perché il POSIZIONAMENTO
REGISTRAZIONE sui MOTORI
di RICERCA
TECNICHE di INDICIZZAZIONE
COSTI di INSERIMENTO su GOOGLE
CONSULENZE PRIMI su GOOGLE
CORSO PRIMO
su GOOGLE
VIVERE con GOOGLE
ALTRI contenuti culturali NON riguardanti GOOGLE
CONTATTI

Consumo di banda e prime reazioni

All'interno di una piccola cerchia di membri dell'università, Google fu un successo. Stimolati da questo, Brin e Page cominciarono a migliorare il servizio, aggiungendo la ricerca sull'intero testo e sempre più pagine all'indice. In genere i dottorandi non hanno i soldi per comprare nuovi computer; Page e Brin non facevano eccezione. Anzi, mendicarono e chiesero prestiti per far esistere Google: un disco fisso del laboratorio di rete, una CPU inutilizzata da quello di informatica. Usando la stanza di Page come laboratorio, forgiarono una sorta di macchina-Frankenstein, fatta con componenti di scarto, poi la collegarono alla rete a banda larga del campus di Stanford. Dopo aver riempito quella stanza di attrezzature, i giovani studenti trasformarono la camera di Brin in ufficio e centro di programmazione.
Hector Garcia-Molina, un altro assistente al progetto della facoltà, prestò agli studenti un Sun Ultra, un computer potente che, come ricorda Page, disponeva di una memoria dieci volte superiore rispetto a un normale Pc. Ma nemmeno questo era lontanamente sufficiente. Ottenere risorse per il loro lavoro divenne quasi un'occupazione a tempo pieno. "Mendicavamo hardware e connettività da altri gruppi, avevamo troppi dati da trasferire – dice Page –. Dovevamo chiedere loro di aprire i loro armadi di cavi e di prestarci le loro schede Ethernet."
Un'e-mail di quel periodo iniziale da Larry Page a Terry Winograd illustra il tipo di problemi incontrati dai due fondatori. È datata 15 luglio 1996 e vi si legge fra l'altro:
« Ho praticamente finito lo spazio su disco, ho scaricato quasi... 24 milioni di URL e circa 100 milioni di link... Penso che mi serviranno altri 8 giga per contenere tutto... I prezzi di mercato oggi sono attorno ai 1000 dollari per 4 giga... Finora sono arrivato soltanto al 15 per cento circa delle pagine, ma il lavoro sembra davvero molto promettente. »
A causa della sua dimensione e scala, il progetto diventò una sorta di leggenda all'interno del dipartimento di informatica e degli uffici di gestione della rete del campus. A un certo punto il crawler BackRub consumava quasi metà dell'intera larghezza di banda della rete dell'università, un fatto straordinario se si considera che Stanford era una delle istituzioni meglio cablate del pianeta. E, almeno in un'occasione, il progetto fece saltare la connessione a Internet di tutta l'università. "Eravamo fortunati che ci fossero un sacco di persone lungimiranti a Stanford – ricorda Page –. Non ci assillavano troppo per le risorse che utilizzavamo."
Gli amministratori della rete di Stanford erano invece a lo ro volta assillati da numerosi proprietari di siti Web, molti dei quali non capivano perché il servizio di Google richiedesse in continuazione copie delle pagine dei loro siti. Nel 1996 a nessuno interessava essere indicizzato da un motore di ricerca; la richiesta di scaricare l'intero contenuto di un sito era spesso considerata alla stregua di una violazione di proprietà. Il tipico visitatore di un sito Web poteva cuccare in giro, guardare qua e là, e poi proseguire verso la successiva destinazione. Ma il crawler di BackRub esauriva interamente un sito indícizzando ogni pagina alla velocità della luce. Spesso, semplicemente, i siti non erano stati progettati per farsi carico di una cosa del genere: rischiavano di soccombere sotto le voraci esigenze di BackRub. Anche se un sito riusciva a sostenere la richiesta del crawler, comunque quella procedura sembrava una violazione di qualche regola di condotta non scritta, se non qualcosa di peggio.
Winograd racconta la storia di un museo d'arte online che contattò Stanford dopo che BackRub aveva indicizzato il suo sito. Poiché il crawler aveva richiesto ogni singola pagina, al museo erano convinti che il suo vero scopo fosse quello di rubare le immagini e il testo, e ricreare il sito altrove. Il museo minacciò di fare causa, ma Winograd negoziò una tregua. Reclami di questo tipo alla fine fecero storcere il naso a Steve Hansen, il responsabile della sicurezza informatica dell'Università di Stanford, che scrisse per posta elettronica all'intera squadra del progetto Google nel febbraio del 1997:
« Negli ultimi sei o sette mesi ho ricevuto numerose lamentele da siti Web esterni al campus riguardanti i troppi e/o non autorizzati accessi Web provenienti dal [...] dipartimento di Informatica [...]. Il signor Page [...] ha fatto poco per placare gli operatori dei siti Web. Se deve essere fatta una ricerca all'esterno, su Internet, bisogna che si faccia con maggiore attenzione e supervisione di quanto non stia accadendo con il progetto BackRub. Se non applichiamo un'efficace autoregolamentazione in questo ambito, potrebbe succedere che altri decidano che abbiamo bisogno di un controllo dall'esterno. »
Page si scusò, incontrò Hansen e promise che avrebbe fatto meglio in futuro. Mise sul Web una pagina per spiegare al pubblico che in effetti Google stava indicizzando l'intero Web, ma non conservava copie di ogni pagina. Spiegò anche in modo dettagliato come era possibile per un proprietario di sito Web chiedere di essere escluso dalle zelanti richieste del crawler. Ma, incitato da un'altra lamentela nell'aprile del 1998, Hansen scrisse di nuovo un'email a Page:
« Questa non è la prima, e nemmeno la seconda volta che il progetto causa problemi a un altro server Web sulla Rete. Episodi simili sono costati a queste persone una significativa perdita economica. E ciò di sicuro non favorisce la reputazione dell'università o del dipartimento d’informatica.
Sono anche preoccupato delle potenziali responsabilità legali. »
Page riuscì di nuovo a placare Hansen e il progetto riprese velocemente. (Page evidentemente restò impressionato dalle capacità di Hansen, visto che in seguito lo assunse come responsabile della sicurezza di Google.)
Ma i reclami non erano soltanto per l'uso (o abuso) di risorse di calcolo da parte di BackRub. I proprietari dei siti cominciavano anche a prestare attenzione al servizio stesso di Google, in particolare a come i propri siti si classificavano secondo il nuovo algoritmo PageRank. Molti non gradivano il fatto che quel motore di ricerca venuto dal nulla desse un giudizio – apparentemente alla cieca – sul loro sito. Dopotutto, era la prima volta che qualcuno pretendeva di classificare il valore intrinseco di un sito Web. Come succede ancora oggi, quel giudizio evocava una risposta violenta. Si legge in una delle tipiche lamentele:
« Sono rimasto stupefatto dal vostro processo di classificazione. Visto che voi avete creato questo motore di ricerca, dovete anche correggere un odioso errore che è allo stesso tempo ridicolo e offensivo per un webmaster. Per favore, digitate le parole "Ulysses S. Grani" nel vostro motore e guardate i risultati. Il mio sito Web, "la home page di Ulysses S. GranC fu votato come "miglior sito sulla Guerra Civile" nel numero del febbraio 1994 della rivista Civil War Time Illustrateti [...]. Si è classificato come la più importante risorsa Web su qualsiasi personaggio o battaglia della Guerra Civile. Bill Gates mi ha persino inviato un'e-mail personale elogiandolo [...]. Voi [...] collocate altri siti, inferiori (alcuni patetici) più in alto nella vostra graduatoria [...]. Questa è un'ingiustizia di tale gravità da richiedere una spiegazione. Sono convinto che se dedicherete cinque minuti a guardare il mio sito lo collocherete più in alto. »
Page e Brin avevano evidentemente toccato un nervo scoperto, non solo per i patiti della Guerra Civile, ma per chiunque avesse lavorato a un sito Web. Chi erano questi mocciosi di Stanford per dire al mondo chi di noi era più importante? Che cosa ne sapevano del lavoro e della passione che c'erano dietro ai nostri siti?
Battelle J., “Google e gli altri”, Raffaello Cortina Editore, pag. 97

Indice delle informazioni su Google e i motori di ricerca

Home page di questa sezione de "Il palo"

Come sono diventato un esperto in Google

"Non essere cattivo" è il motto di Sergey Brin e Larry Page

Come funziona Google

AdSense consente a editori Web grandi e piccoli di accedere alla rete di inserzionisti di Google

Alcuni consigli per usare Google

Azioni di Google di due tipi diversi

Bibliografia su Google: libri sui motori di ricerca il web e internet

Cercando Usher: un esempio di ricerca

Che cosa c'entrano i blog?

Clic e trucchi sulla pubblicità online

Code lunghe nelle reti

Come gli hacker usano Google

Come Google definisce se stesso

Come guadagna Google: Adword e i collegamenti sponsorizzati

Come redigere un elenco di frasi mirate al posizionamento su Google

Confederato e specifico per il dominio: la focalizzazione

Consumo di banda e prime reazioni

Contatti provenienti da siti pornografici

Cosa Google non pubblicizza

Domande frequenti sul posizionamento in Google e nei motori di ricerca

Echelon

Feed RSS (acronimo di RDF Site Summary, o di Really Simple Syndication)

Frasi in cui "Il palo" vince su Google e i motori di ricerca

Free software (sofware libero) e open source (sorgente aperta)

Giornalismo online: analizzare le seconde parole cercate su Google

Giornalismo online: uno studio sui piromani tramite informazioni reperibili sui motori di ricerca

Giornalismo online: usare Google per cercare informazioni, le regole base

Gli algoritmi

Gli altri servizi di Google

Gli uffici dei dirigenti di Google

Gmail usava la tecnologia AdWords per collocare annunci pubblicitari

Google Api, librerie proprietarie

Google aspirante Grande fratello: "personalizzazione di massa"

Google e il porno

Google e la legislazione sui marchi

Google guadagna dalla spesa di migliaia di aziende piccole e medie

Google includeva la nozione di popolarità di un'inserzione pubblicitaria

Google quotato in borsa

Google rischia accuse per la legge antitrust

Google sorpresa a barare dalla parte avversa

GoTo/Overture

I network Peer to peer (p2p) come eMule

I primi motori di ricerca

I risultati delle ricerche gratuite su Google rimangono il luogo migliore per ottenere visibilità

Il "Web invisibile"

Il cuoco di Google: Charlie's Place

Il Danny Sullivan Show

Il pollo fritto di Google

Il principio della "coda di domanda"

Il SEO commerciale avanzato: far comparire siti in testa alla classifica di Google

Il SEO commerciale: come si fa arrivare il cliente primo su Google

Il SEO per le reputazioni: difesa di nome e risonanze online

Il Web semantico?

Immagazzinare in cache

L’ingresso di Google in Cina e i problemi di censura

L’introduzione dei nuovi servizi: "Google immagini", "Google gruppi"

La «frode da clic»: la minaccia più seria per il modello commerciale di Google

La AdWords Connection

La frode di click

La fuga dei cervelli verso Google: il caso Kai-Fu Lee

La gente crede che Google premi i siti più visitati: non è così

La maggior parte degli utenti non si rende conto che Google contiene link pubblicitari

La nascita di Google in un garage

La prima “navigata” di Google

La ricerca ideale

La ricerca inversa

La riservatezza di Google sui suoi fondi e i suoi metodi

La suddivisione di incarichi tra i tre dirigenti di Google

Le aste su AdWord

Le domande della CONSOB americana a Google

Le risorse di gestione e finanziarie di Google in proporzione 70:20:10

L'entrata in Cina

L'immagine è tutto: la "filosofia" di Google

Lo spamming contro i motori per falsarne i risultati

Lo spider non si interessa dei contenuti di una pagina

L'obiettivo di Google di democratizzare l'accesso a dati e informazioni

Otto domande per un giornalista

PageRank vi sta dicendo che se qualcuno punta a voi, è importante

Premi per i programmatori

Quando AdWords debuttò, alla fine del 2000

Ricerca, archiviazione, interrogazione, restituzione dei risultati

Scansire/scannerizzare un libro e trasferirlo su supporto digitale

Sergey Brin non ascolta molta musica

Sviluppo e manutenzione del datacenter

Tutti i profitti venivano dalle persone che cliccavano sui link di testo

Tutti vogliono lavorare a Googleplex

Un mondo di ricerca perfetta

Un piccolo commerciante legato a Google

Un rapido sguardo sul futuro semantico

Uno dei primi esperti di Google: Philipp Lenssen

17 gennaio 2038 La fine del mondo in un biscotto

Google
 
Web www.ilpalo.com