di  -  venerdì 16 novembre 2012

Google, Google e ancora Google!

Quando si utilizza di Internet è quasi scontato che si acceda al noto motore di Mountain View per iniziare le proprie ricerche o approfondire specifici argomenti.

Eppure c’è stata un’epoca in cui Sergey Brin e Larry Page erano assenti dalla scena della Rete, un’epoca in cui uno degli eventi più attesi era il rilascio della nuova versione di MS-DOS (;-)).

Stiamo parlando del periodo tra la fine degli anni ’80 e l’inizio degli anni ’90, in cui era pratica comune usare Internet per lo scambio dei file tramite protocollo FTP.

Lo svantaggio però è chiaro ed evidente: bisognava conoscere a quale host FTP collegarsi per poter scaricare il file desiderato. Gli utenti, in prima battuta, pubblicizzavano la disponibilità di un nuovo file tramite una e-mail inviata ad una message list o aprendo una discussione su di un forum.

Archie nel 1990 cambia tutto ciò, grazie alla geniale intuizione di Alan Emtage, allora studente all’università McGill di Montreal.

Alan Emtage

Quello che viene oggi accreditato come il “papà” dei motori di ricerca era chiaramente profondamente diverso dagli attuali search engine, oltretutto il Web non era neanche nato al momento del suo rilascio (bisognerà aspettare fino al 6 agosto 1991).

Emtage pensò inizialmente di chiamare il proprio sistema “Archives”, ma decise di allinearsi alla pratica Unix di assegnare ai programmi nomi semplici e criptici (es: grep, cat, troff, sed, awk, perl, ecc.). Archie- (con il trattino) indicava il core del sistema, ovvero “Archie servers” composto da una serie di programmi in grado di gestire un database di FTP Anonimi in cui effettuare la ricerca dei file per nome.

Automaticamente Archie si connetteva agli host presenti nei propri archivi e, oltre a verificarne il funzionamento, scaricava l’elenco completo dei file pubblici.

La base dati che così si creava veniva interrogata tramite espressioni regolari al fine di effettuare il match tra la stringa specificata dall’utente e il nome del file. Una volta trovato quanto richiesto, veniva presentato all’utente l’host FTP relativo da cui recuperare il file.

Nel libro “The daemon, the gnu, and the penguin: A History of Free and Open Source” si riporta che, nel 1992, Archie conteneva informazioni inerenti circa 2,6 milioni di file per un totale di 150 gigabytes di informazioni, mentre nel documento Research Problems for Scalable Internet Resource Discovery si evidenzia che nel 1993 Archie era al massimo del suo splendore, anche se cominciava a dare i primi segni di difficoltà nei tempi di risposta:

“The global collection of Archie servers process approximately 50,000 queries per day, generated by a few thousand users worldwide. Every month or two of Internet growth requires yet another replica of Archie. A dozen Archie servers now replicate a continuously evolving 150 MB database of 2.1 million records. While it responds in seconds on a Saturday night, it can take five minutes to several hours to answer simple queries during a weekday afternoon”

Chiaramente l’ascesa del Web cambia completamente gli scenari e Archie lascia presto lo spazio ai nuovi search engine basata su indicizzazione automatica delle pagine. In particolare, però, ispira il lavoro di Martijn Koster che realizza ALIWEB (Archie-Like Indexing in the Web), fondamentale per lo sviluppo dei robot automatici di indicizzazione. Sempre nel 1993 compare anche JumpStation che introduce gli spider, consentendo agli utenti di cercare parole chiave nei titoli e nelle intestazioni delle pagine web.

JumpStation può essere considerato a tutti gli effetti il primo motore di ricerca in chiave moderna, anche se, dopo solo un anno, non era più in grado di stare al passo con la crescita esponenziale del Web.

Nel 1994 viene lanciato WebCrawler, più efficiente di JumpStation e in grado di analizzare l’intero contenuto della pagina, seguito da Lycos che aggiunge caratteristiche innovative come la scelta dei risultati in base alla similitudine con l’elemento cercato e l’ordinamento dell’elenco risultante in base alla rilevanza.

Primo logo di Lycos

Nel 1996 viene lanciato MetaCrawler il primo meta-motore di ricerca, in grado di utilizzare a sua volta altri motori di ricerca per effettuare le ricerche e poi elaborarne il risultato.

L’anno successivo entrano in scena David Filo e Jerry Yang, i due studenti della Stanford University che lanciano il famosissimo Yahoo, mentre all’incirca nello stesso periodo, si afferma Altavista, in grado di indicizzare milioni di pagine al giorno grazie al proprio spider.

 

David Filo e Jerry Yang

Ma la vera rivoluzione arriva verso la fine del 1997, quando viene lanciato quello che diventerà il Re dei motori di ricerca: stiamo chiaramente parlando di Google e del suo strabiliante “page ranking”.

Il resto è storia recente.

9 Commenti »

I commenti inseriti dai lettori di AppuntiDigitali non sono oggetto di moderazione preventiva, ma solo di eventuale filtro antispam. Qualora si ravvisi un contenuto non consono (offensivo o diffamatorio) si prega di contattare l'amministrazione di Appunti Digitali all'indirizzo info@appuntidigitali.it, specificando quale sia il commento in oggetto.

  • # 1
    Giovanni
     scrive: 

    Ne è passta di acqua sotto i ponti.

    Io allora in realtà usavo gopher.

  • # 2
    Nexol
     scrive: 

    Con Laycos credo s’intenda Lycos. :)

  • # 3
    musehead
     scrive: 

    Splendido articolo come sempre. Siete un blog fantastico.

    Parlando di ricordi, la mia tappa fissa era Altavista ed in seconda scelta Excite (ma che fine hanno fatto?). Era bizzarro come le indicizzazioni dei vari motori restituissero risultati spesso notevolmente diversi!

  • # 4
    massimo
     scrive: 

    Gopher l’ho usato una volta sola, poi ho sempre usato Veronica, che indicizzava i contenuti di Gopher, cioè era un motore di ricerca nel Gopher-spazio :-)

    Poco fa mi sono andato a vedere se c’è ancora qualcuno su Gopher: SI’, e un mattoide ha pure tirato fuori una nuova versione di Veronica. Ma ci sono rimasto male quando ho scoperto che Firefox non supporta più il protocollo. Mi dice “Firefox non sa come aprire questo indirizzo” :-(

  • # 5
    mirco
     scrive: 

    detengo ancora il record all’ università di 14 ore filate senza alzarsi dalla sedia per stare davanti a Netscape
    bei tempi .. ovviamente a toni di grigio

  • # 6
    Flare
     scrive: 

    Webcrawler, Excite, Hotbot, Lycos, Altavista, Yahoo… Poi un giorno dico: “Hai sentito che c’è un nuovo motore di ricerca?”
    “Uh?”
    “Ha un nome strano… mmm… Aspetta, ti faccio vedere…”
    E da allora Google fu.

    I domini dei vecchi motori di ricerca esistono ancora, ma in buona parte sono divenuti dei frontend per i motori ora più utilizzati.

  • # 7
    Leo
     scrive: 

    C’era anche Arianna in Italia, ai tempi anche dmoz.org era una valida fonte, poi in università un compagno mi fece vedere google e tutto il resto sparì. :)

  • # 8
    banryu
     scrive: 

    C’era anche Arianna in Italia, ai tempi anche dmoz.org era una valida fonte, poi in università un compagno mi fece vedere google e tutto il resto sparì. :)

    @Leo: per me invece è da quando ho incontrato DuckDuckGo che Google è sparito :)

  • # 9
    Leo
     scrive: 

    @banryu

    Conosco DuckDuckGo e lo sto usando pure io. ;)

Scrivi un commento!

Aggiungi il commento, oppure trackback dal tuo sito.

I commenti inseriti dai lettori di AppuntiDigitali non sono oggetto di moderazione preventiva, ma solo di eventuale filtro antispam. Qualora si ravvisi un contenuto non consono (offensivo o diffamatorio) si prega di contattare l'amministrazione di Appunti Digitali all'indirizzo info@appuntidigitali.it, specificando quale sia il commento in oggetto.