Esplorare il Deep Web

Workspace

Google ha sorpassato il trilione di pagine Web indicizzate, ma ancora molto rimane sconosciuto ai motori di ricerca. Kosmix e DeepPeep provano a sondare sotto la punta dell’ice-berg del Web visibile

Nel 1999, agli albori del Web quando Google non era ancora nessuno nel nascente mercato dei search engine, Nature scrisse che i motori di ricerca prendevano in considerazione ovvero riuscivano a coprire una parte piccolissima della Rete (Altavista il 12 per cento, Northernlight il 16 per cento Lycos il 2,5 per cento eccetera); oltretutto la parte di Internet che indicizzavano era soprattutto di tipo commerciale (dossier di S. Lawrence e C. Lee Giles in NATURE, Vol.400, 8 luglio 1999, Nature). Lo riportava un libro pionieristico sui motori di ricerca (ed. Shake). Da allora molti passi sono stati avanti, tanti motori non esistono più e altri sono nati ed evoluti, per illuminare e gettare luce sul cosiddetto Deep Web: Google, per esempio, ha sorpassato il trilione di indirizzi Web indicizzati.

Ma il trilione di pagine di Google è solo la punta dell’ice-berg , e il Deep Web rimane profondo e oscuro. Kosmix , una start-up in cui investe anche Jeff Bezos di Amazon, ora vuole cercare di esplorare i fondali di Internet, dove non arrivano i crawler o gli spider (che navigano di link in link). Google ha le sue strategie L’Università dello Utah sta lavorando a un ambizioso progetto, detto DeepPeep .

La prossima frontiera sarà il Web semantico che, rispondendo a domande in linguaggio naturale, potrà esplorare anche sotto la punta dell’ice-berg del Web oggi visibile.

Dì la tua sul Blog Scacco al Web: Il Deep Web rimane il lato oscuro di Internet

Clicca per leggere la biografia dell'autore  Clicca per nascondere la biografia dell'autore