Nota bene: l'articolo proposto in questa pagina è proprietà dell'autore e non può essere distribuito o riutilizzato in alcun modo o forma senza il suo consenso scritto.
Le informazioni qui riportate risalgono alla data di pubblicazione dell'articolo e non è detto che siano ancora valide o che rispecchino lo stato attuale dei programmi, le posizioni delle persone interpellate o quelle degli autori stessi.

Introduzione

La rete è grande, in rete c'è tutto... ma come si fa quando serve un'informazione e non si sa dove trovarla?

La differenza fra Internet ed i servizi telematici che l'hanno

Immagine Oltre alla ricerca semplice, AltaVista offre numerose altre opzioni ed alcuni utili tutorial per l'uso.

preceduta sta nel fatto che in passato vi era una netta distinzione fra utenti e fornitori di informazione. Oggi, chiunque si connetta alla grande rete può offrire sul proprio computer se dotato di collegamento permanente, basta un contratto ADSL aziendale, o su un servizio di web hosting, contenuti di ogni tipo. Oltrettutto, se in passato chi voleva realizzare dei servizi era obbligato a pagare il gestore della rete, oggi la creazione di un sito web è spesso gratuita per i privati ed a costo irrisorio per le aziende.
L'estrema facilità con cui è possibile aprire siti web è ciò che rende Internet tanto dinamica ed interessante: oltre ai siti più famosi e pubblicizzati esistono milioni di pagine meno note ma dai contenuti altrettanto interessanti o utili (ad esempio i siti dei vari comuni d'Italia). Il problema si pone quando vogliamo cercare delle informazioni. Mancando un'ente centrale di coordinamento del web, non esiste un indice ufficiale dei contenuti, che del resto sarebbe di difficile gestione vista la velocità con cui nascono e muoiono i siti.
Per cercare in rete si utilizzano quindi i cosiddetti "motori di ricerca", che sono servizi totalmente gratuiti (ma alcuni prevedono opzioni avanzate a pagamento) e consentono di trovare le informazioni richieste nel sottoinsieme delle pagine web a loro noto.

Directory e ragni

Esistono due tipologie principali di motori: directory e ragni ("web

Immagine Virgilio, una grande directory italiana. Notare l'organizzazione delle categorie.

spiders"). I motori che operano come directory, ad esempio l'italiano Virgilio o Yahoo, sono gestiti da uno staff che si occupa di recensire ogni singolo sito trovato (o più frequentemente segnalato dall'autore stesso o dai visitatori) e catalogarlo. Il risultato è simile all'indice analitico presente nei servizi della telematica pre-Internet: ci si collega al sito e si naviga attraverso una lista di categorie fino a trovare quella che più ci interessa. Da lì si seleziona il sito in base alla mini-recensione presente. Se questo approccio vi sembra ottimo tenete presente che l'intervento umano e cioè visione, catalogazione e recensione, riduce il numero di siti "coperti" dai motori di questo tipo e che questi servizi non possono contenere le ultime novità, per esempio il sito che un vostro amico ha aperto una settimana prima e di cui si è dimenticato di darvi l'indirizzo.
Alla lentezza dell'aggiornamento sopperiscono i ragni, sistemi totalmente automatizzati di indicizzazione del web. Si tratta di potenti mainframe che esplorano 24 ore al giorno, 365 giorni l'anno la rete e fagocitano tutti i siti che trovano, memorizzandone i principali contenuti testuali. In questi servizi la ricerca avviene sulla base di parole chiave: si inserisce nell'apposito modulo sul sito del motore il

Immagine Non solo web, DejaNews permette di effettuare ricerche nei newsgroup sin dalla loro nascita. In primo piano Mamma, un motore di ricerca che interroga i siti più noti e fornisce i risultati in un'unica pagina.

testo desiderato e si guardano i risultati della ricerca. Quanto più il termine è generico tanto più saranno numerosi, e probabilmente lontani dall'argomento cercato, i risultati. Al contrario, inserendo termini multipli o intere frasi, sarà più facile trovare ciò che si cerca, anche se spesso si tratta di una questione più di fortuna che di correttezza della ricerca.
Negli anni i ragni si sono evoluti: dalla ricerca semplice si è passati alle opzioni avanzate, ad esempio la ricerca su pagine che contengono alcuni termini ma non ne contengono altri; il supporto per le espressioni regolari, sin’anche, in tempi più recenti, all'identificazione di parole "simili" a quella cercata o alla proposta di pagine dai contenuti analoghi. In pratica il motore modifica la chiave di ricerca dell'utente per renderla più affine ai contenuti che evidentemente questi desidera trovare.
Ma come fanno i ragni ad indicizzare un sito? Esistono due approcci: la memorizzazione integrale del testo presente in ogni pagina web e l'analisi dei TAG "meta". Nel secondo caso il programma cerca specifici TAG HTML nel documento da memorizzare. Tali TAG indicano la natura della pagina, i contenuti ed eventualmente la lingua. Segue un esempio per i lettori che desiderassero inserirle nelle proprie pagine.

<meta name="description"
  lang="it"
  content="Frequenze delle emittenti radio italiane">

<meta name="keywords"
  lang="it"
  content="emittenti radio, frequenze, frequenze emittenti radio italiane">

In breve, nell'attributo "content" nel primo TAG va inserita una breve descrizione della pagina, mentre nel secondo si mettono, separate le une dalle altre da una virgola ed uno spazio, le parole chiave che corrispondono ai contenuti della pagina. Per maggiori informazioni rimandiamo alla sezione "B.4" delle specifiche HTML 4.0 (presenti anche sul CD allegato) espressamrente dedicata all'interazione con i motori di ricerca.
Risulta evidente che l'efficacia dei TAG "meta", soluzione che in un mondo perfetto avvicinerebbe ragni e directory (i primi caratterizzati dalla velocità di "apprendimento" e le seconde dall'accuratezza delle informazioni), dipende dalla correttezza del webmaster. E infatti... molti siti, soprattutto di tipo pornografico, presentano TAG "meta" con descrizioni fuorvianti utilizzate allo scopo di comparire anche all'interno di ricerche di tutt'altra natura.
Dal canto loro i motori più seri offrono funzionalità preventive (ad esempio il "Family filter" di AltaVista), atte ad evitare, per quanto possibile, la visualizzazione di siti dai contenuti inadatti al pubblico minore. Purtroppo in nessun caso vi è la garanzia che il sito trovato corrisponda a quanto da noi cercato, né, è bene dirlo, che l'indirizzo memorizzato nel motore di ricerca appartenga ancora a quel sito. Tutti i servizi comunque consentono di segnalare abusi o problemi di questa natura.

Conclusioni

Abbiamo visto quali tipi di motori di ricerca esistono e come operano. La domanda che i lettori si porranno ora è "qual è il migliore?". Difficile rispondere, si tratta di un approccio soggettivo, basato sulle proprie abitudini in rete. Chi ama navigare senza meta potrebbe preferire la "lenta" ricerca fra le categorie di una directory. Ad altri, più sbrigativi, risulterà più congeniale inserire una chiave di ricerca in un ragno per scovare un sito stranissimo, magari mai visitato da nessuno prima di loro. L'unico vero consiglio che ci sentiamo di dare è di non fossilizzarsi su un singolo servizio, per quanto buono possa essere. Le tecnologie di indicizzazione del web sono in continua evoluzione e capita che motori emergenti possano riservare delle sorprese: è il caso di Google, che spesso oggigiorno supera di molto AltaVista per numero dei risultati offerti.

Indirizzi utili

Motori internazionali consigliati

Italiani

Amiga

Questi indirizzi sono stati verificati a maggio 2019.