3. Tutti conosciamo i
MOTORI DI RICERCA
Ma come funzionano?
Pierluigi Tavella 3
4. MOTORI DI RICERCA
Tutti i motori di ricerca funzionano tramite dei software chiamati
“spider” o “bot”.
Lo “spider” è un robot che simula il comportamento di un qualsiasi
navigatore della rete (clicca su tutti i pulsanti e i link presenti) e
raccoglie tutta una serie di informazioni che vengono registrate
nella banca dati del motore di ricerca.
I criteri di classificazione non includono mai il giudizio umano
sulla qualità o la pertinenza di un sito.
Pierluigi Tavella 4
5. MOTORI DI RICERCA
Gli algoritmi di ricerca e di classificazione delle pagine sono
segreti modificati regolarmente
segreti e modificati regolarmente per 2 ragioni:
1. Tutti i motori sono gestiti da società a fini di lucro che ci
tengono a tenere segreto il codice informatico per il
proprio successo economico
2. I gestori dei motori non vogliono che i risultati della
ricerca siano manipolabili da parte di chi vuole
promuovere prodotti, informazioni o altro nel Web
Pierluigi Tavella 5
6. MOTORI DI RICERCA
I Webmaster
Webmaster, attraverso l’esperienza, cercano di scoprire
come ottenere il miglior posizionamento per il proprio sito.
Il criterio di ricerca più importante è quello per cui la parola o le
parole che stiamo cercando ricorrano effettivamente nella
pagina. Se il termine cercato è scritto in grassetto o è
contrassegnato come sottotitolo all’interno della pagina, gli
viene assegnato un valore più alto.
Importante per un sito è la “Link popularity” ossia il numero di
“Link popularity
”
link presenti nel Web che portano ad esso.
(scrivere su Google: “link: nomedominio” per ottenere la “link popularity” del sito)
Pierluigi Tavella 6
7. MOTORI DI RICERCA
Nessun motore di ricerca può offrire un giudizio di qualità e di autorevolezza
dell’informazione in termini di affidabilità e serietà.
Nessun motore di ricerca è capace di liberarci da un’analisi critica dei risultati fornitici e
di ricostruire per ciascuna pagina il contesto nella quale è nata.
Esistono però strumenti alternativi come i portali specializzati o
verticali (generalmente a carattere monografico);
esistono le “virtual library” (servizi di consultazione virtuali di carattere
universalistico in cui le informazioni sono raggruppate per categorie e
sottocategorie) ed anche le directory.
Tratto comune a tutte queste risorse è proprio la selezione umana e non
automatica dei Siti a differenza dei portali generalisti od “orizzontali” che
offrono poco o nessun accesso ragionato alle risorse del Web.
Pierluigi Tavella 7
8. RICERCHE ALTERNATIVE
Tim Berners Lee, progettista e inventore del World
Wide Web, già all’inizio degli anni ’90, ha avvertito la
necessità di mettere a disposizione degli utenti del web
strumenti che consentissero un accesso ragionato a
quest’ultimo.
Così è nato il progetto “Virtual Library” consistente in un catalogo ragionato
delle risorse web (http://vlib.org/). Un’esperienza simile in ambito italiano è la
Virtual Library (http://www.segnaweb.it/), costruita dall’Associazione Italiana
Bibliotecari e dal CILEA, il consorzio delle università lombarde.
Pierluigi Tavella 8
9. Questo tipo di ricerca attraverso directory
apparentemente più semplice e immediatamente più
soddisfacente rivela però una nostra pigrizia !
Le strutture categoriali ci piacciono: troviamo più facile cliccare su una
categoria già pronta e poi su di una sottocategoria come ad esempio:
Arte e Cultura > Archeologia > Musei > Museo Egizio di Torino invece
che inserire faticosamente in un motore di ricerca una stringa con gli
operatori logici: quot;Muse* AND Egizio AND Torinoquot; e poi navigare nella
selva dei risultati della ricerca.
Pierluigi Tavella 9
13. Un problema tipico delle ricerche in rete è
la difficoltà di quot;centrarequot; il documento o la
risorsa che ci interessa, e di essere quindi
sommersi da un mare di risposte non
significative, in mezzo alle quali annega ciò
che stiamo cercando.
Questo problema si
chiama:
Pierluigi Tavella 13
16. Osservando l’immagine della slide precedente possiamo notare
che il risultato della ricerca ci ha restituito una quantità
esagerata di documenti: circa 35.900.000 per Grecia
Un risultato veramente RUMOROSO
(overload di informazioni). Troppe informazioni = nessuna informazione
Questa ricerca non ha dato risultati soddisfacenti anzi direi proprio che
questa mole impressionante di risposte poco significative ha provocato
un effetto che potremmo definire: SILENZIO
Aver utilizzato un linguaggio libero cioè il
termine (Grecia) senza aver specificato
semanticamente la ricerca.
Pierluigi Tavella 16
17. Cosa fare per evitare il rumore e quindi il
silenzio?
— In questa situazione possono tornare utili gli
strumenti di ricerca avanzata, in particolare gli
operatori logici.
— L’obiettivo della ricerca avanzata è quello di permettere
un interrogazione abbastanza specifica, in modo da
escludere documenti non rilevanti. Per fare questa
selezione è necessario definire il maggior numero
possibile di caratteristiche che il documento che
stiamo cercando deve possedere, più specifica è la
descrizione, meno sono i documenti che vi
corrispondono, e più pertinente è il loro contenuto.
Pierluigi Tavella 17
18. Prima di tutto dobbiamo sapere cosa stiamo cercando. Gli
operatori logici tornano utili soprattutto quando abbiamo un’idea
chiara di ciò che vogliamo, e lo possiamo quindi descrivere in
modo adeguato. Chiarirsi le idee è quindi la cosa fondamentale.
Il modo migliore di procedere è cominciare l’interrogazione con una parola o frase
altamente specifica, come può essere un termine tecnico o il nome di una persona.
Spesso questo è sufficiente. Se non otteniamo alcun risultato o ne otteniamo troppo
pochi, prima di cambiare parola chiave si può provare con le sue declinazioni
grammaticali (maschile/femminile e singolare/plurale per i sostantivi, e i diversi
tempi e modi per i verbi). A questo scopo può essere utile il segno * (asterisco).
Se i risultati sono troppi, oppure non ci vengono in mente che parole generiche,
possiamo cominciare ad aggiungere parole chiave legate da AND. Un modo
alternativo per scremare i risultati è l’uso di NOT. Se facendo così abbiamo ridotto
troppo il campo della ricerca si può utilizzare OR per allargarlo leggermente.
Procedendo per aggiustamenti successivi, utilizzando se necessario le parentesi,
mettendo o togliendo parole chiave per mezzo di AND o ponendo alternative per
mezzo di OR, si riesce in genere a ridurre i risultati ad un piccolo numero veramente
rilevante.
Pierluigi Tavella 18