Este documento describe los principales tipos de buscadores de información en Internet, incluyendo buscadores automáticos, metabuscadores y directorios. Explica cómo funcionan los buscadores al indexar páginas web y ordenar los resultados de búsqueda. También compara los principales buscadores automáticos como AltaVista, Northern Light e Inktomi según su tamaño e indexación.
1. BUSCADORES
¿Por qué buscadores?
¿Qué son?
Principales buscadores automáticos
Metabuscadores
¿Cómo funcionan?
Directorios
Cómo ordenan los resultados
Estrategias de búsqueda
2. Buscadores automáticos
(Search engines)
Son
aquellos que a partir de cierta
información entregada en lenguaje natural o
de acuerdo a alguna especificación, puede
recuperar la información que uno está
buscando, desde la base de datos que
mantienen
Anterior
Siguiente
3. Buscadores automáticos
Existen
más de 1000 en Internet
No entregan los mismos resultados
Encontramos diferencias:
• Tamaño de la base de datos
• Frecuencia de actualización
• Capacidades de búsqueda
Anterior
Siguiente
4. Caracteristicas de los buscadores
Están
compuestos por tres partes
• los robots que recorren la red escrutándola.
• la base de datos (índice) que es construida por los
robots.
• el motor de búsqueda que facilita la consulta a la base
Anterior
Siguiente
5. ¿Cómo funcionan?
Al conectar con algún buscador nos
encontraremos con una página que contiene
un formulario para definir nuestra búsqueda y
las opciones de la misma; tras rellenarla,
enviarla y esperar unos segundos, el
buscador nos devolverá una lista de lugares
donde figura nuestra búsqueda.
Anterior
Siguiente
6. ¿Cómo ordenan los resultados?
• Los buscadores seleccionan entre millones
de páginas aquellas que coinciden con la
palabra clave y luego despliegan esos
resultados en un orden que varía según el
tipo de buscador.
Utilizan diferentes
mecanismos para establecer la relevancia.
Documento de
Anterior
Siguiente
Microsoft Word
Hacer clic para ver detalles
7. Comparación de buscadores
automáticos
según tamaño
TAMAÑO
MILLONES DE PAGINAS WEB INDIZADAS
Fuente: w w w .searchenginew atch.com - mayo, 1999
150
Alta Vista
140
Northern Light
110
Inktomi (Yahoo/Hotbot)
80
Fast
Excite
55
Lycos
50
Infoseek
Webcrawler
Anterior
Siguiente
45
2
8. Comparación de buscadores
automáticos
según cobertura
COBERTURA
% DEL WWW INDIZADO
(Est. 550 millones de páginas)
Fuente: www.searchenginewatch.com - mayo, 1999
27
Alta Vista
25
Northern Light
20
Inktom i (Yahoo/Hotbot)
15
Fast
Excite
10
Lycos
9
8
Infoseek
Webcraw ler
Anterior
Siguiente
0,4
9. Altavista
http://altavista.digital.com/
• Tamaño:
Más de 150 millones de
páginas
• Actualización: 2 a 3 días
Interface:
Simple y avanzada. Las dos
permiten búsqueda booleana. La interface
avanzada permite limitar la búsqueda por
fecha.
Anterior
Siguiente
Netscape Hypertext
Docum ent
Haga clic para ver un
cuadro detallado
10. Northern Light
http://northenlight.com/
• Tamaño: 140 millones de páginas. Su
base de datos es una de las 3 más
grandes, junto con HotBot y Alta Vista.
• Indexación:
2 a 3 semanas.
• Interface: Simple y avanzada.
Anterior
Siguiente
Docum ento de
Microsoft Word
11. Hot Bot
http://www.hotbot.com/
• Tamaño:
110 millones de páginas
• Indexación: 1 y 3 días
• Interface:
HotBot ofrece 1 interface
Netscape Hypertext
Docum ent
Anterior
Siguiente
12. Excite
http://www.excite.com/
• Tamaño: Más de 50 millones de
páginas
• Indexación:
12 a 15 días
• Interface: Ofrece 2 interfaces:
Netscape Hypertext
Docum ent
Anterior
Siguiente
13. Infoseek
http://www.infoseek.com/
• Tamaño: 45 millones de
páginas
• Indexación:
Varía. Instantáneo, otras
1 o más días.
• Interface:
Sólo
interface
simple,
pudiendo buscar por ciertos tipos de
documentos Internet (web, news)
Anterior
Siguiente
Netscape Hyperte xt
Docum ent
15. Metabuscadores
Características.
Búsquedas simultáneas en varios buscadores.
Interfase única.
Extracción de información por sitio, dominio, selección
de buscadores.
Limitaciones.
Sujetos al “time-out”, no logran recuperar toda la
información.
Ninguno busca en Northern Light y pocos en Inktomi.
Anterior
Siguiente
16. Directorios
Definición.
Guía temática jerárquica organizada en
directorios,que va de lo general a lo particular.
Compuestos por
la base de datos construida por los URLs remitidos
la estructura jerárquica que facilita la consulta a la
base
Anterior
Siguiente
17. Directorios
Funcionamiento. Se encuentra una página que contiene una
estructura jerárquica de temas.
Al seleccionar un tema se despliega otro grupo de
temas dependiente, más específico. Se sigue así hasta localizar
el tema de interés.
Tipos
Académicos y profesionales
Portales comerciales
Anterior
Siguiente
18. Directorios
Consideraciones:
• Apropiados para búsquedas temáticas generales, más que para temas
muy específicos.
• Menor cantidad de resultados de búsqueda (aciertos) ya que las bases
de datos suelen ser más pequeñas que las de los buscadores
automáticos.
• La mayoría de ellos son compilados y mantenidos por personas, lo que
reduce la posibilidad de recuperar información no relevante. Los
buscadores automáticos indexan cada página de un sitio web, en cambio
en los directorios temáticos se hace un enlace directo a la página principal
del sitio.
• No suelen estar muy actualizados, ya que la actualización es más lenta
por la intervención humana.
• Es lenta para encontrar lo deseado, pues exige varios pasos previos.
• Podemos perdernos al distraernos antes de localizar lo que nos
habíamos propuesto encontrar.
• Existen temas de difícil categorización.
Anterior
Siguiente
19. Directorios
Principales directorios
Directorios más destacados
- Yahoo! (http://www.yahoo.com/)
- Enclyclopedia Britannica's Internet Guide (http://www.eblast.com)
- Infomine: Scholarly Internet Resource Collections (http://lib-www.ucr.edu/)
- Argus Clearinghouse (http://www.clearinghouse.net)
- WWW Virtual Library Group http://www.vlib.standford.edu/overview.html
Anterior
Siguiente
20. Estrategia de búsqueda
Establecer
que se quiere obtener como
resultado de búsqueda
Identificar
palabras claves
Seleccionar
sinónimos y formas variantes de
las palabras claves
Combinar
Anterior
sinónimos y palabras claves
Siguiente
21. Avance de las herramientas
Respecto
a la facilidad de uso
Respecto
al aumento de la potencia de
búsqueda
Mejora
Anterior
de los criterios de relevancia
Siguiente