2. 1.QUE ES UN BUSCADOR /
PRINCIPALES BUSCADORES INDICE:
2.CÓMO OPTIMIZAR LAS
BÚSQUEDAS:
3.SUGERENCIAS: MEJORES
BÚSQUEDAS
4.BÚSQUEDA AVANZADA:
COMANDOS
5.RECURSOS: LOS
METABUSCADORES
6.RECURSOS: LOS AGENTES PULL Desarrollo Corporativo
7. RECURSOS: ARCHIVE.ORG
8.RECURSOS: INTERNET INVISIBLE
9.RECURSOS: LITERATURA GRIS
10.CASOS PRÁCTICOS
3. 1.QUE ES UN BUSCADOR /
PRINCIPALES
BUSCADORES:
Desarrollo Corporativo
4. QUE ES UN BUSCADOR WEB:
Un motor de búsqueda es un sistema informático que busca archivos almacenados en
servidores web gracias a su «spider» (o Web crawler). Un ejemplo son los buscadores de
Internet (algunos buscan sólo en la Web pero otros buscan además en noticias, servicios como
Gopher, FTP, etc.) cuando se pide información sobre algún tema. Las búsquedas se hacen con
palabras clave o con árboles jerárquicos por temas; el resultado de la búsqueda es un listado
de direcciones Web en los que se mencionan temas relacionados con las palabras clave
buscadas.
Tipos:
Hay dos tipos principales de buscadores en la Web:
los Directorios o Índices temáticos (también conocidos como directorios, catálogos o
buscadores por categorías)
los Motores de búsqueda (o buscadores por contenido).
Diferencia:
La diferencia fundamental entre un índice y un motor de búsqueda es que mientras los índices
mantienen su base de datos “manualmente”, utilizando para la inclusión de las direcciones a
sus empleados o a los propios internautas que dan de alta sus páginas, los motores de
búsqueda emplean para ello un robot de búsqueda. Estos robots no son otra cosa que potentes
programas que se dedican a recorrer la Web automáticamente recopilando e indizando todo el
texto que encuentran, formando así enormes bases de datos en las que luego los internautas
hacen sus búsquedas mediante la inclusión de palabras
5. Estadísticas globales de uso de buscadores por
países/SO/Navegador Web: http://gs.statcounter.com
PRINCIPALES BUSCADORES:
Google www.google.com
Yahoo www.yahoo.com
Bing www.bing.com
Aol http://search.aol.com/aol/webhome
Altavista: http://www.altavista.com/
Hotbot: www.hotbot.com
Ask: www.ask.com
Baidu: www.baidu.com
9. SUGERENCIAS MEJORES BÚSQUEDAS (I)
Introduce consultas sencillas. Si estás buscando una empresa determinada, introduce solo
su nombre o todo lo que puedas recordar del nombre. Si estás buscando un concepto, un lugar
o un producto determinados, empieza introduciendo su nombre. Si estás buscando una
pizzería, escribe "pizza" y el nombre de tu ciudad o tu código postal. Para la mayoría de las
consultas, no es necesario utilizar operadores avanzados ni sintaxis poco habitual. Te
recomendamos que utilices términos sencillos.
Piensa en cómo estará escrita la página que estás buscando. Los motores de búsqueda
no son humanos, sino programas que buscan coincidencias entre las palabras que proporcionas
y las páginas de la web.
Utiliza las palabras con mayor probabilidad de aparición en la página. Por ejemplo, en
lugar de escribir [ me duele la cabeza ], escribe[ dolor de cabeza ], ya que es el término que se
utilizará en una página médica. La consulta[ ¿en qué países los murciélagos se consideran un
augurio de mala suerte? ] resulta muy clara para una persona, pero es posible que el
documento que contenga la respuesta no incluya esas palabras. En su lugar, introduce la
consulta [ los murciélagos dan mala suerte en ] o simplemente [ murciélagos mala suerte ], ya
que es probable que ese sea el resultado que aparezca en la página correcta.
10. SUGERENCIAS MEJORES BÚSQUEDAS (II)
Describe lo que necesitas con el menor número de términos posible. El objetivo
de cada una de las palabras de una consulta es restringir la búsqueda lo máximo posible.
Todas las palabras se tienen en cuenta, por lo que cada palabra adicional que se añada
limitará los resultados. Si limitas demasiado la búsqueda, perderás una gran cantidad de
información útil. La principal ventaja de empezar con pocas palabras clave es que, si no
encuentras lo que necesitas, los resultados probablemente te indicarán cuáles son las
palabras adicionales necesarias para definir mejor los resultados en la próxima búsqueda.
Por ejemplo, [ tiempo cancún ] es una forma sencilla de encontrar información
meteorológica y es posible que ofrezca mejores resultados que una consulta más larga,
como [ previsión meteorológica para cancún méxico ].
Selecciona palabras descriptivas. Cuanto más específica sea la palabra, mayor será
la probabilidad de que encuentres resultados relevantes. Las palabras que no son muy
descriptivas, como "documento", "sitio web", "empresa" o "información", no suelen ser
necesarias. Sin embargo, debes tener en cuenta que, aunque la palabra tenga el
significado correcto, si no es el término más utilizado, es posible que no encuentres la
página que necesitas. Por ejemplo, [ tonos famosos ] es una consulta más descriptiva y
más específica que [ sonidos famosos ].
12. COMANDOS (I):
Búsqueda de frases: comillas ("")
Al escribir un conjunto de palabras entre comillas, estás indicando a Google que tenga en
cuenta esas palabras exactas en ese mismo orden sin realizar ninguna modificación. Google ya
tiene en cuenta el orden de las palabras y el hecho de que aparezcan juntas se interpreta como
una clara señal que sólo se ignorará por motivos justificados, por lo que normalmente no será
necesario utilizar comillas. Si insistes en utilizar esta función, es posible que se omitan
resultados relevantes de forma accidental. Por ejemplo, si se utilizan comillas para
buscar [ "Alexander Bell" ], se omitirán las páginas que hagan referencia a Alexander G. Bell.
Búsquedas en un sitio web específico (site:)
Google te permite especificar que los resultados de búsqueda procedan de un sitio web
determinado. Por ejemplo, la consulta[ iraq site:elpais.com ] sólo devolverá páginas
relacionadas con Iraq cuya fuente sea elpais.com. Consultas más sencillas, como [ iraq
elpais.com ] o [ iraq El País ], suelen ser igual de correctas, aunque también pueden devolver
resultados de otros sitios que mencionan El País. También puedes especificar una clase entera
de sitios (por ejemplo,[ iraq site:.gov ] sólo devolverá resultados de un dominio .gov y [ iraq
site:.iq ] sólo devolverá resultados de sitios iraquíes).
Términos que desees excluir (-)
Si incluyes un signo menos delante de una palabra, estarás indicando que no quieres que
aparezcan páginas que contengan ese término en los resultados. El signo menos debe incluirse
delante de la palabra y debe ir precedido de un espacio. Por ejemplo, en la consulta [ software
anti-virus ], el signo menos se utiliza como un guión y no se interpretará como un símbolo de
exclusión. Un ejemplo: tiendas –elcorteingles (busco tiendas, pero no las del Corte Ingles)
13. COMANDOS (II):
Rellenar espacios en blanco (*) mientras que en la consulta [ anti-virus -software ] se
buscarán las palabras "anti-virus", pero se excluirán las referencias al término "software".
Puedes excluir todas las palabras que desees incluyendo el signo - delante de ellas (por
ejemplo, [ jaguar -coches -natación -sincronizada ]). El signo - no sólo se utiliza para excluir
palabras. Por ejemplo, puedes incluir un guión delante del operador "site:" (sin espacio) para
excluir un sitio específico de los resultados de búsqueda. (*)
El símbolo * o asterisco, es una función poco conocida que puede resultar muy útil. Si incluyes
un asterisco * en una consulta, estarás indicando a Google que intente considerar ese símbolo
como un marcador de posición de términos desconocidos y que, a continuación, busque los
mejores resultados. Por ejemplo, la búsqueda [ Google * ] devolverá resultados de muchos
productos de Google (puedes consultar páginas y páginas de productos). La consulta[ Obama
votó * el proyecto de ley * ] devolverá resultados sobre diferentes votos relacionados con
distintos proyectos de ley. Ten en cuenta que el operador * sólo funciona con palabras
completas, no con términos incompletos.
Búsqueda exacta (+)
Google utiliza sinónimos de forma automática, por lo que encuentra páginas que incluyen
términos relacionados con la consulta (por ejemplo, puede encontrar "antivirus" para la
consulta [ anti-virus ] (con guión) o "historia española" para la consulta[ historia de España ]).
Sin embargo, en ocasiones, Google devuelve demasiados resultados y muestra sinónimos que
no deseas que aparezcan. Si incluyes un signo + delante de una palabra (ten en cuenta que no
debes añadir un espacio detrás del símbolo +), estarás indicando a Google que busque
resultados exactos de la palabra que has escrito. Puedes conseguir el mismo resultado si
escribes una única palabra con comillas dobles.
14. COMANDOS (III):
Operadores OR, AND:
De forma predeterminada, Google tiene en cuenta todas las palabras de una búsqueda. Si
quieres especificar una o varias palabras en los resultados de búsqueda, puedes utilizar el
operador OR (ten en cuenta que debes escribir "OR" con mayúsculas). Por ejemplo, la
consulta [ Real Madrid 2004 OR 2005 ] devolverá resultados de uno de esos dos años, mientras
que la consulta [ Real Madrid 2004 2005 ] (sin el operador OR) mostrará páginas en las que se
incluyan ambas fechas. El operador OR se puede sustituir por el símbolo |. (AND, que significa
'y', es el operador predeterminado, por lo que no es necesario incluirlo).
Excepciones:
No es muy común que una búsqueda sea absoluta. Los motores de búsqueda utilizan una serie
de técnicas que permiten imitar el pensamiento de los usuarios y aproximarse a su
comportamiento. De esta forma, la mayoría de las reglas tienen excepciones. Por ejemplo,
Google no interpretará [ hotel or blanc ] como una consulta con un operador OR, sino como
una frase que coincide con el nombre de un hotel. Para la consulta [ 34 * 87 ] , Google
mostrará resultados matemáticos en lugar de utilizar el operador de asterisco. En ambos
ejemplos, los resultados obtenidos cumplen el objetivo de la consulta. A continuación se indica
una lista de excepciones a algunas reglas y directrices incluidas en este documento:
15. COMANDOS (IV):
Excepciones a la regla "todas las palabras son importantes“:
Las palabras comunes, también denominadas "palabras vacías", como artículos y preposiciones,
se suelen ignorar. Sin embargo, esta excepción también tiene sus propias excepciones. Es
probable que la búsqueda [ el mundo ] haga referencia al periódico, mientras que la
consulta [ mundo ] puede referirse simplemente al planeta Tierra, por lo que Google no
ignorará el artículo "el" de la primera consulta.
Los sinónimos pueden sustituir a algunas palabras de la consulta original. (Si añades un
signo + delante de una palabra, inhabilitarás el uso de sinónimos).
Es posible que una palabra específica no aparezca en una de las páginas de resultados si
existen suficientes referencias que demuestran que esa página es relevante. Estas referencias
pueden proceder del análisis lingüístico realizado por Google o de otras muchas fuentes. Por
ejemplo, la consulta [ vista satélite de Mallorca ] devolverá imágenes de satélite de páginas
que no incluyen la palabra "vista".
Algunos signos de puntuación no se ignoran:
No se ignoran términos populares, en cuyo nombre se incluye algún signo de puntuación, que
tienen un significado específico (por ejemplo, [ C++ ] o [ C# ] son los nombres de dos
lenguajes de programación).
El signo del dólar ($) se utiliza para indicar precios (por ejemplo, las consultas [ nikon
400 ] y [ nikon $400 ] devolverán resultados diferentes).
En ocasiones, el guión - indica que dos palabras están muy relacionadas entre sí, a menos que
haya un espacio delante y detrás de este símbolo, en cuyo caso se considera un signo menos.
El guión bajo _ no se ignora cuando conecta dos palabras (por ejemplo, [ página_web ]).
16. COMANDOS (IV):
Excepciones a la regla "todas las palabras son importantes“:
Las palabras comunes, también denominadas "palabras vacías", como artículos y preposiciones,
se suelen ignorar. Sin embargo, esta excepción también tiene sus propias excepciones. Es
probable que la búsqueda [ el mundo ] haga referencia al periódico, mientras que la
consulta [ mundo ] puede referirse simplemente al planeta Tierra, por lo que Google no
ignorará el artículo "el" de la primera consulta.
Los sinónimos pueden sustituir a algunas palabras de la consulta original. (Si añades un
signo + delante de una palabra, inhabilitarás el uso de sinónimos).
Es posible que una palabra específica no aparezca en una de las páginas de resultados si
existen suficientes referencias que demuestran que esa página es relevante. Estas referencias
pueden proceder del análisis lingüístico realizado por Google o de otras muchas fuentes. Por
ejemplo, la consulta [ vista satélite de Mallorca ] devolverá imágenes de satélite de páginas
que no incluyen la palabra "vista".
Algunos signos de puntuación no se ignoran:
No se ignoran términos populares, en cuyo nombre se incluye algún signo de puntuación, que
tienen un significado específico (por ejemplo, [ C++ ] o [ C# ] son los nombres de dos
lenguajes de programación).
El signo del dólar ($) se utiliza para indicar precios (por ejemplo, las consultas [ nikon
400 ] y [ nikon $400 ] devolverán resultados diferentes).
En ocasiones, el guión - indica que dos palabras están muy relacionadas entre sí, a menos que
haya un espacio delante y detrás de este símbolo, en cuyo caso se considera un signo menos.
El guión bajo _ no se ignora cuando conecta dos palabras (por ejemplo, [ página_web ]).
17. COMANDOS (V):
Conversión de unidades: Google cuenta con un sistema muy eficaz para convertir cualquier
unidad con tan solo escribirlo en el buscador. Simplemente escribe la unidad que estas tratando
de convertir y la unidad a la que deseas convertirlo y dale enter en el buscador. Ejemplo: 10
metros en pulgadas o cuantos litros en un galón
Sitios bloqueados: Si estás teniendo problemas para entrar en un sitio bloqueado,
simplemente escribe cache:(dirección del sitio web) y google te enviara a la copia del cache del
sitio que estas buscando.
Buscar un formato en específico: (filetype o ext.) Si lo que quieres encontrar viene en un
formato en específico, por ejemplo PDF, simplemente escribe filetype:pdf y tu busqueda.
Ejemplo: filetype:pdf marketing
Buscar dentro de un sitio en específico: (site)Si ya sabes que lo que quieres está en un
sitio en especial, simplemente escríbelo como en el ejemplo: site:zavordigital.com marketing
Buscar en un tipo de sitio: (site:..)Si quieres hacer una búsqueda en algun tipo de sitio
específico como en una página de gobierno de México, escribe: site:gob.mx marketing
18. COMANDOS (VI):
Calculadora instantanea: Tambien puedes hacer operaciones, simplemente escribe en el
buscador la operación simple, ejemplo: 11*2+10
Términos en la dirección Url: Esta opción es muy útil para blogs por ejemplo, ya que
muchos tienen en su dirección url, el año de publicación. simplemente escribe: inurl:2010
marketing
Recibir la hora exacta: Puedes saber cual es la hora exacta de cualquier lugar con tan solo
escribir “time” antes de la ciudad, ej: time logroño (funciona solo en
http://www.google.com/ncr)
Intervalo: Cuando tenemos que buscar resultados para una serie de diferentes años o
números, Google permite introducir una búsqueda del tipo “Número..Número”, por ejemplo:
Resultados de Telefónica 2007..2010, que nos devolverá resultados que contengan 2007, 2008,
2009 y 2010.
Símbolo “~”: se usa delante de una palabra para significar que queremos buscar esa palabra
u otra similar, de esta forma, si buscamos: ~logros científicos argentinos, nos devolverá
resultados sobre “logros” pero también, por ejemplo, sobre “avances”.
Tipos de docs: si buscamos gestión talento filetype:ppt obtendremos solamente documentos
de PowerPoint y si la búsqueda es gestión talento filetype:pdf, serán documentos en formato
PDF.
Tipos de archivo permitidos: torrent, pdf, ps, mw, mks, wps, wdb, doc, wri, rtf, swf, ans, txt,
wk1, wk2, wk3, wk4, wk5, wki, wks y wku
19. COMANDOS (VII):
Definiciones: el comando define: nos devuelve varias definiciones de un término
Related: Otra posibilidad es buscar sitios webs relacionados con uno dado, por ejemplo, la
búsqueda related: www.iadb.org proporcionará sitios webs relacionados con el Banco
Interamericano de Desarrollo
id: y info: Nos mostrará alguna información que tenga Google sobre una Web
ejemplo info:www.elmundo.es
cache:Nos muestra la caché de un dominio o página Web
ejemplo cache:www.elmundo.es
link: Nos muestra los enlaces de un dominio o página Web
ejemplo link:www.elmundo.es o ejemplo link:www.elmundo.es - site:elmundo.es
Combinado con -site: quitamos los enlaces propios
Nota: El comando link en Google no devuelve todos los datos que Google conoce. El comando
link: en Yahoo parece ser más fiable
20. COMANDOS (VIII):
allinanchor: Nos muestra páginas que tienen la keyword o keywords en el texto de los
enlaces que apuntan a ella. Ejemplo allinanchor:mejor restaurante de Madrid
allintext: Nos muestra sólo páginas que tienen la keyword o keywords en el texto de la
página. Ejemplo allintext:mejor restaurante de Madrid
allintitle: Nos muestra sólo páginas que tienen la keyword o keywords en el título de la
página. ejemplo allintitle:mejor restaurante de Madrid
allinurl: Nos muestra sólo páginas que tienen la keyword o keywords en la URL de la
página. ejemplo allinurl:mejor restaurante de Madrid
inanchor: Nos muestra sólo páginas que tienen la keyword o keywords en el texto de los
enlaces que apuntan a ella. Ejemplo Madrid inanchor:mejor restaurante
Nota: Los archor text es el texto que aparece subrayado como link que es tomado muy en
cuenta por los robots de los buscadores para indexar las páginas.
22. QUE SON LOS METABUSCADORES:
El metabuscador es un sistema que localiza información en los motores de búsqueda mas
usados y carece de base de datos propia y, en su lugar, usa las de otros buscadores y muestra
una combinación de las mejores páginas que ha devuelto cada uno. Un buscador normal
recopila la información de las páginas mediante su indexación, como Google o bien mantiene
un amplio directorio temático, como Yahoo. La definición simplista sería que un metabuscador
es un buscador en buscadores.
Es muy curioso que se utilicen solo los buscadores como google, para obtener ingentes
cantidades de información en detrimento de los metabuscadores, los cuales nos ofrecen más
resultados de una manera organizada, ante el usuario.
EJEMPLOS DE METABUSCADORES:
En ingles:
http://www.dmoz.org (es un proyecto colaborativo multilingüe en el que editores voluntarios
listan y categorizan enlaces a páginas web).
http://www.xaarky.es/ (español, existe un plugin para el navegador firefox)
http://www.metacrawler.com (Google, Yahoo, Bing)
http://www.dogpile.com (Google, Yahoo, Bing)
http://search.yippy.com
http://vivisimo.com/ un buscador que organiza los resultados de las búsquedas en grupos
http://kartoo.com (búsqueda semántica)
http://www.search.com/
http://www.techxtra.ac.uk/ (metabuscador de ingeniería, matemáticas e informática)
24. QUE SON LOS AGENTES DE BUSQUEDAS (AGENTES PULL):
Permiten mecanizar las tareas de vigilancia de forma rutinaria. Es decir, pueden vigilarse una
serie de webs sin tener que mirarlas cada día o cada semana.
Con estos agentes pull es posible montar un servicio de vigilancia: se enumeran las webs que
se desean vigilar y estos agentes avisan con un mensaje cada vez que se ha producido una
variación en una web determinada. Eso es de gran utilidad para las empresas. Así pues, la
vigilancia en Internet tiene un potencial enorme.
EJEMPLOS DE AGENTES DE BÚSQUEDAS (AGENTES PULL):
Zotero www.zotero.com (plugin para firefox) :
Es una ayuda para recopilar, organizar, citar y compartir fuentes de investigación. Es una
herramienta de investigación única que detecta de forma automática el contenido y la añade a
una biblioteca personal con un solo clic.
Copernic: www.copernic.com/en/products/agent/index.html
A partir de una sola consulta, Copernic Agent proporciona mejores resultados del motor de
búsqueda mediante la consulta de múltiples motores de búsqueda a la vez, la combinación de
sus resultados, la eliminación de duplicados y mantener sólo lo mejor de la información
obtenida de los motores de búsqueda a consultar. Número de motores de búsqueda accesibles
y fuentes de información: mas de 900. Tiene una versión gratuita y una de pago.
26. QUE ES WWW.ARCHIVE.ORG
QUE ES: Internet Archive es un sitio web y una organización sin ánimo de lucro destinada a la
preservación de historiales Web y recursos multimedia. Creada en 1996, se encuentra
en el Presidio de San Francisco (California). La colaboración que llevó a cabo la amplitud de esa
página fue gracias a Alexa Internet y de otros colaboradores aparte de la colaboración de la
Biblioteca del Congreso. Tiene una gran cantidad de archivos misceláneos como audio, video y
texto, algunos de ellos en dominio público, o de licencias a base del Creative Commons o
cualquier otra licencia que permita la distribución.
En otra parte para volver atrás en el tiempo existe la Wayback Machine que tiene 40 mil
millones de páginas grabadas desde 1996 a partir de los inicios de la actual Internet.
28. QUÉ ES INTERNET INVISIBLE:
Se conoce como Internet profunda o Internet invisible (en inglés: Deepnet, Invisible Web, Dark
Web o Hidden Web) a todo el contenido de Internet que no forma parte del Internet
Superficial, es decir, de las páginas indexadas por las arañas de los motores de búsqueda de
Internet. Esto es debido a las limitaciones que tienen las arañas para acceder a todas las webs
por distintos motivos.
CAUSAS:
•Páginas protegidas con contraseña
•Bases de datos de bibliotecas y universidades
•Documentos en formatos no indexables
•Enciclopedias, diccionarios, revistas en las que
• para acceder a la información hay que interrogar
• a la base de datos (Por ejemplo RAE)
Muchos buscadores de este tipo han fracasado: www.internetinvisible.com
Buscadores de Internet Invisible: http://aip.completeplanet.com
http://www.filecrop.com/
30. QUÉ ES LA LITERATURA GRIS:
La literatura gris ES EL conjunto de documentos, de muy diversa tipología, que no son
editados o que se publican pero distribuyen a través de canales poco convencionales (tesis
doctorales, actas de congresos, informes de investigación, memorias, proyectos, patentes,
normas, traducciones científicas, etc.), por lo que suelen plantear problemas especiales para
conocerlos y localizarlos.
INICIATIVAS:
EAGLE:
La Unión Europea constituyó la “European Association for Grey Literature Explotation (EAGLE)
http://www.opengrey.eu
ARXIV:
Creado por la Universidad e Cornell. Es útil para consultar materiales de matemáticas, quimica
e ingeniería:
http://arxiv.org
32. CASOS PRÁCTICOS:
1. Buscar webs relacionadas con los concursos públicos: (dos opciones)
2. Buscar páginas que enlazan con la web de ASV:
3. Buscar en Internet powerpoints relacionados con el tema de Desarrollo
Corporativo:
4. Buscar en la web de ASV documentos en formato PDF referentes al Tanatorio de
Campanar:
33. CASOS PRÁCTICOS:
1. Buscar webs relacionadas con los concursos públicos: (dos opciones)
inurl: concursos publicos (diferencias usando +)
Related: concursos publicos (diferencias usando +)
2. Buscar páginas que enlazan con la web de ASV:
inlink:www.grupoasv.com
3. Buscar en Internet powerpoints relacionados con el tema del desarrollo
corporativo:
Filetype:ppt +desarrollo +corporativo (“desarrollo corporativo”) ver Nº
4. Buscar en la web de ASV documentos en formato PDF referentes al Tanatorio de
Campanar:
site:www.grupoasv.com filetype:pdf