El documento habla sobre el nuevo motor de búsqueda de Google llamado Knowledge Graph, el cual ofrece resúmenes y hechos clave sobre temas en el lado derecho de los resultados de búsqueda. Knowledge Graph entiende el significado y contexto de las búsquedas de los usuarios para proporcionar respuestas más relevantes en lugar de largas listas de resultados. El motor de búsqueda semántico representa un paso hacia delante en la generación de búsquedas inteligentes.
Careaga en busca del conocimiento encuentraolo con knowledge graph jun2012
1. “En Busca del Conocimiento: Encuéntralo con Knowledge Graph”
Ana Lilia Careaga Mercadillo, Junio de 2012
Abstract
When you search, you’re not just looking for a webpage. You’re looking to get
answers, understand concepts and explore knowledge. Google has unveiled the
“Knowledge Graph” search engine, which they’re calling the “first step in the next
generation of search.” The initial release was launched on May 16 th 2012 and it is
gradually rolling out to U.S. English users and consists of three elements:
Links to different sets of results based on contextual meanings for any
given search term
Topic summaries with key facts visible in the sidebar of the SERPs
(Search Engine Results Page)
“Information boxes” that offer additional information in the SERPs
sidebar based on popular related queries.
---------------------------------------------------------------------------------------------------------
Introducción
La única vez que tuve la oportunidad de ver y escuchar a Carlos Fuentes 1
en
persona fue en el homenaje que se le hizo por su 80 aniversario en la Sala
Nezahualcóyotl del Centro Cultural Universitario (Noviembre 2008) con el coloquio
“El arte de narrar” . En medio del tumulto y expectación, la Sala Nezahualcóyotl
se vio rodeada de jóvenes entusiasmados y ansiosos por ver de cerca a dos de
los escritores más importantes de la lengua española: Carlos Fuentes y Gabriel
García Márquez (Premio Nobel Literatura, 1982). Afuera la espera de los jóvenes
por conseguir un lugar no alteró su ánimo y algunos llevaban consigo a Aura y la
edición especial de Cien Años de Soledad con la esperanza de ser autografiados
en algún momento a pesar de confesar, algunos, nunca haberlos leído. Ante la
insistencia de los jóvenes se abrieron las puertas, pero no pasó mucho tiempo
cuando los gritos de emoción se cortaron de tajo porque no había cabida para
todos y fue necesario cerrarlas. El rector de la UNAM, José Narro, salió para
calmarlos y agradecer su presencia e interés por los escritores y unos cuantos
segundos después, regresó al recinto para dar inicio al evento. El programa del
1
Carlos Fuentes Macías (Panamá, 11 de Noviembre 1928- † México DF, 15 de mayo 2012 fue uno de
los escritores más conocidos de finales del siglo XX , candidato al Premio Nobel de Literatura en reiteradas ocasiones y
autor de novelas y ensayos, entre los que destacan Aura, La muerte de Artemio Cruz, La región más transparente y
Terra Nostra
2. coloquio “El arte de narrar” inscrito por los 80 años de vida y 50 de la primera
edición de su novela “La región más transparente” anunciaba originalmente la
participación de Gabriel García Márquez como Presidente Honorario y a Sealtiel
Alatriste como presidente de la mesa. Sin embargo, de última hora invirtieron los
papeles y Alatriste tomó la palabra. En la mesa también participaron los escritores
Nélida Piñón, Tomás Eloy Martínez, Sergio Ramírez, Juan Goytisolo y la Nobel de
Literatura sudafricana Nadine Gordimer. Después de la apertura fue Carlos
Fuentes, quien con su notable elegancia y sonrisa en el rostro, subió al podio
desde las butacas de las primeras filas de esta sala para hablar del arte de
narrar. Se veía contento y agradecido y dirigió sus palabras especialmente a los
jóvenes. Con la fuerza característica con la que solía enhebrar sus palabras y su
magisterio en el arte de narrar nos hizo sentir la belleza de la escritura y el
placer para el que la lee. Su entusiasmo no solo por la vida sino por la literatura
nos encendió y la elegancia estilística de sus palabras narrando nos hizo ver cómo
la literatura nos puede servir para ir “en contra de toda oligarquía económica,
para defendernos de los atropellos que día a día nos machacan”. Recuerdo
que me sentí pletórica y dichosa al escuchar estas palabras que ahora, al
recordarlas, he vuelto a saborear. Él ya no está aquí pero sus pensamientos
trazados e hilvanados cuidadosamente están engarzados en toda su obra literaria.
Su escritura fue un regalo y leerla es el mejor homenaje que se le puede dar.
Desde muy joven, Carlos Fuentes se dio cuenta que leer y escribir eran tareas
indispensables para quienes estaban decididos a comprender el mundo. El
lenguaje junto con el arte, afirmaba Fuentes en numerables ocasiones, son los
instrumentos idóneos para saber quiénes somos y quienes queremos ser. Él
insistía que un lenguaje deficiente y un mal manejo de las palabras nos genera
vacío e improductividad. Carlos Fuentes no sólo nos dejó su gran literatura sino
que nos mostró con su ejemplo que la lectura y la escritura son fuentes del
conocimiento y de acción. Libros como “Las buenas consciencias” o “La
región más transparente” nos hacen una invitación a no quedarnos en la orilla
de las realidades dadas sino abrir nuestro pensamiento a nuevas perspectivas.
Porque, de acuerdo al pensamiento de Fuentes, la literatura es siempre “un
manantial del que brota transparencia y en el que la música de las palabras
nos muestra que el mundo está cargado de sorpresas” y es, sin duda alguna,
más excepcional y rica de lo que pensamos . A través de sus novelas, Fuentes
nos describió un nuevo universo del saber donde el conocimiento es capaz de
multiplicarse a través de la imaginación literaria. Al acercarse a un libro como
Aura, los lectores pueden recorrer un profundo sendero donde se acompaña a un
personaje pasear por los caminos más oscuros para rescatar a su amada de la
muerte. "Toda literatura dice lo que no puede decirse de otra forma", y “es
por ello que la novela no sólo refleja realidad, sino que crea una realidad
nueva, una realidad que antes no estaba allí… “2
2
Fuentes, Carlos “En esto creo” pp 90-94 2002
3. Carlos Fuentes afirmó varias veces que serán los jóvenes quienes tendrán que
enmendar los errores de generaciones pasadas, caracterizadas por un enorme
individualismo y ambición. Indudablemente la tecnología tendrá un papel esencial ,
no solo en la comunicación sino en la movilización social que nos traerán los
cambios, pero no obstante, decía Fuentes, que además de tecnología, se
requiere tener una comprensión y conocimiento del mundo para poderlo
entonces transformar. Y esa comprensión indispensable para la transformación
podía iniciarse a partir de la novela porque “a través de la imaginación y el
lenguaje, la novela convierte el pasado, en memoria, y el futuro, en deseo.
Pero ambos ocurren hoy, en el presente del lector que, leyendo, recuerda y
desea. A través de las novelas, nuestras almas se sumergen dentro lo real a
través de lo imaginario para descubrir lo que maravillosamente se esconde
en las peripecias de lo cotidiano. La novela constituye un tipo concreto de
conocimiento social sobre el mundo al mismo tiempo que es capaz de
reinventarlo dentro de nuestros sueños”3
Pero para tener ese concreto conocimiento social del mundo al que nos
introduce no solo la novela sino la realidad misma es imprescindible primero tener
acceso a la información. Sin información NO hay conocimiento, pero
información no es conocimiento. El conocimiento es reflexión sobre la
información, es capacidad de discernimiento y de discriminación, es
jerarquizar y ordenar. Pero esta capacidad no se recibe como información y es
necesario desarrollarla porque todo es información menos el conocimiento que
nos permite aprovechar esa información.
El último cuarto del Siglo XX quedó en la historia como un punto de referencia en
la transformación de la sociedad y la economía porque aquí se dieron grandes
avances tecnológicos, entre los más importantes está la llegada de Internet, la
cual, como todos sabemos, abrió opciones no sólo en la generación,
almacenamiento e intercambio de la información, sino también en la generación
de conocimiento .La información es , entonces, el insumo más importante
en la sociedad basada en ese conocimiento capaz de transformar. Y para
obtener información actualmente accedemos a la web mediante el uso de los
motores de búsqueda como Google , los cuales en realidad aún son poco
inteligentes porque en lugar de contestar una pregunta nos muestran una lista casi
interminable de links con documentos a veces muy lejanos de la información que
estamos buscando. Lo que la mayoría de las personas quieren son respuestas y
no largas listas de documentos. Lo anterior se debe a que los motores de
búsqueda operan bajo el criterio de la sintaxis y no tienen la inteligencia para
comprender la semántica4
de las palabras claves que inscribimos en el buscador.
Los motores de búsqueda funcionan enviando hordas de “arañas robóticas”
(web spiders) que se desplazan a través de la red indexando las palabras clave
en cada pagina que encuentran a su paso y en realidad, el resultado de la
3
Fuentes, Carlos “En esto creo” pp 90-94 2002
4
El término semántica se refiere a los aspectos del significado, sentido o interpretación de una palabra, expresión o
inclusive de algún símbolo o representación formal. Dentro de la lingüística, la semántica, junto con la sintaxis (forma) y
la pragmática (contexto) son los aspectos que intervienen en una expresión con significado
4. búsqueda nos muestra un índice de dichas páginas en base al ordenamiento que
está establecido por un algoritmo desarrollado por Google llamado Page Rank.
Sin embargo, estos motores de búsqueda han ido evolucionando para
comprender el significado de nuestras palabras, es decir, para convertirse en
verdaderos buscadores semánticos que sean capaces de devolvernos
resultados que realmente respondan al significado de nuestra pregunta.
Knowledge Graph, es uno de varios buscadores semánticos que fue anunciado el
pasado Mayo 16, 2012, casi coincidiendo con la partida de Carlos Fuentes.
Knowledge Graph nos facilitará las búsquedas para la obtención de la
información que analizará objetos y no sólo líneas de texto. Esta nueva
funcionalidad, se ha empezado a probar en Estados Unidos y se irá extendiendo
a otros países.
¿Quieres saber más de Knowledge Graph?
Continua leyendo…..
La Web Semántica
Hoy casi todo está representado de una u otra forma en la web, y con la ayuda de
un buen buscador, podemos encontrar información sobre casi cualquier cosa que
necesitemos. La web está cerca de convertirse en una enciclopedia universal
del conocimiento humano. Por otra parte la web nos permite realizar diferentes
actividades de nuestra vida diaria con una comodidad, economía y eficiencia sin
precedentes: sin movernos de casa podemos comprar todo tipo de productos y
servicios, gestionar una cuenta bancaria, buscar un restaurante, consultar la
cartelera, leer la prensa, localizar a una persona, inscribirnos en la universidad o
trabajar desde casa .No obstante, en este panorama tan favorable hay espacio
para mejoras. Por ejemplo, el enorme tamaño que ha alcanzado la web, a la vez
que es una de las claves de su éxito, hace que algunas veces la búsqueda de
información sea una tarea compleja. La asombrosa eficacia de los buscadores
actuales tiene también sus límites. Por ejemplo, si buscamos un “artículo sobre
Carlos Fuentes”, el resultado de la búsqueda nos arroja un sin número de artículos
de Carlos Fuentes pero ninguno que se trate del escritor. Este ejemplo es el
síntoma de una causa común: la falta de capacidad de las representaciones en
que se basa la web actual para expresar significados. Los contenidos y servicios
5. en la web se presentan en formatos (p.ejem. HTML) e interfaces (p.ejem.
formularios) comprensibles por personas, pero no por máquinas.5
La Web Semántica ( Berners-Lee, 2001) propone superar las limitaciones de la
web actual mediante la introducción de descripciones explícitas del significado, la
estructura interna y la estructura global de los contenidos y servicios disponibles
en la WWW. Frente a la semántica implícita, el crecimiento caótico de recursos y
la ausencia de una organización clara de la web actual, la web semántica aboga
por clasificar, dotar de estructura y anotar los recursos con semántica explícita
procesable por máquinas.
Entonces la Web Semántica puede ser entendida como una web extendida,
dotada de un mayor significado. Se desarrolla con lenguajes universales que
permitirán a los usuarios encontrar respuestas a sus preguntas de una forma más
rápida y sencilla gracias a la mejor estructuración de la información. Pero para
que las máquinas puedan llevar a cabo esta función necesitan acceder a
colecciones estructuradas de información y a formalismos actualmente basados
en lógica matemática que les permitan tener un cierto grado de razonamiento
automático. Estas necesidades pueden cubrirse utilizando “ontologías”6
y
“metadatos” 7
para anotar y organizar los recursos Web. Para lograr lo anterior,
es necesario hacer toda una restructuración de las páginas Web y emplear nuevos
lenguajes y herramientas. Algunos lenguajes desarrollados para la Web
Semántica son el lenguaje estructurado XML (Extensible Markup Language) y
el lenguaje RDF (Resource Description Framework) que dotan a cada página,
a cada archivo y a cada recurso o contenido de la red, de una lógica y un
significado permitiendo así a las computadoras y buscadores conocer el
significado de la información que manejan con el fin de que ésta pueda no sólo ser
presentada en pantalla, sino también que pueda ser integrada y reutilizada. Estos
lenguajes deben ser estandarizados y formalizados para que su uso sea universal,
reutilizable y compartido a lo largo y ancho de la web. Adicionalmente, se necesita
otro lenguaje común basado en web, con suficiente capacidad expresiva y de
razonamiento para representar la semántica de las ontologías. De esta forma, la
utilización de lenguajes tales como OWL (Ontology Web Language) son un paso
más en la consecución de la Web Semántica. Mediante este lenguaje es posible
crear una ontología o biblioteca de vocabularios descriptivos/semánticos,
definidos en formato RDF y ubicados en la Web para determinar el
significado contextual de una palabra por medio de la consulta a la ontología
apropiada.
5
Castells, Pablo. “La Web Semántica”
6
El término ‘ontología’ (utilizado en filosofía para hablar acerca de una ‘teoría sobre la existencia’) ha sido adoptado por la
comunidad de investigadores de inteligencia artificial para definir una categorización y las relaciones entre sus términos
7
Debido a la gran diversidad y volumen de las fuentes y recursos en Internet, se hizo necesario establecer un mecanismo
para etiquetar, catalogar, describir y clasificar los recursos de la Web con el fin de facilitar la posterior búsqueda y
recuperación de la información. Este mecanismo los constituyen los llamados metadatos (datos de datos).Un metadato no
es más que un dato estructurado sobre la información que hay en la Web
6. Consecuentemente, mediante el empleo de todos estos lenguajes y algunas
herramientas más, los agentes inteligentes y programas autónomos pueden
rastrear la web de forma automática y localizar, exclusivamente, las páginas que
se refieran a la palabra buscada con el significado y concepto precisos con el que
interpretemos ese término. Por lo tanto, para potenciar el uso de ontologías en
la web, se necesitan aplicaciones específicas de búsqueda de ontologías
(buscadores semánticos), que permitan realizar una búsqueda específica y
contextual.8
Resumiendo, la tecnología anteriormente descrita se ha creado para hacer posible
la Web Semántica y ésta incluye lenguajes para la representación de ontologías,
lenguajes de consulta, entornos de desarrollo, módulos de gestión
(almacenamiento, acceso, actualización) de ontologías, módulos de visualización,
conversión de ontologías, librerías y otras herramientas que a continuación se
muestran esquemáticamente:
Fuente: The Semantic Web “layer cake” as presented by Tim Berners-Lee
UNICODE: Es un estándar cuyo objetivo es proporcionar el medio por el cual un
texto en cualquier forma e idioma pueda ser codificado para el uso informático.
URI: Son cadenas que permiten acceder a cualquier recurso de la web. En la Web
Semántica las URIs son las encargadas de identificar objetos.
XML: Provee una sintaxis elemental para las estructuras de contenidos dentro de
documentos.
XMLSchema: Es un lenguaje para proporcionar y restringir la estructura y el
contenido de los elementos contenidos dentro de documentos XML.
RDF: Es un lenguaje simple para expresar modelos de los datos, que refieren a los
objetos “recursos” y a sus relaciones.
RDFSchema: Es un vocabulario para describir propiedades y clases de recursos
RDF-based, con semántica para generalizar jerarquías de las propiedades y clases.
OWL: Es un mecanismo para desarrollar temas o vocabularios específicos en los
que podamos asociar esos recursos.
Logic: Además de ontologías se precisan reglas de inferencia.
Proof: Se intercambiarán “pruebas” escritas en el lenguaje unificador de la Web
Semántica.
Trust: Comprobación de forma exhaustiva la confianza de las fuentes de información
Digital Signature: Se emplea para verificación de la confianza de fuentes
8
Careaga, Ana Lilia “ Web 3.0: Más allá de Lucy y la Web Semántica ”INGENET. Enero , 2010
7. Qué es un buscador semántico
Un buscador semántico es aquel que realiza el rastreo atendiendo
al significado del grupo de palabras que ha introducido el usuario al realizar su
búsqueda, para devolverle resultados que realmente respondan al significado de
su pregunta. ¿Cómo? Rastreando en las etiquetas que se han estructurado de
un modo semántico y no en los campos habituales que tienen en cuenta los
algoritmos de los buscadores tradicionales (como Google o Yahoo) basados en
cadenas de palabras introducidas en las etiquetas de encabezamientos (h1, h2…),
o en la etiqueta título, en los links apuntan hacia esa web.
Knowledge Graph
Google presentó, de nueva cuenta, un cambio a su motor de búsqueda, con lo
que espera hacer más eficiente su sistema de entrega de resultados a sus
usuarios. La nueva función se deriva de una base de datos creada por Google
sobre más de 500 millones de personas, lugares y cosas solicitadas
frecuentemente para proveer un sumario de información sustancial que acompañe
los resultados principales de la búsqueda. El cúmulo de información, al que
Google denomina Knowledge Graph, tiene como fin proveer respuestas tan
rápida y concisamente como sea posible, a fin de que los usuarios no tengan que
hacer una selección de entre los vínculos presentados como resultados.
Google pasó los últimos dos años analizando minuciosamente la enciclopedia
virtual Wikipedia, el mapa de datos de la CIA y otras fuentes para expandir una
base de datos de 12 millones de entradas que obtuvo como parte de la compra de
Metaweb en 2010.
La presentación de Knowledge Graph se dio una semana después de que la
segunda máquina de búsqueda más grande, Bing de Microsoft Corp., anunció
un ajuste que destacará más información extraída de Facebook, algo que por lo
general no surge en los resultados de Google.
Knowledge Graph mejora el buscador de Google en 3 formas9
:
Encontrar lo que buscamos (Find the right thing) : Ahora podremos
indicarle a Google los resultados que más nos interesen en función de
nuestra búsqueda. Porque a veces el lenguaje puede ser muy confuso y
mostrarnos más de lo que necesitamos. Ahora podremos elegir de qué
queremos ver los resultados exactamente. Y lo veremos en la parte
derecha de la pantalla.
9
Citado en http://www.google.com/insidesearch/features/search/knowledge.html y en
http://searchenginewatch.com/article/2175783/Google-Launches-Knowledge-Graph-First-Step-in-Next-Generation-Search
8. Encontrar un contenido más resumido (Get the best summary): esta
función permite tener resultados muy concretos y resumidos de búsquedas
del tipo personajes, actores, etc. Podremos ver en la columna derecha
contenido tipo artículo de wikipedia .
Mostrar contenido más allá (Go deeper and broader): podremos disponer
de más datos adicionales relacionados con la búsqueda que hicimos
mediante los “information boxes”. Por ejemplo, si buscas por Matt
Groening, creador de los Simpsons, podrás saber en qué se inspiró para
sacar los nombres de los personajes. Google intenta adaptarse y
adelantarse a lo que posiblemente buscarás después.
Si deseas saber más detalles sobre el funcionamiento de Knowledge Graph, te
recomiendo ver este video:
http://www.youtube.com/watch?v=mmQl6VGvX-c&feature=youtu.be
9. Otros Buscadores Semánticos:
1. Bing: Buscador semántico de Microsoft con cambios notables que incluyen
la lista de sugerencias de búsqueda en tiempo real y una lista de las
búsquedas relacionadas (llamado "Panel de explorador" en el lado izquierdo
de los resultados de búsqueda), basado en tecnología semántica de
Powerset
2. Swoogle: Desarrollado por la Universidad de Maryland, es un sistema de
indización , recuperación y organización de la información para Documentos
de la Web Semántica, lo que se denomina en Swoogle (SWDs, Semantic
Web Documents), o lo que es lo mismo documentos escritos básicamente en
RDF y OWL
3. Kngine: introduce la herramienta “Conceptos”. Lo primero que muestra al
buscar una palabra es la información que tiene sobre esta. Por ejemplo: si
buscas iPhone 4 te mostrará sus especificaciones, si buscas una ciudad te
dirá los datos que tiene sobre ésta. Actualmente tiene en su base de datos
más de 8 millones de conceptos.
4. Hakia: divide sus resultados en Webs, News, Blogs, Twitter, Image y Video.
A menudo puede ofrecer una definición de tu búsqueda directamente
extraída de Wikipedia.
5. Kosmix: su portada es mucho más elaborada (tiene cierto parecido a
Yahoo). Se diferencia por la manera de ofrecer los resultados de búsqueda:
directamente con artículos de blogs o imágenes.
6. DuckDuckGO: lo más curioso es que cuando buscas una palabra que
pueda tener doble sentido te permite elegir con qué sentido la quieres
buscar. Ejemplo: buscas Apple y te pregunta quieres decir la empresa o
la fruta.
7. Evri: tiene cierto parecido a Kosmix. Puedes filtrar los resultados por
artículos, citas, imágenes y tweets. Además se integra con redes sociales
como Facebook o Twitter. También cuenta con una versión para iPhone.
8. Powerset: este buscador fue adquirido por Microsoft y básicamente permite
buscar en Wikipedia mejor que nadie. Ahora es empleado en Bing
9. Truevert; este buscador encuentra cualquier término que le pidas en un
contexto relacionado temas de medioambiente. Se llama a sí mismo el
“buscador verde”.
…………………………………………………………………………………………...
Conclusiones
Cuando hacemos una búsqueda por Internet, no sólo estamos buscando una
página web sino estamos buscando respuestas para obtener datos o
comprender conceptos y entonces explorar el conocimiento. Las búsquedas
semánticas han conseguido que podamos encontrar respuestas más parecidas a
cómo las personas comprendemos el mundo y sin duda alguna nos facilitará esta
10. tarea indispensable para la obtención del conocimiento, pero no podemos
soslayar a la lectura , recordemos siempre que la novela constituye un tipo
concreto de conocimiento social sobre el mundo necesario para poder
transformarlo.
De frente ante la historia, Fuentes, junto con otros escritores del “boom
latinoamericano” 10
de la talla de Gabriel García Márquez, Julio Cortázar y
Mario Vargas Llosa, nos han dejado la letra no solo para conocer nuestro entorno
sino para inventar el mundo desde nuestros sueños. Todos ellos han sido
escritores convencidos que, por encima de la razón, somos el territorio que
habitan nuestras pasiones y anhelos.
….porque una sílaba pronunciada, una palabra dicha o una palabra inmersa en un
buscador, se pierden para siempre en el pasado que acoge impasiblemente todos
los presentes que constituyen el tiempo y sólo duran el instante preciso de su
fugaz articulación, pero la letra queda y permanece no solo como anhelo sino
como conocimiento.
La tarea aquí, como predice Carlos Fuentes, es utilizar la información, el
conocimiento, el uso de la tecnología y el despertar de las ideas para el
encuentro del bien. Para transformar, para innovar…para aportar a la sociedad
del conocimiento y hacerla más accesible a todos, más llevadera y no permanecer
más con los brazos cruzados .Utilicemos esta ráfaga de viento a favor del bien
del mundo que nos tocó vivir.
“En los jóvenes está no "un futuro" para México, sino "todo el futuro" de esta nación”. "Este es un
país donde 50 por ciento de la población tiene 30 años o menos, que no corresponde al sistema
político, ni al económico y lo van a cambiar, de manera pacífica, progresiva y para bien".
Carlos Fuentes, Diciembre 2011
10
El Boom latinoamericano fue un fenómeno editorial que surgió entre los años 1960 y 1970 , cuando el trabajo de un
grupo de novelistas latinoamericanos relativamente joven fue ampliamente distribuido en Europa y en todo el mundo.
El Boom está más relacionado con los autores Gabriel García Márquez de Colombia, Julio Cortázar de Argentina, Carlos
Fuentes de México, Mario Vargas Llosa de Perú y José Donoso de Chile. Por el movimiento de América Latina de la
Vanguardia, estos escritores desafiaron las convenciones establecidas de la literatura latinoamericana.