1. Web Semántica
Proyecto:
crawler o spider sobre
linio.com.mx &
mercadolibre.com.mx
http://soyprogramador.liz.mx/
1http://soyprogramador.liz.mx/
2. Web Semántica
Por web semántica se entiende una forma de organizar el contenido
en la Web que mejore la cooperación entre computadoras y humanos.
Esto pasa por avanzar de una web de documentos a una web de
datos enlazados en la que se puedan ofrecer novedosos servicios que
hagan uso del potencial de combinar e interrelacionar datos de
diversa índole y procedencia.
2http://soyprogramador.liz.mx/
3. Historia
Web 1.0
• Páginas
estáticas
• El uso
de framesets o
Marcos
Web 2.0
• El auge de los
blogs
• Redes sociales
• Las webs
creadas por los
usuarios
• AJAX
Web 3.0
Semántica
• Bases de
datos
• XML, RDF y
microformatos
• Inteligencia
artificial
• Clasificando la
información
http://www.estudioseijo.com/noticias/web-10-web-20-y-web-30.htm
3http://soyprogramador.liz.mx/
6. RDF, SPARQL, y OWL
Para obtener esa adecuada definición de los
datos, la Web Semántica utiliza esencialmente
RDF, SPARQL, y OWL, mecanismos que
ayudan a convertir la Web en una
infraestructura global en la que es posible
compartir, y reutilizar datos y documentos entre
diferentes tipos de usuarios.
http://www.w3c.es/Divulgacion/GuiasBreves/WebSemantica#
6http://soyprogramador.liz.mx/
7. RDF?
Se basa en XML
RSS (Muy usado y popular)
http://web.resource.org/rss/1.0/
CFDI (Factura electrónica)
7http://soyprogramador.liz.mx/
8. RDF como FOAF
FOAF es un proyecto de Web Semántica, que permite crear
páginas Web para describir personas, vínculos entre ellos, y cosas
que hacen y crean. Se trata de un vocabulario RDF, que permite
tener disponible información personal de forma sencilla y
simplificada para que pueda ser procesada, compartida y
reutilizada.
Con esta descripción, los datos personales serán compartidos en la
Web pasando a formar parte de un motor de búsqueda donde será
posible descubrir información a cerca de una persona en concreto de
una forma sencilla y rápida.
http://www.ldodds.com/foaf/foaf-a-matic.es.html
8http://soyprogramador.liz.mx/
10. Micro formatos
Enfocado para los usuarios y maquinas, especialmente para los primeros,
los micro formatos son un conjunto de formatos de datos simples,
construidos sobre las normas existentes y ampliamente adoptados.
En lugar de tirar lo que funciona hoy, los micro formatos tienen la intención
de resolver problemas sencillos y organizar la información.
10http://soyprogramador.liz.mx/
12. Uso de micro formatos
Eventos
Calendarios
Información producto
Entrada (post)
Dirección
Tarjeta presentación
etc
http://microformats.org/wiki/microformats2
Organizando la información ya existente en la web
http://dublincore.org/documents/2012/06/14/dcmi-terms/?v=terms#title 12http://soyprogramador.liz.mx/
13. Micro formato
Ejemplo de h-card
Ejemplo de h-product
http://microformats.org/code/hcard/creator
13http://soyprogramador.liz.mx/
14. RDFa
RDFa es en esencia una generalización de los atributos de los
elementos meta y link de XHTML. La a minúscula que se añade a las
siglas RDF es precisamente la inicial de la palabra "atributos".
14http://soyprogramador.liz.mx/
18. Web semántica
Proyecto:
crawler o spider
Sobre linio.com.mx & mercadolibre.com.mx
Asiendo uso de la web semántica
18http://soyprogramador.liz.mx/
19. ¿Qué es un crawler o spider?
Las arañas (también llamadas "spiders") de los motores
de búsqueda, recorren las páginas recopilando
información sobre los contenidos de las páginas.
Cuando se busca una información concreta en los
buscadores, ellos consultan su base de datos y
presentan resultados clasificados por su relevancia para
esa búsqueda concreta. Los buscadores pueden
almacenar en sus bases de datos desde la página de
entrada de cada web, hasta todas las páginas que
residan en el servidor, una vez que las arañas (spiders)
las hayan reconocido e indexado.
19http://soyprogramador.liz.mx/
20. ¿Qué es un crawler o spider?
Los crawlers se pueden usar para varias cosas, lo más
común es que se usen para:
Analizar los enlaces de un sitio para buscar links rotos.
Recolectar información de un cierto tipo, como precios
de productos para armar un catálogo.
etc.
20http://soyprogramador.liz.mx/
21. Herramientas para la web
semántica
http://answers.semanticweb.com/q
uestions/75/which-tools-and-
libraries-do-you-use-to-develop-
semantic-web-applications 21http://soyprogramador.liz.mx/
22. Herramientas online
http://dbpedia.org/sparql
Editor donde podremos probar el uso de SPARQL
Tutorial sobre RDF
http://www.obitko.com/tutorials/ontologies-
semantic-web/rdf-elements.html
Top 10 productos de web semantica 2010
Introducción a Link data
Ontologías ejemplos
RDF en Wikipedia
DataSets
22http://soyprogramador.liz.mx/