El objetivo del CRTM es la introducción de técnicas de la “Web Semántica” en la información del Transporte Público. Con la finalidad de que la información sea accesible a un mayor número de personas. De manera, que en esta primera fase se esta trabajando en el desarrollo de una familia de ontologías especializadas en el transporte.
Aplicación de las técnicas de la “Web Semántica” en la información del Transporte Público
1. Aplicación de las técnicas de la “Web Semántica” en la información del Transporte Público. Luis Criado Fernández Área de Innovación Tecnológica Consorcio Regional de Transportes de Madrid [email_address] Javier Chamorro Mata Área de Movilidad y Accesibilidad Consorcio Regional de Transportes de Madrid [email_address]
2. ¿Qué es la Web Semántica? ¿Qué son los buscadores semánticos? ¿Para qué puede servirnos la Web Semántica? Procuraremos contestar varias preguntas ¿Cómo aplicar esta tecnología al transporte público?
3. El Problema Según Netcraft [1], en febrero del 2009 el número de sitios webs es de 216 millones [1] http://news.netcraft.com/
4. El Problema Bergman realizó un estudio en el cual se calculaba que el volumen de páginas web estáticas era del orden de páginas web estáticas. Lo que es equivalente, en el caso más pesimista, a 14 millones de libros. [Bergman; 2001] Teniendo en cuenta, la gráfica de Netcraft y el trabajo de Bergman, se deduce que aproximadamente corresponden con Considerando la misma relación, en febrero del 2009 se podría estimar en páginas web estáticas. Se ha calculado que la web profunda, aquella que se genera dinámicamente mediante el acceso al contenido a base de datos (BBDD), puede contener un tamaño de información varios cientos de veces superior a la web estática y crece a un ritmo aún mayor [O'Neill et al; 2003]. Equivalente a más de 86’4 millones de libros (caso pesimista)
5. El Problema ¿Cuál es el problema de la Web actual? El volumen que ya tiene y sus expectativas de crecimiento ¿Por qué? Tanta información provoca que cada día sea más difícil buscar información precisa, de calidad. En consecuencia, el usuario tiene que dedicar más tiempo a filtrar los enlaces que ofrecen los buscadores. Pero además hay mucha información en la Web que nunca se encuentra. Hay más cosas en la Web de lo que nos dicen los buscadores actuales
6. El Problema ¿Cómo podemos solucionarlo? Con la Web Semántica, mediante uso de ontologías ¿Qué son las ONTOLOGÍAS?
7. Estado del Arte La Web Semántica tiene que superar dos grandes bloques de dificultades para poder implantarse. 1º.-, Aprendizaje de ontologías (ontology learning). El objetivo es disponer de ontologías que representen el conocimiento de toda la Web, y aunque existen varias propuestas como [Gómez Pérez et al ; 2003], [Valencia García; 2005], [Cimiano et al ; 2006] y proyectos que desarrollan trabajos en este ámbito, como NeOn [13] , SEKT [87], Dot.Kom [88], X-Media [89], Abraxas [90], ect… Todavía no se tiene solidez para que la industria pueda absorberlo 2º.- Población de ontologías (ontology population). En este ámbito de investigación, se parte de que las ontologías ya existen, de manera que se trata de rellenar éstas con instancias. El objetivo es realizar anotaciones semánticas de todos los sitios webs de acuerdo al uso de ontologías. Al igual que en “ontology learning”, las investigaciones actuales se orientan hacia métodos de construcción semi-automáticos o automáticos. Pero actualmente, estamos lejos para abordar la transformación de la Web actual en una Web donde partiendo de cada página web que forma un sitio web se describa el contenido formalmente anotado respecto a una o varias ontologías, es decir, herramientas de transformación desde la Web hacia Web Semántica.
8. Estado del Arte Herramientas de anotación Todavía son herramientas para entornos de INVESTIGACIÓN. Ninguna se puede utilizar en un entorno real.
9. Buscador Semántico ¿Qué es un Buscador Semántico? Es un buscador que permite explotar la tecnología de la Web Semántica. Por lo tanto, incorpora un cierto grado de entendimiento sobre las preguntas que el usuario formula. Un buscador semántico primero contesta la pregunta y después ofrece enlaces que justifican su respuesta. ¿Funcionan? Muy mal ¿Qué es un Buscador Semántico vertical? Es un buscador semántico especializado en un dominio de conocimiento. ¿Funcionan? Menos mal. ¿Por qué hay diferencia?
10. CRTM y la WS El objetivo del CRTM es la introducción de técnicas de la “Web Semántica” en la información del Transporte Público. Con la finalidad de que la información sea accesible a un mayor número de personas . Objetivo ¿Cómo superar el problema de Aprendizaje de ontologías ? ¿Cómo superar el problema de la población de ontologías ? 1.- Enfocándonos hacia un buscador semántico vertical. 2.- Generando nuestras propias ontologías (protégé ) 3.- Construyendo una intranet lo más cercano posible a las clases y atributos de las mismas ¿Cómo construir el buscador semántico vertical del CRTM ?
12. Bibliografía [Bergman; 2001] Michael K. Bergman Obra original: The Deep Web: Surfacing Hidden Value. vol. 7, no. 1. Journal of Electronic Publishing, 2001. Disponible en Web: http://quod.lib.umich.edu/cgi/t/text/text-idx?c=jep;view=text;rgn=main;idno=3336451.0007.104, http://hdl.handle.net/2027/spo.3336451.0007.104, [O'Neill et al ; 2003] Edward T. O'Neill, Brian F. Lavoie, Rick Bennett. Obra original: Trends in the Evolution of the Public Web. Volume 9 Number 4. Web: D-Lib Magazine, 2003. ISBN: ISSN 1082-9873. Disponible en Web: http://www.dlib.org/dlib/april03/lavoie/04lavoie.html,