4. Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los
parlamentarios y el parlamento, para el cabal cumplimiento de sus
compromisos y el atisbamiento de nuevos escenarios posibles de país
5. Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los
parlamentarios y el parlamento, para el cabal cumplimiento de sus
compromisos y el atisbamiento de nuevos escenarios posibles de país
Rol societal, ser el repositorio del Archivo del Parlamento, en especial
de la historia de la Ley y de la labor parlamentaria
6. Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los
parlamentarios y el parlamento, para el cabal cumplimiento de sus
compromisos y el atisbamiento de nuevos escenarios posibles de país
Rol societal, ser el repositorio del Archivo del Parlamento, en especial
de la historia de la Ley y de la labor parlamentaria
Rol público, ser el espacio de conocimiento y comprensión de los
ámbitos de interés social prioritarios para el país con énfasis en lo
político y lo jurídico
7. Roles de la BCN
Rol parlamentario, ser un instrumento relevante, a juicio de los
parlamentarios y el parlamento, para el cabal cumplimiento de sus
compromisos y el atisbamiento de nuevos escenarios posibles de país
Rol societal, ser el repositorio del Archivo del Parlamento, en especial
de la historia de la Ley y de la labor parlamentaria
Rol público, ser el espacio de conocimiento y comprensión de los
ámbitos de interés social prioritarios para el país con énfasis en lo
político y lo jurídico
11. Una historia: procesamiento de diarios
Unidad de Recortes de Prensa:
analizaba las noticias
recortaba físicamente (con tijeras)
almacenaba estos recortes en sobres clasificados por materia, previa
asignación de una tarjeta de identificación
actualmente son más de 5 millones de recortes de prensa
12. Una historia: procesamiento de diarios
Actualmente
Digitalizando recortes (estándares, resolución, …)
Metadata (Dublin core, propias …)
OCR (calidad, ICR, …)
Estos documentos se ingresan como noticias históricas a nuestro
sistema noticias.bcn.cl (después lo veré en detalle)
13. Una historia: procesamiento de diarios
Unidad de Indización de la prensa:
revisaba los diarios
redactaba fichas con un resumen y con una referencia al diario
cerrada en 1990 (pasó al olvido)
existen 15 ficheros con estas fichas
16. Una historia: procesamiento de diarios
Encontró artículo
(mismo medio, fecha y contenido)
Encontró para el mismo día contenidos
similares pero de diferentes medios
Encontró en la semana artículos de
contenidos similares
17. Una historia: procesamiento de diarios
Después de 22 años se pudo integrar información on-the-fly,
ya que se dispuso digitalmente
Pero…
sólo para Senador Anselmo Sule
107 fichas
digitalización 107 fichas 10 minutos
OCR 5 minutos sin corrección
dos personas usaron 2:45 hrs. c/u para revisar OCRs
Tenemos 400.000 fichas app.
Sólo un prototipo
25. Definiciones
Open Data: es un idea que impulsa la publicación de
datos de forma libre y asequible a cualquier
persona para usar y republicar sin restricciones de
ningún tipo
Linked Data: es usar la web para conectar datos
relacionados que no estaban enlazados
previamente. Usa algunas de las mejores prácticas
de la Web Semántica
26. Motivación
Acciones y datos del Estado pueden ser supervisados
Mejora transparencia y confianza
Valor público (genera experiencia ciudadana)
Colaboración e invetigación
Reutilización de los datos
Información pública pertenece a los ciudadanos
Financiado con recursos públicos
ROI
29. Legislación
Hacer disponible y facilitar el acceso a la comunidad de las
fuentes jurídicas de uso en el Congreso Nacional, junto con
educar y fomentar las redes sociales en torno a temas
jurídicos
31. Legislación
En los años 50
compilación mediante fichas con referencias entre las
normas y clasificadas por materia
32. Legislación
En los 80
el sistema de fichas fue reemplazado por un sistema
automático basado en STAIRS
A mediados de los 90
el sistema anterior se reemplaza por una arquitctura cliente-
servidor basada en BASIS PLUS, reconstruyendo en línea en
texto completo de las normas
42. LeyChile
XML
Texto: versiones, hypervículos, referencias, notas
Estructura: Organización jerárquica de las partes de una
norma
Metadata: información adicional del documento, como
identificación de la norma, materias, términos libres, etc.
45. LeyChile: nuestra oferta a máquinas
WSDL (http://www.leychile.cl/ws/LeyChile.wsdl)
Links, widgets, web services (http://llevatelo.bcn.cl)
46. LeyChile: ¿es posibe incorporarle linked-open
data (LOD)?
Extensión natural
Mejorar la interoperabilidad (más formatos)
Crear ontologías del dominio
Ofrecer una solución a consultas complejas usando un
endpoint SPARQL
Primer paso: exponer metadata de las normas
47. Principios LOD: URIs
Diseño cuidadoso (leyes, decretos, reglamentos, resoluciones,
decretos ley…)
FRBR
Work
Work ley 20000
ley 20000
1
N
Versión actualizada
Versión actualizada
Expression
Expression para el año 2012
para el año 2012
1
N
Manisfestation
Manisfestation archivo XML
archivo XML
1
N
Archivo físico XML en
Archivo físico XML en
Item
Item un servidor específico
un servidor específico
48. Principios LOD: URIs
Decreto 341; publicado el 11/11/2008; del Ministerio de Educación
http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341
http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341
Versión original
http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2008-11-07
http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2008-11-07
Otra versión
http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2010-07-20
http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2010-07-20
50. Principios LOD: enlaces
Relaciones a otros datasets: países (Tratados internacionales)
DBPedia, Geonames
Reuso de vocabularios/ontologías
SKOS, DC, FOAF, DBPedia, ORG
51. Consulta compleja
Encontrar todas las ordenanzas municipales publicadas entre
1995 y 2000, pero que hayan sido modificadas después del
2005
PREFIX dc: <http://purl.org/dc/elements/1.1/>
PREFIX dc: <http://purl.org/dc/elements/1.1/>
PREFIX n: <http://datos.bcn.cl/ontologies/bcn-norms#>
PREFIX n: <http://datos.bcn.cl/ontologies/bcn-norms#>
SELECT distinct str(?normTitle) as ?Titulo str(?creatorName) as ?
SELECT distinct str(?normTitle) as ?Titulo str(?creatorName) as ?
Municipio ?pubDate as ?Fecha_Publicacion ?pubDateOther as ?
Municipio ?pubDate as ?Fecha_Publicacion ?pubDateOther as ?
Fecha_modificacion
Fecha_modificacion
WHERE {
WHERE {
?norm
?norm n:createdBy
n:createdBy ?creator .
?creator .
?creator
?creator n:hasName
n:hasName ?creatorName .
?creatorName .
?norm
?norm dc:title
dc:title ?normTitle .
?normTitle .
?norm
?norm n:publishDate ?pubDate .
n:publishDate ?pubDate .
?norm
?norm n:isModifiedBy ?otherNorm .
n:isModifiedBy ?otherNorm .
?otherNorm n:publishDate ?pubDateOther .
?otherNorm n:publishDate ?pubDateOther .
FILTER (regex(?creatorName,"MUNICIPALIDAD","i"))
FILTER (regex(?creatorName,"MUNICIPALIDAD","i"))
FILTER (?pubDate
FILTER (?pubDate > xsd:date("1995") &&
> xsd:date("1995") &&
?pubDate
?pubDate < xsd:date("2000") &&
< xsd:date("2000") &&
?pubDateOther > xsd:date("2005"))
?pubDateOther > xsd:date("2005"))
}
}
ORDER BY (?pubDate)
ORDER BY (?pubDate)
52. http://datos.bcn.cl
Primera etapa finalizada en mayo del 2011
Más de 300.000 normas exportadas
≈27 triplas por norma
≈8 millones de triplas
200 a 400 triplas se agregan cada día
53. David Robinson and Harlan Yu in “El desafío hacia el gobierno
abierto en la hora de la igualdad”, Gastón Concha y
Alejandra Naser (eds.), Santiago, CEPAL, 2012
“Open data does not create its own demand. The government
should compromise the developers”
57. Historia política
Rescatar y poner en servicio a la comunidad la memoria
política chilena, resguardando los discursos, actos y rol de
los parlamentarios y el Congreso, como al mismo tiempo, el
contexto en que se desenvuelve la política chilena y con ello
contribuir a que los ciudadanos reconozcan su identidad y
sentido político en una perspectiva histórica
61. Historia política
Reseñas biográficas
no tenemos todos los años de nacimiento, ni fallecimiento,
ni los lugares
por ejemplo, Salvador de la Cavareda Trucios diputado suplente por
Valparaíso 1824 a 1825 (hermano de Salvador y José Joaquín)
Pero sabemos lo que nos falta:
PREFIX bcnbio: <http://datos.bcn.cl/ontologies/bcn-biographies#>
PREFIX bcnbio: <http://datos.bcn.cl/ontologies/bcn-biographies#>
select * where {
select * where {
?a a foaf:Person .
?a a foaf:Person .
OPTIONAL {?a bcnbio:hasBorn ?ano } .
OPTIONAL {?a bcnbio:hasBorn ?ano } .
FILTER (!bound(?ano)) .
FILTER (!bound(?ano)) .
}
}
62. Historia política
Reseñas biográficas
Manuel Joaquín Díaz (diputado Congreso Constituyente 1891)
Manuel Joaquín Díaz Besoaín (diputado 1906-1908)
¡No es la misma persona!
el primero es Liberal-Democrático y el segundo Conservador
64. Historia política
Reseñas biográficas
Carlos Larraín Claro (diputado 1912- 1915)
Carlos Larraín Claro, suegro de Jorge Astaburuaga Lyon
(diputado 1924-1927)
¿Es la misma persona?
67. Trabajo actual y futuro
Más datasets: biografías, transparencia, datos geográficos,
historia de la ley, documentos legislativos…
Exponer partes de una norma y su metadata
68. Conclusiones
Open data, open linked data, web semántica es más que una
tecnología… es una manera de administrar información
Visualización no es un producto final, es un proceso de
realimentación para “purificar” los datos y mejorar la
visualización
Crea valor para nosotros mismos 1
Muchos detalles técnicos y desafíos permanecen sin resolver 1
1.- David Robinson and
Harlan Yu in “El desafío
hacia el gobierno abierto
en la hora de la
igualdad”, Gastón
Concha y Alejandra
Naser (eds.), Santiago,
CEPAL, 2012