2. Archivo
Consejo Internacional de Archivos (ICA):
• Conjunto de documentos
• Institución responsable
• Edificio o parte del edificio donde se
conservan (depósito)
3. Archivo
CPLT:
• Muy buenas guías en
http://www.educatransparencia.cl/docs
• Sistema con firma electrónica
4. Archivística
• Identificación: fase del tratamiento archivístico que
consiste en la investigación y sistematización de las
categorías administrativas y archivísticas en que se
sustenta la estructura de un fondo
• Clasificación: operación archivística que consiste en
el establecimiento de las categorías y grupos que
reflejan la estructura jerárquica del fondo
• Ordenamiento: operación archivística realizada
dentro del proceso de organización, que consiste en
establecer secuencias naturales cronológicas y/o
alfabéticas, dentro de las categorías y grupos
definidos en la clasificación
5. Archivística
• Instalación: conjunto de medios físicos dispuestos
para la adecuada conservación de los documentos
• Descripción: fase del tratamiento archivístico
destinada a la elaboración de los instrumentos de
consulta para facilitar el conocimiento y consulta de
los fondos documentales y colecciones de los
archivos
• Digitalización: conjunto de procedimientos de copia o
microcopia realizados mediante cualquier tecnología
y en distintos soportes
6. Digitalización
• Ingreso de documentos organizados
archivísticamente
• Preparación de los documentos para
digitalización
• Ingreso de metadatos
• Escaneo
• Retorno de documentos a su unidad
• Instalación en los depósitos
7. Digitalización
• Metadatos
• negocio electrónico
• conservación
• descripción de los recursos de
información
• localización de recursos de información
• gestión de derechos de propiedad
intelectual
• Formato máster, formato distribución
• Roles, comunidades, colecciones
9. Bolsa “inteligente”
Debe:
• manejar objetos digitales, organizados en
colecciones y éstas a su vez agrupadas en
comunidades
• ofrecer uso de metadatos estándar Dublin
Core, y permitir extenderlo
• soportar amplio espectro de formatos de
archivos: texto, videos, sonido, imágenes
• versionamiento
10. Bolsa “inteligente”
Usar esta bolsa inteligente como backend y como
frontend sitios web que sólo ofrezcan los documentos
acorde a cierta metadata
Sitio web - Frontend
Repositorio - Backend
s
bjeto
os o
l
ame
trég ientes
En ec
r
más
Objet
os
más r
ecien
t es
14. Adecuado al contenido
• Interesa determinar cambios en
un documento o entre
documentos
• Referenciar o reutilizar partes de
o todo un documento
• Interoperabilidad
• Otras consideraciones
19. Adecuado al contenido
LeyChile: XML
Texto: versiones, hiperenlaces, referencias,
notas
Estructura: organización jerárquica de las
partes de una norma legal
Metadatos: información adicional acerca de
los documentos, como identificación de la
norma, materia, términos libres, etc.
20. Adecuado al contenido
LeyChile interopera con Contraloría
Parámetros:
Número ley
AJAX
AJAX
Prepara lista de
resultados
Envía
parámetros
Capa de
Negocios
Sistema Ley Chile
Consume
Dictámenes
asociados a una
ley
Capa de Integración
Capa de Presentación
Requerimiento de
dictámenes para
cualquier ley
22. Adecuado al contenido
Akoma Ntoso http://
www.akomantoso.org/
Es un conjunto de representaciones
electrónicas tecnológicamente neutral
(en formato XML) de documentos
parlamentarios, legislativos y
judiciales
26. Archivos
Ver Decreto Supremo 13 2009 Reglamento, ART-42
Sencillo: enlace a
http://www.leychile.cl/Navegar?idNorma=1001095&idParte
27. Archivos
Ver Decreto Supremo 13 2009 Reglamento, ART-42
Menos sencillo: procesar XML
http://www.leychile.cl/Consulta/obtxml?opt=7&idNorma=10
y buscar idParte="8527294"
31. Archivos
Documentos grandes
Documento PDF
complejo consistente
en imágenes
facsimilares + texto
OCR + mapeo de cada
palabra a su posición
en cada página
PDF imágenes con
texto 72 páginas en
PDF, tamaño 24 MB.
XML
Mismo archivo en XML
0.5 MB
41. Transparencia activa
Oferta para máquinas
WSDL (http://www.leychile.cl/ws/LeyChile.wsdl)
Enlaces, widgets, servicios web (http://llevatelo.bcn.cl)
42.
43. Web semántica
Open Data: es un idea que impulsa la
publicación de datos de forma libre y
asequible a cualquier persona para usar
y republicar sin restricciones de ningún
tipo
Linked Data: es usar la web para
conectar datos relacionados que no
estaban enlazados previamente. Usa
algunas de las mejores prácticas de la
Web Semántica
44. Web semántica
Web
• Repleta de información
• Orientada al ser humano:
• para comprender el contenido de una
página
• para relacionar contenidos dentro de una
página (textos, imágenes, videos, etc.)
45. Web semántica
Web
• Dificultad en localización de la información (adaptar a
una región específica, por ejemplo, traducir)
• Buscadores actuales funcionan bien, pero orientados
al keyword
• Por ejemplo: “constitución”
¿la de Chile?
¿ciudad del sur?
46. Web semántica
Soluciones
• ad hoc: usar métodos de IA para analizar la
información no estructurada existente en la
Web
• a priori: estructurar la información en la Web
para facilitar el análisis automático Web
Semántica
54. De documentos a datos
Documentos
• OCR
• aplicación de algoritmos Named-entity
Recognition
• Enlaces a ontologías
• Ejemplo: proyecto Historia de la Ley y
Labor Parlamentaria