SlideShare une entreprise Scribd logo
1  sur  4
Bases de datos
documentales
Este tipo de base de datos esta orientada exclusivamente a gestionar de forma efectiva
el almacenamiento y acceso a documentos.
Las bases de datos orientadas a documentos no almacenan datos en esquemas
estrictos ni usan tablas con campos uniformes.

Introducción                                       Evolución de las bases de
El manejo de información a través de bases         datos
de datos ha sido unos de los campos de
                                                   Desde sus inicios las bases de datos han
mayor aplicación dentro de la informática. A
                                                   tenido una serie de cambios y características,
lo largo de los años se han desarrollado
                                                   que han determinado la presencia de
numerosos manejadores de datos como:
                                                   distintos tipos de base de datos y
Oracle, Informix, SQL server, PostgreSQL,
                                                   almacenamiento, de entre las cuales
MySQL, etc. que permiten de una manera
                                                   podemos destacar:
fácil y eficiente manipular los datos, es decir:
introducir, modificar, buscar, eliminar, generar      ✔   Bases de datos flat
reportes etc..                                        ✔   Bases de datos Jerárquicas
Por lo general operan instalados en un                ✔   Bases de datos de red
servidor de datos al cual se conectan
numerosos usuarios denominados clientes               ✔   Bases de datos relacionales
por medio de un red local tipo Intranet.              ✔   Bases de datos dimensionales
Desde hace varios años las herramientas               ✔   Bases de datos orientadas a objetos
informáticas han avanzado enormemente, en
relación a los manejadores de datos vemos             ✔   Bases de       datos    orientadas    a
como podemos trabajar con nuevos tipos de                 documentos
campos como gráficos, animación y sonido,
los cuales antes eran imposibles de manejar;
esto ha producido verdaderas bases de datos        Bases de datos relacionales
multimedios.                                       Hoy en día la mayoría de los SGBD son
Otro aspecto donde se ha notado una                relacionales, éstas están diseñadas para
evolución importante es en la posibilidad de       almacenar y hacer informes sobre datos
conectar estas bases de datos a la Internet        fuertemente       estructurados    (esquemas
de manera directa y transparente. La               estrictos) e interrelacionados. Su objetivo es
información puede traspasar la barrera de la       la de dotar mayor seguridad, más
intranet y ser manejada de forma más amplia        posibilidades     y    supuestamente      estar
por un mayor número de usuarios usando un          preparados para afrontar la sobrecarga,
navegador (browser), a esto se ha sumado           adicionalmente permiten disponer de una
una nueva forma de almacenar los datos,            funcionalidad distribuida.
pudiendo ser esta de forma natural (sin
cambios)      y   no    estructurada,    que
paradójicamente parecería lo opuesto a lo
                                                   Base de datos orientada a
que estamos acostumbrados hasta hoy en             documentos
día.
                                                   A diferencia de las bases de datos
                                                   relacionales, las bases de datos orientadas a
documentos no almacenan datos en tablas           un conjunto homogéneo de documentos que
con campos uniformes para cada fila o             pueden encontrarse en cualquier soporte
registro (no tiene un esquema estricto).          (papel, magnético, óptico, etc)
Este tipo de base de datos esta orientada
exclusivamente a almacenar y gestionar            Funciones     básicas                       del
documentos.       Cada      documento    es
almacenado de forma que tenga ciertas             análisis documental
características, cualquier número o tipo de       Entre las funciones básicas del análisis
campos pueden ser añadidos a un                   documental se encuentran el:
documento, e incluso contener varios tipos
de datos.
Dentro las bases de datos orientadas a               ✔   Almacenar la información documental
documentos se hace un uso intensivo de                   y
pares clave/valor, considerándose a la base          ✔   Facilitar su recuperación
de datos como un conjunto de identificadores
y documentos, y los documentos a su vez
como un conjunto de de campos y valores.          Conceptos     básicos                       del
Los pares clave/valor son muy usados en           análisis documental
cloud computing (computación de la nube),
un buen ejemplo de esto es el algoritmo Map/      Dos elementos importantes          dentro    del
Reduce; adicionalmente las bases de datos         análisis documental son:
documentales pueden ser consideradas                 ✔   La indexación y
también como tablas hash y son optimizadas
para datos accedidos mediante clave                  ✔   El lenguaje documental
primaria.
El no contar con una estructura estricta las      Niveles    del                     análisis
hace mas eficientes al momento de manejar         documental
grandes volúmenes de documentos. Y la
ausencia de relaciones, facilita la replicación   En el análisis documental se realiza a tres
de datos, pero denota la dificultad para          niveles de detalle:
expresar modelos complejos.
                                                     ✔   Asiento:        Se   determinan los
                                                         identificadores de la información
SGBDD                                                    (título, autor, etc)
                                                     ✔   Descriptores:  Se    extraen    las
Una Sistema de Gestión de Bases de Datos
                                                         palabras clave más representativas
Documentales se ocupa de la gestión de
                                                         (indexación)
documentos optimizando el almacenaje y
facilitando su recuperación.                         ✔   Resumen (o abstract): Resumen
                                                         analítico del texto integro para hacer
A diferencia de cualquier otro SGBD, un
                                                         más fácil la consulta
SGBDD no realiza ningún tratamiento sobre
la información, simplemente la almacena y         Tesauros es un lenguaje documental que
posibilita su recuperación.                       incluye relaciones semánticas de tres tipos:
                                                     ✔   Relaciones de equivalencia
Que es un documento                                  ✔   Relaciones     jerárquicas    (término
Un conjunto de información o conocimiento                general y término específico)
humano: un libro, una revista, una factura,          ✔   Relaciones    asociativas     (términos
una cédula de identidad, una conferencia                 relacionados)
editada, una cinta de vídeo, un disco, etc.
En consecuencia, un fondo documental será
Bases de datos orientadas a                          Ventajas
documentos o NoSQL                                     ✔    No están    sujetas   a   esquemas
                                                            estrictos
NoSQL es un término que representa y
engloba a las bases de datos no relacionales           ✔    Poseen un lenguaje de consulta
o las orientadas a documentos y cuyo uso se                 orientado al lenguaje natural
ha extendido rápidamente, junto con la
                                                       ✔    Extrema sencillez en el escalado
popularidad de este tipo de bases de datos.
                                                            horizontal.


Ejemplo de diferencias de SQL y NoSQL
A continuación mostramos un ejemplo de las diferencias de almacenamiento y tratamiento entre
las bases de datos relacionales y no relacionales.
Base de datos orientada a documentos:
       Clave                                  Documento

       63      Nombre: Esteban; Apellidos: Saavedra; Nacionalidad: Boliviana

       64      Nombre: Francisco; Apellidos: Torrez; Nacionalidad: Portuguesa; Edad: 39;

       65      Nombre: Jorge; Nacionalidad: Chilena


Base de datos relacional:
       Clave Nombre         Apellidos   Nacionalidad       Edad

       63      Esteban      Saavedra    Boliviana

       64      Francisco Torrez         Portuguesa     39

       65      Jorge                    Chilena


En el ejemplo podemos ver que en la base de datos NoSQL, los campos vacíos no se añaden y
que se pueden añadir campos concretos a documentos concretos, sin tener que aumentar el
número de columnas.


Tipos de almacenamiento                              Aplicaciones de
En la actualidad existen varios tipos de             almacenamiento clave/valor
almacenamiento, entre los que destacan:
                                                       ✔    Voldemort
   ✔   Clave/valor,           almacenamiento
                                                       ✔    Scalaris
       distribuido en tablas hash (DHT)
                                                       ✔    Tokyo Cabinet
   ✔   Orientados a documentos
                                                       ✔    Redis
   ✔   Orientados a columnas
                                                       ✔    MemcacheDB
Aplicaciones de                                 de datos orientadas a documentos.

almacenamiento orientados                       En el próximo número comenzaremos a
                                                describir algunas aplicaciones de origen
a documentos                                    opensource orientadas a la gestión de
   ✔   CouchDB                                  documentos,         considerando       sus
                                                características propias, su instalación y
   ✔   MongoDB                                  manejo.
   ✔   SimpleDB (Amazon)
                                                Autor
Aplicaciones de
almacenamiento orientado a
columnas
   ✔   BigTable (Google)
   ✔   HBase (Hadoop Database)
   ✔   Hypertable (BigTable Open Source
       clone)
                                                Esteban Saavedra López
   ✔   Cassandra (Facebook)                     Presidente de la Fundación AtixLibre (Bolivia)
                                                Activista de Software Libre en Bolivia
                                                jesaavedra@opentelematics.org
Consideraciones                                 esteban.saavedra@atixlibre.org
Siempre es recomendable que antes de            http://jesaavedra.opentelematics.org
poner en marcha cualquier tipo de aplicación,   http://www.atixlibre.org
es recomendable inicialmente tener claro
algunos conceptos relacionados, por lo que
hemos dedicado este primer número a
brindar una pequeña introducción a las bases

Contenu connexe

Tendances

Diseño de Archivos y Base de Datos
Diseño de Archivos y Base de DatosDiseño de Archivos y Base de Datos
Diseño de Archivos y Base de DatosGuadalupeOsorio9
 
sistema gestor BD PostgreSql
sistema gestor BD PostgreSqlsistema gestor BD PostgreSql
sistema gestor BD PostgreSqlJr. Serrano
 
Bases de datos orientadas a grafos
Bases de datos orientadas a grafosBases de datos orientadas a grafos
Bases de datos orientadas a grafosAbraham Paez
 
Diagrama componentes
Diagrama componentesDiagrama componentes
Diagrama componentesmarianela0393
 
Servicios web xml
Servicios web xmlServicios web xml
Servicios web xmlJuan Anaya
 
Data modeling star schema
Data modeling star schemaData modeling star schema
Data modeling star schemaSayed Ahmed
 
Tema 1 Datos y tipos de datos
Tema 1    Datos y tipos de datosTema 1    Datos y tipos de datos
Tema 1 Datos y tipos de datosrufiflores0469
 
Sql o NoSql en Informática Médica
Sql o NoSql en Informática MédicaSql o NoSql en Informática Médica
Sql o NoSql en Informática MédicaLiz Armenteros
 
Calidad de datos. Preparación y limpieza de los datos
Calidad de datos. Preparación y limpieza de los datosCalidad de datos. Preparación y limpieza de los datos
Calidad de datos. Preparación y limpieza de los datosRoman Herrera
 
BASES DE DATOS
BASES DE DATOSBASES DE DATOS
BASES DE DATOSfas_sakura
 
Generalidades de Bases de Datos
Generalidades de Bases de DatosGeneralidades de Bases de Datos
Generalidades de Bases de DatosOscar Diaz
 
Base de Datos
Base de DatosBase de Datos
Base de Datosvjgaby
 
Clasificacion de los sistemas de base de datos
Clasificacion de los sistemas de base de datosClasificacion de los sistemas de base de datos
Clasificacion de los sistemas de base de datosManuel Gutiérrez
 

Tendances (20)

Diseño de Archivos y Base de Datos
Diseño de Archivos y Base de DatosDiseño de Archivos y Base de Datos
Diseño de Archivos y Base de Datos
 
sistema gestor BD PostgreSql
sistema gestor BD PostgreSqlsistema gestor BD PostgreSql
sistema gestor BD PostgreSql
 
Bases de datos orientadas a grafos
Bases de datos orientadas a grafosBases de datos orientadas a grafos
Bases de datos orientadas a grafos
 
Diagrama componentes
Diagrama componentesDiagrama componentes
Diagrama componentes
 
Servicios web xml
Servicios web xmlServicios web xml
Servicios web xml
 
Togaf
TogafTogaf
Togaf
 
Data modeling star schema
Data modeling star schemaData modeling star schema
Data modeling star schema
 
Ado.net
Ado.netAdo.net
Ado.net
 
Tema 1 Datos y tipos de datos
Tema 1    Datos y tipos de datosTema 1    Datos y tipos de datos
Tema 1 Datos y tipos de datos
 
Sql o NoSql en Informática Médica
Sql o NoSql en Informática MédicaSql o NoSql en Informática Médica
Sql o NoSql en Informática Médica
 
Calidad de datos. Preparación y limpieza de los datos
Calidad de datos. Preparación y limpieza de los datosCalidad de datos. Preparación y limpieza de los datos
Calidad de datos. Preparación y limpieza de los datos
 
BASES DE DATOS
BASES DE DATOSBASES DE DATOS
BASES DE DATOS
 
Jackson
JacksonJackson
Jackson
 
NoSQL: Introducción a las Bases de Datos no estructuradas
NoSQL: Introducción a las Bases de Datos no estructuradasNoSQL: Introducción a las Bases de Datos no estructuradas
NoSQL: Introducción a las Bases de Datos no estructuradas
 
Generalidades de Bases de Datos
Generalidades de Bases de DatosGeneralidades de Bases de Datos
Generalidades de Bases de Datos
 
Base de Datos
Base de DatosBase de Datos
Base de Datos
 
Modelo entidad relacion
Modelo entidad relacionModelo entidad relacion
Modelo entidad relacion
 
Estructuras de datos
Estructuras de datosEstructuras de datos
Estructuras de datos
 
Clasificacion de los sistemas de base de datos
Clasificacion de los sistemas de base de datosClasificacion de los sistemas de base de datos
Clasificacion de los sistemas de base de datos
 
Conceptos Fundamentales de Base de Datos
Conceptos Fundamentales de Base de DatosConceptos Fundamentales de Base de Datos
Conceptos Fundamentales de Base de Datos
 

Similaire à Bases de Datos Documentales

Similaire à Bases de Datos Documentales (20)

Bases De Datos
Bases De DatosBases De Datos
Bases De Datos
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 
Actividad de aprendizaje 4 .Principales bases de datos existentes
Actividad de aprendizaje 4 .Principales bases de datos existentesActividad de aprendizaje 4 .Principales bases de datos existentes
Actividad de aprendizaje 4 .Principales bases de datos existentes
 
Exposición de base de datos en programación
Exposición de base de datos en programaciónExposición de base de datos en programación
Exposición de base de datos en programación
 
Basedatos
BasedatosBasedatos
Basedatos
 
Presentación107
Presentación107Presentación107
Presentación107
 
Base de Datos - Yaiberth Bravo
Base de Datos - Yaiberth BravoBase de Datos - Yaiberth Bravo
Base de Datos - Yaiberth Bravo
 
Jhostin vasquez bases de datos
Jhostin vasquez   bases de datosJhostin vasquez   bases de datos
Jhostin vasquez bases de datos
 
Base de datos yeiker
Base de datos yeikerBase de datos yeiker
Base de datos yeiker
 
Bases de Datos, Definición, Clasificación y Aplicaciones
Bases de Datos, Definición, Clasificación y AplicacionesBases de Datos, Definición, Clasificación y Aplicaciones
Bases de Datos, Definición, Clasificación y Aplicaciones
 
Bases de datos Actuales
Bases de datos ActualesBases de datos Actuales
Bases de datos Actuales
 
Bases de Datos Cbtis75
Bases de Datos Cbtis75Bases de Datos Cbtis75
Bases de Datos Cbtis75
 
Base datos-romero
Base datos-romeroBase datos-romero
Base datos-romero
 
base de datos
base de datosbase de datos
base de datos
 
Presentación
PresentaciónPresentación
Presentación
 
02 base de datos hernandez_luis
02 base de datos hernandez_luis02 base de datos hernandez_luis
02 base de datos hernandez_luis
 
Base de datos yanna
Base de datos yannaBase de datos yanna
Base de datos yanna
 
Julieth
JuliethJulieth
Julieth
 
Base de datos
Base de datosBase de datos
Base de datos
 
Bases de datos
Bases de datosBases de datos
Bases de datos
 

Plus de Esteban Saavedra (20)

Atix30
Atix30Atix30
Atix30
 
Atix29
Atix29Atix29
Atix29
 
Atix28
Atix28Atix28
Atix28
 
Atix27
Atix27Atix27
Atix27
 
Atix26
Atix26Atix26
Atix26
 
Atix25
Atix25Atix25
Atix25
 
Rabbitmq
RabbitmqRabbitmq
Rabbitmq
 
Ansible
AnsibleAnsible
Ansible
 
Perl
PerlPerl
Perl
 
Atix24
Atix24Atix24
Atix24
 
Atix23
Atix23Atix23
Atix23
 
Lineas Base Migracion a Software Libre
Lineas Base Migracion a Software LibreLineas Base Migracion a Software Libre
Lineas Base Migracion a Software Libre
 
Seguridad Sistemas de Gobierno
Seguridad Sistemas de GobiernoSeguridad Sistemas de Gobierno
Seguridad Sistemas de Gobierno
 
Tunneling: Esquivando Restricciones de Proxies y Firewalls
Tunneling: Esquivando Restricciones de Proxies y FirewallsTunneling: Esquivando Restricciones de Proxies y Firewalls
Tunneling: Esquivando Restricciones de Proxies y Firewalls
 
Bi Un Modelo Eficiente para Gerenciar Empresas
Bi Un Modelo Eficiente para Gerenciar EmpresasBi Un Modelo Eficiente para Gerenciar Empresas
Bi Un Modelo Eficiente para Gerenciar Empresas
 
Clouds privadas
Clouds privadasClouds privadas
Clouds privadas
 
Introduccion Computacion Ubicua
Introduccion Computacion UbicuaIntroduccion Computacion Ubicua
Introduccion Computacion Ubicua
 
Frameworks de Desarrollo Web Grails
Frameworks de Desarrollo Web GrailsFrameworks de Desarrollo Web Grails
Frameworks de Desarrollo Web Grails
 
Avances Tecnologicos
Avances TecnologicosAvances Tecnologicos
Avances Tecnologicos
 
Dni Electronico Bolivia
Dni Electronico BoliviaDni Electronico Bolivia
Dni Electronico Bolivia
 

Dernier

POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...silviayucra2
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan JosephBRAYANJOSEPHPEREZGOM
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxpabonheidy28
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIAWilbisVega
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveFagnerLisboa3
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdfIsabellaMontaomurill
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafiosFundación YOD YOD
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx241521559
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudianteAndreaHuertas24
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíassuserf18419
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxJOSEMANUELHERNANDEZH11
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesFundación YOD YOD
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024GiovanniJavierHidalg
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricKeyla Dolores Méndez
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)GDGSucre
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfsoporteupcology
 

Dernier (16)

POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
POWER POINT YUCRAElabore una PRESENTACIÓN CORTA sobre el video película: La C...
 
guía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Josephguía de registro de slideshare por Brayan Joseph
guía de registro de slideshare por Brayan Joseph
 
Plan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docxPlan de aula informatica segundo periodo.docx
Plan de aula informatica segundo periodo.docx
 
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE  DE TECNOLOGIA E INFORMATICA PRIMARIACLASE  DE TECNOLOGIA E INFORMATICA PRIMARIA
CLASE DE TECNOLOGIA E INFORMATICA PRIMARIA
 
EPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial UninoveEPA-pdf resultado da prova presencial Uninove
EPA-pdf resultado da prova presencial Uninove
 
trabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdftrabajotecologiaisabella-240424003133-8f126965.pdf
trabajotecologiaisabella-240424003133-8f126965.pdf
 
La era de la educación digital y sus desafios
La era de la educación digital y sus desafiosLa era de la educación digital y sus desafios
La era de la educación digital y sus desafios
 
Proyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptxProyecto integrador. Las TIC en la sociedad S4.pptx
Proyecto integrador. Las TIC en la sociedad S4.pptx
 
9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante9egb-lengua y Literatura.pdf_texto del estudiante
9egb-lengua y Literatura.pdf_texto del estudiante
 
Trabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnologíaTrabajo Mas Completo De Excel en clase tecnología
Trabajo Mas Completo De Excel en clase tecnología
 
Hernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptxHernandez_Hernandez_Practica web de la sesion 12.pptx
Hernandez_Hernandez_Practica web de la sesion 12.pptx
 
KELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento ProtégelesKELA Presentacion Costa Rica 2024 - evento Protégeles
KELA Presentacion Costa Rica 2024 - evento Protégeles
 
Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024Cortes-24-de-abril-Tungurahua-3 año 2024
Cortes-24-de-abril-Tungurahua-3 año 2024
 
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft FabricGlobal Azure Lima 2024 - Integración de Datos con Microsoft Fabric
Global Azure Lima 2024 - Integración de Datos con Microsoft Fabric
 
International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)International Women's Day Sucre 2024 (IWD)
International Women's Day Sucre 2024 (IWD)
 
Redes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdfRedes direccionamiento y subredes ipv4 2024 .pdf
Redes direccionamiento y subredes ipv4 2024 .pdf
 

Bases de Datos Documentales

  • 1. Bases de datos documentales Este tipo de base de datos esta orientada exclusivamente a gestionar de forma efectiva el almacenamiento y acceso a documentos. Las bases de datos orientadas a documentos no almacenan datos en esquemas estrictos ni usan tablas con campos uniformes. Introducción Evolución de las bases de El manejo de información a través de bases datos de datos ha sido unos de los campos de Desde sus inicios las bases de datos han mayor aplicación dentro de la informática. A tenido una serie de cambios y características, lo largo de los años se han desarrollado que han determinado la presencia de numerosos manejadores de datos como: distintos tipos de base de datos y Oracle, Informix, SQL server, PostgreSQL, almacenamiento, de entre las cuales MySQL, etc. que permiten de una manera podemos destacar: fácil y eficiente manipular los datos, es decir: introducir, modificar, buscar, eliminar, generar ✔ Bases de datos flat reportes etc.. ✔ Bases de datos Jerárquicas Por lo general operan instalados en un ✔ Bases de datos de red servidor de datos al cual se conectan numerosos usuarios denominados clientes ✔ Bases de datos relacionales por medio de un red local tipo Intranet. ✔ Bases de datos dimensionales Desde hace varios años las herramientas ✔ Bases de datos orientadas a objetos informáticas han avanzado enormemente, en relación a los manejadores de datos vemos ✔ Bases de datos orientadas a como podemos trabajar con nuevos tipos de documentos campos como gráficos, animación y sonido, los cuales antes eran imposibles de manejar; esto ha producido verdaderas bases de datos Bases de datos relacionales multimedios. Hoy en día la mayoría de los SGBD son Otro aspecto donde se ha notado una relacionales, éstas están diseñadas para evolución importante es en la posibilidad de almacenar y hacer informes sobre datos conectar estas bases de datos a la Internet fuertemente estructurados (esquemas de manera directa y transparente. La estrictos) e interrelacionados. Su objetivo es información puede traspasar la barrera de la la de dotar mayor seguridad, más intranet y ser manejada de forma más amplia posibilidades y supuestamente estar por un mayor número de usuarios usando un preparados para afrontar la sobrecarga, navegador (browser), a esto se ha sumado adicionalmente permiten disponer de una una nueva forma de almacenar los datos, funcionalidad distribuida. pudiendo ser esta de forma natural (sin cambios) y no estructurada, que paradójicamente parecería lo opuesto a lo Base de datos orientada a que estamos acostumbrados hasta hoy en documentos día. A diferencia de las bases de datos relacionales, las bases de datos orientadas a
  • 2. documentos no almacenan datos en tablas un conjunto homogéneo de documentos que con campos uniformes para cada fila o pueden encontrarse en cualquier soporte registro (no tiene un esquema estricto). (papel, magnético, óptico, etc) Este tipo de base de datos esta orientada exclusivamente a almacenar y gestionar Funciones básicas del documentos. Cada documento es almacenado de forma que tenga ciertas análisis documental características, cualquier número o tipo de Entre las funciones básicas del análisis campos pueden ser añadidos a un documental se encuentran el: documento, e incluso contener varios tipos de datos. Dentro las bases de datos orientadas a ✔ Almacenar la información documental documentos se hace un uso intensivo de y pares clave/valor, considerándose a la base ✔ Facilitar su recuperación de datos como un conjunto de identificadores y documentos, y los documentos a su vez como un conjunto de de campos y valores. Conceptos básicos del Los pares clave/valor son muy usados en análisis documental cloud computing (computación de la nube), un buen ejemplo de esto es el algoritmo Map/ Dos elementos importantes dentro del Reduce; adicionalmente las bases de datos análisis documental son: documentales pueden ser consideradas ✔ La indexación y también como tablas hash y son optimizadas para datos accedidos mediante clave ✔ El lenguaje documental primaria. El no contar con una estructura estricta las Niveles del análisis hace mas eficientes al momento de manejar documental grandes volúmenes de documentos. Y la ausencia de relaciones, facilita la replicación En el análisis documental se realiza a tres de datos, pero denota la dificultad para niveles de detalle: expresar modelos complejos. ✔ Asiento: Se determinan los identificadores de la información SGBDD (título, autor, etc) ✔ Descriptores: Se extraen las Una Sistema de Gestión de Bases de Datos palabras clave más representativas Documentales se ocupa de la gestión de (indexación) documentos optimizando el almacenaje y facilitando su recuperación. ✔ Resumen (o abstract): Resumen analítico del texto integro para hacer A diferencia de cualquier otro SGBD, un más fácil la consulta SGBDD no realiza ningún tratamiento sobre la información, simplemente la almacena y Tesauros es un lenguaje documental que posibilita su recuperación. incluye relaciones semánticas de tres tipos: ✔ Relaciones de equivalencia Que es un documento ✔ Relaciones jerárquicas (término Un conjunto de información o conocimiento general y término específico) humano: un libro, una revista, una factura, ✔ Relaciones asociativas (términos una cédula de identidad, una conferencia relacionados) editada, una cinta de vídeo, un disco, etc. En consecuencia, un fondo documental será
  • 3. Bases de datos orientadas a Ventajas documentos o NoSQL ✔ No están sujetas a esquemas estrictos NoSQL es un término que representa y engloba a las bases de datos no relacionales ✔ Poseen un lenguaje de consulta o las orientadas a documentos y cuyo uso se orientado al lenguaje natural ha extendido rápidamente, junto con la ✔ Extrema sencillez en el escalado popularidad de este tipo de bases de datos. horizontal. Ejemplo de diferencias de SQL y NoSQL A continuación mostramos un ejemplo de las diferencias de almacenamiento y tratamiento entre las bases de datos relacionales y no relacionales. Base de datos orientada a documentos: Clave Documento 63 Nombre: Esteban; Apellidos: Saavedra; Nacionalidad: Boliviana 64 Nombre: Francisco; Apellidos: Torrez; Nacionalidad: Portuguesa; Edad: 39; 65 Nombre: Jorge; Nacionalidad: Chilena Base de datos relacional: Clave Nombre Apellidos Nacionalidad Edad 63 Esteban Saavedra Boliviana 64 Francisco Torrez Portuguesa 39 65 Jorge Chilena En el ejemplo podemos ver que en la base de datos NoSQL, los campos vacíos no se añaden y que se pueden añadir campos concretos a documentos concretos, sin tener que aumentar el número de columnas. Tipos de almacenamiento Aplicaciones de En la actualidad existen varios tipos de almacenamiento clave/valor almacenamiento, entre los que destacan: ✔ Voldemort ✔ Clave/valor, almacenamiento ✔ Scalaris distribuido en tablas hash (DHT) ✔ Tokyo Cabinet ✔ Orientados a documentos ✔ Redis ✔ Orientados a columnas ✔ MemcacheDB
  • 4. Aplicaciones de de datos orientadas a documentos. almacenamiento orientados En el próximo número comenzaremos a describir algunas aplicaciones de origen a documentos opensource orientadas a la gestión de ✔ CouchDB documentos, considerando sus características propias, su instalación y ✔ MongoDB manejo. ✔ SimpleDB (Amazon) Autor Aplicaciones de almacenamiento orientado a columnas ✔ BigTable (Google) ✔ HBase (Hadoop Database) ✔ Hypertable (BigTable Open Source clone) Esteban Saavedra López ✔ Cassandra (Facebook) Presidente de la Fundación AtixLibre (Bolivia) Activista de Software Libre en Bolivia jesaavedra@opentelematics.org Consideraciones esteban.saavedra@atixlibre.org Siempre es recomendable que antes de http://jesaavedra.opentelematics.org poner en marcha cualquier tipo de aplicación, http://www.atixlibre.org es recomendable inicialmente tener claro algunos conceptos relacionados, por lo que hemos dedicado este primer número a brindar una pequeña introducción a las bases