SlideShare une entreprise Scribd logo
1  sur  18
Bases de Datos
 Distribuidas


                   Presentado Por:
      Jonathan Pérez…2008-0821
          Renso Díaz…2009-0133
         Juan Castillo…2009-0161
         Luis Collado…2009-0452
HISTORIA DE LAS BASES DE DATOS DISTRIBUIDAS

La necesidad de almacenar datos de forma masiva dio
paso a la creación de los sistemas de bases de datos. En
1970 Edgar Frank Codd escribió un artículo con nombre:
"A Relational Model of Data for Large Shared Data
Banks" ("Un modelo relacional para grandes bancos de
datos compartidos"). Con este artículo y otras
publicaciones, definió el modelo de bases de datos
relacionales y reglas para poder evaluar un
administrador de bases de datos relacionales.
Inicialmente podemos decir que las SBDD surgen como
respuesta a la distribución que las empresas ya tienen, al
menos de manera lógica (divisiones, departamentos, etc…) y
que en ocasiones también tiene de manera física (plantas,
fábricas, etc…). Todo esto nos lleva a que posiblemente los
datos también estén distribuidos, ya que cada unidad
organizacional mantendrá los datos con los que normalmente
opere.
A cada uno de estas subdivisiones se les llama “islas de información”
(sitios), y lo que hace un sistema distribuido es establecer los “puentes”
necesarios para conectar a esas islas entre si.
En definitiva lo que pretende es que la estructura de la base de datos
refleje la estructura de la empresa (principal beneficio de los sistemas
distribuidos). Es en realidad una BD virtual compuesta de varias BDs
“reales” distintas que se encuentran en varios sitios distintos.
Otra de las principales motivaciones para el desarrollo de sistemas de bases de
datos es el deseo de integrar los datos operacionales de una organización y
proporcionar un acceso controlado a esos datos. Aunque la integración y el acceso
controlado pueden implicar la necesidad de utilizar mecanismos de centralización,
el objetivo en realidad no es ese. De hecho, el desarrollo de redes informáticas
promueve el modo descentralizado de trabajo.


Los SGBD distribuidos deberían ayudarnos a resolver el problema de las islas de
información. Esto puede ser resultado de la separación geográfica, de la
incompatibilidad de las arquitecturas informáticas, de los protocolos de
comunicaciones, etc. Si se consigue integrar las bases de datos en un todo lógico
coherente, podemos resolver el problema.
DEFINICIÓN DE BASES DE DATOS DISTRIBUIDAS


Podemos ver las BDD Como una colección de múltiples bases
de datos interrelacionadas lógicamente y distribuidas por una
red de computadores, formando una única gran base de
datos.
TIPOS DE BASE DE DATOS DISTRIBUIDAS (I)
  Una de las decisiones más importantes que el
  diseñador de bases de datos distribuidas debe tomar
  es el posicionamiento de la data en el sistema y el
  esquema bajo el cual lo desea hacer. Para esto
  existen cuatro alternativas principales: centralizada,
  replicada, fragmentada, e híbrida.
TIPOS DE BASE DE DATOS DISTRIBUIDAS (II)

•   Centralizada: Es muy similar al modelo de Cliente/Servidor en el sentido
    que la BDD está centralizada en un lugar y los usuarios están
    distribuidos. Este modelo solo brinda la ventaja de tener el
    procesamiento distribuido ya que en sentido de disponibilidad y
    fiabilidad de los datos no se gana nada.
•   Replicadas: El esquema de BDD de replicación consiste en que cada
    nodo debe tener su copia completa de la base de datos. Es fácil ver que
    este esquema tiene un alto costo en el almacenamiento de la
    información. Debido a que la actualización de los datos debe ser
    realizada en todas las copias, también tiene un alto costo de escritura,
    pero todo esto vale la pena si tenemos un sistema en el que se va a
    escribir pocas veces y leer muchas, y dónde la disponibilidad y fiabilidad
    de los datos sea de máxima importancia.
TIPOS DE BASE DE DATOS DISTRIBUIDAS (III)

•   Particionadas: Este modelo consiste en que solo hay una copia de cada
    elemento, pero la información está distribuida a través de los nodos. En
    cada nodo se aloja uno o más fragmentos disjuntos de la base de datos.
    Como los fragmentos no se replican esto disminuye el costo de
    almacenamiento, pero también sacrifica la disponibilidad y fiabilidad de los
    datos. Algo que se debe tomar en cuenta cuando se desea implementar
    este modelo es la granularidad de la fragmentación. La fragmentación se
    puede realizar también de tres formas:
           • Horizontal
           • Vertical
           • Mixto
•   Híbrida: Este esquema simplemente representa la combinación del
    esquema de partición y replicación. Se particiona la relación y a la vez los
    fragmentos están selectivamente replicados a través del sistema de BDD.
LOS OBJETIVOS DE UN SGBDD

1. Autonomía local: Los sitios en un sistema distribuido deben ser autónomos.
 La autonomía local significa que todas las operaciones en un sitio dado están
  controladas por ese sitio; ningún sitio X debe depender de algún otro sitio Y para
  su operación satisfactoria.
 La seguridad, integridad y representación de almacenamiento de los datos
  locales permanecen bajo el control y jurisdicción del sitio local.


2. Independencia de un sitio central: La autonomía local implica que todos los
sitios deben ser tratados como iguales.
 Por lo tanto, no debe haber particularmente ninguna dependencia de un sitio
  “maestro” central para algún servicio central, tal que todo el sistema dependa de
  ese sitio central.
 Razones por las cuales no debería haber un sitio central:
    El sitio central puede ser un cuello de botella
    El sistema sería vulnerable; es decir, si el sitio central falla, también fallará
     todo el sistema
3. El sistema debe estar en continua operación: Una ventaja de los sistemas distribuidos es
que deben proporcionar mayor confiabilidad y mayor disponibilidad.


Confiabilidad. La probabilidad de que el sistema esté listo y funcionando en cualquier
   momento dado. Los SD no son una propuesta de todo o nada; pueden continuar
   operando cuando hay alguna falla en algún componente independiente.
Disponibilidad: probabilidad de que el sistema esté listo y funcionando continuamente a lo
    largo de un período especificado. Podemos decir que nunca debería ser necesario apagar
    el sistema para realizar tareas como: añadir un sitio, creación dinámica de fragmentos,
    actualización de versiones, etc.


4. Transparencia de ubicación: Para el usuario la localización física de los datos debe ser
transparente. No necesita saber dónde está el dato para utilizarlo.


5. Transparencia de fragmentación: Un sistema soporta la fragmentación de datos cuando
puede ser dividida en o partes o fragmentos, para efectos de almacenamiento físico.
 La fragmentación es necesaria por razones de rendimiento: los datos pueden estar
  almacenados en la ubicación donde son usados más frecuentemente para que la mayoría
  de las operaciones sean locales y se reduzca el tráfico en la red.
 Los usuarios deben comportarse como si los datos en realidad estuvieran sin
  fragmentación alguna.
6. Transparencia en la replicación: El sistema soporta replicación de datos cuando
un fragmento puede ser representado por muchas copias distintas, o réplicas,
guardadas en muchos sitios distintos.
 Las réplicas son necesarias por dos razones principales:
 Significan un mejor rendimiento (las aplicaciones pueden operar sobre las copias
  locales en lugar de tener que comunicarse con sitios remotos).
 Pueden significar una mejor disponibilidad (un objeto replicado permanece
  disponible para su procesamiento, mientras esté disponible al menos una copia).
Por supuesto, la principal desventaja de las réplicas es que al actualizarlas es
   necesario actualizar todas: el problema de la propagación de la actualización.


7. Procesamiento de consultas distribuidas: El sistema debe ser capaz de procesar
    consultas que afecten a datos de más de un sitio y hacerlo de forma
    optimizada. Este hecho puede ser considerado como otra razón por la que los
    sistemas distribuidos siempre son relacionales (las peticiones relacionales son
    optimizables, mientras que las no relacionales no lo son).
8. Administración de transacciones distribuidas: Existen dos aspectos principales en la
administración de transacciones: control de recuperación y control de la concurrencia.
 Ambos aspectos requieren un tratamiento amplio en el ambiente distribuido.
 Ya que una sola transacción puede involucrar la ejecución de código en muchos sitios.
 Puede involucrar actualizaciones en muchos sitios y se debe de cuidar que la
  transacción no caiga en un bloqueo mortal (basado en el bloqueo).
 Para el control de la recuperación, es necesario asegurarse que una transacción
  dada sea atómica en el ambiente distribuido, el sistema debe por lo tanto asegurarse
  de que la transacción sea confirmada o deshecha (se puede utilizar el protocolo de
  confirmación de dos fases).


9. Independencia del hardware: Es necesario tener la posibilidad de ejecutar el mismo
SGBDD en diferentes plataformas de hardware (IBM, ICL, HP, PC, SUN) y, además, hacer
que esas máquinas diferentes participen de igual forma en un sistema distribuido.


10. Independencia del sistema operativo: Una vez más, es necesario tener la posibilidad
de ejecutar el mismo SGBDD, en diferentes plataformas de sistema operativo (UNIX,
Windows XP …) bajo un mismo sistema distribuido.
11. Independencia de la red: El sistema debe tener la posibilidad de soportar
también, una variedad de redes de comunicación distintas.


12. Independencia del SGBD: Lo que se necesita es que todos los ejemplares de
DBMS en sitios diferentes soporten la misma interfaz.
 Aunque no tienen que ser necesariamente copias del mismo software DBMS.
 En otras palabras, sería posible que el sistema distribuido fuera heterogéneo, al
  menos en cierto grado.
 Sería muy bueno si diferentes DBMS pudieran participar de alguna forma en un
  sistema distribuido.
VENTAJAS (I)
•   La principal ventaja de los sistemas distribuidos es la capacidad de compartir y
    acceder a la información de una forma fiable y eficaz.


•   Flexibilidad, acceso desde distintos lugares y por distintas personas a la vez


•   Autonomía, Cada nodo tiene cierto grado de control sobre sus datos, en un
    sistema centralizado, hay un administrador del sistema responsable de los datos
    a nivel global. En base de datos distribuidas, cada administrador local puede
    tener un nivel de autonomía.


•   Agilización del procesamiento de consultas. Si una consulta comprende datos de
    varias localidades, puede ser posible dividir la consulta en varias subconsultas
    que se ejecuten en paralelo en distintas localidades.
VENTAJAS (II)
•   Mejora del rendimiento, BD más pequeñas, operaciones de menor
    volumen. Los datos son localizados en lugar más cercano, por tanto, el
    acceso es más rápido, logrando esto un mejor rendimiento.


•   Fiabilidad y disponibilidad. Si se produce un fallo en una localidad de un
    sistema distribuido, es posible que las demás localidades puedan seguir
    trabajando. En particular, si los datos se repiten en varias localidades,
    una transacción que requiere un dato específico puede encontrarlo en
    más de una localidad. Así, el fallo de una localidad no implica
    necesariamente la desactivación del sistema.
VENTAJAS (III)
•   Modularidad, se pueden modificar, agregar o quitar sistemas de la base
    de datos distribuida sin afectar a los demás sistemas (módulos).
DESVENTAJAS
•   Coste de desarrollo del software. La complejidad añadida que es
    necesaria para mantener la coordinación entre nodos hace que el
    desarrollo de software sea más costoso.
•   Dificultad de diseño.
•   Mayor probabilidad de errores. Como los nodos que constituyen el
    sistema funcionan en paralelo, es más difícil asegurar el funcionamiento
    correcto de los algoritmos, así como de los procedimientos de
    recuperación de fallos del sistema.
•   Mayor dificultad para la administración de la base de datos, y un mayor
    coste a nivel de implementación.

Contenu connexe

Tendances

Modelos y capas de la ingenieria de software
Modelos y capas  de la ingenieria de softwareModelos y capas  de la ingenieria de software
Modelos y capas de la ingenieria de software
jhonatanalex
 
Distribución y fragmentación de datos
Distribución y fragmentación  de datosDistribución y fragmentación  de datos
Distribución y fragmentación de datos
José Mendoza
 
Ingenieria de requerimientos 1
Ingenieria de requerimientos 1Ingenieria de requerimientos 1
Ingenieria de requerimientos 1
jmpov441
 
Base de datos propiedades acid
Base de datos propiedades acidBase de datos propiedades acid
Base de datos propiedades acid
Jefer Lee Parra
 

Tendances (20)

Unidad 3 Modelo De Negocio
Unidad 3 Modelo De NegocioUnidad 3 Modelo De Negocio
Unidad 3 Modelo De Negocio
 
Modelos y capas de la ingenieria de software
Modelos y capas  de la ingenieria de softwareModelos y capas  de la ingenieria de software
Modelos y capas de la ingenieria de software
 
Ingenieria de software
Ingenieria de softwareIngenieria de software
Ingenieria de software
 
3.1 inserción, eliminación y modificación de registros
3.1 inserción, eliminación y modificación de registros3.1 inserción, eliminación y modificación de registros
3.1 inserción, eliminación y modificación de registros
 
Distribución y fragmentación de datos
Distribución y fragmentación  de datosDistribución y fragmentación  de datos
Distribución y fragmentación de datos
 
PAGINACION Y SEGMENTACION DE MEMORIA
PAGINACION Y SEGMENTACION DE MEMORIAPAGINACION Y SEGMENTACION DE MEMORIA
PAGINACION Y SEGMENTACION DE MEMORIA
 
Modelo de prototipo
Modelo de prototipoModelo de prototipo
Modelo de prototipo
 
Bases de datos orientadas a objetos
Bases de datos orientadas a objetosBases de datos orientadas a objetos
Bases de datos orientadas a objetos
 
Arquitectura 3 Capas
Arquitectura 3 CapasArquitectura 3 Capas
Arquitectura 3 Capas
 
Transacciones
TransaccionesTransacciones
Transacciones
 
Diagrama componentes
Diagrama componentesDiagrama componentes
Diagrama componentes
 
Ingenieria de requerimientos 1
Ingenieria de requerimientos 1Ingenieria de requerimientos 1
Ingenieria de requerimientos 1
 
10.el diseño en el nivel de componentes
10.el diseño en el nivel de componentes10.el diseño en el nivel de componentes
10.el diseño en el nivel de componentes
 
Gestión de archivos
Gestión de archivosGestión de archivos
Gestión de archivos
 
Estándares del modelo osi
Estándares del modelo osiEstándares del modelo osi
Estándares del modelo osi
 
Fundamentos de Ingenieria de Software - Unidad 1 modelo de negocios
Fundamentos de Ingenieria de Software - Unidad 1 modelo de negociosFundamentos de Ingenieria de Software - Unidad 1 modelo de negocios
Fundamentos de Ingenieria de Software - Unidad 1 modelo de negocios
 
Normalización de Base de Datos
Normalización de Base de DatosNormalización de Base de Datos
Normalización de Base de Datos
 
Tema 4: Procesamiento paralelo.
Tema 4: Procesamiento paralelo.Tema 4: Procesamiento paralelo.
Tema 4: Procesamiento paralelo.
 
Procedimientos almacenados
Procedimientos almacenadosProcedimientos almacenados
Procedimientos almacenados
 
Base de datos propiedades acid
Base de datos propiedades acidBase de datos propiedades acid
Base de datos propiedades acid
 

Similaire à Bases de datos distribuidas

bases de datos distribuidas
bases de datos distribuidasbases de datos distribuidas
bases de datos distribuidas
Bofo Cid
 
Base de datos distribuidas
Base de datos distribuidasBase de datos distribuidas
Base de datos distribuidas
juan carlos
 
Presen base de datos distribuida
Presen base de datos distribuidaPresen base de datos distribuida
Presen base de datos distribuida
Armando Rosales
 
Arquitecturas de bd
Arquitecturas de bdArquitecturas de bd
Arquitecturas de bd
Luis Jherry
 
Presen bdd 3
Presen bdd 3Presen bdd 3
Presen bdd 3
ankrn_glz
 
Base de datos distribuida
Base de datos distribuidaBase de datos distribuida
Base de datos distribuida
Julio Lovera
 

Similaire à Bases de datos distribuidas (20)

Base de datos distribuidas
Base de datos distribuidasBase de datos distribuidas
Base de datos distribuidas
 
bases de datos distribuidas
bases de datos distribuidasbases de datos distribuidas
bases de datos distribuidas
 
Tema del 1.1 al 1.2
Tema del 1.1 al 1.2Tema del 1.1 al 1.2
Tema del 1.1 al 1.2
 
Base de datos distribuidas vs centralizadas
Base de datos distribuidas vs centralizadasBase de datos distribuidas vs centralizadas
Base de datos distribuidas vs centralizadas
 
Base de datos distribuidas
Base de datos distribuidasBase de datos distribuidas
Base de datos distribuidas
 
Base de datos distribuidas
Base de datos distribuidasBase de datos distribuidas
Base de datos distribuidas
 
Presen base de datos distribuida
Presen base de datos distribuidaPresen base de datos distribuida
Presen base de datos distribuida
 
Unidad1 Bases De Datos Distribuidas
Unidad1 Bases De Datos DistribuidasUnidad1 Bases De Datos Distribuidas
Unidad1 Bases De Datos Distribuidas
 
Distribuidas y centralizadas
Distribuidas y centralizadasDistribuidas y centralizadas
Distribuidas y centralizadas
 
Arquitecturas de Base de Datos- kmm.pptx
Arquitecturas de Base de Datos- kmm.pptxArquitecturas de Base de Datos- kmm.pptx
Arquitecturas de Base de Datos- kmm.pptx
 
Tipos_Arquitecturas_de_Base_de_Datos.pptx
Tipos_Arquitecturas_de_Base_de_Datos.pptxTipos_Arquitecturas_de_Base_de_Datos.pptx
Tipos_Arquitecturas_de_Base_de_Datos.pptx
 
Arquitecturas de bd
Arquitecturas de bdArquitecturas de bd
Arquitecturas de bd
 
Final presentacionactualizada
Final presentacionactualizadaFinal presentacionactualizada
Final presentacionactualizada
 
Presen bdd 3
Presen bdd 3Presen bdd 3
Presen bdd 3
 
tema 1.pptx
tema 1.pptxtema 1.pptx
tema 1.pptx
 
Base de datos distribuida
Base de datos distribuidaBase de datos distribuida
Base de datos distribuida
 
Cuestiones de Repaso: Capítulo 22
Cuestiones de Repaso: Capítulo 22Cuestiones de Repaso: Capítulo 22
Cuestiones de Repaso: Capítulo 22
 
Notas bd distribuidas
Notas bd distribuidasNotas bd distribuidas
Notas bd distribuidas
 
Bd centralizadas distribuidas
Bd centralizadas distribuidasBd centralizadas distribuidas
Bd centralizadas distribuidas
 
Cuestiones de Repaso Capitulo 22
Cuestiones de Repaso Capitulo 22Cuestiones de Repaso Capitulo 22
Cuestiones de Repaso Capitulo 22
 

Dernier

RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACIONRESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
amelia poma
 
Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdf
patriciaines1993
 

Dernier (20)

Linea del tiempo - Filosofos Cristianos.docx
Linea del tiempo - Filosofos Cristianos.docxLinea del tiempo - Filosofos Cristianos.docx
Linea del tiempo - Filosofos Cristianos.docx
 
Factores que intervienen en la Administración por Valores.pdf
Factores que intervienen en la Administración por Valores.pdfFactores que intervienen en la Administración por Valores.pdf
Factores que intervienen en la Administración por Valores.pdf
 
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).pptPINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
 
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACIONRESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
RESOLUCIÓN VICEMINISTERIAL 00048 - 2024 EVALUACION
 
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN PARÍS. Por JAVIER SOL...
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN  PARÍS. Por JAVIER SOL...ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN  PARÍS. Por JAVIER SOL...
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN PARÍS. Por JAVIER SOL...
 
prostitución en España: una mirada integral!
prostitución en España: una mirada integral!prostitución en España: una mirada integral!
prostitución en España: una mirada integral!
 
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docxPLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
PLAN DE REFUERZO ESCOLAR MERC 2024-2.docx
 
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxCONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
 
Usos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicasUsos y desusos de la inteligencia artificial en revistas científicas
Usos y desusos de la inteligencia artificial en revistas científicas
 
Proyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdfProyecto de aprendizaje dia de la madre MINT.pdf
Proyecto de aprendizaje dia de la madre MINT.pdf
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESOPrueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
Prueba de evaluación Geografía e Historia Comunidad de Madrid 4ºESO
 
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdfFeliz Día de la Madre - 5 de Mayo, 2024.pdf
Feliz Día de la Madre - 5 de Mayo, 2024.pdf
 
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdfPlan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
 
Los avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtualesLos avatares para el juego dramático en entornos virtuales
Los avatares para el juego dramático en entornos virtuales
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024
 
Power Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptxPower Point E. S.: Los dos testigos.pptx
Power Point E. S.: Los dos testigos.pptx
 
PP_Comunicacion en Salud: Objetivación de signos y síntomas
PP_Comunicacion en Salud: Objetivación de signos y síntomasPP_Comunicacion en Salud: Objetivación de signos y síntomas
PP_Comunicacion en Salud: Objetivación de signos y síntomas
 
Tema 11. Dinámica de la hidrosfera 2024
Tema 11.  Dinámica de la hidrosfera 2024Tema 11.  Dinámica de la hidrosfera 2024
Tema 11. Dinámica de la hidrosfera 2024
 
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICABIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
BIOMETANO SÍ, PERO NO ASÍ. LA NUEVA BURBUJA ENERGÉTICA
 

Bases de datos distribuidas

  • 1. Bases de Datos Distribuidas Presentado Por: Jonathan Pérez…2008-0821 Renso Díaz…2009-0133 Juan Castillo…2009-0161 Luis Collado…2009-0452
  • 2. HISTORIA DE LAS BASES DE DATOS DISTRIBUIDAS La necesidad de almacenar datos de forma masiva dio paso a la creación de los sistemas de bases de datos. En 1970 Edgar Frank Codd escribió un artículo con nombre: "A Relational Model of Data for Large Shared Data Banks" ("Un modelo relacional para grandes bancos de datos compartidos"). Con este artículo y otras publicaciones, definió el modelo de bases de datos relacionales y reglas para poder evaluar un administrador de bases de datos relacionales.
  • 3. Inicialmente podemos decir que las SBDD surgen como respuesta a la distribución que las empresas ya tienen, al menos de manera lógica (divisiones, departamentos, etc…) y que en ocasiones también tiene de manera física (plantas, fábricas, etc…). Todo esto nos lleva a que posiblemente los datos también estén distribuidos, ya que cada unidad organizacional mantendrá los datos con los que normalmente opere.
  • 4. A cada uno de estas subdivisiones se les llama “islas de información” (sitios), y lo que hace un sistema distribuido es establecer los “puentes” necesarios para conectar a esas islas entre si. En definitiva lo que pretende es que la estructura de la base de datos refleje la estructura de la empresa (principal beneficio de los sistemas distribuidos). Es en realidad una BD virtual compuesta de varias BDs “reales” distintas que se encuentran en varios sitios distintos.
  • 5. Otra de las principales motivaciones para el desarrollo de sistemas de bases de datos es el deseo de integrar los datos operacionales de una organización y proporcionar un acceso controlado a esos datos. Aunque la integración y el acceso controlado pueden implicar la necesidad de utilizar mecanismos de centralización, el objetivo en realidad no es ese. De hecho, el desarrollo de redes informáticas promueve el modo descentralizado de trabajo. Los SGBD distribuidos deberían ayudarnos a resolver el problema de las islas de información. Esto puede ser resultado de la separación geográfica, de la incompatibilidad de las arquitecturas informáticas, de los protocolos de comunicaciones, etc. Si se consigue integrar las bases de datos en un todo lógico coherente, podemos resolver el problema.
  • 6. DEFINICIÓN DE BASES DE DATOS DISTRIBUIDAS Podemos ver las BDD Como una colección de múltiples bases de datos interrelacionadas lógicamente y distribuidas por una red de computadores, formando una única gran base de datos.
  • 7. TIPOS DE BASE DE DATOS DISTRIBUIDAS (I) Una de las decisiones más importantes que el diseñador de bases de datos distribuidas debe tomar es el posicionamiento de la data en el sistema y el esquema bajo el cual lo desea hacer. Para esto existen cuatro alternativas principales: centralizada, replicada, fragmentada, e híbrida.
  • 8. TIPOS DE BASE DE DATOS DISTRIBUIDAS (II) • Centralizada: Es muy similar al modelo de Cliente/Servidor en el sentido que la BDD está centralizada en un lugar y los usuarios están distribuidos. Este modelo solo brinda la ventaja de tener el procesamiento distribuido ya que en sentido de disponibilidad y fiabilidad de los datos no se gana nada. • Replicadas: El esquema de BDD de replicación consiste en que cada nodo debe tener su copia completa de la base de datos. Es fácil ver que este esquema tiene un alto costo en el almacenamiento de la información. Debido a que la actualización de los datos debe ser realizada en todas las copias, también tiene un alto costo de escritura, pero todo esto vale la pena si tenemos un sistema en el que se va a escribir pocas veces y leer muchas, y dónde la disponibilidad y fiabilidad de los datos sea de máxima importancia.
  • 9. TIPOS DE BASE DE DATOS DISTRIBUIDAS (III) • Particionadas: Este modelo consiste en que solo hay una copia de cada elemento, pero la información está distribuida a través de los nodos. En cada nodo se aloja uno o más fragmentos disjuntos de la base de datos. Como los fragmentos no se replican esto disminuye el costo de almacenamiento, pero también sacrifica la disponibilidad y fiabilidad de los datos. Algo que se debe tomar en cuenta cuando se desea implementar este modelo es la granularidad de la fragmentación. La fragmentación se puede realizar también de tres formas: • Horizontal • Vertical • Mixto • Híbrida: Este esquema simplemente representa la combinación del esquema de partición y replicación. Se particiona la relación y a la vez los fragmentos están selectivamente replicados a través del sistema de BDD.
  • 10. LOS OBJETIVOS DE UN SGBDD 1. Autonomía local: Los sitios en un sistema distribuido deben ser autónomos.  La autonomía local significa que todas las operaciones en un sitio dado están controladas por ese sitio; ningún sitio X debe depender de algún otro sitio Y para su operación satisfactoria.  La seguridad, integridad y representación de almacenamiento de los datos locales permanecen bajo el control y jurisdicción del sitio local. 2. Independencia de un sitio central: La autonomía local implica que todos los sitios deben ser tratados como iguales.  Por lo tanto, no debe haber particularmente ninguna dependencia de un sitio “maestro” central para algún servicio central, tal que todo el sistema dependa de ese sitio central.  Razones por las cuales no debería haber un sitio central:  El sitio central puede ser un cuello de botella  El sistema sería vulnerable; es decir, si el sitio central falla, también fallará todo el sistema
  • 11. 3. El sistema debe estar en continua operación: Una ventaja de los sistemas distribuidos es que deben proporcionar mayor confiabilidad y mayor disponibilidad. Confiabilidad. La probabilidad de que el sistema esté listo y funcionando en cualquier momento dado. Los SD no son una propuesta de todo o nada; pueden continuar operando cuando hay alguna falla en algún componente independiente. Disponibilidad: probabilidad de que el sistema esté listo y funcionando continuamente a lo largo de un período especificado. Podemos decir que nunca debería ser necesario apagar el sistema para realizar tareas como: añadir un sitio, creación dinámica de fragmentos, actualización de versiones, etc. 4. Transparencia de ubicación: Para el usuario la localización física de los datos debe ser transparente. No necesita saber dónde está el dato para utilizarlo. 5. Transparencia de fragmentación: Un sistema soporta la fragmentación de datos cuando puede ser dividida en o partes o fragmentos, para efectos de almacenamiento físico.  La fragmentación es necesaria por razones de rendimiento: los datos pueden estar almacenados en la ubicación donde son usados más frecuentemente para que la mayoría de las operaciones sean locales y se reduzca el tráfico en la red.  Los usuarios deben comportarse como si los datos en realidad estuvieran sin fragmentación alguna.
  • 12. 6. Transparencia en la replicación: El sistema soporta replicación de datos cuando un fragmento puede ser representado por muchas copias distintas, o réplicas, guardadas en muchos sitios distintos. Las réplicas son necesarias por dos razones principales:  Significan un mejor rendimiento (las aplicaciones pueden operar sobre las copias locales en lugar de tener que comunicarse con sitios remotos).  Pueden significar una mejor disponibilidad (un objeto replicado permanece disponible para su procesamiento, mientras esté disponible al menos una copia). Por supuesto, la principal desventaja de las réplicas es que al actualizarlas es necesario actualizar todas: el problema de la propagación de la actualización. 7. Procesamiento de consultas distribuidas: El sistema debe ser capaz de procesar consultas que afecten a datos de más de un sitio y hacerlo de forma optimizada. Este hecho puede ser considerado como otra razón por la que los sistemas distribuidos siempre son relacionales (las peticiones relacionales son optimizables, mientras que las no relacionales no lo son).
  • 13. 8. Administración de transacciones distribuidas: Existen dos aspectos principales en la administración de transacciones: control de recuperación y control de la concurrencia.  Ambos aspectos requieren un tratamiento amplio en el ambiente distribuido.  Ya que una sola transacción puede involucrar la ejecución de código en muchos sitios.  Puede involucrar actualizaciones en muchos sitios y se debe de cuidar que la transacción no caiga en un bloqueo mortal (basado en el bloqueo).  Para el control de la recuperación, es necesario asegurarse que una transacción dada sea atómica en el ambiente distribuido, el sistema debe por lo tanto asegurarse de que la transacción sea confirmada o deshecha (se puede utilizar el protocolo de confirmación de dos fases). 9. Independencia del hardware: Es necesario tener la posibilidad de ejecutar el mismo SGBDD en diferentes plataformas de hardware (IBM, ICL, HP, PC, SUN) y, además, hacer que esas máquinas diferentes participen de igual forma en un sistema distribuido. 10. Independencia del sistema operativo: Una vez más, es necesario tener la posibilidad de ejecutar el mismo SGBDD, en diferentes plataformas de sistema operativo (UNIX, Windows XP …) bajo un mismo sistema distribuido.
  • 14. 11. Independencia de la red: El sistema debe tener la posibilidad de soportar también, una variedad de redes de comunicación distintas. 12. Independencia del SGBD: Lo que se necesita es que todos los ejemplares de DBMS en sitios diferentes soporten la misma interfaz.  Aunque no tienen que ser necesariamente copias del mismo software DBMS.  En otras palabras, sería posible que el sistema distribuido fuera heterogéneo, al menos en cierto grado.  Sería muy bueno si diferentes DBMS pudieran participar de alguna forma en un sistema distribuido.
  • 15. VENTAJAS (I) • La principal ventaja de los sistemas distribuidos es la capacidad de compartir y acceder a la información de una forma fiable y eficaz. • Flexibilidad, acceso desde distintos lugares y por distintas personas a la vez • Autonomía, Cada nodo tiene cierto grado de control sobre sus datos, en un sistema centralizado, hay un administrador del sistema responsable de los datos a nivel global. En base de datos distribuidas, cada administrador local puede tener un nivel de autonomía. • Agilización del procesamiento de consultas. Si una consulta comprende datos de varias localidades, puede ser posible dividir la consulta en varias subconsultas que se ejecuten en paralelo en distintas localidades.
  • 16. VENTAJAS (II) • Mejora del rendimiento, BD más pequeñas, operaciones de menor volumen. Los datos son localizados en lugar más cercano, por tanto, el acceso es más rápido, logrando esto un mejor rendimiento. • Fiabilidad y disponibilidad. Si se produce un fallo en una localidad de un sistema distribuido, es posible que las demás localidades puedan seguir trabajando. En particular, si los datos se repiten en varias localidades, una transacción que requiere un dato específico puede encontrarlo en más de una localidad. Así, el fallo de una localidad no implica necesariamente la desactivación del sistema.
  • 17. VENTAJAS (III) • Modularidad, se pueden modificar, agregar o quitar sistemas de la base de datos distribuida sin afectar a los demás sistemas (módulos).
  • 18. DESVENTAJAS • Coste de desarrollo del software. La complejidad añadida que es necesaria para mantener la coordinación entre nodos hace que el desarrollo de software sea más costoso. • Dificultad de diseño. • Mayor probabilidad de errores. Como los nodos que constituyen el sistema funcionan en paralelo, es más difícil asegurar el funcionamiento correcto de los algoritmos, así como de los procedimientos de recuperación de fallos del sistema. • Mayor dificultad para la administración de la base de datos, y un mayor coste a nivel de implementación.