PINTURA DEL RENACIMIENTO EN ESPAÑA (SIGLO XVI).ppt
Arquitecturas de bd
1. Base de Datos:
Arquitecturas de Bases de
Datos Multiusuario
D t M lti i
Profesor:
Msc.
Msc Luis Serna Jherry
2. Objetivos del Dia de Hoy
Sistemas Centralizados
Sistemas Cliente Servidor
Sistemas Distribuidos
3. Sistemas Cent ali ados
Centralizados
Usuario 1
i
AP1
D
Usuario 2 OScc B OSdm
AP2
M DB
S
AP3
Usuario n
Oscc = Control de comunicaciones del sistema operativo
Osdm = Administración de datos del sistema operativo
4. Arquitectura cliente - servidor
Usuario 1
i AP1 OS
net
AP2 Red
Usuario 2 AP2 OSnet
OSnet DBMS OSdm BD
AP2 OS Osnet= porción de comunicaciones de red
Usuario n net
AP3 del SO
Oddm= p
porción de administración de datos
del SO
5. Sistemas Cliente/Servidor
/
Funcionalidades de la parte visible al
usuario y del sistema subyacente
i d l i b
Interfaz de Diseñador
Interfaz de Interfaz Parte visible
usuario de
formularios gráfica al usuario
SQL Informes
Interfaz
(SQL + API)
Motor SQL
Sistema
subyacente
6. Sistemas Cliente/Servidor
Si t Cli t /S id
Existen dos arquitecturas básicas:
De dos niveles, en los que:
La lógica de la Presentación está en el Cliente.
La lógica de los Datos y del negocio está en el Servidor.
g g
De tres niveles, que implica servicios de gestión
de transacciones complejas, y donde:
La lógica de la Presentación está en el Cliente.
La lógica de los Datos está en el Servidor de Datos
La lógica del Negocio está en el Servidor de
Aplicaciones.
7. Sistema Distribuido de Base de
Datos
Sitio 3 Sitio 2
Sitio 4
Red de Comunicaciones
Sitio 5 Sitio 1
9. Sistemas Distribuidos
En un sistema distribuido la base de datos se
almacena en varias computadoras.
Varios medios de comunicación, como redes
de alta velocidad o líneas telefónicas, ponen
en contacto a las distintas computadoras.
No comparten memoria ni discos.
Las
L computadoras pueden variar en tamaño
t d d i t ñ
y función.
10. Sistemas Distribuidos
Un conjunto de localizaciones o sitios
conectados entre si mediante algún tipo de
red de comunicaciones, en el cual:
Cada sitio es un sistema de base de datos
en sí mismo.
Los sitios han convenido en trabajar juntos
(si es necesario) como si los datos
estuvieran almacenados localmente en el
propio sitio del usuario
usuario.
11. Sistemas Distribuidos
Principio fundamental: Desde el punto de vista
del usuario, un sistema distribuido deberá ser
idéntico
idé i a un sistema no di ib id
i distribuido.
Permite que cada sitio almacene y mantenga su
propia BD.
BD
Puede mejorar la fiabilidad; esto es, si falla un
sitio el resto de la red puede seguir funcionando.
Permite el control local de los datos que se usan
con mas frecuencia en un sitio.
12. Características
Ca acte ísticas
Los distintos emplazamientos están informados sobre los
demás.
Aunque algunas tablas pueden estar almacenadas sólo
en algunos emplazamientos, éstos comparten un
esquema global común.
l b l ú
Cada emplazamiento proporciona un entorno para la
ejecuc ó
ejecución de t a sacc o es ta to g oba es co o locales.
transacciones tanto globales como oca es
En general, en cada emplazamiento se ejecuta el mismo
software de gestión de BD distribuidas.
13. Ventajas
Compartimiento de Datos
Los usuarios de un emplazamiento pueden acceder a los
datos que residen en otros emplazamientos.
q p
Autonomía.
Cada emplazamiento conserva un cierto grado de control
sobre los datos almacenados localmente. Cada administrador
local de BD puede tener una a tonomía local dif
l ld d t autonomía diferente,
t
dependiendo del diseño del sistema distribuido de BD.
Mejora del rendimiento para procesamientos
locales
La base de datos se fragmenta en bases de datos más
pequeñas, manteniendo los datos cerca de donde más se
necesitan
Las
L consultas y transacciones locales tienen mejor
l i l l i j
rendimiento debido al tamaño de la BD
14. Ventajas
Fiabilidad y Disponibilidad
La fiabilidad se refiere a la probabilidad de que el sistema esté
operativo en cualquier momento dado.
La disponibilidad consiste en la probabilidad de que el sistema
esté disponible continuamente durante un determinado
período de tiempo
Si falla un emplazamiento, los restantes pueden continuar
funcionando.
Si se duplican los elementos de datos acertadamente en
varios emplazamientos, una transacción que requiera un
determinado elemento puede obtenerlo de cualquiera de
dichas copias.
Así, el fallo de un emplazamiento no implica necesariamente
el cierre del sistema.
15. Inconvenientes
Incon enientes
Costo de desarrollo del software.
La implementación de un sistema distribuido de BD es más
difícil,
difícil y por tanto más costoso.
costoso
Mayor probabilidad de errores.
Como los emplazamientos operan en paralelo, es mas difícil
asegurarse de la corrección de los algoritmos del
algoritmos,
funcionamiento especial durante los fallos de parte del
sistema, así como de la recuperación.
Mayor sobrecarga de procesamiento
Debido al intercambio de mensajes y el cómputo adicional
para la coordinación entre los emplazamientos.
16. Almacenamiento Distribuido de
Datos
Fragmentación
Significa dividir una relación en fragmentos
g g
para propósito de almacenamiento. Mejora el
desempeño.
• Fragmentación Horizontal: Consiste en la
partición de una tabla en subconjuntos de filas.
• Fragmentación Vertical: Consiste en particionar
una tabla por la proyección del subconjunto de sus
atributos.
17. Fragmentación Horizontal
NUM NUM
SALARIO
EMP DEPTO
E1 DX 45K
Percepción del E2 DY 40K
usuario E3 DZ 50K
E4 DY 63K
E5 DZ 40K
Fragmento en Fragmento en
Tokyo Lima
NUM NUM NUM NUM
SALARIO
SA ARIO SALARIO
EMP DEPTO
EMP DEPTO
E1 DX 45K
E4 DY 63K
E3 DZ 50K
E5 DZ 40K E2 DY 40K
Almacenamiento físico en Tokyo Almacenamiento físico en Lima
18. Almacenamiento Distribuido de
Datos
Réplica
é li
Ocurre si el sistema mantiene copias de una tabla X en diferentes
sitios para que la data tenga mas disponibilidad.
Los
L usuarios deberán poder comportarse como si solo hubiera una
i d b á d t i l h bi
copia de los datos (Independencia de Réplica).
Permite la creación y eliminación dinámica de réplicas en
respuesta a cambios en los requerimientos, sin afectar los
p q ,
programas o actividades de los usuarios.
Ventajas
Si una de las estaciones que contiene la tabla X falla, la tabla puede
recuperarse de otro sitio
Si la mayoría de los accesos a la tabla X sólo involucran una consulta
a la tabla, entonces varios sitios pueden estar solicitando datos de X
en forma concurrente. Mientras mas copias haya de X será menor el
tráfico de la red.
red
19. Réplica
NUM NUM
SALARIO
EMP DEPTO
E1 DX 45K
E2 DY 40K
Percepción del Usuario E3 DZ 50K
E4 DY 63K
E5 DZ 40K
NUM NUM
Fragmento Fragmento
SALARIO NUM NUM
EMP DEPTO SALARIO
EMP DEPTO
de Tokyo E1
E3
DX
DZ
45K
50K
E4 DY 63K de Lima
E2 DY 40K
E5 DZ 40K
NUM NUM
Réplica del
SALARIO
Réplica del
é NUM NUM
SALARIO
EMP DEPTO
fragmento
EMP DEPTO E1
E3
DX
DZ
45K
50K
fragmento
E4 DY 63K
de Lima E2 DY 40K E5 DZ 40K de Tokyo
Almacenamiento físico en Almacenamiento físico en
Tokyo Lima
20. Esquema de Asignación y
Replicación: objetivos
l ó b
Mínimo Coste:
De almacenamiento de cada fragmento en el nodo
correspondiente
di t
De modificar un fragmento que está replicado en
distintos nodos
De trasferencia de datos en la red
Rendimiento:
Minimizar tiempos de respuesta
Maximizar capacidad de procesamiento en cada
nodo
21. Funciones Adicionales de los
SGBDD
Mantenimiento de la pista de los datos
Expandiendo el catálogo de la BD para seguir la pista de la
distribución de los datos, la fragmentación y la réplica
, g p
Gestión de Transacciones Distribuidas
Determinar estrategias de ejecución de consultas y
transacciones que acceden a datos de más de una
localización, sincronizar el acceso a dichos datos y mantener
la integridad
Gestión de datos replicados
p
Decidir a qué copia de los datos acceder y mantener la
consistencia entre dichas copias
Recuperación de la base de datos distribuida
La capacidad de recuperarse de caídas de sitios individuales y
de fallos de los enlaces de comunicación
22. Funciones Adicionales de los
SGBDD
Seguridad
Controlar la seguridad y privilegios de acceso de los
usuarios de las transacciones distribuidas
i d l t i di t ib id
Gestión del directorio (catálogo) distribuido
Información de dónde y cómo se almacenan los
datos, el modo de acceso y características físicas.
Alternativas: catálogo centralizado, replicado
g , p
completamente, dividido, combinación de
centralizado y dividido.
23. Procesamiento Distribuido de
Consultas
Cons ltas
Consideraciones:
El número de accesos a disco
El costo de la trasmisión de datos por la red
p
(número y volumen de mensajes)
La ganancia potencial en rendimiento respecto de
hacer que varios emplazamientos procesen en
paralelo parte de la consulta
“Buscar todas las tuplas de la tabla Cuenta”
Si replicada, si fragmentada, si replicada y
fragmentada.
24. Procesamiento Distribuido de
Transacciones
T ansacciones
Agente: proceso ejecutado a nombre de una
determinada transacción en un determinado
sitio.
iti
Control de concurrencia: No se permite bloqueo
mutuo entre dos agentes que sean parte de una
misma transacción.
Control de recuperación: Todos los agentes de la
misma transacción se comprometen (Commit) o
abortan (Rollback) simultáneamente.
25. Control de Concurrencia y
Recuperación en BDD
ó
Manejar múltiples copias de los datos:
Debe mantenerse la consistencia entre las copias: El control
de
d concurrencia debe asegurar que cada copia sea consistente
i d b d i i t t
con todas las demás, aún cuando el sitio en el que reside falla
y se recupera posteriormente
Fallo d iti i di id l
F ll de sitios individuales:
El sistema debe continuar operando con sus sitios activos, si
es posible, cuando fallen sitios individuales.
Cuando el sitio que falló se recupera, su BD local debe
sincronizarse con las demás antes de reincorporarse al
sistema.
26. Control de Concurrencia y
Recuperación en BDD
ó
Confirmación (commit) distribuida:
Podría haber problemas al confirmar una
transacción distribuida si alguno de los sitios
involucrados falla durante la confirmación
Bloqueo mortal distribuido:
Podría ocurrir bloqueo mortal (interbloqueo) entre
varios sitios, por lo que deben extenderse las
i iti l d b t d l
técnicas para su tratamiento para considerar esta
situación
27. Control de Concurrencia por
“Copia Distinguida”
d ”
Se designa una de las copias de cada elemento
de datos como copia distinguida
p g
Todos los bloqueos se asocian a la copia
distinguida, y todas las solicitudes de bloqueo y
desbloqueo se envían al sitio que contiene esa
copia
28. Control de Concurrencia por
“Copia Distinguida”
d ”
Técnicas de elección de copia distinguida:
Sitio primario:
Se designa un sitio como coordinador para todos
los elementos de la base de datos. Los bloqueos son
hechos en este sitio.
29. Control de Concurrencia por
“Copia Distinguida”
d ”
Técnicas de elección de copia distinguida:
Sitio primario con sitio de respaldo
Se designa un segundo sitio como de respaldo, y los
S d i d ii d ld l
bloqueos se mantienen en ambos sitios
30. Control de Concurrencia por
“Copia Distinguida”
d ”
Técnicas de elección de copia distinguida:
Té i d l ió d i di ti id
Copia primaria
Se mantienen las copias distinguidas de los elementos de
datos almacenadas en diferentes sitios.
Se puede combinar con sitios de respaldo
A B
B B
A A
31. Recuperación
Rec pe ación en BDD
El sistema debe ser capaz de detectar un fallo en uno
de los emplazamientos, de modo que pueda decidir si
es necesaria alguna acción de recuperación.
ó ó
El sistema debe dejar de utilizar los servicios del
emplazamiento con falla.
p
Deben existir mecanismos para reintegrar fácilmente
en el sistema al emplazamiento que falló, cuando se
haya recuperado.
recuperado
32. Tipos de BD Dist ib idas
Distribuidas
AP1 W
X No
AP2
Y Distribuida
DBMS/OS Z
AP1
Línea de W
comunicación DBMS/OS X
Dividida no
BD1
Duplicada
AP2
Y
DBMS/OS Z
BD2
33. Tipos de BD Dist ib idas
Distribuidas
AP1
W
AP2 X
Y
DBMS/OS Z
Línea de
comunicación BD (copia 1) No Dividida
y D li d
Duplicada
AP1 W
X
AP2 Y
Z
DBMS/OS
BD (copia 2)
34. Tipos de BD Dist ib idas
Distribuidas
AP1 W
Línea de X
comunicación DBMS/OS Y
BD1
Dividida y
Duplicada
D li d
AP2
Y
DBMS/OS Z
BD2
35. Clases de SGBDD
Distribución
SGDB federado, Sistema
SGDB federado, SGDB homogéneo y multibase,
heterogéneo y
h t é homogéneo y
h é distribuido
di ib id homogéneo y
h é
distribuido distribuido distribuido
SGDB
heterogéneo y
h t é
distribuido Sistema multibase,
heterogéneo y
Múltiples SGDB distribuido
homogéneos, lógicamente
integrados
Autonomía
Sistema multibase,
multibase
SGDB
homogéneo
integrados,
heterogéneos SGDB federado,
SGDB federado
federado, Sistema multibase,
multibase
homogéneo en
heterogéneo en heterogéneo
Heterogeneidad una sede
una sede
36. Arquitectura para SGBDD
q p
Esquema Externo Esquema Externo Esquema Externo
Global 1 Global 2 Global n
Esquema Esquema Esquema Conceptual Esquema Esquema
Externo Externo Externo Externo
Global
Local 11 Local 1h Local n1 Local nm
Esquema Conceptual Esquema Conceptual
BD Local 1 BD Local n
Esquema Interno
E I t Esquema Interno
E I t
BD Local 1 BD Local n
37. Arquitectura de los SGBD
Multibase
M ltib
Esquema
E Esquema
E Esquema
E
Externo 1 Externo 2 Externo n
Esquema Esquema Esquema
Conceptual Conceptual Conceptual
BD L l 1
Local BD Local 2 BD Local n
Esquema Interno
E I t Esquema Interno
E I t Esquema Interno
E I t
BD Local 1 BD Local 2 BD Local n
38. Diseño de BDD
Esquema
Lógico
Global
Di
istribuc
ración
ción
Esquema
E Esquema
E Esquema
E
Integr
Lógico Lógico Lógico
Local 1 Local 2 Local n