Las fallas en una base de datos Oracle pueden dividirse en varias categorías como fallas de sentencias, fallas de procesos de usuario, fallas de red, errores de usuario, falla de instancia y falla de medio. El DBA debe proteger la base de datos contra fallas para incrementar el tiempo entre fallas y minimizar el tiempo de recuperación y la pérdida de datos. La recuperación de instancia usa información en archivos redo y de control para restaurar la base de datos al estado anterior a la falla. Configurar el modo ARCHIVELOG y multiplexar archivos
2. Objetivos
Después de completar esta lección, usted
debería ser capaz de:
Identificar los tipos de fallas que pueden ocurrir
en una Base de Datos Oracle
Describir las formas de afinar una recuperación
de instancia
Identificar la importancia de los checkpoints,
redo log files y archive log files
Configurar el modo ARCHIVELOG
3. Parte de su trabajo
La responsabilidad del DBA es:
Protejer la base de datos ante fallas lo más
posible
Incrementar el Mean-Time-Between-Failures
(MTBF)
Decrementar el Mean-Time-To-Recover
(MTTR)
Minimizar la pérdida de datos
4. Categorias de Fallas
Las fallas pueden generalmente ser divididas en
las siguientes categorías:
Fallas de Sentencias
Fallas de procesos de Usuario
Fallas de Red
Error de Usuario
Falla de Instancia
Falla de Medio
5. Falla de Sentencia
Posibles SolucionesProblemas Típicos
Trabajar con los
desarrolladores para corregir
errores de programación.
Errores de lógica en la
aplicación
Incrementar la cuota de
espacio del usuario.
Agregar espacio al
tablespace.
Intentos fallidos de obtener
espacio
Proveer privilegios apropiados
de objeto y sistema.
Intentos de realizar
operaciones con privilegios
insuficientes
Trabajar con los usuarios para
validar y corregir los datos.
Intentos de ingresar datos
inválidos a una tabla
6. Falla de Procesos de Usuario
Posibles SolucionesProblemas Típicos
Una acción del DBA
usualmente no es
necesariapara resolver fallas
de de procesos de usuario.
Process Monitor (PMON)
procesa roll back de cambios
sin commit y libera locks.
Observar las tendencias.
Un usuario realiza una
desconección anormal.
Una sesión de usuario es
terminada anormalmente.
Un usuario experimenta un
error de programa que
termina la sesión.
7. Fallas de Red
Posibles SolucionesProblemas Típicos
Configure una red de
respaldo.
Fallas de conectividad a
la red.
Configure múltiples tarjetas
de red.
Falla de Tarjeta de
Interfaz de Red (NIC).
Configure un respaldo de
listener.
Falla del Listener.
8. Errores de Usuario
Posibles SolucionesCausas Típicas
Recuperar la tabla desde recycle
bin.
Un usuario borra una
tabla.
Use Roll back o use flashback
query para recuperar.
Un usuario
inadvertidamente borra o
modifica datos.
9. Falla de Instancia
Falla en alguno de los
procesos background
Posibles SolucionesCausas Típicas
Procedimiento de
bajada de emergencia
Falla de Hardware
Reinicie la instancia usando el
comando “startup”.
Recuperación de la instancia
después de una falla es
automático, incluyendo rolling
forward para los cambios en redo
logs y luego rolling back de las
transacciones no commit.
Investigue las causas de la falla
revisando alert log, trace files y
Enterprise Manager.
Corte de Poder
10. Procesos Background y Recuperación:
Checkpoint (CKPT)
CKPT es responsable de :
Señalar a DBWn un checkpoints
Actualizar la cabecera de data file
headers con información de
checkpoint
Actualizar control files con
información de
checkpoint
Checkpoint
(CKPT)
Database
Writer
(DBWn)
SGA
Database
buffer cache
Control file
Data files
11. Procesos Background y Recuperación:
Redo Log Files y LogWriter
Redo log files:
Graba cambios a la Base
de Datos
Debería ser multiplexado
para protegerlos de
pérdida
LogWriter escribe:
Al commit
Cada tres segundos
Antes que escriba DBWn
Group 3
LogWriter
(LGWR)
Redo log
group 1
Redo log
group 2
Redo log
buffer
SGA
Redo log
group 3
12. Procesos Background y Recuperación:
Archiver (ARCn)
Archiver (ARCn):
Es un proceso
background opcional
Automáticamente archiva
los online redo log files
cuando la base de datos
es configurada como
ARCHIVELOG
Preserva los registros de
todos los cambios hechos
a la base de datos
LogWriter
(LGWR)
Archiver
(ARCn)
Redo log
buffer
SGA
Online
redo log
Archive
log files
13. Recuperación de Instancia
Recuperación de instancia o caída:
Intenta abrir la base de datos y aquellos archivos que
no fueron sincronizados en la caída
Es automatico
Usa información almacenada en los grupos de redo
log para sincronizar los archivos
Invloucra dos acciones distintas:
Rolling forward: Data files son restaurados al estado
anterior de la falla de instancia.
Rolling back: Cambios hechos sin commit son
devueltos a su estado original.
14. Fases de Recuperación de Isntancia
1. Data files no sincronizados
2. Roll forward (redo)
3. Datos en archivos
Committed y noncommitted
4. Roll back (undo)
5. Committed datos in files
Database
Undo
Instance
Background
processes
Data file
SCN: 99
Data file
SCN: 129
Data file
SCN: 140
Control file
SCN: 143
Control file
SCN: 143
Redo log
group
SCN 74-101
Redo log
group
SCN 102-143
SGA
15. Afinando la Recuperación de Instancia
Durante la Recuperación de Instancia, las
transacciones entre la posición de checkpoint y la de
fin de redo log deben ser aplicadas a los data files.
Usted afina la Recuperación de Instancia controlando
la diferencia entre la posición de checkpoint y el fin
de redo log.
End of redo logCheckpoint position
Transactions
Instance recovery
16. Usando el Asistente MTTR
Especifica el tiempo deseado en segundos o
minutos.
El valor por defecto es 0 (disabled).
El valor máximo es 3.600 segundos (una hora).
17. Falla de Medio
Falla de controladora de
disco
Borrado o corrupción de
un archivo de base de
datos
Posibles SolucionesCausas Tipicas
1. Restaure el archivo afetado
desde un respaldo.
2. Si es necesario, informe a la
base de datos respecto de
una nueva ubicación del
archivo.
3. Si es necesario, recupere el
archivo aplicando información
redo.
Falla de disco
18. Configurando la Recuperabilidad
Para configurar su base de datos en
máxima recuperabilidad, usted debe:
Programar respaldos regulares
Multiplexar control files
Multiplexar redo log groups
Retener copias archivadas de redo logs
19. Control Files
Proteja la base de datos ante fallas multiplexando
control files. Se sugiere que su base de datos
tenga:
Al menos dos copias (Oracle recomienda tres) de
control file
Cada copia en discos separados
Al menos una copia en una controladora de discos
separada
Control files
20. Redo Log Files
Multiplexar los grupos de redo log groups para
protegerlos de fallas de medio y pérdida de datos.
Es sugerido que los grupos de redo log tengan:
Al menos dos miembros (archivos) por grupo
Cada miembro en discos separados
Cada miembro en controladoras de disco separadas
Nota: El rendimiento es
fuertemente
influenciado por la
escritura en los
redo logs. Group 1 Group 2 Group 3
Disk 1
Disk 2
Member
1
Member
2
Member
1
Member
2
Member
1
Member
2
22. Archivos Archive Log
Para preservar información de redo, crear copias
archivadas de los archivos redo efectuando los
siguientes pasos.
1. Especifique la convención de nombre para los
archive log.
2. Especifique uno o más ubicaciones para los archive
log file.
3. Cambie la base de datos a modo ARCHIVELOG.
Online redo log files Archive log files
23. Archivos Archive Log : Nombres y
Destinos
%s: Incluye el número de secuencia como parte del nombre de archivo
%t: Incluye el número de hilo como parte del nombre de archivo
%r: Incluye el número de resetlogs para asegurar que el nombre del archivo archive log es único
%d: Incluye el ID de la Base de Datos como parte del nombre del archivo (opcional)
24. Modo ARCHIVELOG
Para dejar una base de datos en modo
ARCHIVELOG , efectúe los siguientes pasos:
1. Seleccione el modo ARCHIVELOG en la casilla.
2. Click Aplicar. La base de datos puede ser
configurada en modo ARCHIVELOG sólo en el
estado MOUNT.
3. Click Si cuando le sea requerido reiniciar la base
de datos.
4. Respalde su base de datos.
Bases de datos en modo ARCHIVELOG
tienen acceso a un gran rango de opciones
de respaldo y recuperación.
25. Resumen
En esta lección, usted debió haber
aprendido:
Identificar los tipos de falla que pueden
ocurrir en una base de datos Oracle
Describir la forma de afinar una
recuperación de Instancia
Identificar la importancia de los
checkpoints, archivos de redo log y
archivos archive log
Configurar el modo ARCHIVELOG