En esta presentación revisamos los conceptos de gobernanza de datos y las metodologías, proponiendo Azure Purview como herramienta para implementar una correcta implementación de gobernanza de datos en las organizaciones
2. •Microsoft Certified Solution Associate SQL Server
•Microsoft Certified: Power BI Data Analyst
Associate
•Microsoft Certified: Azure Database Administrator
Associate
•Microsoft Certified Trainer
•Microsoft Most Valuable Professional (MVP)
•Actividad profesional:
•Consultor Líder: Arqueto - dbLearner.com
•Comunidades oficiales:
•Power BI User Group Lima –Líder
•Cloud Experts - Miembro
Alberto De Rossi
@albertoderossi
3. A medida que aumenta el volumen y la
variedad de los datos, también
aumenta la dificultad de disponer de
una gobernanza de los datos eficaz
La transformación digital ha
provocado una explosión de nuevos
orígenes de datos.
¿Cómo saben los usuarios qué datos
hay disponibles?
¿Cómo administran los datos los
administradores?
¿Los datos contienen información
confidencial o personal?
5. The Data
Management
Association
https://dama.org
DM-BOK2
• Framework funcional
• Introduce conceptos
• Objetivos | funciones | actividades
• Roles | principios | tecnología
• Cultural organizacional
• Buenas prácticas | enfoques
alternativos.
Gobernanza | Metodología
INTRODUCCIÓN
6. Gobernanza | Herramientas
Azure
Purview
• Solución unificada de gobernanza de datos
• Servicio basado en la nube
• Registro de distintos orígenes de datos
• Detección y conocimiento de orígenes de
datos
• Descubrimiento y mantenimiento de datos
• Controlar y mantener el patrimonio de
datos
• Controlar acceso a los datos
INTRODUCCIÓN
7. Azure Purview | elementos principales
• Mapa de datos de Microsoft Purview
• Catálogo de datos de Purview
• Información sobre el estado de los datos de Purview.
INTRODUCCIÓN
8. Azure Purview | procesos clave
• Abastecimiento de datos
• Elaboración de mapas de los datos
• Examen de los datos
• Clasificación
• Búsqueda
• Linaje
PROCESOS
9. Azure Purview | Abastecimiento de datos
• Registrar los orígenes de datos: locales, multinube y de
software (SaaS)
• Los datos permanecen en su ubicación y no se migran
• Cada origen tendrá requisitos específicos de autenticación y
configuración
• Opciones de autenticación :
• Identidad administrada de Microsoft Purview
• Clave de cuenta (mediante Key Vault)
• Autenticación de SQL (mediante Key Vault)
• Entidad de servicio (mediante Key Vault)
PROCESOS
11. Azure Purview | mapas de datos (1 de 2)
recursos de datos + linaje + clasificaciones + contexto
empresarial
• Grafo de conocimiento de los datos
• Registro, examen y clasificación automáticos de los datos a
gran escala
• Colecciones: agrupación de recursos de datos en colecciones
lógicas
• Simplifica la administración y la detección de los recursos
en el catálogo
PROCESOS
13. Azure Purview | examen de los datos
• Acceder a metadatos y examinar información de los recursos
• Configurar reglas de examen
• Crear conjuntos de reglas de examen
• Acceso a través de credenciales
• Credenciales se almacenan en Azure Key Vault
• El portal de gobernanza incluye conjuntos de reglas de
examen
• Seleccionar al crear una nueva regla de examen
• Especificar un conjunto de reglas personalizadas
PROCESOS
14. Azure Purview | clasificación (1 de 3)
• Reglas de clasificación para aplicarlas durante el examen
• Se dividen en cinco categorías principales:
• Administración pública: cubre atributos como los documentos de
identidad gubernamentales, los números de los permisos de
conducir, los números de pasaporte, etc
• Datos financieros: cubre atributos como los números de cuentas
bancarias o los números de tarjetas de crédito
• Personal: información personal, como la edad de una persona, su
fecha de nacimiento, dirección de correo electrónico, número de
teléfono, etc
• Seguridad: atributos que se pueden almacenar, como las
contraseñas
• Varios: atributos no cubiertos en las otras categorías
PROCESOS
15. Azure Purview | clasificación (2 de 3)
• Enriquece los metadatos con descripciones y etiquetas
• Metadatos descriptivos complementarios
• Nombres de columna
• Tipos de datos
• Los usuarios contribuyen con el catálogo:
• Etiquetado
• Documentación
• Anotación de los orígenes de datos
PROCESOS
17. Azure Purview | búsqueda
• Buscar información en el Mapa de datos usando el Catálogo de
Purview.
• Búsquedas basadas en texto y contexto empresarial
• Glosarios empresariales
• Detección con poco esfuerzo con:
• Búsqueda semántica y exploración
• Glosario y flujos de trabajo empresariales
• Linaje de los datos
• Orígenes
• Propietarios
• Transformaciones
• Ciclo de vida
PROCESOS
18. Azure Purview | linaje (1 de 2)
• Los datos se obtienen, mueven y almacenan a lo largo de su
ciclo de vida
• Transformaciones ELT/ETL
• Información detallada sobre su ciclo de vida
• Identificar la causa principal de los problemas
• Realizar análisis de calidad de los datos
• Comprobar el cumplimiento normativo
• Formato visual que ilustra el movimiento de los datos
• Desde el origen hasta el destino
PROCESOS
20. Azure Purview | niveles de acceso
• Rol Lector de datos: acceso al portal de gobernanza; puede
leer todo el contenido, excepto los enlaces de examen
• Rol Curador de datos: acceso al portal de gobernanza; puede
leer todo el contenido, excepto los enlaces de examen. Puede
editar información sobre los recursos, editar las
definiciones de clasificación y los términos del glosario y
aplicar clasificaciones y términos del glosario a los
recursos
• Rol administrador de orígenes de datos: no tiene acceso al
portal de gobernanza: puede administrar todos los aspectos
del examen de datos, pero no tiene acceso de lectura o
escritura al contenido, más allá de esas tareas relacionadas
con el examen
SEGURIDAD
21. Azure Purview | Vistas principales (1 de 2)
• Información de los recursos
• Informe sobre el patrimonio de datos y la distribución de
los tipos de origen. Puede verlo por tipo de origen,
clasificación y tamaño de archivo. Vea la información como
un grafo o como indicadores clave de rendimiento (KPI)
• Información de los exámenes
• Proporciona información sobre el estado de los exámenes
(satisfactorios, erróneos o cancelados)
• Información del glosario
• Estado sobre el glosario para ayudar a los usuarios a
conocer la distribución de los términos del glosario por
estado
VISTAS
22. Azure Purview | Vistas principales (2 de 2)
• Información de las clasificaciones
• Muestra dónde se encuentran los datos clasificados.
Permite a los administradores de seguridad el
reconocimiento de los tipos de información que se
encuentran en los datos de su organización
• Información de confidencialidad
• Etiquetas de confidencialidad que se encuentran durante
los exámenes. Los administradores de seguridad asegurarse
de que la seguridad es adecuada para el patrimonio de
datos
• Información de las extensiones de archivo
• Informes detallados sobre las extensiones (o tipos) de
archivo que se encuentran durante los exámenes.
VISTAS