SlideShare une entreprise Scribd logo
1  sur  5
Dimensiones de la
Calidad de Datos
Completitud
Carlos Loachamin
Completitud
 Qué tan completo está un registro?
 Un registro se considera completo incluso si faltan datos opcionales.
 Si los datos cumplen las expectativas, entonces los datos se consideran
completos.
 Existen dos factores a tomar en cuenta:
 Cobertura: La porción de datos de la realidad que se encuentra contenido en los
sistemas de información.
 Densidad: Es la cantidad de información contenida y faltante acerca de las
entidades.
 Problemas en completitud se da por valores nulos, vacíos, y por clasificación
de defecto
Errores
 Valor Nulo
 Información omitida
 Se analiza la causa de la omisión.
 Se define qué valor debería tomar el valor nulo.
 Influye en el análisis de los datos
 Al analizar si no se completa los omitidos
 Al omitirse genera un análisis erróneo
Errores
 Clasificación de Errores
 Se da al momento de detectar defectos y se los clasifica de manera
errónea.
 Se pueden dar por las siguientes causas.
 Omisión por parte del verificador al registrar un defecto y omitir clasificarlo.
 Falta de conocimiento por parte del verificador al no saber como clasificar el
defecto registrado.
 Un error en la aplicación o BDD al almacenar la información referente a la
clasificación del defecto.
Ejemplos
 Caso roles de pago
 Los salarios de los vendedores no solo están determinado por su sueldo, muchas
veces se percibe por el ingreso por comisiones, el campo de comisiones no siempre
está con datos en el caso de que el empleado no sea un vendedor, por ello es
necesario remplazar los valores nulos con el cero.
 Caso datos personales del cliente
 Cuando el operador toma datos del cliente, en muchos casos la información es
llenada con datos erróneos, por ejemplo en el caso de la dirección se llenan con
puntos, o cuando se debe establecer la ubicación geográfica del cliente, se
establece el primero que se encuentra en la lista.
 Caso datos de los productos
 El operador ingresa un producto que puede estar contenido en dos o más
clasificadores, pero toma la decisión de clasificarlo bajo su propia perspectiva, sin
tomar en cuenta la experiencia de la empresa de sus recursos.

Contenu connexe

Tendances

Cuadro comparativo metodos
Cuadro comparativo metodosCuadro comparativo metodos
Cuadro comparativo metodos
ivansierra20
 
Modelo entidad relacion(gestion de examenes)
Modelo entidad relacion(gestion de examenes)Modelo entidad relacion(gestion de examenes)
Modelo entidad relacion(gestion de examenes)
agustinbilmer
 
SíMbolos Del Diccionario De Datos
SíMbolos Del Diccionario De DatosSíMbolos Del Diccionario De Datos
SíMbolos Del Diccionario De Datos
Clariza
 
Transformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logicoTransformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logico
josecuartas
 
2. requerimientos técnicos
2. requerimientos técnicos2. requerimientos técnicos
2. requerimientos técnicos
Rosita Falen
 
Recopilacion De Informacion De Ing.Sofware
Recopilacion De Informacion De Ing.SofwareRecopilacion De Informacion De Ing.Sofware
Recopilacion De Informacion De Ing.Sofware
carolina
 

Tendances (20)

Cuadro comparativo metodos
Cuadro comparativo metodosCuadro comparativo metodos
Cuadro comparativo metodos
 
Modelo entidad relacion(gestion de examenes)
Modelo entidad relacion(gestion de examenes)Modelo entidad relacion(gestion de examenes)
Modelo entidad relacion(gestion de examenes)
 
Requerimientos Funcionales y No Funcionales
Requerimientos Funcionales y No FuncionalesRequerimientos Funcionales y No Funcionales
Requerimientos Funcionales y No Funcionales
 
SíMbolos Del Diccionario De Datos
SíMbolos Del Diccionario De DatosSíMbolos Del Diccionario De Datos
SíMbolos Del Diccionario De Datos
 
Csv y xml
Csv y xmlCsv y xml
Csv y xml
 
Transformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logicoTransformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logico
 
Programación I 2. Arquitectura de Capas
Programación I 2. Arquitectura de CapasProgramación I 2. Arquitectura de Capas
Programación I 2. Arquitectura de Capas
 
Presentación Modelo de Datos
Presentación Modelo de DatosPresentación Modelo de Datos
Presentación Modelo de Datos
 
20 tips para escribir stored procedures en sql server
20 tips para escribir stored procedures en sql server20 tips para escribir stored procedures en sql server
20 tips para escribir stored procedures en sql server
 
2. requerimientos técnicos
2. requerimientos técnicos2. requerimientos técnicos
2. requerimientos técnicos
 
Ejemplo de Modelos de Base de Datos
Ejemplo de Modelos de Base de DatosEjemplo de Modelos de Base de Datos
Ejemplo de Modelos de Base de Datos
 
Ejercicios de base de datos
Ejercicios de base de datosEjercicios de base de datos
Ejercicios de base de datos
 
BASES DE DATOS
BASES DE DATOSBASES DE DATOS
BASES DE DATOS
 
Recopilacion De Informacion De Ing.Sofware
Recopilacion De Informacion De Ing.SofwareRecopilacion De Informacion De Ing.Sofware
Recopilacion De Informacion De Ing.Sofware
 
Administracion de Bases de datos
Administracion de Bases de datosAdministracion de Bases de datos
Administracion de Bases de datos
 
Curso: Control de acceso y seguridad: 02 Análisis de riesgos 1
Curso: Control de acceso y seguridad: 02 Análisis de riesgos 1Curso: Control de acceso y seguridad: 02 Análisis de riesgos 1
Curso: Control de acceso y seguridad: 02 Análisis de riesgos 1
 
Sistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datosSistemas de Gestión de Bases de datos
Sistemas de Gestión de Bases de datos
 
Diccionario de base de datos
Diccionario de base de datosDiccionario de base de datos
Diccionario de base de datos
 
Modelo Entidad Relacion
Modelo Entidad RelacionModelo Entidad Relacion
Modelo Entidad Relacion
 
Introduccion a Power BI
Introduccion a Power BIIntroduccion a Power BI
Introduccion a Power BI
 

En vedette (6)

Calidad de datos (data quality)
Calidad de datos (data quality)Calidad de datos (data quality)
Calidad de datos (data quality)
 
Data quality
Data qualityData quality
Data quality
 
sistema de gestion de datos
sistema de gestion de datossistema de gestion de datos
sistema de gestion de datos
 
Consideraciones sobre BI
Consideraciones sobre BIConsideraciones sobre BI
Consideraciones sobre BI
 
Factores y caracteristicas que determinan la calidad
Factores y caracteristicas que determinan la calidadFactores y caracteristicas que determinan la calidad
Factores y caracteristicas que determinan la calidad
 
Herramientas de medición de calidad
Herramientas de medición de calidadHerramientas de medición de calidad
Herramientas de medición de calidad
 

Similaire à Dimensiones de la calidad de datos Completitud

Similaire à Dimensiones de la calidad de datos Completitud (20)

4.2 Clase Riesgo Importancia Relativa (1).pptx
4.2 Clase Riesgo Importancia Relativa (1).pptx4.2 Clase Riesgo Importancia Relativa (1).pptx
4.2 Clase Riesgo Importancia Relativa (1).pptx
 
Propuesta de Auditoria en Informatica
Propuesta de Auditoria en InformaticaPropuesta de Auditoria en Informatica
Propuesta de Auditoria en Informatica
 
DatawareHouse.pptx
DatawareHouse.pptxDatawareHouse.pptx
DatawareHouse.pptx
 
Norma 3000.pptx
Norma 3000.pptxNorma 3000.pptx
Norma 3000.pptx
 
Control de carga en Regimen de Datos de Pozo
Control de carga en Regimen de Datos de PozoControl de carga en Regimen de Datos de Pozo
Control de carga en Regimen de Datos de Pozo
 
Implementacion de base de datos
Implementacion de base de datosImplementacion de base de datos
Implementacion de base de datos
 
Calidad de datos
Calidad de datos Calidad de datos
Calidad de datos
 
Material sesión 4 Materialidad.pdf
Material sesión 4 Materialidad.pdfMaterial sesión 4 Materialidad.pdf
Material sesión 4 Materialidad.pdf
 
Guía de-ejecución
Guía de-ejecuciónGuía de-ejecución
Guía de-ejecución
 
05-manual-deudores.pdf
05-manual-deudores.pdf05-manual-deudores.pdf
05-manual-deudores.pdf
 
Historias de Usuario Prosoftware
Historias de Usuario ProsoftwareHistorias de Usuario Prosoftware
Historias de Usuario Prosoftware
 
Zulaima hernandez
Zulaima hernandezZulaima hernandez
Zulaima hernandez
 
Casos Call Center
Casos Call CenterCasos Call Center
Casos Call Center
 
Guía evaluado 2014
Guía evaluado 2014Guía evaluado 2014
Guía evaluado 2014
 
Presentación cuadros finales 2014
Presentación cuadros finales 2014Presentación cuadros finales 2014
Presentación cuadros finales 2014
 
Presentación cuadros finales 2014
Presentación cuadros finales 2014 Presentación cuadros finales 2014
Presentación cuadros finales 2014
 
Clasificación de Conjuntos de Datos Desequilibrados.pptx
Clasificación de Conjuntos de Datos Desequilibrados.pptxClasificación de Conjuntos de Datos Desequilibrados.pptx
Clasificación de Conjuntos de Datos Desequilibrados.pptx
 
Vision del negocio 1
Vision del negocio 1Vision del negocio 1
Vision del negocio 1
 
Introduccion BD - 01
Introduccion BD - 01Introduccion BD - 01
Introduccion BD - 01
 
Fuzzy Duplicates Arbutus Analyzer
Fuzzy Duplicates Arbutus AnalyzerFuzzy Duplicates Arbutus Analyzer
Fuzzy Duplicates Arbutus Analyzer
 

Dernier

ETICA EN LA CADENAS la cadena de suministro
ETICA EN LA CADENAS la cadena de suministroETICA EN LA CADENAS la cadena de suministro
ETICA EN LA CADENAS la cadena de suministro
IrisMoreno27
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
MedicinaInternaresid1
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
ssuserbdc329
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
JC Díaz Herrera
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
BESTTech1
 

Dernier (20)

Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
ETICA EN LA CADENAS la cadena de suministro
ETICA EN LA CADENAS la cadena de suministroETICA EN LA CADENAS la cadena de suministro
ETICA EN LA CADENAS la cadena de suministro
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
 
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptxP.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
P.P ANÁLISIS DE UN TEXTO BÍBLICO. TEMA 10.pptx
 
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdfReservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
Reservas de divisas y oro en México en sexenio de AMLO (2018-2024).pdf
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
 
La Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdfLa Guerra Biologica - Emiliano Paico Vilchez.pdf
La Guerra Biologica - Emiliano Paico Vilchez.pdf
 
PIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos añosPIB PERÚ datos y análisis de los últimos años
PIB PERÚ datos y análisis de los últimos años
 
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdfLos más ricos administradores de fondo de cobertura (1968-2024).pdf
Los más ricos administradores de fondo de cobertura (1968-2024).pdf
 
Conversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latinoConversacion.pptx en guarani boliviano latino
Conversacion.pptx en guarani boliviano latino
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpoint
 
Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1Alfredo Gabriel Rodriguez Yajure Tarea#1
Alfredo Gabriel Rodriguez Yajure Tarea#1
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
El Manierismo. El Manierismo
El Manierismo.              El ManierismoEl Manierismo.              El Manierismo
El Manierismo. El Manierismo
 
Perú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineriaPerú en el ranking mundial, segun datos mineria
Perú en el ranking mundial, segun datos mineria
 
Los idiomas más hablados en el mundo (2024).pdf
Los idiomas más hablados en el mundo  (2024).pdfLos idiomas más hablados en el mundo  (2024).pdf
Los idiomas más hablados en el mundo (2024).pdf
 
diseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptxdiseño de una linea de produccion de jabon liquido.pptx
diseño de una linea de produccion de jabon liquido.pptx
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 

Dimensiones de la calidad de datos Completitud

  • 1. Dimensiones de la Calidad de Datos Completitud Carlos Loachamin
  • 2. Completitud  Qué tan completo está un registro?  Un registro se considera completo incluso si faltan datos opcionales.  Si los datos cumplen las expectativas, entonces los datos se consideran completos.  Existen dos factores a tomar en cuenta:  Cobertura: La porción de datos de la realidad que se encuentra contenido en los sistemas de información.  Densidad: Es la cantidad de información contenida y faltante acerca de las entidades.  Problemas en completitud se da por valores nulos, vacíos, y por clasificación de defecto
  • 3. Errores  Valor Nulo  Información omitida  Se analiza la causa de la omisión.  Se define qué valor debería tomar el valor nulo.  Influye en el análisis de los datos  Al analizar si no se completa los omitidos  Al omitirse genera un análisis erróneo
  • 4. Errores  Clasificación de Errores  Se da al momento de detectar defectos y se los clasifica de manera errónea.  Se pueden dar por las siguientes causas.  Omisión por parte del verificador al registrar un defecto y omitir clasificarlo.  Falta de conocimiento por parte del verificador al no saber como clasificar el defecto registrado.  Un error en la aplicación o BDD al almacenar la información referente a la clasificación del defecto.
  • 5. Ejemplos  Caso roles de pago  Los salarios de los vendedores no solo están determinado por su sueldo, muchas veces se percibe por el ingreso por comisiones, el campo de comisiones no siempre está con datos en el caso de que el empleado no sea un vendedor, por ello es necesario remplazar los valores nulos con el cero.  Caso datos personales del cliente  Cuando el operador toma datos del cliente, en muchos casos la información es llenada con datos erróneos, por ejemplo en el caso de la dirección se llenan con puntos, o cuando se debe establecer la ubicación geográfica del cliente, se establece el primero que se encuentra en la lista.  Caso datos de los productos  El operador ingresa un producto que puede estar contenido en dos o más clasificadores, pero toma la decisión de clasificarlo bajo su propia perspectiva, sin tomar en cuenta la experiencia de la empresa de sus recursos.