SlideShare une entreprise Scribd logo
1  sur  10
Limpieza de datos



http://es.wikipedia.org/wiki/Informatica


 JOSÉ CUARTAS   INFORMÁTICA
Limpieza datos
¿Podemos interpretar los datos?¿Qué significan los campos?

¿Cuál es la clave? Las medidas?

Como manejar los datos censurados?

¿Los datos se refieren a los mismos períodos de tiempo?


No olvide hay fallos como: Errores tipográficos,
múltiples formatos, los valores perdidos, no se
entiende la especificación, entre otros.
      JOSÉ CUARTAS       INFORMÁTICA                      2
Limpieza datos

En general, se tiene un problema si los
 datos no significa lo que usted cree.


 Problemas de calidad de datos son
    costosas en tiempo y dinero.


   JOSÉ CUARTAS       INFORMÁTICA     3
Los malos datos y datos malos.

El mal diseño de información .Si compras una medicina que no
requiere de receta médica, y no indica cuanto y cuando hay que consumirla,
(Busco una solución, voy donde el medico, chaman o alguien que resuelva).
     "La cultura de la duda“

     “La peor decisión es la indecisión” Benjamin Frankiln

La mala información. Se tienes la certeza de estar consumiendo la
medicina de manera correcta, aunque no sea cierto.

Nunca olvide
“las decisiones de hoy son las consecuencias de mañana”

        JOSÉ CUARTAS           INFORMÁTICA                            4
Datos




        http://es.wikipedia.org/wiki/Dato
Cuando los DATOS son VALIDOS hay MAYOR confianza
para la TOMA DE DECISIONES.
    JOSÉ CUARTAS     INFORMÁTICA                   5
Preprocesar y Preparar Datos
• Son todas aquellas técnicas de análisis de datos que
  permite mejorar la calidad de un conjunto de datos.

   – Esto permite que las técnicas de extracción de conocimiento
     puedan obtener mayor y mejor información.
      •   mejor porcentaje de clasificación, reglas con más completitud, entre otras.




     JOSÉ CUARTAS                 INFORMÁTICA                                           6
Ventajas en la Limpieza de datos
• Unas ventajas:
  – Permite     aplicar    modelos     de
    Aprendizaje/Minería de Datos de forma
    más rápida y sencilla.

  – Patrones de más calidad, precisión e
    interoperabilidad.



   JOSÉ CUARTAS   INFORMÁTICA              7
Inconvenientoes en la Limpieza
            datos
• Unos inconvenientes:
  – No es un área totalmente estructurada con
    una metodología concreta para todos los
    problemas.

  – Cada problema puede requerir una manera
    diferente de solución.



   JOSÉ CUARTAS     INFORMÁTICA                 8
Limpieza datos
• Recolección de datos e integración: Se Obtienen los
  datos de diferentes fuentes de información, en este paso
  se resuelven los problemas de representación y
  codificación, integrando los datos desde diferentes
  fuentes con el fin de crear información homogénea, ...

• Transformación de datos: Los datos son transformados
  o consolidados para luego poder extraer información
  realizar operaciones de resúmenes de datos y
  operaciones de agregación, entre otras.



     JOSÉ CUARTAS       INFORMÁTICA                      9
No olvide
Es un procedimiento donde se recurre a métodos
de muchas disciplinas como estadísticas, análisis
exploratorio de datos minería (EDM), bases de
datos, gestión, y los metadatos.

Busque siempre la calidad en los datos, esto
mejora    notablemente   la  obtención   de
conocimiento.



    JOSÉ CUARTAS     INFORMÁTICA               10

Contenu connexe

Similaire à Limpieza datos optimiza análisis

Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Joaquín Borrego-Díaz
 
Minería de Datos. Introducción
Minería de Datos. IntroducciónMinería de Datos. Introducción
Minería de Datos. Introduccióntravon1
 
Data set module 3 - spanish
Data set   module 3 - spanishData set   module 3 - spanish
Data set module 3 - spanishData-Set
 
base de datos Farmacologia
base de datos Farmacologiabase de datos Farmacologia
base de datos Farmacologiaoncesistemas2018
 
Base De Datos Farmacológica
Base De Datos FarmacológicaBase De Datos Farmacológica
Base De Datos Farmacológicaoncesistemas2018
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosMaría Inés Cahuana Lázaro
 
Proyecto nro 2 caso de estudio enfermedades cardiovasculares
Proyecto nro 2   caso de estudio enfermedades cardiovascularesProyecto nro 2   caso de estudio enfermedades cardiovasculares
Proyecto nro 2 caso de estudio enfermedades cardiovascularesDanielPerezFierro
 
Mineria de datos detencion de enfermedades
Mineria de datos detencion de enfermedadesMineria de datos detencion de enfermedades
Mineria de datos detencion de enfermedadesYennyyanethYucraMira
 
Caso de Estudio 2 - Grupo 4
Caso de Estudio 2 - Grupo 4Caso de Estudio 2 - Grupo 4
Caso de Estudio 2 - Grupo 4Trafagal Law
 
Sistemas de Información
Sistemas de Información Sistemas de Información
Sistemas de Información Ana Castañeda
 
SISTEMAS DE LA INFORMACION
SISTEMAS DE LA INFORMACIONSISTEMAS DE LA INFORMACION
SISTEMAS DE LA INFORMACIONCristianYoseri
 

Similaire à Limpieza datos optimiza análisis (20)

Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
Información Adaptativa, Ingeniería del Conocimiento e Inteligencia Colectiva ...
 
2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx2023-T4-Analisis_Datos.ppsx
2023-T4-Analisis_Datos.ppsx
 
Minería de Datos. Introducción
Minería de Datos. IntroducciónMinería de Datos. Introducción
Minería de Datos. Introducción
 
Data set module 3 - spanish
Data set   module 3 - spanishData set   module 3 - spanish
Data set module 3 - spanish
 
informatica medica
informatica medicainformatica medica
informatica medica
 
base de datos Farmacologia
base de datos Farmacologiabase de datos Farmacologia
base de datos Farmacologia
 
Base De Datos Farmacológica
Base De Datos FarmacológicaBase De Datos Farmacológica
Base De Datos Farmacológica
 
Unidad II SIM
Unidad II SIMUnidad II SIM
Unidad II SIM
 
Unidad 2
Unidad 2 Unidad 2
Unidad 2
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Proyecto nro 2 caso de estudio enfermedades cardiovasculares
Proyecto nro 2   caso de estudio enfermedades cardiovascularesProyecto nro 2   caso de estudio enfermedades cardiovasculares
Proyecto nro 2 caso de estudio enfermedades cardiovasculares
 
Minería de Datos Proyecto
Minería de Datos ProyectoMinería de Datos Proyecto
Minería de Datos Proyecto
 
Mineria de datos detencion de enfermedades
Mineria de datos detencion de enfermedadesMineria de datos detencion de enfermedades
Mineria de datos detencion de enfermedades
 
Caso de Estudio 2 - Grupo 4
Caso de Estudio 2 - Grupo 4Caso de Estudio 2 - Grupo 4
Caso de Estudio 2 - Grupo 4
 
Sistemas de Información
Sistemas de Información Sistemas de Información
Sistemas de Información
 
Matemática y Data Science
Matemática y Data ScienceMatemática y Data Science
Matemática y Data Science
 
Data mining
Data miningData mining
Data mining
 
SISTEMAS DE LA INFORMACION
SISTEMAS DE LA INFORMACIONSISTEMAS DE LA INFORMACION
SISTEMAS DE LA INFORMACION
 
MDM_Sesion_1_PPT.pptx
MDM_Sesion_1_PPT.pptxMDM_Sesion_1_PPT.pptx
MDM_Sesion_1_PPT.pptx
 

Plus de josecuartas

Seguridad en el almacenamiento de las bases de datos
Seguridad en el almacenamiento de las bases de datosSeguridad en el almacenamiento de las bases de datos
Seguridad en el almacenamiento de las bases de datosjosecuartas
 
Anti patrones SQL, Modelo conceptual
Anti patrones SQL, Modelo conceptualAnti patrones SQL, Modelo conceptual
Anti patrones SQL, Modelo conceptualjosecuartas
 
Tableros de control o Dashboard
Tableros de control o DashboardTableros de control o Dashboard
Tableros de control o Dashboardjosecuartas
 
Visualizacion de datos
Visualizacion de datosVisualizacion de datos
Visualizacion de datosjosecuartas
 
De los datos a la información
De los datos a la informaciónDe los datos a la información
De los datos a la informaciónjosecuartas
 
Datos semiestructurados Xml
Datos semiestructurados XmlDatos semiestructurados Xml
Datos semiestructurados Xmljosecuartas
 
Sql DML Lenguaje de manipulación de datos
Sql DML Lenguaje de manipulación de datos Sql DML Lenguaje de manipulación de datos
Sql DML Lenguaje de manipulación de datos josecuartas
 
Bases de datos temporales
Bases de datos temporalesBases de datos temporales
Bases de datos temporalesjosecuartas
 
Transformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logicoTransformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logicojosecuartas
 
índices en bases de datos
índices en bases de datosíndices en bases de datos
índices en bases de datosjosecuartas
 
Sql DDL Lenguaje de definición de datos
Sql DDL Lenguaje de definición de datosSql DDL Lenguaje de definición de datos
Sql DDL Lenguaje de definición de datosjosecuartas
 
Seguridad en bases de datos
Seguridad en bases de datosSeguridad en bases de datos
Seguridad en bases de datosjosecuartas
 
Los datos en el disco duro
Los datos en el disco duroLos datos en el disco duro
Los datos en el disco durojosecuartas
 
Digramas de venn aplicado en las bases datos
Digramas de venn aplicado en las bases datosDigramas de venn aplicado en las bases datos
Digramas de venn aplicado en las bases datosjosecuartas
 
Bases de datos avanzado NOSQL
Bases de datos avanzado NOSQLBases de datos avanzado NOSQL
Bases de datos avanzado NOSQLjosecuartas
 
Disco duro bases datos
Disco duro bases datosDisco duro bases datos
Disco duro bases datosjosecuartas
 
Fuga de información
Fuga de informaciónFuga de información
Fuga de informaciónjosecuartas
 
Patrones de arquitectura Software(Capa de Datos)
Patrones de arquitectura Software(Capa de Datos)Patrones de arquitectura Software(Capa de Datos)
Patrones de arquitectura Software(Capa de Datos)josecuartas
 
Sql dinamico14042011
Sql dinamico14042011Sql dinamico14042011
Sql dinamico14042011josecuartas
 

Plus de josecuartas (20)

Seguridad en el almacenamiento de las bases de datos
Seguridad en el almacenamiento de las bases de datosSeguridad en el almacenamiento de las bases de datos
Seguridad en el almacenamiento de las bases de datos
 
Anti patrones SQL, Modelo conceptual
Anti patrones SQL, Modelo conceptualAnti patrones SQL, Modelo conceptual
Anti patrones SQL, Modelo conceptual
 
Tableros de control o Dashboard
Tableros de control o DashboardTableros de control o Dashboard
Tableros de control o Dashboard
 
Visualizacion de datos
Visualizacion de datosVisualizacion de datos
Visualizacion de datos
 
De los datos a la información
De los datos a la informaciónDe los datos a la información
De los datos a la información
 
Datos semiestructurados Xml
Datos semiestructurados XmlDatos semiestructurados Xml
Datos semiestructurados Xml
 
Sql DML Lenguaje de manipulación de datos
Sql DML Lenguaje de manipulación de datos Sql DML Lenguaje de manipulación de datos
Sql DML Lenguaje de manipulación de datos
 
Bases de datos temporales
Bases de datos temporalesBases de datos temporales
Bases de datos temporales
 
Transformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logicoTransformar modelo entidad relacion a modelo logico
Transformar modelo entidad relacion a modelo logico
 
índices en bases de datos
índices en bases de datosíndices en bases de datos
índices en bases de datos
 
Sql DDL Lenguaje de definición de datos
Sql DDL Lenguaje de definición de datosSql DDL Lenguaje de definición de datos
Sql DDL Lenguaje de definición de datos
 
Seguridad en bases de datos
Seguridad en bases de datosSeguridad en bases de datos
Seguridad en bases de datos
 
Los datos en el disco duro
Los datos en el disco duroLos datos en el disco duro
Los datos en el disco duro
 
Digramas de venn aplicado en las bases datos
Digramas de venn aplicado en las bases datosDigramas de venn aplicado en las bases datos
Digramas de venn aplicado en las bases datos
 
Bases de datos avanzado NOSQL
Bases de datos avanzado NOSQLBases de datos avanzado NOSQL
Bases de datos avanzado NOSQL
 
Disco duro bases datos
Disco duro bases datosDisco duro bases datos
Disco duro bases datos
 
Fuga de información
Fuga de informaciónFuga de información
Fuga de información
 
Patrones de arquitectura Software(Capa de Datos)
Patrones de arquitectura Software(Capa de Datos)Patrones de arquitectura Software(Capa de Datos)
Patrones de arquitectura Software(Capa de Datos)
 
SQL avanzado
SQL avanzadoSQL avanzado
SQL avanzado
 
Sql dinamico14042011
Sql dinamico14042011Sql dinamico14042011
Sql dinamico14042011
 

Dernier

CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADauxsoporte
 
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024AndreRiva2
 
cortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuacortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuaDANNYISAACCARVAJALGA
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PCCesarFernandez937857
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptELENA GALLARDO PAÚLS
 
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxlclcarmen
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxAna Fernandez
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIACarlos Campaña Montenegro
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.José Luis Palma
 
2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdfBaker Publishing Company
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...JAVIER SOLIS NOYOLA
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxlclcarmen
 
la unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscala unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscaeliseo91
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Lourdes Feria
 
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptxFelicitasAsuncionDia
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzprofefilete
 

Dernier (20)

CALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDADCALENDARIZACION DE MAYO / RESPONSABILIDAD
CALENDARIZACION DE MAYO / RESPONSABILIDAD
 
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024
 
cortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahuacortes de luz abril 2024 en la provincia de tungurahua
cortes de luz abril 2024 en la provincia de tungurahua
 
Identificación de componentes Hardware del PC
Identificación de componentes Hardware del PCIdentificación de componentes Hardware del PC
Identificación de componentes Hardware del PC
 
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.pptDE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
DE LAS OLIMPIADAS GRIEGAS A LAS DEL MUNDO MODERNO.ppt
 
Sesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdfSesión de clase: Defendamos la verdad.pdf
Sesión de clase: Defendamos la verdad.pdf
 
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptxSINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
SINTAXIS DE LA ORACIÓN SIMPLE 2023-2024.pptx
 
RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docx
 
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIARAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
RAIZ CUADRADA Y CUBICA PARA NIÑOS DE PRIMARIA
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.
 
2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf2024 - Expo Visibles - Visibilidad Lesbica.pdf
2024 - Expo Visibles - Visibilidad Lesbica.pdf
 
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
ACERTIJO DE LA BANDERA OLÍMPICA CON ECUACIONES DE LA CIRCUNFERENCIA. Por JAVI...
 
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptxTIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
TIPOLOGÍA TEXTUAL- EXPOSICIÓN Y ARGUMENTACIÓN.pptx
 
la unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscala unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fisca
 
Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...Caja de herramientas de inteligencia artificial para la academia y la investi...
Caja de herramientas de inteligencia artificial para la academia y la investi...
 
Power Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptxPower Point: "Defendamos la verdad".pptx
Power Point: "Defendamos la verdad".pptx
 
Repaso Pruebas CRECE PR 2024. Ciencia General
Repaso Pruebas CRECE PR 2024. Ciencia GeneralRepaso Pruebas CRECE PR 2024. Ciencia General
Repaso Pruebas CRECE PR 2024. Ciencia General
 
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
 
Registro Auxiliar - Primaria 2024 (1).pptx
Registro Auxiliar - Primaria  2024 (1).pptxRegistro Auxiliar - Primaria  2024 (1).pptx
Registro Auxiliar - Primaria 2024 (1).pptx
 
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyzel CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
el CTE 6 DOCENTES 2 2023-2024abcdefghijoklmnñopqrstuvwxyz
 

Limpieza datos optimiza análisis

  • 2. Limpieza datos ¿Podemos interpretar los datos?¿Qué significan los campos? ¿Cuál es la clave? Las medidas? Como manejar los datos censurados? ¿Los datos se refieren a los mismos períodos de tiempo? No olvide hay fallos como: Errores tipográficos, múltiples formatos, los valores perdidos, no se entiende la especificación, entre otros. JOSÉ CUARTAS INFORMÁTICA 2
  • 3. Limpieza datos En general, se tiene un problema si los datos no significa lo que usted cree. Problemas de calidad de datos son costosas en tiempo y dinero. JOSÉ CUARTAS INFORMÁTICA 3
  • 4. Los malos datos y datos malos. El mal diseño de información .Si compras una medicina que no requiere de receta médica, y no indica cuanto y cuando hay que consumirla, (Busco una solución, voy donde el medico, chaman o alguien que resuelva). "La cultura de la duda“ “La peor decisión es la indecisión” Benjamin Frankiln La mala información. Se tienes la certeza de estar consumiendo la medicina de manera correcta, aunque no sea cierto. Nunca olvide “las decisiones de hoy son las consecuencias de mañana” JOSÉ CUARTAS INFORMÁTICA 4
  • 5. Datos http://es.wikipedia.org/wiki/Dato Cuando los DATOS son VALIDOS hay MAYOR confianza para la TOMA DE DECISIONES. JOSÉ CUARTAS INFORMÁTICA 5
  • 6. Preprocesar y Preparar Datos • Son todas aquellas técnicas de análisis de datos que permite mejorar la calidad de un conjunto de datos. – Esto permite que las técnicas de extracción de conocimiento puedan obtener mayor y mejor información. • mejor porcentaje de clasificación, reglas con más completitud, entre otras. JOSÉ CUARTAS INFORMÁTICA 6
  • 7. Ventajas en la Limpieza de datos • Unas ventajas: – Permite aplicar modelos de Aprendizaje/Minería de Datos de forma más rápida y sencilla. – Patrones de más calidad, precisión e interoperabilidad. JOSÉ CUARTAS INFORMÁTICA 7
  • 8. Inconvenientoes en la Limpieza datos • Unos inconvenientes: – No es un área totalmente estructurada con una metodología concreta para todos los problemas. – Cada problema puede requerir una manera diferente de solución. JOSÉ CUARTAS INFORMÁTICA 8
  • 9. Limpieza datos • Recolección de datos e integración: Se Obtienen los datos de diferentes fuentes de información, en este paso se resuelven los problemas de representación y codificación, integrando los datos desde diferentes fuentes con el fin de crear información homogénea, ... • Transformación de datos: Los datos son transformados o consolidados para luego poder extraer información realizar operaciones de resúmenes de datos y operaciones de agregación, entre otras. JOSÉ CUARTAS INFORMÁTICA 9
  • 10. No olvide Es un procedimiento donde se recurre a métodos de muchas disciplinas como estadísticas, análisis exploratorio de datos minería (EDM), bases de datos, gestión, y los metadatos. Busque siempre la calidad en los datos, esto mejora notablemente la obtención de conocimiento. JOSÉ CUARTAS INFORMÁTICA 10