SlideShare une entreprise Scribd logo
1  sur  26
Télécharger pour lire hors ligne
Santiago, octubre 2014 
Felipe Vera L Director Ejecutivo Prodigio Consultores www.prodigioconsultores.com 
Charlas CORFO 
Big Data Aplicada a la Gestión de Información 
Big data y minería de datos 
en unidades de información y Bibliotecas
Big Data 
Big Data es en el sector de tecnologías de la información y la comunicación una referencia a los sistemas que manipulan grandes conjuntos de datos (o data sets). Las dificultades más habituales en estos casos se centran en la captura, almacenamiento, búsqueda, compartición, análisis y visualización. 
www.americanis.net
Las “V” del Big Data (Gartner) 
Volumen de los datos. 
Velocidad en el tratamiento de los datos. 
Variedad de los datos. 
Valor de los datos que tiene que ver con la confiabilidad. 
“Venue” o campo de trabajo, que habla de la complejidad de tener una alta diversidad de fuentes de datos no estructurados. 
Visualización, una herramienta útil para trasformar análisis complejos en formatos procesables.
Evolución 
Estructuración, Digitalización y almacenamiento 
Análisis y toma de decisiones 
Servicios y uso
Big data, gestión de información y Bibliotecas
Big data, gestión de información y Bibliotecas
Big data, gestión de información y Bibliotecas
Big data, gestión de información y Bibliotecas
La Biblioteca como fuente de datos
El problema de lo tácito V/S Explícito
Patrones 
Conexiones 
Tendencias 
Información estructurada 
¿Qué se busca? 
Información no estructurados 
Las unidades de información y Bibliotecas son una vasta y activa fuente de datos
Inteligencia de Negocios – cadena de valor 
Datos 
• Datos Clientes 
• Datos Tiendas 
• Datos Demográficos 
• Datos Geográficos 
Información 
• X vive en Z 
• S tiene Y anos 
• X y S se cambiaron 
• W tiene dinero en Z 
Conocimiento 
• Una cantidad Y del producto A es usada en la región Z 
• Clientes de la clase P usan x% de producto C en el periodo D 
Decisión y servicios 
• Promocione el producto A en la región Z 
• Mailing a familias del perfil P 
• Venta cruzada del servicio B a clientes C
Minería de datos 
“Es un proceso no trivial de identificación de patrones de datos válidos, nuevos, potencialmente usables” 
(Fayyad, Piatetsky-Shapiro y Smyth, 1996). 
Minería de datos en Unidades de información 
“Extracción y descubrimiento de patrones de comportamiento, datos e información no trivial proveniente de la totalidad de los sistemas de información tradicionales (opac´s, circulación) y por sobre todo de la gran variedad de servicios de información basados en la web (sitio web, redes sociales, Repositorios), con el fin de apoyar a la toma de decisiones y a los objetivos estratégicos de la organización a la cuál pertenezca. 
“Integración a la cadena de valor”
Minería de datos – metodología KDD 
2.Selección y 
Preprocesamiento 
4.Interpretación y 
Evaluación 
Knowledge 
p(x)=0.02 
Warehouse 
Patrones y Modelos 
Datos preparados 
Datos Consolidados 
3.Data Mining 
1.Consolidación 
de los Datos 
Conocimiento 
DW 
6. Apoyo a la Toma 
de Decisiones 
5. Visualización 
del conocimiento
Data Science - elementos
Data Science
3 focos para el entrenamiento en el manejo de datos 
Christopher Erdmann, Head Librarian 
Harvard-Smithsonian Center for Astrophysics 
Técnicas 
Aplicaciones 
Cultura de datos y analítica
Alguna técnicas 
Fuentes de datos 
Minería de datos 
Web mining 
-Web content mining 
-Web structure mining 
-Web usage mining 
Text mining 
Process mining 
Concept based text mining 
Procesamiento de lenguaje natural (PLN) *
Tipos de problemas a resolver con Data mining 
Problemas 
Clasificación 
Regresión 
Agrupamiento 
Reglas de asociación 
Análisis correlacional 
Predictivos 
(supervisados) 
Descriptivos (no Supervisados)
Aplicaciones de Data mining - Support Vector Mchines 
20 
- Base de datos inicial 
- Hiperplano separador 
- Función de decisión (decisión de corte)
Aplicaciones de Data mining – no supervisados
Aplicaciones de Data mining a Unidades de información 
Se requiere conocer la demanda que tendrán ciertas bases de datos en un periodo determinado. 
Problema supervisado de regresión. 
Se requiere saber si x postulaciones a ciertas líneas de financiamiento CORFO tienen potencial de éxito. 
Problema Predictivo de clasificación. 
Se requiere segmentar los tipos de usuarios de un sistema de Bibliotecas para ofrecer recursos de información diferenciados. 
Problema no supervisado de agrupamiento.
Tipos de problemas a resolver con Data mining 
Se requiere saber que recursos de información se utilizan por cierto perfil de usuario o el director de la institución. 
Problema descriptivo de reglas de asociación. 
Se requiere saber que recursos de información (parte de la bibliografía base) se asocian (tipos y frecuencia) con los alumnos que obtienen mejor rendimiento. 
Modelo no supervisado de análisis correlacional.
Tipos de problemas a resolver con Data mining 
Principales métodos y algoritmos utilizados en Data Mining 
K-medias – No supervisado de agrupamiento. 
Árboles de decisión – Supervisado - regresión y clasificación. 
Regresión Lineal y Logística - Supervisado clasificación y regresión. 
Redes Neuronales - Supervisado y no supervisado. 
Reglas de Asociación – No supervisados de reglas de asociación. 
Vector Suport Machine – Supervisados de clasificación.
5 habilidades esenciales para abordar un proyecto de minería de datos en unidades de información 
Claridad en las fuentes de beneficios y/o ingresos. 
Capacidades analíticas. 
Pensamiento estratégico del negocio. 
Visión estratégica de la tecnología. 
Visualización (sobre todo cuando es producto final).
felipevera@gmail.com fvera@prodigioconsultores.com www.prodigioconsultores.com 
Muchas gracias

Contenu connexe

Tendances

Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data MiningAndres Eyherabide
 
Minería de datos
Minería de datosMinería de datos
Minería de datosanag catal
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datosArnoldo Gil
 
Mineria De Datos Secuenciales
Mineria De Datos SecuencialesMineria De Datos Secuenciales
Mineria De Datos SecuencialesMarilyn Jaramillo
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datossaibelr
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics Spain
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datosdataminingperu
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kddYaz_Cuapio
 
Gerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data MiningGerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data MiningNicoleaks
 
Open Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpen Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpenAnalytics Spain
 
Minería de datos
Minería de datosMinería de datos
Minería de datosKeopx
 

Tendances (20)

Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Introducción al Data Mining
Introducción al Data MiningIntroducción al Data Mining
Introducción al Data Mining
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
aplicaciones de minería de datos
aplicaciones de minería de datosaplicaciones de minería de datos
aplicaciones de minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Mineria De Datos Secuenciales
Mineria De Datos SecuencialesMineria De Datos Secuenciales
Mineria De Datos Secuenciales
 
Minería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilizaciónMinería de Datos: Qué significa realmente y ejemplos de utilización
Minería de Datos: Qué significa realmente y ejemplos de utilización
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Nociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de DatosNociones Básicas de la Minería de Datos
Nociones Básicas de la Minería de Datos
 
OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)OpenAnalytics - Minería de datos por Diego García (Unican)
OpenAnalytics - Minería de datos por Diego García (Unican)
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Presentación Minería de Datos
Presentación Minería de DatosPresentación Minería de Datos
Presentación Minería de Datos
 
Minería de datos y kdd
Minería de datos y kddMinería de datos y kdd
Minería de datos y kdd
 
Mineria De Datos
Mineria De DatosMineria De Datos
Mineria De Datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Gerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data MiningGerenciar el Conocimiento -CRM - Data Mining
Gerenciar el Conocimiento -CRM - Data Mining
 
Open Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con KnimeOpen Analytics - Minería de Datos con Knime
Open Analytics - Minería de Datos con Knime
 
Minería de datos
Minería de datosMinería de datos
Minería de datos
 
Mineria de datos
Mineria de datosMineria de datos
Mineria de datos
 

Similaire à Charla big data y data mining para gestión de información y bibliotecas

Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de DatosLuisAzofeifa6
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Facultad de Informática UCM
 
1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptxRupertoCisneros3
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosMaría Inés Cahuana Lázaro
 
Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Pedro Contreras Flores
 
Datawarehouse y Datamining
Datawarehouse y DataminingDatawarehouse y Datamining
Datawarehouse y Dataminingdannoblack
 
La Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLa Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLPI ONG
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdfDarnelyC
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresUniversidad Nacional del Nordeste
 
Minería de Datos. Introducción
Minería de Datos. IntroducciónMinería de Datos. Introducción
Minería de Datos. Introduccióntravon1
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosLuis Fernando Aguas Bucheli
 
BIG DATA (MACRODATOS).pdf
BIG DATA (MACRODATOS).pdfBIG DATA (MACRODATOS).pdf
BIG DATA (MACRODATOS).pdfssuser88a1941
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeEduardo Castro
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Ana Delgado
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOSLosMorales
 

Similaire à Charla big data y data mining para gestión de información y bibliotecas (20)

Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
Análisis de Sentimientos y otros retos del aprovechamiento inteligente de los...
 
1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx
 
Presentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datosPresentacion data mining (mineria de datos)- base de datos
Presentacion data mining (mineria de datos)- base de datos
 
Business intelligence (bi) y big data0
Business intelligence (bi) y big data0Business intelligence (bi) y big data0
Business intelligence (bi) y big data0
 
Datawarehouse y Datamining
Datawarehouse y DataminingDatawarehouse y Datamining
Datawarehouse y Datamining
 
Marisela labrador
Marisela labradorMarisela labrador
Marisela labrador
 
La Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica PredictivaLa Minería de Datos en la Analítica Predictiva
La Minería de Datos en la Analítica Predictiva
 
Data mining
Data miningData mining
Data mining
 
Análisis de Datos.pdf
Análisis de Datos.pdfAnálisis de Datos.pdf
Análisis de Datos.pdf
 
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de HogaresMinería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
Minería de Datos Aplicado a la EPH Encuesta Permanente de Hogares
 
Minería de Datos. Introducción
Minería de Datos. IntroducciónMinería de Datos. Introducción
Minería de Datos. Introducción
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 
PLANES Panamá v.3.1
PLANES Panamá v.3.1PLANES Panamá v.3.1
PLANES Panamá v.3.1
 
BIG DATA (MACRODATOS).pdf
BIG DATA (MACRODATOS).pdfBIG DATA (MACRODATOS).pdf
BIG DATA (MACRODATOS).pdf
 
Big data
Big dataBig data
Big data
 
Big Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nubeBig Data con Sql Server 2014 y la nube
Big Data con Sql Server 2014 y la nube
 
Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez Exposicion mineria de datos - Franklin Rodríguez
Exposicion mineria de datos - Franklin Rodríguez
 
MINERIA DE DATOS
MINERIA DE DATOSMINERIA DE DATOS
MINERIA DE DATOS
 
Mineria de datos ok
Mineria de datos okMineria de datos ok
Mineria de datos ok
 

Plus de Felipe Vera (Prodigio Consultores)

Primera prueba de concepto e implementación piloto del mundo de un sistema de...
Primera prueba de concepto e implementación piloto del mundo de un sistema de...Primera prueba de concepto e implementación piloto del mundo de un sistema de...
Primera prueba de concepto e implementación piloto del mundo de un sistema de...Felipe Vera (Prodigio Consultores)
 
The Blockchain Revolution in Information Management and Libraries
The Blockchain Revolution in Information Management and LibrariesThe Blockchain Revolution in Information Management and Libraries
The Blockchain Revolution in Information Management and LibrariesFelipe Vera (Prodigio Consultores)
 
(First use case in the world of Blockchain in Libraries) Descentralizing Lati...
(First use case in the world of Blockchain in Libraries) Descentralizing Lati...(First use case in the world of Blockchain in Libraries) Descentralizing Lati...
(First use case in the world of Blockchain in Libraries) Descentralizing Lati...Felipe Vera (Prodigio Consultores)
 
La biblioteca del futuro: Inteligencia artificial - Blockchain - Internet de ...
La biblioteca del futuro: Inteligencia artificial - Blockchain - Internet de ...La biblioteca del futuro: Inteligencia artificial - Blockchain - Internet de ...
La biblioteca del futuro: Inteligencia artificial - Blockchain - Internet de ...Felipe Vera (Prodigio Consultores)
 
La Revolución Blockchain y su aplicación en gestión de información biblioteca...
La Revolución Blockchain y su aplicación en gestión de información biblioteca...La Revolución Blockchain y su aplicación en gestión de información biblioteca...
La Revolución Blockchain y su aplicación en gestión de información biblioteca...Felipe Vera (Prodigio Consultores)
 
Visión General de las Herramientas de arquitectura de informacion resumen
Visión General  de las Herramientas de arquitectura de informacion resumenVisión General  de las Herramientas de arquitectura de informacion resumen
Visión General de las Herramientas de arquitectura de informacion resumenFelipe Vera (Prodigio Consultores)
 

Plus de Felipe Vera (Prodigio Consultores) (8)

Primera prueba de concepto e implementación piloto del mundo de un sistema de...
Primera prueba de concepto e implementación piloto del mundo de un sistema de...Primera prueba de concepto e implementación piloto del mundo de un sistema de...
Primera prueba de concepto e implementación piloto del mundo de un sistema de...
 
The Blockchain Revolution in Information Management and Libraries
The Blockchain Revolution in Information Management and LibrariesThe Blockchain Revolution in Information Management and Libraries
The Blockchain Revolution in Information Management and Libraries
 
(First use case in the world of Blockchain in Libraries) Descentralizing Lati...
(First use case in the world of Blockchain in Libraries) Descentralizing Lati...(First use case in the world of Blockchain in Libraries) Descentralizing Lati...
(First use case in the world of Blockchain in Libraries) Descentralizing Lati...
 
La biblioteca del futuro: Inteligencia artificial - Blockchain - Internet de ...
La biblioteca del futuro: Inteligencia artificial - Blockchain - Internet de ...La biblioteca del futuro: Inteligencia artificial - Blockchain - Internet de ...
La biblioteca del futuro: Inteligencia artificial - Blockchain - Internet de ...
 
La Revolución Blockchain y su aplicación en gestión de información biblioteca...
La Revolución Blockchain y su aplicación en gestión de información biblioteca...La Revolución Blockchain y su aplicación en gestión de información biblioteca...
La Revolución Blockchain y su aplicación en gestión de información biblioteca...
 
Innovacion y servicios de informacion digital - 2011
Innovacion y servicios de informacion digital - 2011Innovacion y servicios de informacion digital - 2011
Innovacion y servicios de informacion digital - 2011
 
Visión General de las Herramientas de arquitectura de informacion resumen
Visión General  de las Herramientas de arquitectura de informacion resumenVisión General  de las Herramientas de arquitectura de informacion resumen
Visión General de las Herramientas de arquitectura de informacion resumen
 
Herramientas de arquitectura de informacion resumen
Herramientas de arquitectura de informacion resumenHerramientas de arquitectura de informacion resumen
Herramientas de arquitectura de informacion resumen
 

Dernier

ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.pptARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.pptMarianoSanchez70
 
hitos del desarrollo psicomotor en niños.docx
hitos del desarrollo psicomotor en niños.docxhitos del desarrollo psicomotor en niños.docx
hitos del desarrollo psicomotor en niños.docxMarcelaArancibiaRojo
 
DOCUMENTO PLAN DE RESPUESTA A EMERGENCIAS MINERAS
DOCUMENTO PLAN DE RESPUESTA A EMERGENCIAS MINERASDOCUMENTO PLAN DE RESPUESTA A EMERGENCIAS MINERAS
DOCUMENTO PLAN DE RESPUESTA A EMERGENCIAS MINERASPersonalJesusGranPod
 
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIAS
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIASTEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIAS
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIASfranzEmersonMAMANIOC
 
nom-028-stps-2012-nom-028-stps-2012-.pdf
nom-028-stps-2012-nom-028-stps-2012-.pdfnom-028-stps-2012-nom-028-stps-2012-.pdf
nom-028-stps-2012-nom-028-stps-2012-.pdfDiegoMadrigal21
 
ECONOMIA APLICADA SEMANA 555555555544.pdf
ECONOMIA APLICADA SEMANA 555555555544.pdfECONOMIA APLICADA SEMANA 555555555544.pdf
ECONOMIA APLICADA SEMANA 555555555544.pdfmatepura
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdffredyflores58
 
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICAINTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICAJOSLUISCALLATAENRIQU
 
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptx
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptxProcesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptx
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptxJuanPablo452634
 
presentacion medidas de seguridad riesgo eléctrico
presentacion medidas de seguridad riesgo eléctricopresentacion medidas de seguridad riesgo eléctrico
presentacion medidas de seguridad riesgo eléctricoalexcala5
 
CLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxCLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxbingoscarlet
 
Calavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfCalavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfyoseka196
 
Una estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NISTUna estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NISTFundación YOD YOD
 
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdfCristhianZetaNima
 
Clase 2 Revoluciones Industriales y .pptx
Clase 2 Revoluciones Industriales y .pptxClase 2 Revoluciones Industriales y .pptx
Clase 2 Revoluciones Industriales y .pptxChristopherOlave2
 
Reporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpacaReporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpacajeremiasnifla
 
07 MECANIZADO DE CONTORNOS para torno cnc universidad catolica
07 MECANIZADO DE CONTORNOS para torno cnc universidad catolica07 MECANIZADO DE CONTORNOS para torno cnc universidad catolica
07 MECANIZADO DE CONTORNOS para torno cnc universidad catolicalf1231
 
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONALCHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONALKATHIAMILAGRITOSSANC
 
COMPEDIOS ESTADISTICOS DE PERU EN EL 2023
COMPEDIOS ESTADISTICOS DE PERU EN EL 2023COMPEDIOS ESTADISTICOS DE PERU EN EL 2023
COMPEDIOS ESTADISTICOS DE PERU EN EL 2023RonaldoPaucarMontes
 

Dernier (20)

ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.pptARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
ARBOL DE CAUSAS ANA INVESTIGACION DE ACC.ppt
 
hitos del desarrollo psicomotor en niños.docx
hitos del desarrollo psicomotor en niños.docxhitos del desarrollo psicomotor en niños.docx
hitos del desarrollo psicomotor en niños.docx
 
DOCUMENTO PLAN DE RESPUESTA A EMERGENCIAS MINERAS
DOCUMENTO PLAN DE RESPUESTA A EMERGENCIAS MINERASDOCUMENTO PLAN DE RESPUESTA A EMERGENCIAS MINERAS
DOCUMENTO PLAN DE RESPUESTA A EMERGENCIAS MINERAS
 
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIAS
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIASTEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIAS
TEXTURA Y DETERMINACION DE ROCAS SEDIMENTARIAS
 
nom-028-stps-2012-nom-028-stps-2012-.pdf
nom-028-stps-2012-nom-028-stps-2012-.pdfnom-028-stps-2012-nom-028-stps-2012-.pdf
nom-028-stps-2012-nom-028-stps-2012-.pdf
 
ECONOMIA APLICADA SEMANA 555555555544.pdf
ECONOMIA APLICADA SEMANA 555555555544.pdfECONOMIA APLICADA SEMANA 555555555544.pdf
ECONOMIA APLICADA SEMANA 555555555544.pdf
 
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdfECONOMIA APLICADA SEMANA 555555555555555555.pdf
ECONOMIA APLICADA SEMANA 555555555555555555.pdf
 
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICAINTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
INTEGRALES TRIPLES CLASE TEORICA Y PRÁCTICA
 
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptx
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptxProcesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptx
Procesos-de-la-Industria-Alimentaria-Envasado-en-la-Produccion-de-Alimentos.pptx
 
presentacion medidas de seguridad riesgo eléctrico
presentacion medidas de seguridad riesgo eléctricopresentacion medidas de seguridad riesgo eléctrico
presentacion medidas de seguridad riesgo eléctrico
 
CLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptxCLASe número 4 fotogrametria Y PARALAJE.pptx
CLASe número 4 fotogrametria Y PARALAJE.pptx
 
Calavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdfCalavera calculo de estructuras de cimentacion.pdf
Calavera calculo de estructuras de cimentacion.pdf
 
Una estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NISTUna estrategia de seguridad en la nube alineada al NIST
Una estrategia de seguridad en la nube alineada al NIST
 
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
04. Sistema de fuerzas equivalentes II - UCV 2024 II.pdf
 
Clase 2 Revoluciones Industriales y .pptx
Clase 2 Revoluciones Industriales y .pptxClase 2 Revoluciones Industriales y .pptx
Clase 2 Revoluciones Industriales y .pptx
 
Reporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpacaReporte de Exportaciones de Fibra de alpaca
Reporte de Exportaciones de Fibra de alpaca
 
07 MECANIZADO DE CONTORNOS para torno cnc universidad catolica
07 MECANIZADO DE CONTORNOS para torno cnc universidad catolica07 MECANIZADO DE CONTORNOS para torno cnc universidad catolica
07 MECANIZADO DE CONTORNOS para torno cnc universidad catolica
 
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONALCHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
CHARLA DE INDUCCIÓN SEGURIDAD Y SALUD OCUPACIONAL
 
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdfVALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
VALORIZACION Y LIQUIDACION MIGUEL SALINAS.pdf
 
COMPEDIOS ESTADISTICOS DE PERU EN EL 2023
COMPEDIOS ESTADISTICOS DE PERU EN EL 2023COMPEDIOS ESTADISTICOS DE PERU EN EL 2023
COMPEDIOS ESTADISTICOS DE PERU EN EL 2023
 

Charla big data y data mining para gestión de información y bibliotecas

  • 1. Santiago, octubre 2014 Felipe Vera L Director Ejecutivo Prodigio Consultores www.prodigioconsultores.com Charlas CORFO Big Data Aplicada a la Gestión de Información Big data y minería de datos en unidades de información y Bibliotecas
  • 2. Big Data Big Data es en el sector de tecnologías de la información y la comunicación una referencia a los sistemas que manipulan grandes conjuntos de datos (o data sets). Las dificultades más habituales en estos casos se centran en la captura, almacenamiento, búsqueda, compartición, análisis y visualización. www.americanis.net
  • 3. Las “V” del Big Data (Gartner) Volumen de los datos. Velocidad en el tratamiento de los datos. Variedad de los datos. Valor de los datos que tiene que ver con la confiabilidad. “Venue” o campo de trabajo, que habla de la complejidad de tener una alta diversidad de fuentes de datos no estructurados. Visualización, una herramienta útil para trasformar análisis complejos en formatos procesables.
  • 4. Evolución Estructuración, Digitalización y almacenamiento Análisis y toma de decisiones Servicios y uso
  • 5. Big data, gestión de información y Bibliotecas
  • 6. Big data, gestión de información y Bibliotecas
  • 7. Big data, gestión de información y Bibliotecas
  • 8. Big data, gestión de información y Bibliotecas
  • 9. La Biblioteca como fuente de datos
  • 10. El problema de lo tácito V/S Explícito
  • 11. Patrones Conexiones Tendencias Información estructurada ¿Qué se busca? Información no estructurados Las unidades de información y Bibliotecas son una vasta y activa fuente de datos
  • 12. Inteligencia de Negocios – cadena de valor Datos • Datos Clientes • Datos Tiendas • Datos Demográficos • Datos Geográficos Información • X vive en Z • S tiene Y anos • X y S se cambiaron • W tiene dinero en Z Conocimiento • Una cantidad Y del producto A es usada en la región Z • Clientes de la clase P usan x% de producto C en el periodo D Decisión y servicios • Promocione el producto A en la región Z • Mailing a familias del perfil P • Venta cruzada del servicio B a clientes C
  • 13. Minería de datos “Es un proceso no trivial de identificación de patrones de datos válidos, nuevos, potencialmente usables” (Fayyad, Piatetsky-Shapiro y Smyth, 1996). Minería de datos en Unidades de información “Extracción y descubrimiento de patrones de comportamiento, datos e información no trivial proveniente de la totalidad de los sistemas de información tradicionales (opac´s, circulación) y por sobre todo de la gran variedad de servicios de información basados en la web (sitio web, redes sociales, Repositorios), con el fin de apoyar a la toma de decisiones y a los objetivos estratégicos de la organización a la cuál pertenezca. “Integración a la cadena de valor”
  • 14. Minería de datos – metodología KDD 2.Selección y Preprocesamiento 4.Interpretación y Evaluación Knowledge p(x)=0.02 Warehouse Patrones y Modelos Datos preparados Datos Consolidados 3.Data Mining 1.Consolidación de los Datos Conocimiento DW 6. Apoyo a la Toma de Decisiones 5. Visualización del conocimiento
  • 15. Data Science - elementos
  • 17. 3 focos para el entrenamiento en el manejo de datos Christopher Erdmann, Head Librarian Harvard-Smithsonian Center for Astrophysics Técnicas Aplicaciones Cultura de datos y analítica
  • 18. Alguna técnicas Fuentes de datos Minería de datos Web mining -Web content mining -Web structure mining -Web usage mining Text mining Process mining Concept based text mining Procesamiento de lenguaje natural (PLN) *
  • 19. Tipos de problemas a resolver con Data mining Problemas Clasificación Regresión Agrupamiento Reglas de asociación Análisis correlacional Predictivos (supervisados) Descriptivos (no Supervisados)
  • 20. Aplicaciones de Data mining - Support Vector Mchines 20 - Base de datos inicial - Hiperplano separador - Función de decisión (decisión de corte)
  • 21. Aplicaciones de Data mining – no supervisados
  • 22. Aplicaciones de Data mining a Unidades de información Se requiere conocer la demanda que tendrán ciertas bases de datos en un periodo determinado. Problema supervisado de regresión. Se requiere saber si x postulaciones a ciertas líneas de financiamiento CORFO tienen potencial de éxito. Problema Predictivo de clasificación. Se requiere segmentar los tipos de usuarios de un sistema de Bibliotecas para ofrecer recursos de información diferenciados. Problema no supervisado de agrupamiento.
  • 23. Tipos de problemas a resolver con Data mining Se requiere saber que recursos de información se utilizan por cierto perfil de usuario o el director de la institución. Problema descriptivo de reglas de asociación. Se requiere saber que recursos de información (parte de la bibliografía base) se asocian (tipos y frecuencia) con los alumnos que obtienen mejor rendimiento. Modelo no supervisado de análisis correlacional.
  • 24. Tipos de problemas a resolver con Data mining Principales métodos y algoritmos utilizados en Data Mining K-medias – No supervisado de agrupamiento. Árboles de decisión – Supervisado - regresión y clasificación. Regresión Lineal y Logística - Supervisado clasificación y regresión. Redes Neuronales - Supervisado y no supervisado. Reglas de Asociación – No supervisados de reglas de asociación. Vector Suport Machine – Supervisados de clasificación.
  • 25. 5 habilidades esenciales para abordar un proyecto de minería de datos en unidades de información Claridad en las fuentes de beneficios y/o ingresos. Capacidades analíticas. Pensamiento estratégico del negocio. Visión estratégica de la tecnología. Visualización (sobre todo cuando es producto final).