Posiciones en el IDH global de EUA (1950-2024).pdf
Procesos de Analítica Predictiva
1. Pedro Enrique Chávez Farfan
pedro.chavez@addkw.org
LPI’s Director
Limitless Power of Information
Business Analytics Society
https://addkw.com/
La Analítica Predictiva
La AnalíticaPredictivaeslaramade la analíticaavanzadaempleadapararealizarprediccionessobre eventos
futuros que enfrentaran las empresas, para lo cual emplea diversas técnicas como la minería de datos,
minería de textos, la estadística, el modelamiento, el aprendizaje de máquina y la inteligencia artificial.
La analíticapredictivaesel procesode gestiónde tecnologíasde información,técnicasde análisisestadístico
ymodelamientode procesosdenegociosconel propósitode realizarprediccionessobreeventosfuturosque
enfrentaran las empresas.
Figura 1
Losdatosestructuradosde losnegocioscomovolúmenesde venta,país,región, edad,sexo,estadocivil,etc.,
provienende nuestrasbases de datos modeladasy puedenserusados para el análisisenforma directa,en
cambio los datos no estructurados como los que provienen de las notas de un call center, contenidos de
redessociales,sensores,correoselectrónicos uotros tiposde textosabiertosrequierenserextraídosde los
textos junto con los sentimientos para ser usados en el proceso de construcción de modelos.
Figura 2
2. Pedro Enrique Chávez Farfan
pedro.chavez@addkw.org
LPI’s Director
Limitless Power of Information
Business Analytics Society
https://addkw.com/
Los patrones y relaciones encontrados en los datos históricos y transaccionales previos pueden emplearse
en la identificación de riesgos y oportunidades futuras bajo condicionesestablecidas de las variables, de
modo de asignar puntajes o pesos a cada escenario de predicción.
La aplicaciónexitosade laanalíticapredictivaenlosnegociospuedelograrlagestiónadecuadade laBigData
en favor de las empresas.
La analítica predictiva es proactiva, mira hacia adelante, se anticipa a los resultados basados en losdatos y
no ensuposiciones. Laanalíticapredictivaesampliamente usadaenlosnegociosendiversossectorescomo
finanzaspara detecciónde fraudes,carterasmorosaso perfilesde clientesparacampañasde mercadeo,en
el sectorsaludparaladeteccióndepacientesconpropensiónadeterminadas enfermedadesydeterminación
de tratamiento médico, etc.
La analítica prescriptiva va más allá ya que simula los resultados de la implementación de acciones y
decisiones bajo diversos modelosde decisión y determina la mejor solución basada en las implicanciasy
resultadosde lasaccionestomadasylasprediccionesanteriores. Uncampoampliodelaanalíticaprescriptiva
es el desarrollo de humanoides basados en inteligencia artificial.
Figura 3
3. Pedro Enrique Chávez Farfan
pedro.chavez@addkw.org
LPI’s Director
Limitless Power of Information
Business Analytics Society
https://addkw.com/
Procesos de la analítica predictiva
La analíticapredictivaesun procesocomplejode anticiparse a eventosque sucederánenel futuro y puede
llevarse a cabo a través de una serie de subprocesos complementarios o paralelos que ayudan al objetivo
final que esel de preversituacionesde riesgooeventosfuturos que enfrentaranlasempresas.Losprocesos
de la analítica predictiva son:
Figura 4
1. Definicióndel proyecto:definelosresultados,entregables,alcance,objetivosdelnegocio,datosque
serán empleados en el proyecto, etc.
2. Recolecciónde datos:conecta yprepara losdatosa travésde la mineríade datos,que provienende
diversas fuentes y que serán empleados en el modelo de predicción.
La minería de datos es el proceso basado en computadoras de descubrimiento de patrones,
tendencias y comportamientos de los datos a partir de la Big Data empresarial, con la ayuda de las
tecnologíasde inteligenciaartificial,aprendizaje de máquina,estadísticaysistemade base de datos.
El objetivode lamineríade datoses extraerinformaciónde laBigData y convertirlaeninformación
estructuradapara un análisisposterior através de los modelosde análisispredictivo.El procesode
minería de datos es un proceso interdisciplinario que requiere la participación de matemáticos,
estadísticos y programadores de computadoras.
Esta fase es automatizada y se vale de aplicaciones de software estadísticos y de aprendizaje de
maquina que ayudan a determinar un conjunto de datos estandarizados, con determinados
patrones,tendenciasyreglasde comportamientoque ayudaránaimplementarelmodelopredictivo.
4. Pedro Enrique Chávez Farfan
pedro.chavez@addkw.org
LPI’s Director
Limitless Power of Information
Business Analytics Society
https://addkw.com/
Figura 5
3. Análisisde datos:Esel procesode revisión,limpieza,transformaciónymodelamiento estadístico de
losdatos con el objetivode encontrar y prepararel modelode predicción,obtener informaciónútil
y llegar a conclusionesque permitan la toma de decisiones. Algunosmétodosde análisis de datos
incluyen: la inteligencia de negocios, el análisis predictivo, el análisis de textos, etc.
En estadísticael análisisde datosnormalmentese divide en:análisisdescriptivo,análisisexploratorio
y análisis de validación.
Los pasos del análisis de datos comprenden: limpieza de datos, análisis de calidad de los datos,
análisis estadístico de base, análisis exploratorio y análisis de validación de hipótesis, validación
cruzada y análisis de sensibilidad y análisis estadístico general.
Algunastécnicasde análisisquepuedenserrealizadasenestafase inicialson:estadísticaunivariable,
correlaciones y asociaciones bivariables, técnicas graficas basadas en diagramas de dispersión,
variables ordinalesy nominales, asociaciones, circunvalaciones, variables continuas, distribuciones,
etc.
Figura 6
5. Pedro Enrique Chávez Farfan
pedro.chavez@addkw.org
LPI’s Director
Limitless Power of Information
Business Analytics Society
https://addkw.com/
4. Estadística: El análisisestadístico esde mayorprofundidadque el análisisanteriory permite validar
las suposiciones e hipótesis y probarlas utilizando modelos estadísticos estándar. El análisis
estadísticocomienzaconladeterminaciónde lapoblaciónyel procesoaanalizar(lapoblaciónesun
conjuntode observacionesdelprocesoendiversosperiodosde tiempo).El análisis estadístico puede
ser:
- Descriptivo: la población es descrita a través de agregados que se muestran en forma gráfica o
numérica.Las variablesnuméricasse describenatravés de promediosodesviacionesestándar,
en tanto las variables de tipo categoría se describen a través de frecuencias o porcentajes.
- Inferencial: las inferencias emplean patrones basados en los datos de ejemplo y toman en
consideración la aleatoriedad.En forma simple las pruebasde hipótesis basadas en inferencias
consistende respuestas“si”o“no”acercade losdatosypuedenserextendidasalospronósticos
y predicciones.
Algunasde laspruebasestadísticasempleadasenel análisispredictivoson:análisisde varianza,
chi cuadrado, correlacion, análisis de factor, correlaciones y regresiones, t- student, etc.
5. Modelamiento:Esel procesode creación,pruebay validaciónde unmodeloconel finde confirmar
la precisión de los resultados de una predicción. Los modelos se eligen a través de los procesos de
prueba, validación y evaluación para detectar el grado de precisión de los resultados dado un
conjuntode datos de entrada.Los diferentesmodelospermitencrearnuevainformaciónenbase a
losdatosy generarel modelofinal de predicción.Cadamodelotienesusventajasydesventajaspara
determinado tipo de problema.
Un modeloesreutilizableyse creaenbase aunalgoritmode entrenamientoutilizandodatahistórica
y almacenando el modelo para una reutilización posterior en procesos similares.
Los procesos generales del modelamiento predictivo son:
- Creación del modelo: donde se definen los algoritmos que se ejecutaran con los datos
disponibles.
- Prueba del modelo: ejecución de los algoritmos de aprendizaje de cada modelo basados en los
datos disponibles.
- Validación del modelo: validación de los resultados de las corridas de los modelos.
- Evaluación del modelo: evaluación del modelo que mejor se ajusta a los datos.
Los algoritmos de predicción emplean la minería de datos y el análisis estadístico para determinar
patrones y tendencias en los datos. Estos algoritmos pueden ser: regresiones, series de tiempo,
arboles de decisiones, redes neuronales, k-means, etc.
6. Pedro Enrique Chávez Farfan
pedro.chavez@addkw.org
LPI’s Director
Limitless Power of Information
Business Analytics Society
https://addkw.com/
6. Implementación:Permite laimplementaciónde losresultadosdel modelode predicciónatravésde
la automatización de decisiones. La validación e implementación de los modelos predictivos son
actividades que consumen mucho tiempo (pueden tomar meses) y dependen de las características
del escenario de negocios. Hay muchos retos en la implementación de los modelos de predicción
debido a las carencias de infraestructura que permita implementar estas soluciones en los
departamentos y unidades de negocio.
7. Monitoreo del modelo: Implica la administración y monitoreo del modelo para evaluar su
performance y asegurar que den los resultados esperados.