2. acerca de mi
• senior consultant en nagnoi
• 15+ años en SQL Server
• 10+ años en BI & OLAP
• 5 años Microsoft MVP in SQL Server
• blog: www.alankoo.com
• co-fundador de Puerto Rico PASS
• mentor regional de PASS para LATAM
12. data science
• palabra clave: “ciencia”
• probar cosas
• (podría no | no va)
a funcionar la primera vez
• esto podría funcionar…pregunta
• wikipediainvestigación
• tengo una ideahipótesis
• pruébalaexperimentación
• ¿funcionó?análisis
• tiempo para otra ideaconclusión
13. machine learning
Rama de la inteligencia artificial cuyo objetivo es desarrollar técnicas
que permitan a las computadoras aprender… trata de crear
programas capaces de generalizar comportamientos a partir de una
información no estructurada suministrada en forma de ejemplos.
..Proceso de inducción del conocimiento.
http://en.wikipedia.org/wiki/Machine_learning
15. necesito predecir la
rentabilidad de mis
clientes
f(Edad, Estado Civil, Género, Ingreso Anual,
Total de Niños, Educación, Ocupación,
Tiene Casa, Distancia Diaria )
17. retos para usar Machine Learning
Tradicional
(adivinar,
regla de
dedo, prueba
y error)
caro
aislado caos
Complejo
Consecuencias
Pérdida de Oportunidades, Errores
operacionales costosos
Estrategia de
cambio
Se dicen
muchas cosas
Data
Scientist
Nuevos
mercados
Alta
competencia
19. Habilita el análisis predictivo poderoso basado en la
nube. Profesionales pueden fácilmente construir,
distribuir y compartir soluciones analíticas avanzadas
Azure Machine Learning
• Accesible a través de un navegador web, no require instalar software
• Colaboración con cualquiera en cualquier lugar usando Azure workspace
• Composición visual con Soporte de inicio a fin para flujos de data science
• Los mejores algoritmos de ML
• Extensible, soporte de lenguaje R y Phyton
20. Azure Machine Learning
Azure Portal
ML Studio
ML API service
equipo de operaciones
profesionales de datos
& Data scientist
desarrolladores de
software
21. Demo [Equipo de operaciones]
Creando un Azure Machine Learning
workspace
22. Flujo de Machine Learning
Recopilar suficientes volúmenes de datos
actuales, limpios y completes es crítico
Garbage in Garbage out
Los conjuntos de datos pueden ser de:
Fuentes internar: operacionales, data warehouses, etc
Fuentes externas, formatos distintos
Combinar conjuntos de datos puede
enriquecer el proceso
Ej. Integrar data external a data interna como el clima, mercados, tasas, etc.
24. Flujo de Machine Learning
Esfuerzos importantes son requeridos para
preparar la data para Machine Learning
Transformar a limpiar, reducir o re-formatear
Aislar y marcar data fuera de lo normal
Sustituir apropiadamente valores no existentes
Categorizar valores continuos en rangos
Normalizar valores continuos entre 0 y 1
Por supuesto, tener la data requerida es
muy importante
Al diseñar el sistema, considere atributos que podrían ser considerados
como entradas en modelos futuros: Ej. Fecha de nacimiento, género, etc.
25. Flujo de Machine Learning
Etapa iterativa, experimentación es requerida para
producir un modelo óptimo
Incluye:
Seleccionar un algoritmo
Definir entradas y salidas
Optimización configurando parámetros del algoritmo
Evaluación del modelo es crítico:
Precisión
Confiabilidad
Usabilidad
27. Flujo de Machine Learning
Primero, agregue un scoring experiment
Lógica de transformación es reemplazada por recursos de transformación
reusable
Lógica de entrenamiento es reemplazada por un modelo entrenado
Se agregan Web Services de entrada y salida
Las propiedades del módulo pueden ser parametrizadas
Prepare el experimiento para
Publique el experimiento como un web service
Publique el experimiento a la galería
Aprenda de otros descubriendo experimientos
Contribuya y muestre sus experimientos
29. Flujo de Machine Learning
Administre los web services
Agregue y administre los endpoints
Configure el throttle y tracing de los endpoints
Monitoree los web services
Monitoree las transacciones en el API
Monitoree el uso de los workspaces
Monitoree los recursos de cómputo
Monitoree el espacio de almacenamiento
Monetice sus web services publicando en el Azure
Marketplace
32. Flujo de Machine Learning
Integrar
Desarrolle una aplicación que integre
funcionalidad predictiva con llamadas al web
service
Cada web Service ofrece dos métodos
• Request/Response Service (RRS): Poca latencia, web Service escalable
• Batch Execution Service (BES): Alto volumen, scoring asíncrono de muchos
registros
El servicio puede ser invocado por cualquier lenguaje de programación
• Conectividad a internet
• Capacidades SSL para solicitudes HTTPS
• ODA endpoint y API key
• Habilidad para formatear JSON
42. créditos/referencias
• Presentación de Seth Juarez, TechEd Europe 2014
• Presentación de Renato Jovic, Advanced Technology Day 2014
• Presentación de Peter Myers, Ignite 2015
• Libro: AzureML Essentials, Jeff Barnes, 2015