SlideShare une entreprise Scribd logo
1  sur  28
Télécharger pour lire hors ligne
Cómo	
  la	
  Ciencia	
  ha	
  impactado	
  
mi	
  vida	
  y	
  cómo	
  yo	
  he	
  
impactado	
  a	
  la	
  Ciencia
Una	
  ventana	
  al	
  Universo
Norte  de  Chile
Cielos  claros  y  transparentes
Carrera	
  como científico
• Tesis de Doctorado en Astrofísica acerca de cómo
evolucionanlas galaxias elítipticas.
• Uso de grandes telescopios en Chile y
colaboraciones con Francia, USA, Canada, etc.
Very Large Teslecope (VLT)
Datos	
  en	
  Astronomía
• Desde la obtención del dato crudo hasta la
generación de resultados en forma de tablas y
gráficos.
• Testigo del impacto del Big data en Astronomía:
SDSS (1998) llena discos duros de 8GB en 25 min.
Time	
  span:	
  15	
  years
Area:	
  14,555	
  deg2
#	
  sources:	
  469,053,874
Dato  procesadoDato  crudo
Ciencia	
  guiada	
  por	
  los	
  datos
• Jim Gray,	
  investigador	
  de	
  Microsoft,	
  hizo	
  notar	
  
que	
  la	
  Ciencia	
  entró	
  al	
  cuarto	
  paradigma:
Data-­‐driven Science
Muñoz et al. 2015
Evolución del	
  procesamiento
y
análisis	
  de	
  datos
Evolución	
  procesamiento	
  de	
  datos
• 1890:	
  Se	
  usa	
  la	
  máquina	
  tabuladora	
  de	
  Hollerith	
  
para	
  procesar	
  los	
  datos	
  del	
  censo	
  de	
  EE.UU.
• 1951:	
  Se	
  diseña	
  el	
  primer	
  computador	
  
electrónico	
  con	
  fines	
  comerciales,	
  UNIVAC	
  I.
Cómputo
Manual
Cómputo
Automático
Cómputo
Automático
Cómputo
Electrónico
Costo	
  del	
  cómputo
• Desde	
  la	
  invención	
  de	
  los	
  computadores	
  
electrónicos,	
  tanto	
  el	
  precio	
  como	
  el	
  tamaño	
  han	
  
disminuido	
  sostenidamente.
Tsunami	
  de	
  datos
• Durante	
  las	
  últimas	
  décadas	
  la	
  sociedad	
  en	
  su	
  
conjunto	
  se	
  ha	
  digitalizado.
• Mayor	
  capacidad	
  de	
  cómputo	
  y	
  tecnología	
  más	
  
asequible	
  han	
  permitido	
  un	
  crecimiento	
  explosivo	
  
de	
  los	
  datos.
Fuente: Oracle, 2012
Los datos crecen a una tasa
anual del 40%.
Se estima una producción
de 45 ZB para el 2020. 10	
  ZB
45	
  ZB
1	
  ZB=1024	
  EB
1	
  EB=1024	
  PB
Comunidad	
  Open	
  Source
• Una	
  mayor	
  variedad	
  y	
  cantidad	
  de	
  datos	
  trae	
  
consigo	
  nuevos	
  desafíos.
• Desarrollo	
  continuo	
  de	
  herramientas	
  y	
  métodos	
  
para	
  analizar	
  los	
  datos.
• Transición	
  de	
  software	
  empaquetado	
  y	
  comercial	
  
a	
  uno	
  desarrollado	
  por	
  comunidad	
  open	
  source.
¿Qué	
  es	
  la	
  Ciencia	
  de	
  datos?
• Data Science es un campo interdisciplinario que
se ocupa de los procesos y sistemas usados en la
extracción de conocimiento a partir del análisis
de datos.
• Se dice interdisciplinario pues requiere
conocimientos de los campos de la computación,
matemáticas y estadística.
Programación Estadística Data	
  
Science
¿Cambio	
  de	
  paradigma?
• Los	
  datos	
  digitales	
  y	
  las	
  tecnologías	
  han	
  cambiado	
  
la	
  manera	
  en	
  cómo	
  vivimos	
  y	
  cómo	
  entendemos	
  
el	
  mundo.
• Jim Gray,	
  investigador	
  de	
  Microsoft	
  y	
  
pionero	
  en	
  bases	
  de	
  datos	
  introdujo	
  
el	
  concepto	
  del	
  cuarto	
  paradigma.
• Era	
  experimental,	
  teórica
computacional	
  y	
  últimamente	
  la	
  Era	
  
del	
  dato.
Carácter	
  interdisciplinario
Diagrama de	
  Venn	
  para	
  Data	
  Science
Drew	
  Conway	
  (2010)
Habilidades
Programación
Exploración de datos
Soluciones creativas
Conocimientos
Matemáticas
Estadística
Experticia
Especialización
Conocimiento	
  de	
  campo
¿Qué	
  hace	
  un	
  Data	
  Scientist?
• Profesional	
  que	
  posee	
  las	
  herramientas	
  y	
  los	
  
conocimientos	
  necesarios	
  para:
§ Recolectar	
  y	
  filtrar	
  datos	
  de	
  diversas	
  fuentes
§ Explorar de	
  manera	
  efectiva	
  un	
  set	
  de	
  datos
§ Obtener	
  información	
  valiosa	
  oculta	
  en	
  los	
  datos
§ Construir	
  modelos	
  que	
  permitan	
  tomar	
  decisiones	
  
informadas.
Data Scientist: Persona que es mejor en estadística que
cualquier ingeniero de software y que es mejor en ingeniería
de software que cualquier estadístico.
Roles	
  en	
  la	
  Organización
Conocimientos	
  y	
  Habilidades
• Formación	
  universitaria	
  en	
  las	
  áreas	
  de	
  Ingeniería	
  
y	
  Ciencias	
  Naturales.	
  Idealmente	
  tienen	
  Magister	
  
y	
  PhD.
• Poseen	
  conocimientos	
  de	
  Matemáticas,	
  
Estadística	
  y	
  Programación	
  computacional.
• Se	
  caracterizan	
  por	
  su	
  curiosidad	
  intelectual,	
  son	
  
capaces	
  de	
  diseñar	
  experimentos	
  y	
  comunicar	
  de	
  
manera	
  efectiva	
  los	
  resultados.
Esquema	
  simple	
  Data	
  Science
Casos	
  Notables
nyc-­‐taxi-­‐data
uber-­‐tlc-­‐foil-­‐response
Análisis de	
  uso	
  de	
  Taxis	
  y	
  Uber	
  en	
  NYC
Open	
  Data+Open Source
Fuente: FiveThirtyEight
Casos	
  Notables
datausa
Análisis de	
  datos	
  públicos	
  de	
  USA
Open	
  Data+Open Source
Fuente: The New York Times
Innovación	
  con	
  base
científica	
  y	
  tecnológica
Visión computacional
• Enseñar	
  a	
  las	
  máquinas a	
  ver	
  e	
  interpretar	
  tal	
  
como	
  lo	
  hacemos	
  los	
  humanos.
• Interdisciplinario:	
  Matemáticas,	
  Física,	
  AI
Industria	
  automotriz
• ¿Por	
  qué	
  usar	
  Visión	
  Computacional?
§ 3.500	
  personas	
  mueren	
  todos	
  los	
  días en	
  
accidentes	
  de	
  tránsito	
  en	
  el	
  mundo
§ Gastamos	
  cerca	
  de	
  1	
  hora	
  conduciendo
Ingresos:  240  millones  USD  (2015)
Mobileye,  2015
Seguridad	
  y	
  Transporte
• Los	
  sistemas	
  de	
  vigilancia	
  cumplen	
  un	
  rol	
  clave	
  en	
  
la	
  seguridad	
  y	
  mejora	
  de	
  experiencia	
  de	
  usuario	
  
en	
  las	
  industrias	
  del	
  retail,	
  transporte	
  público	
  y	
  
orden	
  público.
Metric Video	
  Analytics
• Análisis	
  de	
  cámaras	
  de	
  seguridad	
  en	
  tiempo	
  real,	
  
escalable	
  y	
  de	
  bajo	
  costo.
• Integración	
  con	
  la	
  plataforma	
  Azure	
  de	
  Microsoft	
  
y	
  capacidad	
  de	
  analítica	
  avanzada.
Informes	
  y	
  alertas
• Conteo	
  y	
  seguimiento	
  de	
  personas
• Alertas	
  de	
  actos	
  delictuales	
  y	
  evasión	
  
• Datos	
  demográficos	
  de	
  clientes	
  y	
  usuarios
Smarcity:	
  Ciudad	
  interconectada
Gracias!
Email:	
  rmunoz@uc.cl
Github:	
  github.com/rpmunoz

Contenu connexe

En vedette

Fct de consommation et l'épargne
Fct de consommation et l'épargneFct de consommation et l'épargne
Fct de consommation et l'épargne
Mejdoubi Amal
 
The ADHD Epidemic in America
The ADHD Epidemic in AmericaThe ADHD Epidemic in America
The ADHD Epidemic in America
worldwideww
 
Seguridad y Privacidad de Documentos Electronicos
Seguridad y Privacidad de Documentos ElectronicosSeguridad y Privacidad de Documentos Electronicos
Seguridad y Privacidad de Documentos Electronicos
Digetech.net
 
Technology Vocabulary
Technology VocabularyTechnology Vocabulary
Technology Vocabulary
Paula Gómez
 

En vedette (17)

Impact of Media on Indian Soceity
Impact of Media on Indian SoceityImpact of Media on Indian Soceity
Impact of Media on Indian Soceity
 
Screendesign und Web-Accessibility
Screendesign und Web-AccessibilityScreendesign und Web-Accessibility
Screendesign und Web-Accessibility
 
Asturias
AsturiasAsturias
Asturias
 
Brick Essay & Notes
Brick Essay & NotesBrick Essay & Notes
Brick Essay & Notes
 
Jabon con inclusiones
Jabon con inclusionesJabon con inclusiones
Jabon con inclusiones
 
Eventually Elasticsearch: Eventual Consistency in the Real World
Eventually Elasticsearch: Eventual Consistency in the Real WorldEventually Elasticsearch: Eventual Consistency in the Real World
Eventually Elasticsearch: Eventual Consistency in the Real World
 
Fct de consommation et l'épargne
Fct de consommation et l'épargneFct de consommation et l'épargne
Fct de consommation et l'épargne
 
Ljus & oljus (ljuskvalitet & hälsa)
Ljus & oljus (ljuskvalitet & hälsa)Ljus & oljus (ljuskvalitet & hälsa)
Ljus & oljus (ljuskvalitet & hälsa)
 
Chp13 E Blueprint
Chp13 E BlueprintChp13 E Blueprint
Chp13 E Blueprint
 
The ADHD Epidemic in America
The ADHD Epidemic in AmericaThe ADHD Epidemic in America
The ADHD Epidemic in America
 
Ficha de historia del arte retrato y escultura funeraria
Ficha de historia del arte retrato y escultura funerariaFicha de historia del arte retrato y escultura funeraria
Ficha de historia del arte retrato y escultura funeraria
 
Seguridad y Privacidad de Documentos Electronicos
Seguridad y Privacidad de Documentos ElectronicosSeguridad y Privacidad de Documentos Electronicos
Seguridad y Privacidad de Documentos Electronicos
 
Marketing deportivo
Marketing deportivoMarketing deportivo
Marketing deportivo
 
Asian financial crisis 1997
Asian financial crisis 1997Asian financial crisis 1997
Asian financial crisis 1997
 
Technology Vocabulary
Technology VocabularyTechnology Vocabulary
Technology Vocabulary
 
Gesund kochen. Gesund leben.
Gesund kochen. Gesund leben.Gesund kochen. Gesund leben.
Gesund kochen. Gesund leben.
 
Bitte von Bürgerinitiative BAKI meine Schule in Bremen
Bitte von Bürgerinitiative BAKI meine Schule in BremenBitte von Bürgerinitiative BAKI meine Schule in Bremen
Bitte von Bürgerinitiative BAKI meine Schule in Bremen
 

Similaire à Data science como motor de la innovación

Similaire à Data science como motor de la innovación (20)

La geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big dataLa geografía y la estadística. dos necesidades para entender big data
La geografía y la estadística. dos necesidades para entender big data
 
1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx1.Unidad1. Fundamentos DataScience.pptx
1.Unidad1. Fundamentos DataScience.pptx
 
El horizonte de la investigación en el siglo xxi
El horizonte de la investigación en el siglo xxiEl horizonte de la investigación en el siglo xxi
El horizonte de la investigación en el siglo xxi
 
Datos de investigación: reflexiones sobre su acceso abierto
Datos de investigación: reflexiones sobre su acceso abiertoDatos de investigación: reflexiones sobre su acceso abierto
Datos de investigación: reflexiones sobre su acceso abierto
 
Aplicaciones de modelos matemáticos
Aplicaciones de modelos matemáticosAplicaciones de modelos matemáticos
Aplicaciones de modelos matemáticos
 
Matemática y Data Science
Matemática y Data ScienceMatemática y Data Science
Matemática y Data Science
 
INTERNET: Retos y Oportunidades en los Archivos
INTERNET:Retos y Oportunidades en los ArchivosINTERNET:Retos y Oportunidades en los Archivos
INTERNET: Retos y Oportunidades en los Archivos
 
Conceptos en Ciencia de Datos
Conceptos en Ciencia de DatosConceptos en Ciencia de Datos
Conceptos en Ciencia de Datos
 
Nuevas formas de comunicación en una escuela hiperconectada. Del Bigdata al ...
Nuevas formas de comunicación  en una escuela hiperconectada. Del Bigdata al ...Nuevas formas de comunicación  en una escuela hiperconectada. Del Bigdata al ...
Nuevas formas de comunicación en una escuela hiperconectada. Del Bigdata al ...
 
Aplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de DatosAplicaciones Difusas: Evolución de las Bases de Datos
Aplicaciones Difusas: Evolución de las Bases de Datos
 
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH DigitalesEl Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
El Big Data como fenómeno y herramienta para el e‐research en CSyH Digitales
 
Big Data para mortales
Big Data para mortalesBig Data para mortales
Big Data para mortales
 
Data Science: Correlación curricular
Data Science: Correlación curricularData Science: Correlación curricular
Data Science: Correlación curricular
 
Introducción al Big Data
Introducción al Big DataIntroducción al Big Data
Introducción al Big Data
 
Big Data Analytics: Oportunidades, Retos y Tendencias
Big Data Analytics: Oportunidades, Retos y TendenciasBig Data Analytics: Oportunidades, Retos y Tendencias
Big Data Analytics: Oportunidades, Retos y Tendencias
 
Minería de Datos: Conceptos y Tendencias
Minería de Datos: Conceptos y TendenciasMinería de Datos: Conceptos y Tendencias
Minería de Datos: Conceptos y Tendencias
 
Herramientas de mineria_de_datos
Herramientas de mineria_de_datosHerramientas de mineria_de_datos
Herramientas de mineria_de_datos
 
Conociendo big data
Conociendo big dataConociendo big data
Conociendo big data
 
Tópicos de Big Data - Introducción
Tópicos de Big Data - IntroducciónTópicos de Big Data - Introducción
Tópicos de Big Data - Introducción
 
Qué es la ciencia de datos.pdf
Qué es la ciencia de datos.pdfQué es la ciencia de datos.pdf
Qué es la ciencia de datos.pdf
 

Plus de Roberto Muñoz

Plus de Roberto Muñoz (15)

Astronomía en la era de la información
Astronomía en la era de la informaciónAstronomía en la era de la información
Astronomía en la era de la información
 
Global AI nights - Casos de uso de ML en Astronomia
Global AI nights - Casos de uso de ML en AstronomiaGlobal AI nights - Casos de uso de ML en Astronomia
Global AI nights - Casos de uso de ML en Astronomia
 
Inserción de científicos en la industria tecnológica
Inserción de científicos en la industria tecnológicaInserción de científicos en la industria tecnológica
Inserción de científicos en la industria tecnológica
 
From academy to industry
From academy to industryFrom academy to industry
From academy to industry
 
Avances y desafíos en la exploración del Universo
Avances y desafíos en la exploración del UniversoAvances y desafíos en la exploración del Universo
Avances y desafíos en la exploración del Universo
 
AstroCV: A computer vision library for Astronomy
AstroCV: A computer vision library for AstronomyAstroCV: A computer vision library for Astronomy
AstroCV: A computer vision library for Astronomy
 
Video analytics: Mejorando la seguridad y calidad de vida
Video analytics: Mejorando la seguridad y calidad de vidaVideo analytics: Mejorando la seguridad y calidad de vida
Video analytics: Mejorando la seguridad y calidad de vida
 
Open Science: El costo de leer y publicar
Open Science: El costo de leer y publicarOpen Science: El costo de leer y publicar
Open Science: El costo de leer y publicar
 
The role of Computer Vision in Astronomy
The role of Computer Vision in AstronomyThe role of Computer Vision in Astronomy
The role of Computer Vision in Astronomy
 
Astronomy in the Data Driven Science Era
Astronomy in the Data Driven Science EraAstronomy in the Data Driven Science Era
Astronomy in the Data Driven Science Era
 
From astronomy to video analytics industry
From astronomy to video analytics industryFrom astronomy to video analytics industry
From astronomy to video analytics industry
 
Efficient data reduction and analysis of DECam images using multicore archite...
Efficient data reduction and analysis of DECam images using multicore archite...Efficient data reduction and analysis of DECam images using multicore archite...
Efficient data reduction and analysis of DECam images using multicore archite...
 
The Next Generation Fornax Survey - Pucon Symposium 2015
The Next Generation Fornax Survey - Pucon Symposium 2015The Next Generation Fornax Survey - Pucon Symposium 2015
The Next Generation Fornax Survey - Pucon Symposium 2015
 
Todo un universo por descubrir - Putre, Octubre del 2014
Todo un universo por descubrir - Putre, Octubre del 2014Todo un universo por descubrir - Putre, Octubre del 2014
Todo un universo por descubrir - Putre, Octubre del 2014
 
Astronomía en la era del big data - Arica, junio del 2015
Astronomía en la era del big data - Arica, junio del 2015Astronomía en la era del big data - Arica, junio del 2015
Astronomía en la era del big data - Arica, junio del 2015
 

Dernier

metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
MedicinaInternaresid1
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
ssuserbdc329
 
PLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorarPLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorar
CelesteRolon2
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
MANUELVILELA7
 

Dernier (20)

procedimiento paran la planificación en los centros educativos tipo v(multig...
procedimiento  paran la planificación en los centros educativos tipo v(multig...procedimiento  paran la planificación en los centros educativos tipo v(multig...
procedimiento paran la planificación en los centros educativos tipo v(multig...
 
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de CyclisticAnálisis de datos en acción: Optimizando el crecimiento de Cyclistic
Análisis de datos en acción: Optimizando el crecimiento de Cyclistic
 
metodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un pacientemetodo SOAP utilizado para evaluar el estado de un paciente
metodo SOAP utilizado para evaluar el estado de un paciente
 
Los países por porcentaje de población blanca europea en AL (2024).pdf
Los países por porcentaje de población blanca europea en AL (2024).pdfLos países por porcentaje de población blanca europea en AL (2024).pdf
Los países por porcentaje de población blanca europea en AL (2024).pdf
 
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
Novelas Turcas vs Series de EUA en audiencia  (2024).pdfNovelas Turcas vs Series de EUA en audiencia  (2024).pdf
Novelas Turcas vs Series de EUA en audiencia (2024).pdf
 
Investigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdfInvestigacion cualitativa y cuantitativa....pdf
Investigacion cualitativa y cuantitativa....pdf
 
Letra de cambio definición y características.ppt
Letra de cambio definición y características.pptLetra de cambio definición y características.ppt
Letra de cambio definición y características.ppt
 
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdfPorcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
Porcentaje de población blanca europea en Europa Occidental (1923-2024).pdf
 
Análisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.pptAnálisis del Modo y Efecto de Fallas AMEF.ppt
Análisis del Modo y Efecto de Fallas AMEF.ppt
 
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdfIndustria musical de EUA vs Industria musical Corea del Sur (2024).pdf
Industria musical de EUA vs Industria musical Corea del Sur (2024).pdf
 
Evolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdfEvolución de la fortuna de la familia Slim (1994-2024).pdf
Evolución de la fortuna de la familia Slim (1994-2024).pdf
 
EPIDEMIO CANCER PULMON resumen nnn.pptx
EPIDEMIO CANCER PULMON  resumen nnn.pptxEPIDEMIO CANCER PULMON  resumen nnn.pptx
EPIDEMIO CANCER PULMON resumen nnn.pptx
 
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdfPosiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
Posiciones_del_sionismo_en_los_imperios globales de la humanidad (2024).pdf
 
PLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorarPLAN ANUAL DE PROYECTO 2020. para mejorar
PLAN ANUAL DE PROYECTO 2020. para mejorar
 
variables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpointvariables-estadisticas. Presentación powerpoint
variables-estadisticas. Presentación powerpoint
 
Las marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdfLas marcas automotrices con más ventas de vehículos (2024).pdf
Las marcas automotrices con más ventas de vehículos (2024).pdf
 
Tipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptxTipos de Educacion en diferentes partes del mundo.pptx
Tipos de Educacion en diferentes partes del mundo.pptx
 
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILASistema Nacional de Vigilancia en Salud Pública SIVIGILA
Sistema Nacional de Vigilancia en Salud Pública SIVIGILA
 
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIALINFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
INFORME FINAL ESTADISTICA DESCRIPTIVA E INFERENCIAL
 
COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .COMUNICADO PARA TODO TIPO DE REUNIONES .
COMUNICADO PARA TODO TIPO DE REUNIONES .
 

Data science como motor de la innovación

  • 1.
  • 2. Cómo  la  Ciencia  ha  impactado   mi  vida  y  cómo  yo  he   impactado  a  la  Ciencia
  • 3. Una  ventana  al  Universo Norte  de  Chile Cielos  claros  y  transparentes
  • 4. Carrera  como científico • Tesis de Doctorado en Astrofísica acerca de cómo evolucionanlas galaxias elítipticas. • Uso de grandes telescopios en Chile y colaboraciones con Francia, USA, Canada, etc. Very Large Teslecope (VLT)
  • 5. Datos  en  Astronomía • Desde la obtención del dato crudo hasta la generación de resultados en forma de tablas y gráficos. • Testigo del impacto del Big data en Astronomía: SDSS (1998) llena discos duros de 8GB en 25 min. Time  span:  15  years Area:  14,555  deg2 #  sources:  469,053,874
  • 6. Dato  procesadoDato  crudo Ciencia  guiada  por  los  datos • Jim Gray,  investigador  de  Microsoft,  hizo  notar   que  la  Ciencia  entró  al  cuarto  paradigma: Data-­‐driven Science Muñoz et al. 2015
  • 8. Evolución  procesamiento  de  datos • 1890:  Se  usa  la  máquina  tabuladora  de  Hollerith   para  procesar  los  datos  del  censo  de  EE.UU. • 1951:  Se  diseña  el  primer  computador   electrónico  con  fines  comerciales,  UNIVAC  I. Cómputo Manual Cómputo Automático Cómputo Automático Cómputo Electrónico
  • 9. Costo  del  cómputo • Desde  la  invención  de  los  computadores   electrónicos,  tanto  el  precio  como  el  tamaño  han   disminuido  sostenidamente.
  • 10. Tsunami  de  datos • Durante  las  últimas  décadas  la  sociedad  en  su   conjunto  se  ha  digitalizado. • Mayor  capacidad  de  cómputo  y  tecnología  más   asequible  han  permitido  un  crecimiento  explosivo   de  los  datos. Fuente: Oracle, 2012 Los datos crecen a una tasa anual del 40%. Se estima una producción de 45 ZB para el 2020. 10  ZB 45  ZB 1  ZB=1024  EB 1  EB=1024  PB
  • 11. Comunidad  Open  Source • Una  mayor  variedad  y  cantidad  de  datos  trae   consigo  nuevos  desafíos. • Desarrollo  continuo  de  herramientas  y  métodos   para  analizar  los  datos. • Transición  de  software  empaquetado  y  comercial   a  uno  desarrollado  por  comunidad  open  source.
  • 12. ¿Qué  es  la  Ciencia  de  datos? • Data Science es un campo interdisciplinario que se ocupa de los procesos y sistemas usados en la extracción de conocimiento a partir del análisis de datos. • Se dice interdisciplinario pues requiere conocimientos de los campos de la computación, matemáticas y estadística. Programación Estadística Data   Science
  • 13. ¿Cambio  de  paradigma? • Los  datos  digitales  y  las  tecnologías  han  cambiado   la  manera  en  cómo  vivimos  y  cómo  entendemos   el  mundo. • Jim Gray,  investigador  de  Microsoft  y   pionero  en  bases  de  datos  introdujo   el  concepto  del  cuarto  paradigma. • Era  experimental,  teórica computacional  y  últimamente  la  Era   del  dato.
  • 14. Carácter  interdisciplinario Diagrama de  Venn  para  Data  Science Drew  Conway  (2010) Habilidades Programación Exploración de datos Soluciones creativas Conocimientos Matemáticas Estadística Experticia Especialización Conocimiento  de  campo
  • 15. ¿Qué  hace  un  Data  Scientist? • Profesional  que  posee  las  herramientas  y  los   conocimientos  necesarios  para: § Recolectar  y  filtrar  datos  de  diversas  fuentes § Explorar de  manera  efectiva  un  set  de  datos § Obtener  información  valiosa  oculta  en  los  datos § Construir  modelos  que  permitan  tomar  decisiones   informadas. Data Scientist: Persona que es mejor en estadística que cualquier ingeniero de software y que es mejor en ingeniería de software que cualquier estadístico.
  • 16. Roles  en  la  Organización
  • 17. Conocimientos  y  Habilidades • Formación  universitaria  en  las  áreas  de  Ingeniería   y  Ciencias  Naturales.  Idealmente  tienen  Magister   y  PhD. • Poseen  conocimientos  de  Matemáticas,   Estadística  y  Programación  computacional. • Se  caracterizan  por  su  curiosidad  intelectual,  son   capaces  de  diseñar  experimentos  y  comunicar  de   manera  efectiva  los  resultados.
  • 19. Casos  Notables nyc-­‐taxi-­‐data uber-­‐tlc-­‐foil-­‐response Análisis de  uso  de  Taxis  y  Uber  en  NYC Open  Data+Open Source Fuente: FiveThirtyEight
  • 20. Casos  Notables datausa Análisis de  datos  públicos  de  USA Open  Data+Open Source Fuente: The New York Times
  • 22. Visión computacional • Enseñar  a  las  máquinas a  ver  e  interpretar  tal   como  lo  hacemos  los  humanos. • Interdisciplinario:  Matemáticas,  Física,  AI
  • 23. Industria  automotriz • ¿Por  qué  usar  Visión  Computacional? § 3.500  personas  mueren  todos  los  días en   accidentes  de  tránsito  en  el  mundo § Gastamos  cerca  de  1  hora  conduciendo Ingresos:  240  millones  USD  (2015) Mobileye,  2015
  • 24. Seguridad  y  Transporte • Los  sistemas  de  vigilancia  cumplen  un  rol  clave  en   la  seguridad  y  mejora  de  experiencia  de  usuario   en  las  industrias  del  retail,  transporte  público  y   orden  público.
  • 25. Metric Video  Analytics • Análisis  de  cámaras  de  seguridad  en  tiempo  real,   escalable  y  de  bajo  costo. • Integración  con  la  plataforma  Azure  de  Microsoft   y  capacidad  de  analítica  avanzada.
  • 26. Informes  y  alertas • Conteo  y  seguimiento  de  personas • Alertas  de  actos  delictuales  y  evasión   • Datos  demográficos  de  clientes  y  usuarios