Publicité

Estadística 1.pptx

21 Mar 2023
Publicité

Contenu connexe

Publicité

Estadística 1.pptx

  1. Estadística I Matemáticas para entender mis datos Cyn - Matemática
  2. Cynthia Castillo Un poco sobre mí… LaMatemaga Matemática Análisis y Ciencia de Datos Banco Regional (Hey Banco) Asistente de Investigación CICFIM UANL (Bioinformática) Mi objetivo: Mostrarte que las matemáticas son tus aliadas. LaMatemaga LaMatemaga
  3. Estructura Sobre el curso… 2 de noviembre Estadística I 4 de noviembre Estadística II 12 de marzo Teoría de Grafos 19 de marzo Matemáticas Discretas con Python
  4. ¿Qué es la Estadística?
  5. Estadística Cody, ¿qué es la estadística?
  6. Estadística Se encarga de desarrollar y estudiar métodos de recopilación, análisis, interpretación y presentación de datos empíricos. Fuente: UCI Donal Bren, School of Information & Computer Science, Department of Statistics (UCI). What is Statistics?
  7. Estadística Se encarga de desarrollar y estudiar métodos de recopilación, análisis, interpretación y presentación de datos empíricos. Fuente: UCI Donal Bren, School of Information & Computer Science, Department of Statistics (UCI). What is Statistics?
  8. Un poco de historia… Orígenes en la administración pública.
  9. Un poco de historia… Orígenes en la administración pública. ● (S. XVII) Juegos de azar y apuestas
  10. Un poco de historia… Orígenes en la administración pública. ● (S. XVII) Juegos de azar y apuestas ● (S. XVIII) Demografía y Economía
  11. Un poco de historia… Orígenes en la administración pública. ● (S. XVII) Juegos de azar y apuestas ● (S. XVIII) Demografía y Economía ● (S. XIX) Mayor colección de datos. Avances en sociología y psicología
  12. Un poco de historia… Orígenes en la administración pública. ● (S. XVII) Juegos de azar y apuestas ● (S. XVIII) Demografía y Economía ● (S. XIX) Mayor colección de datos. Avances en sociología y psicología ● (S. XX) Mayor presencia de las computadoras digitales
  13. Un poco de historia… Orígenes en la administración pública. ● (S. XVII) Juegos de azar y apuestas ● (S. XVIII) Demografía y Economía ● (S. XIX) Mayor colección de datos. Avances en sociología y psicología ● (S. XX) Mayor presencia de las computadoras digitales ● (S. XXI) Big Data
  14. Estadística Se encarga de desarrollar y estudiar métodos de recopilación, análisis, interpretación y presentación de datos empíricos. Fuente: UCI Donal Bren, School of Information & Computer Science, Department of Statistics (UCI). What is Statistics?
  15. Criptografía Cadenas Binarias Visión Computacional Imágenes Sistemas Dinámicos Estados de un Sistema Sobre los Machine Learning Atributos Renderización de Gráficos Shaders Espacios Multidimensionales Puntos en el Espacio Procesos Estocásticos Distribuciones de Probabilidad Datos Empíricos
  16. Sobre los Datos Empíricos
  17. Sobre los Datos Empíricos Genética
  18. Sobre los Datos Empíricos Genética Bancos
  19. Sobre los Datos Empíricos Genética Política Bancos
  20. Sobre los Datos Empíricos Medicina Genética Política Bancos
  21. Sobre los Datos Empíricos Medicina Genética Política Bancos Agricultura
  22. Sobre los Datos Empíricos Medicina Genética Política Bancos Agricultura Meteorología
  23. Sobre los Datos Empíricos Industria Automotriz Medicina Genética Política Bancos Agricultura Meteorología
  24. Sobre los Datos Empíricos Industria Automotriz Medicina Genética Política Bancos Agricultura Turismo Meteorología
  25. Sobre los Datos Empíricos Industria Automotriz Medicina Genética Política Bancos Agricultura Turismo Meteorología Experiencia de Usuario
  26. Sobre los Datos Empíricos Industria Automotriz Medicina Genética Educación Política Bancos Agricultura Turismo Meteorología Experiencia de Usuario
  27. Sobre los Datos Empíricos Industria Automotriz Medicina Genética Farmacéutica Educación Política Bancos Agricultura Turismo Meteorología Experiencia de Usuario
  28. Sobre los Datos Empíricos Industria Automotriz Medicina Genética Farmacéutica Educación Política Bancos Mercadotecnia Agricultura Turismo Meteorología Experiencia de Usuario
  29. Sobre los Datos Empíricos Industria Automotriz Medicina Genética Farmacéutica Educación Política Bancos Mercadotecnia Agricultura Turismo Meteorología Experiencia de Usuario Deporte
  30. Sobre los Datos Empíricos Industria Automotriz Medicina Genética Farmacéutica Educación Política Bancos Mercadotecnia Agricultura Turismo Meteorología Experiencia de Usuario Deporte La imaginación es el límite
  31. Pero antes…
  32. Probabilidad
  33. Antes de empezar, veamos algunos El conjunto de todos los posibles resultados de un experimento. Normalmente se denota por la letra S. Nota: Cada elemento de este conjunto es conocido como punto muestral Conceptos Importantes Espacio Muestral
  34. Antes de empezar, veamos algunos El conjunto de todos los posibles resultados de un experimento. Normalmente se denota por la letra S. Nota: Cada elemento de este conjunto es conocido como punto muestral Conceptos Importantes Espacio Muestral S:
  35. Antes de empezar, veamos algunos El conjunto de todos los posibles resultados de un experimento. Normalmente se denota por la letra S. Nota: Cada elemento de este conjunto es conocido como punto muestral Conceptos Importantes Espacio Muestral S: Las cartas de poker
  36. Antes de empezar, veamos algunos El conjunto de todos los posibles resultados de un experimento. Normalmente se denota por la letra S. Nota: Cada elemento de este conjunto es conocido como punto muestral Conceptos Importantes Espacio Muestral S: Las cartas de poker Q♥ ∈ S
  37. Antes de empezar, veamos algunos Es un subconjunto del espacio muestral. Conceptos Importantes Evento
  38. Antes de empezar, veamos algunos Es un subconjunto del espacio muestral. Conceptos Importantes Evento A: As’ de la baraja
  39. Antes de empezar, veamos algunos Es un subconjunto del espacio muestral. Conceptos Importantes Evento A: As’ de la baraja
  40. Antes de empezar, veamos algunos Es un subconjunto del espacio muestral. Conceptos Importantes Evento A: As’ de la baraja A = {A♥, A⧫, A♣, A♠}
  41. Antes de empezar, veamos algunos Es un subconjunto del espacio muestral. Conceptos Importantes Evento A: As’ de la baraja A = {A♥, A⧫, A♣, A♠} A ⊂ S
  42. Antes de empezar, veamos algunos Son eventos que no tienen elementos en común Conceptos Importantes Eventos Mutuamente Excluyentes
  43. Antes de empezar, veamos algunos Son eventos que no tienen elementos en común Conceptos Importantes Eventos Mutuamente Excluyentes
  44. Antes de empezar, veamos algunos Son eventos que no tienen elementos en común Conceptos Importantes Eventos Mutuamente Excluyentes A: As’ de la baraja
  45. Antes de empezar, veamos algunos Son eventos que no tienen elementos en común Conceptos Importantes Eventos Mutuamente Excluyentes B: Corazones
  46. Antes de empezar, veamos algunos Son eventos que no tienen elementos en común Conceptos Importantes Eventos Mutuamente Excluyentes A: As’ de la baraja B: Corazones
  47. Antes de empezar, veamos algunos Son eventos que no tienen elementos en común Conceptos Importantes Eventos Mutuamente Excluyentes A: As’ de la baraja B: Corazones A y B no son eventos mutuamente excluyentes
  48. Probabilidad Clásica Todas las posibilidades (N) tienen la misma probabilidad de ocurrir.
  49. Un ejemplito… ¿Cuál es la probabilidad de sacar un as de un deck de 52 cartas?
  50. Un ejemplito… ¿Cuál es la probabilidad de sacar un as de un deck de 52 cartas?
  51. Un ejemplito… ¿Cuál es la probabilidad de sacar un as de un deck de 52 cartas?
  52. Un ejemplito… ¿Cuál es la probabilidad de sacar un as de un deck de 52 cartas?
  53. Un ejemplito… ¿Cuál es la probabilidad de sacar un as de un deck de 52 cartas?
  54. Un ejemplito… ¿Cuál es la probabilidad de sacar un as de un deck de 52 cartas?
  55. Un ejemplito… ¿Cuál es la probabilidad de sacar un as de un deck de 52 cartas?
  56. Probabilidad Clásica Podemos también calcular algunas probabilidades de esta manera
  57. Distribuciones y Densidades de Probabilidad
  58. Antes de empezar, veamos algunos Se dice que X es una variable aleatoria si es posible asignarle un valor de probabilidad a que ocurra X. Este valor está dado por una función llamada f(x) Conceptos Importantes Variable Aleatoria
  59. Antes de empezar, veamos algunos Las variables aleatorias pueden ser: - Discretas: Como un naipe dentro de un mazo o una cara de un dado. - Continuas: Como la altura de una persona o la temperatura de un espacio. Conceptos Importantes Variable Aleatoria
  60. Antes de empezar, veamos algunos Si X es una variable aleatoria discreta, se define como P(X=x) = f(x) para cada x dentro del espacio muestral. Conceptos Importantes Distribución de Probabilidad
  61. Antes de empezar, veamos algunos Conceptos Importantes Distribución de Probabilidad f(x): Probabilidad de que caigan x caras al lanzar una moneda
  62. ● Bernoulli ● Binomial ● Uniforme discreta ● Geométrica ● Hipergeométrica ● Binomial Negativa ● Poisson Distribuciones de Probabilidad
  63. ● Bernoulli ● Binomial ● Uniforme discreta ● Geométrica ● Hipergeométrica ● Binomial Negativa ● Poisson Distribuciones de Probabilidad
  64. Antes de empezar, veamos algunos Si X es una variable aleatoria continua, se define como P(a ≤ X ≤ b) = para cada x dentro del espacio muestral. Conceptos Importantes Densidad de Probabilidad
  65. Antes de empezar, veamos algunos Conceptos Importantes Densidad de Probabilidad f(x): El volumen (x) de una botella que debería contener 16 onzas.
  66. ● Beta ● Cauchy ● Chi-cuadrada ● Exponencial ● F ● Gamma ● Normal ● t ● Uniforme Densidades de Probabilidad
  67. ● Beta ● Cauchy ● Chi-cuadrada ● Exponencial ● F ● Gamma ● Normal ● t ● Uniforme Densidades de Probabilidad
  68. ● Beta ● Cauchy ● Chi-cuadrada ● Exponencial ● F ● Gamma ● Normal ● t ● Uniforme Densidades de Probabilidad
  69. ¿Por qué no P(X=x) como con las variables discretas? Pregunta de Reflexión
  70. Los conceptos básicos de Probabilidad nos dará mejor entendimiento de la Estadística.
  71. Ahora sí…
  72. Estadística Descriptiva
  73. ¿No son lo mismo? Población Todos los elementos de un espacio muestral Tamaño: N Población vs. Muestra Recomendado: 31 Minutos. Censo 2017 - Bodoque censista Muestra Sólo algunos de los elementos de un espacio muestral. Tamaño: n
  74. ● Media ● Mediana ● Moda Conozcamos las Medidas de Tendencia Central
  75. Ej. Pases de Touchdown: 37, 33, 33, 32, 29, 28, 28, 23, 22, 22, 22, 21, 21, 21, 20, 20, 19, 19, 18, 18, 18, 18, 16, 15, 14, 14, 14, 12, 12, 9, 6 Media (Aritmética) Conozcamos las Medidas de Tendencia Central Poblacional Muestral
  76. El valor que queda justo en medio al ordenar los datos de menor a mayor. También conocido como el 50vo percentil. Ej. Pases de Touchdown: 37, 33, 33, 32, 29, 28, 28, 23, 22, 22, 22, 21, 21, 21, 20, 20, 19, 19, 18, 18, 18, 18, 16, 15, 14, 14, 14, 12, 12, 9, 6 Mediana Conozcamos las Medidas de Tendencia Central
  77. El valor que más se repite. Ej. Pases de Touchdown: 37, 33, 33, 32, 29, 28, 28, 23, 22, 22, 22, 21, 21, 21, 20, 20, 19, 19, 18, 18, 18, 18, 16, 15, 14, 14, 14, 12, 12, 9, 6 Moda Conozcamos las Medidas de Tendencia Central
  78. ¿Valen igual las tres medidas?
  79. ¿Valen igual las tres medidas?
  80. ¿Valen igual las tres medidas? ● Media: 1183 ● Mediana: 500 ● Moda: 250
  81. Sesgo y medidas de centralidad
  82. ● Rango ● Rango Intercuartil ● Varianza ● Desviación estándar Conozcamos las Medidas de Dispersión
  83. Ej. Pases de Touchdown: 37, 33, 33, 32, 29, 28, 28, 23, 22, 22, 22, 21, 21, 21, 20, 20, 19, 19, 18, 18, 18, 18, 16, 15, 14, 14, 14, 12, 12, 9, 6 Rango Conozcamos las Medidas de Dispersión
  84. Ej. Pases de Touchdown: 37, 33, 33, 32, 29, 28, 28, 23, 22, 22, 22, 21, 21, 21, 20, 20, 19, 19, 18, 18, 18, 18, 16, 15, 14, 14, 14, 12, 12, 9, 6 Rango Intercuartil Conozcamos las Medidas de Dispersión
  85. Ej. Pases de Touchdown: 37, 33, 33, 32, 29, 28, 28, 23, 22, 22, 22, 21, 21, 21, 20, 20, 19, 19, 18, 18, 18, 18, 16, 15, 14, 14, 14, 12, 12, 9, 6 Varianza Conozcamos las Medidas de Dispersión Poblacional Muestral
  86. Ej. Pases de Touchdown: 37, 33, 33, 32, 29, 28, 28, 23, 22, 22, 22, 21, 21, 21, 20, 20, 19, 19, 18, 18, 18, 18, 16, 15, 14, 14, 14, 12, 12, 9, 6 Desviación Estándar Conozcamos las Medidas de Dispersión Poblacional Muestral
  87. La Estadística es la base de la ciencia de datos.
  88. Es hora de los Ejercicios de Estadística
  89. Abre el archivo Datos.gsheets de la carpeta compartida. Elige sólo una de sus 13 hojas y copia las columnas A y B en un archivo nuevo de Google Sheets. Llegó la hora de la verdad Manos a los Datos~
  90. Estamos obteniendo Diferentes Visualizaciones Fuente: GitHub (jumpingrivers). DatasauRus
  91. Claramente necesitamos Herramientas Adicionales Fuente: GitHub (jumpingrivers). DatasauRus
  92. Estadística I Matemáticas para entender mis datos Cyn - Matemática

Notes de l'éditeur

  1. ¡Hola! Mi nombre es Cynthia Castillo. En redes navego bajo el nombre de “Elaia, la Matemaga”. En este momento estoy concluyendo la Licenciatura en Matemáticas, pero también me apasionan muchísimo áreas como Informática, Física, Biología y Medicina. Además, llevo prácticamente un año trabajando en Análisis y Ciencia de Datos en Hey Banco, la banca digital de Banco Regional que es más conocida en México como Banregio. Trabajé 4 años haciendo investigación en mi universidad como asistente en el Laboratorio de Modelación y Simulación de Sistemas Complejos (¡mates pero en la biología!), particularmente analizando problemas de Bioinformática en un equipo muy diverso. También tengo un canal de YouTube donde de vez en vez comparto contenido de matemáticas, y un canal de Twitch donde hablamos de matemáticas, de videojuegos y de R, un lenguaje de programación que, al igual que Python, se utiliza muchísimo en el área de Ciencia de Datos (particularmente en áreas relacionadas a la biología). Las mates me han parecido siempre un pasatiempo. Les adelanto que en En las sesiones de Matemáticas de Código Facilito 🐊 quiero transmitirte este lado divertido de las matemáticas: ¡las matemáticas van más allá de sólo hacer cuentitas! Verás cómo puedes usar las matemáticas para hacer una revisión crítica de los análisis y modelos que propongas en tu carrera como científica o científico de datos.
  2. A diferencia de las matemáticas como rama general, la estadística tuvo sus orígenes en la administración pública. El conteo de datos se hacía en tablillas de madera, piedra o papel (dependiendo de la época)
  3. Siglo 17: Teoría de la probabilidad Siglo 18: Mayores avances en demografía y economía (estadística descriptiva) Siglo 19: Con el tiempo se expandió su término a la recolección, resumen y análisis de datos. Mínimos cuadrados, regresión lineal, … Siglo 20: Llegaron las computadoras! Hacer cálculos era más sencillo Siglo 21: Nos sobrepasaron la cantidad de datos. ¿Cómo puedo obtener información útil de una cantidad abrumadora de datos? (de pref. en tiempo real)
  4. Siglo 17: Teoría de la probabilidad Siglo 18: Mayores avances en demografía y economía (estadística descriptiva) Siglo 19: Con el tiempo se expandió su término a la recolección, resumen y análisis de datos. Mínimos cuadrados, regresión lineal, … Siglo 20: Llegaron las computadoras! Hacer cálculos era más sencillo Siglo 21: Nos sobrepasaron la cantidad de datos. ¿Cómo puedo obtener información útil de una cantidad abrumadora de datos? (de pref. en tiempo real)
  5. Siglo 17: Teoría de la probabilidad Siglo 18: Mayores avances en demografía y economía (estadística descriptiva) Siglo 19: Con el tiempo se expandió su término a la recolección, resumen y análisis de datos. Mínimos cuadrados, regresión lineal, … Siglo 20: Llegaron las computadoras! Hacer cálculos era más sencillo Siglo 21: Nos sobrepasaron la cantidad de datos. ¿Cómo puedo obtener información útil de una cantidad abrumadora de datos? (de pref. en tiempo real)
  6. Siglo 17: Teoría de la probabilidad Siglo 18: Mayores avances en demografía y economía (estadística descriptiva) Siglo 19: Con el tiempo se expandió su término a la recolección, resumen y análisis de datos. Mínimos cuadrados, regresión lineal, … Siglo 20: Llegaron las computadoras! Hacer cálculos era más sencillo Siglo 21: Nos sobrepasaron la cantidad de datos. ¿Cómo puedo obtener información útil de una cantidad abrumadora de datos? (de pref. en tiempo real)
  7. Siglo 17: Teoría de la probabilidad Siglo 18: Mayores avances en demografía y economía (estadística descriptiva) Siglo 19: Con el tiempo se expandió su término a la recolección, resumen y análisis de datos. Mínimos cuadrados, regresión lineal, … Siglo 20: Llegaron las computadoras! Hacer cálculos era más sencillo Siglo 21: Nos sobrepasaron la cantidad de datos. ¿Cómo puedo obtener información útil de una cantidad abrumadora de datos? (de pref. en tiempo real)
  8. Hablar de áreas random como en el deporte,
  9. Hablar de áreas random como en el deporte,
  10. Hablar de áreas random como en el deporte,
  11. Por practicidad, vamos a hablar de la probabilidad clásica, donde todos los posibles resultados de que algo pase son iguales.
  12. ¿por qué se llama así? Estadística que me ayuda a “resumir” la información de mis datos.
  13. Hablar de las ventajas de hablar con 1 sobre otro Dar ejemplos. Pedir ejemplos
  14. Comparar lo que obtuvimos Hablar de salarios. ¿Han visto datos sobre los salarios? ¿Qué buscan? ¿Promedio, mediana o moda?
  15. Salarios beisbol
  16. Salarios beisbol
  17. ¿Cómo lidiamos con el sesgo?
  18. Los operadores relacionales nos ayudan a comparar dos objetos y nos devuelven valores VERDADERO ó FALSO.
  19. Los operadores relacionales nos ayudan a comparar dos objetos y nos devuelven valores VERDADERO ó FALSO.
  20. Los operadores relacionales nos ayudan a comparar dos objetos y nos devuelven valores VERDADERO ó FALSO.
Publicité