Cynthia Castillo
Un poco sobre mí…
LaMatemaga
Matemática
Análisis y Ciencia de Datos
Banco Regional (Hey Banco)
Asistente de Investigación
CICFIM UANL (Bioinformática)
Mi objetivo:
Mostrarte que las matemáticas son tus aliadas.
LaMatemaga LaMatemaga
Estructura
Sobre el curso…
2 de noviembre
Estadística I
4 de noviembre
Estadística II
12 de marzo
Teoría de Grafos
19 de marzo
Matemáticas Discretas con Python
Estadística
Se encarga de desarrollar y estudiar métodos de
recopilación, análisis, interpretación y
presentación de datos empíricos.
Fuente: UCI Donal Bren, School of Information & Computer Science, Department of Statistics (UCI).
What is Statistics?
Estadística
Se encarga de desarrollar y estudiar métodos de
recopilación, análisis, interpretación y
presentación de datos empíricos.
Fuente: UCI Donal Bren, School of Information & Computer Science, Department of Statistics (UCI).
What is Statistics?
Un poco de historia…
Orígenes en la administración pública.
Un poco de historia…
Orígenes en la administración pública.
● (S. XVII) Juegos de azar y apuestas
Un poco de historia…
Orígenes en la administración pública.
● (S. XVII) Juegos de azar y apuestas
● (S. XVIII) Demografía y Economía
Un poco de historia…
Orígenes en la administración pública.
● (S. XVII) Juegos de azar y apuestas
● (S. XVIII) Demografía y Economía
● (S. XIX) Mayor colección de datos. Avances en
sociología y psicología
Un poco de historia…
Orígenes en la administración pública.
● (S. XVII) Juegos de azar y apuestas
● (S. XVIII) Demografía y Economía
● (S. XIX) Mayor colección de datos. Avances en
sociología y psicología
● (S. XX) Mayor presencia de las computadoras digitales
Un poco de historia…
Orígenes en la administración pública.
● (S. XVII) Juegos de azar y apuestas
● (S. XVIII) Demografía y Economía
● (S. XIX) Mayor colección de datos. Avances en
sociología y psicología
● (S. XX) Mayor presencia de las computadoras digitales
● (S. XXI) Big Data
Estadística
Se encarga de desarrollar y estudiar métodos de
recopilación, análisis, interpretación y
presentación de datos empíricos.
Fuente: UCI Donal Bren, School of Information & Computer Science, Department of Statistics (UCI).
What is Statistics?
Criptografía
Cadenas Binarias
Visión Computacional
Imágenes
Sistemas Dinámicos
Estados de un Sistema
Sobre los
Machine Learning
Atributos
Renderización de Gráficos
Shaders
Espacios Multidimensionales
Puntos en el Espacio
Procesos Estocásticos
Distribuciones de Probabilidad
Datos Empíricos
Antes de empezar, veamos algunos
El conjunto de todos los posibles resultados
de un experimento.
Normalmente se denota por la letra S.
Nota: Cada elemento de este conjunto es
conocido como punto muestral
Conceptos Importantes
Espacio
Muestral
Antes de empezar, veamos algunos
El conjunto de todos los posibles resultados
de un experimento.
Normalmente se denota por la letra S.
Nota: Cada elemento de este conjunto es
conocido como punto muestral
Conceptos Importantes
Espacio
Muestral
S:
Antes de empezar, veamos algunos
El conjunto de todos los posibles resultados
de un experimento.
Normalmente se denota por la letra S.
Nota: Cada elemento de este conjunto es
conocido como punto muestral
Conceptos Importantes
Espacio
Muestral
S: Las cartas de poker
Antes de empezar, veamos algunos
El conjunto de todos los posibles resultados
de un experimento.
Normalmente se denota por la letra S.
Nota: Cada elemento de este conjunto es
conocido como punto muestral
Conceptos Importantes
Espacio
Muestral
S: Las cartas de poker
Q♥ ∈ S
Antes de empezar, veamos algunos
Es un subconjunto del espacio muestral.
Conceptos Importantes
Evento
Antes de empezar, veamos algunos
Es un subconjunto del espacio muestral.
Conceptos Importantes
Evento
A: As’ de la baraja
Antes de empezar, veamos algunos
Es un subconjunto del espacio muestral.
Conceptos Importantes
Evento
A: As’ de la baraja
Antes de empezar, veamos algunos
Es un subconjunto del espacio muestral.
Conceptos Importantes
Evento
A: As’ de la baraja
A = {A♥, A⧫, A♣, A♠}
Antes de empezar, veamos algunos
Es un subconjunto del espacio muestral.
Conceptos Importantes
Evento
A: As’ de la baraja
A = {A♥, A⧫, A♣, A♠}
A ⊂ S
Antes de empezar, veamos algunos
Son eventos que no tienen elementos en
común
Conceptos Importantes
Eventos
Mutuamente
Excluyentes
Antes de empezar, veamos algunos
Son eventos que no tienen elementos en
común
Conceptos Importantes
Eventos
Mutuamente
Excluyentes
Antes de empezar, veamos algunos
Son eventos que no tienen elementos en
común
Conceptos Importantes
Eventos
Mutuamente
Excluyentes
A: As’ de la baraja
Antes de empezar, veamos algunos
Son eventos que no tienen elementos en
común
Conceptos Importantes
Eventos
Mutuamente
Excluyentes
B: Corazones
Antes de empezar, veamos algunos
Son eventos que no tienen elementos en
común
Conceptos Importantes
Eventos
Mutuamente
Excluyentes
A: As’ de la baraja
B: Corazones
Antes de empezar, veamos algunos
Son eventos que no tienen elementos en
común
Conceptos Importantes
Eventos
Mutuamente
Excluyentes
A: As’ de la baraja
B: Corazones
A y B no son eventos
mutuamente excluyentes
Antes de empezar, veamos algunos
Se dice que X es una variable aleatoria si es
posible asignarle un valor de probabilidad a
que ocurra X.
Este valor está dado por una función
llamada f(x)
Conceptos Importantes
Variable
Aleatoria
Antes de empezar, veamos algunos
Las variables aleatorias pueden ser:
- Discretas: Como un naipe dentro de un
mazo o una cara de un dado.
- Continuas: Como la altura de una
persona o la temperatura de un
espacio.
Conceptos Importantes
Variable
Aleatoria
Antes de empezar, veamos algunos
Si X es una variable aleatoria discreta, se
define como
P(X=x) = f(x)
para cada x dentro del espacio muestral.
Conceptos Importantes
Distribución de
Probabilidad
Antes de empezar, veamos algunos
Conceptos Importantes
Distribución de
Probabilidad
f(x): Probabilidad de que caigan x caras al
lanzar una moneda
Antes de empezar, veamos algunos
Si X es una variable aleatoria continua, se
define como
P(a ≤ X ≤ b) =
para cada x dentro del espacio muestral.
Conceptos Importantes
Densidad de
Probabilidad
Antes de empezar, veamos algunos
Conceptos Importantes
Densidad de
Probabilidad
f(x): El volumen (x) de una botella que
debería contener 16 onzas.
● Beta
● Cauchy
● Chi-cuadrada
● Exponencial
● F
● Gamma
● Normal
● t
● Uniforme
Densidades de Probabilidad
● Beta
● Cauchy
● Chi-cuadrada
● Exponencial
● F
● Gamma
● Normal
● t
● Uniforme
Densidades de Probabilidad
● Beta
● Cauchy
● Chi-cuadrada
● Exponencial
● F
● Gamma
● Normal
● t
● Uniforme
Densidades de Probabilidad
¿Por qué no P(X=x) como con las variables
discretas?
Pregunta de Reflexión
¿No son lo mismo?
Población
Todos los elementos de un espacio
muestral
Tamaño: N
Población vs. Muestra
Recomendado: 31 Minutos. Censo 2017 - Bodoque censista
Muestra
Sólo algunos de los elementos de un
espacio muestral.
Tamaño: n
Ej. Pases de Touchdown:
37, 33, 33, 32, 29, 28,
28, 23, 22, 22, 22, 21,
21, 21, 20, 20, 19, 19,
18, 18, 18, 18, 16, 15,
14, 14, 14, 12, 12, 9, 6
Media
(Aritmética)
Conozcamos las
Medidas de Tendencia Central
Poblacional
Muestral
El valor que queda justo en medio al ordenar
los datos de menor a mayor. También
conocido como el 50vo percentil.
Ej. Pases de Touchdown:
37, 33, 33, 32, 29, 28,
28, 23, 22, 22, 22, 21,
21, 21, 20, 20, 19, 19,
18, 18, 18, 18, 16, 15,
14, 14, 14, 12, 12, 9, 6
Mediana
Conozcamos las
Medidas de Tendencia Central
El valor que más se repite.
Ej. Pases de Touchdown:
37, 33, 33, 32, 29, 28,
28, 23, 22, 22, 22, 21,
21, 21, 20, 20, 19, 19,
18, 18, 18, 18, 16, 15,
14, 14, 14, 12, 12, 9, 6
Moda
Conozcamos las
Medidas de Tendencia Central
Abre el archivo Datos.gsheets de la carpeta compartida.
Elige sólo una de sus 13 hojas y copia las
columnas A y B en un archivo nuevo de
Google Sheets.
Llegó la hora de la verdad
Manos a los Datos~
¡Hola! Mi nombre es Cynthia Castillo. En redes navego bajo el nombre de “Elaia, la Matemaga”. En este momento estoy concluyendo la Licenciatura en Matemáticas, pero también me apasionan muchísimo áreas como Informática, Física, Biología y Medicina.
Además, llevo prácticamente un año trabajando en Análisis y Ciencia de Datos en Hey Banco, la banca digital de Banco Regional que es más conocida en México como Banregio.
Trabajé 4 años haciendo investigación en mi universidad como asistente en el Laboratorio de Modelación y Simulación de Sistemas Complejos (¡mates pero en la biología!), particularmente analizando problemas de Bioinformática en un equipo muy diverso.
También tengo un canal de YouTube donde de vez en vez comparto contenido de matemáticas, y un canal de Twitch donde hablamos de matemáticas, de videojuegos y de R, un lenguaje de programación que, al igual que Python, se utiliza muchísimo en el área de Ciencia de Datos (particularmente en áreas relacionadas a la biología).
Las mates me han parecido siempre un pasatiempo. Les adelanto que en En las sesiones de Matemáticas de Código Facilito 🐊 quiero transmitirte este lado divertido de las matemáticas: ¡las matemáticas van más allá de sólo hacer cuentitas! Verás cómo puedes usar las matemáticas para hacer una revisión crítica de los análisis y modelos que propongas en tu carrera como científica o científico de datos.
A diferencia de las matemáticas como rama general, la estadística tuvo sus orígenes en la administración pública.
El conteo de datos se hacía en tablillas de madera, piedra o papel (dependiendo de la época)
Siglo 17: Teoría de la probabilidad
Siglo 18: Mayores avances en demografía y economía (estadística descriptiva)
Siglo 19: Con el tiempo se expandió su término a la recolección, resumen y análisis de datos. Mínimos cuadrados, regresión lineal, …
Siglo 20: Llegaron las computadoras! Hacer cálculos era más sencillo
Siglo 21: Nos sobrepasaron la cantidad de datos. ¿Cómo puedo obtener información útil de una cantidad abrumadora de datos? (de pref. en tiempo real)
Siglo 17: Teoría de la probabilidad
Siglo 18: Mayores avances en demografía y economía (estadística descriptiva)
Siglo 19: Con el tiempo se expandió su término a la recolección, resumen y análisis de datos. Mínimos cuadrados, regresión lineal, …
Siglo 20: Llegaron las computadoras! Hacer cálculos era más sencillo
Siglo 21: Nos sobrepasaron la cantidad de datos. ¿Cómo puedo obtener información útil de una cantidad abrumadora de datos? (de pref. en tiempo real)
Siglo 17: Teoría de la probabilidad
Siglo 18: Mayores avances en demografía y economía (estadística descriptiva)
Siglo 19: Con el tiempo se expandió su término a la recolección, resumen y análisis de datos. Mínimos cuadrados, regresión lineal, …
Siglo 20: Llegaron las computadoras! Hacer cálculos era más sencillo
Siglo 21: Nos sobrepasaron la cantidad de datos. ¿Cómo puedo obtener información útil de una cantidad abrumadora de datos? (de pref. en tiempo real)
Siglo 17: Teoría de la probabilidad
Siglo 18: Mayores avances en demografía y economía (estadística descriptiva)
Siglo 19: Con el tiempo se expandió su término a la recolección, resumen y análisis de datos. Mínimos cuadrados, regresión lineal, …
Siglo 20: Llegaron las computadoras! Hacer cálculos era más sencillo
Siglo 21: Nos sobrepasaron la cantidad de datos. ¿Cómo puedo obtener información útil de una cantidad abrumadora de datos? (de pref. en tiempo real)
Siglo 17: Teoría de la probabilidad
Siglo 18: Mayores avances en demografía y economía (estadística descriptiva)
Siglo 19: Con el tiempo se expandió su término a la recolección, resumen y análisis de datos. Mínimos cuadrados, regresión lineal, …
Siglo 20: Llegaron las computadoras! Hacer cálculos era más sencillo
Siglo 21: Nos sobrepasaron la cantidad de datos. ¿Cómo puedo obtener información útil de una cantidad abrumadora de datos? (de pref. en tiempo real)
Hablar de áreas random como en el deporte,
Hablar de áreas random como en el deporte,
Hablar de áreas random como en el deporte,
Por practicidad, vamos a hablar de la probabilidad clásica, donde todos los posibles resultados de que algo pase son iguales.
¿por qué se llama así?
Estadística que me ayuda a “resumir” la información de mis datos.
Hablar de las ventajas de hablar con 1 sobre otro
Dar ejemplos.
Pedir ejemplos
Comparar lo que obtuvimos
Hablar de salarios. ¿Han visto datos sobre los salarios? ¿Qué buscan? ¿Promedio, mediana o moda?
Salarios beisbol
Salarios beisbol
¿Cómo lidiamos con el sesgo?
Los operadores relacionales nos ayudan a comparar dos objetos y nos devuelven valores VERDADERO ó FALSO.
Los operadores relacionales nos ayudan a comparar dos objetos y nos devuelven valores VERDADERO ó FALSO.
Los operadores relacionales nos ayudan a comparar dos objetos y nos devuelven valores VERDADERO ó FALSO.