Presentación del Seminario del Grupo Ciencia, Razón y Fe de la Universidad de Navarra, Jesús López Fidalgo, Pamplona, 17 de enero de 2017.
Ponente:
Jesús López Fidalgo es catedrático de Estadística en el ICS; ha realizado estancias prolongadas de investigación y docentes en las Universidades de Manchester, Glasgow, UCLA y California en Riverside; profesor adjunto de la Universidad Nacional de Colombia en Medellín; vicepresidente de la Sociedad de Estadística e Investigación Operativa y editor-jefe de la revista Test. Es también miembro electo del Instituto Internacional de Estadística. Ha sido gestor del Plan Nacional de Matemáticas en el Ministerio de Ciencia e Innovación (2009-2011) y director de la Escuela Técnica Superior de Ingenieros Industriales de la UCLM (2008-2016). Ha publicado más de 100 artículos en revistas científicas. Autor del libro de divulgación “el azar no existe”. Ha dirigido trece tesis doctorales y coordina un nodo de la red nacional de bioestadística.
Resumen:
La investigación científica, entre otras muchas cosas, es deductiva e inductiva. La deducción es utilizada en todas las disciplinas. Sus demostraciones, irrefutables, suelen acabar con un q.e.d. Por otra parte, en las así llamadas ciencias experimentales, la inducción es cada vez más esencial. La estadística moderna ha venido a dar consistencia matemática a la inducción mediante las leyes del azar. En este seminario se pretende mostrar cómo lo hace, utilizando los procesos naturales de la mente humana para extraer conclusiones de datos sencillos. Se abordará el tema de la posible manipulación en todas las fases de la investigación, desde la planificación de la recogida de datos hasta la toma de decisiones a partir de la interpretación de los resultados. Se abordarán con ejemplos sencillos algunos temas candentes hoy día como son la inferencia causal, los procedimientos bayesianos, cuestiones ético-estadísticas, el tratamiento de datos masivos, la detección estadística de datos fraudulentos o la dificultad de hacer predicciones cuando entra en juego la libertad humana.
Morgado & Rodríguez (eds.) - Los animales en la historia y en la cultura [201...
q.e.d. (quod erat demonstrandum) ¿Es científica la demostración estadística?
1. q.e.d. (quod erat demonstrandum)
¿Es cient´ıfica la demostraci´on estad´ıstica?
Jes´us L´opez Fidalgo
fidalgo@unav.es
https://www.uclm.es/profesorado/jesuslopezfidalgo/
CRYF La demostraci´on estad´ıstica
2. Esquema
Mala prensa de la estad´ıstica.
Estad´ıstica y sentido com´un.
La magia blanca de la estad´ıstica.
Manipulaci´on en todos los niveles.
Temas candentes:
Reproducibilidad.
Inferencia causal.
´Etica de la estad´ıstica.
Paradigma bayesiano.
¿Por qu´e fallan las encuestas?
Casualidades de la vida.
CRYF La demostraci´on estad´ıstica
3. Mala prensa de la estad´ıstica
CRYF La demostraci´on estad´ıstica
4. Miedo a la estad´ıstica
Al desastre de las ´ultimas predicciones de voto.
Al uso que otros hagan de ella.
A sus limitaciones.
A sus nuevas dimensiones: capacidad de c´alculo, simulaciones,
remuestreo, m´etodos bayesianos, Big Data (¡M´as datos en los 2
´ultimos a˜nos que en toda la historia!).
CRYF La demostraci´on estad´ıstica
6. La prensa “mala”
Encuestas telediario: 4 escogidos ¿“al azar”?
Opiniones viajeros ocasionales:
7–15 d´ıas: Establecen teor´ıas generales irrefutables.
1 mes: Establecen teor´ıas generales con muchas excepciones.
1 a˜no: No se atreven a generalizar.
CRYF La demostraci´on estad´ıstica
7. Estad´ıstica y sentido com´un
Una muestra estad´ıstica convenientemente torturada confiesa lo que
quieras.
CRYF La demostraci´on estad´ıstica
8. ¿Existe el azar?
Henri Poincar´e (+1912): “El azar es la medida de nuestra ignorancia”.
Florence Nightingale (+1910): “Para entender los pensamientos de Dios
hemos de estudiar estad´ıstica, porque esta es la medida de
su prop´osito”.
Albert Einstein (+1955): “No existe el azar, Dios no juega a los dados”
(atribuida, no verificada).
George Box (+2013): “Tengo la impresi´on de que cuanto m´as trabajo
m´as suerte tengo”.
Picaso: “La inspiraci´on me pilla siempre trabajando”.
Cualquiera: Un mismo plan puesto en pr´actica dos veces, exactamente
en las mismas condiciones, conduce habitualmente a
resultados similares, pero no id´enticos.
CRYF La demostraci´on estad´ıstica
9. ¿Qu´e hace?
Inferir conclusiones de los datos (descubrir relaciones):
Genes relacionados con una enfermedad.
Influencia de una dieta en la prevenci´on de un c´ancer.
Si un carburante es m´as contaminante que otro.
Modelo para identificar una imagen (c´amaras de vigilancia).
Decidir si un cirujano opera o no a un paciente.
´Indices de valoraci´on: “Da miedo el uso de indicadores, pero temo
m´as a los que no los quieren usar”.
Fichar al delantero que necesitamos.
...
CRYF La demostraci´on estad´ıstica
10. La magia blanca de la
estad´ıstica
CRYF La demostraci´on estad´ıstica
11. Estad´ıstica moderna
Uni´on de dos disciplinas que evolucionaron independientemente:
C´alculo de Probabilidades
Estad´ıstica como simple descripci´on de datos
Resultado: Inferencia, toma de decisiones
CRYF La demostraci´on estad´ıstica
14. Demostraci´on
R´apida y eficaz.
No exacta,
pero rigurosa y cient´ıfica (en cierto sentido s´ı es exacta).
La madre de Sergio sabe c´omo hacerlo...
CRYF La demostraci´on estad´ıstica
15. Ha desaparecido la tableta de chocolate
Primera hip´otesis (“nula”): Cuando lo compr´o esta ma˜nana lo
guard´o en otro sitio y no se acuerda d´onde.
Segunda hip´otesis (“alternativa”): Se la ha comido Sergio.
Recojamos informaci´on:
b´usqueda en otros armarios, bolsas...
Se convoca a Sergio...
CRYF La demostraci´on estad´ıstica
16. Sergio asegura que no sabe nada del tema
¡No puede sancianar a Sergio si no est´a completamente segura!
CRYF La demostraci´on estad´ıstica
17. Sistematizaci´on del razonamiento ordinario
Queremos comprobar si una moneda est´a trucada o no.
Obtenemos 63 caras en 100 lanzamientos.
Si no est´a trucada deber´ıan ser unas 50 (?).
Su probabilidad es de menos de 3 entre 1.000 (¡muy sospechoso!).
Problemas reales no son tan sencillos, pero tenemos herramientas
para calcular probabilidades.
CRYF La demostraci´on estad´ıstica
18. El modelo estad´ıstico
Modelo matem´atico que deja un espacio a la incertidumbre (error
aleatorio):
Caja del “azar” o “error aleatorio” donde introducimos bien
empaquetada nuestra ignorancia.
Admitida nuestra ignorancia, esto es una idea genial.
Cierto control de lo desconocido con las leyes del azar.
CRYF La demostraci´on estad´ıstica
20. Contraste de hip´otesis
El sistema asume inocencia hasta que se prueba la culpabilidad (rechazo
hip´otesis nula, significatividad).
Verdad
H0 H1
Inocente Culpable
H0 Inocente Culpable
En libertad en libertad en libertad
Sentencia ERROR II
H1 Inocente Culpable
Condenado condenado condenado
ERROR I
CRYF La demostraci´on estad´ıstica
21. El p-valor
No mide la magnitud de la asociaci´on entre dos variables (Ej. Pisa).
No es la probabilidad de H0.
No rechazar H0 no significa aceptar H0.
Importancia del dise˜no y el muestreo para conseguir rechazar H0
cuando es falsa.
CRYF La demostraci´on estad´ıstica
23. Teorema Central del L´ımite (m´agico)
¿Y si la distribuci´on de los datos es desconocida?
“La distribuci´on de la media se aproxima a una campana de Gauss”
Para n ≥ 30 la aproximaci´on es buena (¿?).
CRYF La demostraci´on estad´ıstica
24. Un ejemplo: Casos at´ıpicos de leucemia
Proporci´on nacional: 0.0001 (1 de cada 10000).
Proporci´on de 0.0017 (17 veces m´as) en un colegio (¿?).
H0: Es pura casualidad (azar).
H1: Hay algo raro (causalidad).
Colegio 1800 alumnos 3 casos de leucemia (rechazamos H0).
Colegio 600 alumnos 1 caso de leucemia (no rechazamos).
CRYF La demostraci´on estad´ıstica
26. Niveles en una posible manipulaci´on
Procedimiento estad´ıstico:
Dise˜no experimental / muestreo:
Planificaci´on incorrecta.
Recogida y preparaci´on de los datos:
E.g. modificar o suprimir datos (la estad´ıstica ayuda a descubrirlo).
An´alisis:
Elecci´on equivocada (e.g. tratamiento de la no respuesta).
Interpretaci´on y toma de decisiones:
E.g. Gr´aficos, comunicaci´on de los resultados.
CRYF La demostraci´on estad´ıstica
29. Pensar antes de actuar
Ronald Fisher: “Llamar a un estad´ıstico despu´es de que el
experimento ya est´a hecho es llamarle para que realice un examen
post-mortem: solamente podr´a decir de qu´e muri´o el experimento.”
S´ofocles: “Uno debe probar a hacer algo; aunque uno piense que ya
sabe lo que va a ocurrir, no lo sabe con certeza hasta que lo prueba.”
“Si no sabes hacia donde vas, cualquier camino te lleva all´ı.”
CRYF La demostraci´on estad´ıstica
30. Tazas de t´e con leche de Fisher (aleatorizaci´on)
Miss Buriel Bristol rechaz´o una taza de t´e con leche a Ronald Fisher al
reconocer que la leche hab´ıa sido agregada al final.
Para probar si realmente era capaz de reconocerlo prepar´o 8 tazas, 4
con cada combinaci´on.
Orden aleatorio, pero no s´olo desordenado.
P(“acertar al azar”)= 1
28 = 0,0039
P(“fallar exactamente una al azar”)=0,03125
CRYF La demostraci´on estad´ıstica
31. Paradoja de Simpson
Nuevo f´armaco: Fraudol.
F´armaco tradicional: Curamina.
Experimentaci´on:
Mejora No mejora %
Curamina 20 20 50 %
Fraudol 24 16 60 %
CRYF La demostraci´on estad´ıstica
35. Monitorizaci´on de la recogida
El ayuntamiento de Londres en encarg´o un estudio a la
RSS sobre los excrementos de caballo en sus calles.
Ejemplo fermentaci´on del vino.
CRYF La demostraci´on estad´ıstica
37. Modelos
George Box (+2013): “Todos los modelos son falsos, pero algunos son
´utiles”. “¿c´omo de err´oneos pueden ser para que no dejen
de ser ´utiles?”
Giberson y Artigas (2012): “Los resultados interesantes en f´ısica
matem´atica casi siempre contienen asunciones y
simplificaciones. Por muy notable que pueda ser el ajuste
entre el mundo natural y las matem´aticas, no hay
virtualmente casos en los que el ajuste sea tan perfecto
que no se requieran asunciones simplificadoras.”
CRYF La demostraci´on estad´ıstica
39. Interpretaci´on
No es lo mismo:
“El 90 % de los enfermos de c´ancer de pulm´on han sido fumadores”
que
“El 90 % de los fumadores desarrolla c´ancer de pulm´on”
Probabilidad (condicional) inversa.
CRYF La demostraci´on estad´ıstica
40. Interpretaci´on: Informe PISA 2012
Informe oficial:
“Por consiguiente, si los intervalos de confianza de dos pa´ıses tienen
intersecci´on com´un, la diferencia entre sus resultados no es
estad´ısticamente significativa.”
Desviaci´on t´ıpica aparece s´olo para hablar de tipificaci´on (16 veces)
en 243 pg.
¿Tama˜nos de muestra?
Espa˜na (484), OCDE (494, s), UE (489, ns).
ns con Reino Unido (494), Noruega (489), Portugal (487), Italia
(485), Estados Unidos (481), Suecia (478)...
s con Corea del Sur (554), Suiza (531), Pa´ıses Bajos (523)...
Si se transforman a una escala de estatura: en lectura OCDE, 180
cm, Espa˜na 178,8.
Contenidos de estad´ıstica en la prueba: 25 %.
CRYF La demostraci´on estad´ıstica
49. El problema estad´ıstico de la causalidad
Relaci´on determinista: Si A causa B entonces B siempre se sigue de A
(fumar no produce enfisema o c´ancer).
Causalidad probabil´ıstica: Si A causa probablemente B entonces la
informaci´on de que ha ocurrido A aumenta la verosimilitud
de B.
Pero es m´as general que P(B|A) > P(B):
Ejemplo: A=“Es fumador”, B=“Tiene o
tendr´a c´ancer”, C=“Tiene o tendr´a enfisema”,
P(B|A) > P(B), P(C|A) > P(C)yP(B|C) > P(B).
Estimar el correcto efecto causal de X en Y :
Variables confusoras : Variables extra˜nas que correlacionan con ambas.
Variable instrumental : Z afecta a Y solamente a trav´es de X.
CRYF La demostraci´on estad´ıstica
50. La ´etica en la estad´ıstica
Dise˜no experimental secuencial.
Principio de solidaridad en compa˜n´ıas de seguros.
Orde˜nar los datos:
Generamos 100 datos de 8 variables independientemente.
Estudio correlaciones 2 a 2.
La 3 y la 8 significativamente correlacionadas.
CRYF La demostraci´on estad´ıstica
51. Estad´ıstica Bayesiana (probabilidad subjetiva)
Un ejemplo asombroso: Aleatoriedad de las terminaciones del n´umero
premiado en la loter´ıa nacional en los ´ultimos 200 a˜nos.
CRYF La demostraci´on estad´ıstica
52. ¿Ha habido trampa?
La estad´ıstica frecuentista basada solo en los datos dice que s´ı.
Poco probable que haya ocurrido por azar.
Estad´ıstica Bayesiana es m´as delicada:
Eval´ua el riesgo de la decisi´on equivocada.
Utiliza una probabilidad subjetiva de que haya habido trampa.
CRYF La demostraci´on estad´ıstica
53. Soluci´on que minimiza el riesgo
0.95 1
En azul el riesgo de decidir err´oneamente que NO hay trampa.
En rojo el riesgo de decidir err´oneamente que SI hay trampa.
CRYF La demostraci´on estad´ıstica
54. Fracasos en las encuestas de intenci´on de voto
Resultados obtenidos bastantes d´ıas antes de las elecciones.
La comunicaci´on de unos resultados influye en la intenci´on de voto.
No respuesta: voto de castigo y voto ´util.
Abstenci´on contabilizada como intenci´on de ir a votar.
Comportamientos hist´oricos invalidados por nuevos partidos
emergentes o las nuevas tecnolog´ıas.
El mundo y la mafia de las apuestas.
Dificultad de hacer predicciones cuando entra en juego la libertad
humana.
CRYF La demostraci´on estad´ıstica
55. Casualidades de la vida
A finales de 2015 hubo una votaci´on de un conocido partido para
apoyar una candidatura.
Resultado: 3030 votantes, 1515 votaron SI y 1515 NO.
Bajo la hip´otesis del 50 % la probabilidad de ese evento es 0.0145.
Este resultado es el m´as probable.
Hay otros razonamientos/supuestos.
CRYF La demostraci´on estad´ıstica
56. Casualidades de la vida
Muchas cosas raras pueden ocurrir en un momento dado.
La probabilidad de que ocurra alguna ya no es tan rara.
CRYF La demostraci´on estad´ıstica
57. La estad´ıstica m´as cerca de lo que pensamos
Probabilidad de lluvia.
Horquillas en las elecciones.
En Google hay muchos estad´ısticos trabajando.
Estad´ısticos sin fronteras.
¡Ah! Miss Buriel Bristol acert´o con las 8 tazas.
CRYF La demostraci´on estad´ıstica