1) El documento habla sobre pruebas de hipótesis, específicamente sobre la diferencia entre medias de dos poblaciones usando muestras pareadas. 2) Explica conceptos como hipótesis nula, hipótesis alternativa, errores tipo I y tipo II, y pruebas unilaterales y bilaterales. 3) También cubre temas como la distribución normal, la distribución t de Student, y pruebas sobre una sola proporción.
1. INGENIERIA EN ADMINISTRACION
ESTADISTICA II
ING.JOSE GUADALUPE RODRIGUEZ RAMOS
CUARTO SEMESTRE
Elizabeth Paniagua Tegchi
UNIDAD I
PRUEBA DE HIPOTESIS
La experiencia sobre el comportamiento de algún índice de un proceso, o la
exigencia del cumplimiento de alguna norma nos lleva a realizar proposiciones
sobre el valor de algún parámetro estadístico.Estas proposiciones se deben
contrastar con la realidad (mediante el muestreo de datos) para tomar una
decisión entre aceptar o rechazar la proposiciónEstas proposiciones se denominan
Hipótesis y el procedimiento para decidir si se aceptan o se rechazan se denomina
Prueba de HipótesisUna prueba de hipótesis es una herramienta de análisis de
datos que puede en general formar parte de un experimento comparativo más
completo.
Procedimiento general para la prueba de Hipótesis
Antes de Examinar los datos muestrales:
1. Identificar el parámetro de interés
2. Establecer la Hipótesis Nula H0
3. Especificar una Hipótesis alternativa adecuada H1
4. Seleccionar un nivel de significancia a
Usando los datos muestrales:
5. Establecer un estadístico de prueba adecuado
6. Establecer una región de rechazo
7. Calcular todas las cantidades muestrales necesarias para el estadístico
8. Decidir si debe o no rechazarse H0
2. HIPOTESIS ESTADISTICAS
Una hipótesis Estadística es un proposición sobre los parámetros de una
población o sobre la distribución de probabilidad de una variable aleatoria.
Una hipótesis estadística es afirmación respecto a una característica de una
población. Contrastar una hipótesis es comparar las predicciones que se deducen
de ella con la realidad que observamos: si hay coincidencia, dentro del margen de
error admisible, mantendremos la hipótesis; en caso contrario, la rechazaremos.
Rechazar una hipótesis implica sustituirla por otra capaz de explicar los datos
observados.
Las siguientes afirmaciones son hipótesis estadísticas:
El tabaco produce cáncer de pulmón.
Disminuir los impuestos disminuye el fraude fiscal.
Las mujeres son más apasionadas que los hombres.
Estas tres hipótesis no se refieren a individuos particulares, sino al conjunto de
elementos de una o varias poblaciones. En estos ejemplos vemos que el contraste
de hipótesis requiere, como pasos
previos:
Especificar la población de interés
Definir la variable a que nos referimos y como medirla.
Relacionar la hipótesis con los parámetros de la o las poblaciones.
Para llegar a tomar decisiones, conviene hacer determinados supuestos o
conjeturas acerca de las
poblaciones que se estudian. Tales supuestos que pueden ser o no ciertos se
llaman hipótesis estadísticas y, en general, lo son sobre las distribuciones de
probabilidad de las poblaciones.
En muchos casos se formulan las hipótesis estadísticas con el solo propósito de
rechazarlas o invalidarlas. Por ejemplo, si se quiere decidir si una moneda está
cargada, se formula la hipótesis de que la moneda está bien, es decir, p : 0.5;
donde p es la probabilidad de cara. Análogamente, si se quiere decidir sobre si un
procedimiento es mejor que otro, se formula la hipótesis de que no hay
diferencia entre los procedimientos (es decir, cualquier diferencia observada se
debe meramente a fluctuaciones en el muestreo de la misma población).Tales
hipótesis se llaman también hipótesis nulas y se denotan por Ho. .
Cualquier hipótesis que difiera de una hipótesis dada se llama hipótesis
alternativa. Por ejemplo:
Si una hipótesis es p=0.5, hipótesis alternativas son p=O.7; p#O.5;
p>0.5.Unahipótesisalternativa de la hipótesis nula se denota por H1
3. Ejemplo: Se tiene interés en la rapidez de combustión de un agente propulsor para
los sistemas de salida de emergencia en aeronaves. (esta rapidez es una variable
aleatoria con alguna distribución de probabilidad). Especialmente interesa la
rapidez de combustión promedio (que es un parámetro (m) de dicha distribución).
De manera más específica, interesa decidir si esta rapidez promedio es o no 50
cm/seg.
El planteamiento formal de la situación se realiza en términos de una Hipótesis
Nula (que es la proposición que se quiere poner a prueba) y una Hipótesis
Alternativa, la cual se aceptará si se rechaza la hipótesis nula:
Hipótesis Nula: H0: Promedio = 50 cm/seg
Hipótesis Alternativa: H1 Promedio 50 cm/seg
ERRORES TIPO I Y TIPO II
Al comprobar una hipótesis nos puede llevar a dos conclusiones erróneas.
Erros Tipo I.- Se rechaza H0 cuando ésta es verdadera
Error Tipo II.- Se acepta H0 cuando ésta es falsa
Error Tipo I
A la probabilidad de cometer un error de Tipo I se denota por a, y se le llama el
nivel o tamaño de significancia de la prueba es decir
a = P(error Tipo I)= P(rechazar H0 | H0 es verdadera)
Ejemplo: Calcular a para el ejemplo de la rapidez de combustión para una muestra
de N=10 datos, suponiendo que la desviación estándar de la rapidez de
combustión es s=2.5 cm/seg.
Solución: en este caso a = P( x caiga en la región crítica | m=50), es decir:
a = P( x< 48.5) + P( x > 51.5)
Recordando que la distribución de x es Normal con media m=50 y desviación
estándar s/N =0.79
4. Esto significa que el 5.76% de las muestras de tamaño 10 conducirán al rechazo
de la Hipótesis H0: m=50 cm/seg, cuando ésta es verdadera.
Es claro que a se puede reducir de dos maneras:
- Aumentando la región de aceptación.
- Aumentando el tamaño de la muestra
ERROR TIPO II
Para evaluar un experimento de prueba de hipótesis también se requiere calcular
la probabilidad del error de Tipo II, denotada por b, es decir
b = P (error Tipo II) = P(aceptar H0 | H0 es falsa)
La probabilidad máxima con la que en el ensayo de una hipótesis se puede
cometer un error del
Tipo I se llama nivel de significación del ensayo. Esta probabilidad se denota
frecuentemente por a; generalmente se fija antes de la extracción de las muestras,
de modo que los resultados obtenidos no influyen en la elección.
Sin embargo, no es posible calcular b si no se tiene una hipótesis alternativa
específica, es decir, un valor particular del parámetro bajo prueba en lugar de un
rango de valores
Por ejemplo, supongamos que es importante rechazar H0 si la rapidez promedio
de combustión m es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la
simetría sólo se requiere evaluar la probabilidad de aceptar H0: m=50 cuando el
valor verdadero es m=52.
En la práctica se acostumbra a utilizar niveles de significación del 0.05 ó 0.01,
aunque igualmente pueden emplearse otros valores. Si, por ejemplo se elige un
nivel de significación del O.05 ó 5%, al diseñar un ensayo de hipótesis, entonces
hay aproximadamente 5 ocasiones en 100 en que se rechazaría la hipótesis
cuando debería ser aceptada, es decir, se está con un 95% de confianza de que
se toma la decisión adecuada. En tal caso se dice que la hipótesis ha sido
rechazada aI nivel de significación del O.O5,lo que significa que se puede cometer
error con una probabilidad de 0.05.
5. H0 es Verdadera H0 es Falsa
Se acepta H0 Decisión correcta Error tipo II
Se rechaza H0 Error tipo I Decisión tipo II
PRUEBAS UNILATERALES Y BILATERALES
Valor estadístico de prueba
Valor determinado a partir de la información muestral, que se utiliza para
determinar si se rechaza la hipótesis nula., existen muchos estadísticos de prueba
para nuestro caso utilizaremos los estadísticos z y t. La elección de uno de estos
depende de la cantidad de muestras que se toman, si las muestras son de la
prueba son iguales a 30 o más se utiliza el estadístico z, en caso contrario se
utiliza el estadístico t.
Tipos de prueba
a) Prueba bilateral o de dos extremos: la hipótesis planteada se formula con la
igualdad
Ejemplo
H0 : µ = 200
H1 : µ ≠ 200
b) Pruebas unilateral o de un extremo: la hipótesis planteada se formula con ≥ o
≤
6. H0 : µ ≥ 200 H0 : µ ≤ 200
H1 : µ < 200 H1 : µ > 200
En las pruebas de hipótesis para la media (μ), cuando se conoce la desviación
estándar (σ) poblacional, o cuando el valor de la muestra es grande (30 o más), el
valor estadístico de prueba es z y se determina a partir de:
El valor estadístico z, para muestra grande y desviación estándar poblacional
desconocida se determina por la ecuación:
En la prueba para una media poblacional con muestra pequeña y desviación
estándar poblacional desconocida se utiliza el valor estadístico t.
Prueba sobre dos medias con distribución
Normal y “t” Student
7. Distribución t de Student
En probabilidad y estadística la distribución t (de Student) es una distribución de
probabilidad que surge del problema de estimar la media de una
poblaciónnormalmente distribuida cuando el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación
de las diferencias entre dos medias muestrales y para la construcción del intervalo
de confianza para la diferencia entre las medias de dos poblaciones cuando se
desconoce la desviación típica de una población y ésta debe ser estimada a partir
de los datos de una muestra.
Distribución normal
La distribución normal fue reconocida por primera vez por el francés Abraham de
Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró
desarrollos más profundos y formuló la ecuación de la curva; de ahí que también
se la conozca, más comúnmente, como la "campana de Gauss". La distribución
de una variable normal está completamente determinada por dos parámetros, su
media y su desviación estándar, denotadas generalmente por y .
Propiedades de la distribución normal:
La distribución normal posee ciertas propiedades importantes que conviene
destacar:
i. Tiene una única moda, que coincide con su media y su mediana.
ii. La curva normal es asintótica al eje de abscisas. Por ello, cualquier
valor entre y es teóricamente posible. El área total bajo la
curva es, por tanto, igual a 1.
iii. Es simétrica con respecto a su media . Según esto, para este tipo
de variables existe una probabilidad de un 50% de observar un dato
mayor que la media, y un 50% de observar un dato menor.
iv. La distancia entre la línea trazada en la media y el punto de inflexión
de la curva es igual a una desviación típica ( ). Cuanto mayor sea
, más aplanada será la curva de la densidad.
v. El área bajo la curva comprendida entre los valores situados
aproximadamente a dos desviaciones estándar de la media es igual
a 0.95. En concreto, existe un 95% de posibilidades de observar un
valor comprendido en el intervalo .
vi. La forma de la campana de Gauss depende de los parámetros y
. La media indica la posición de la campana, de modo que para
diferentes valores de la gráfica es desplazada a lo largo del eje
horizontal. Por otra parte, la desviación estándar determina el grado
de apuntamiento de la curva. Cuanto mayor sea el valor de , más
8. se dispersarán los datos en torno a la media y la curva será más
plana.
Prueba sobre una sola proporción
Prueba Sobre una Sola Proporción.
Las pruebas de hipótesis que se relacionan con proporciones son muy utilizadas
en muchas áreas. El político se interesa en conocer que fracción de votantes lo
favorecerá en la siguiente elección. Todas las empresas fabricantes se preocupan
por la proporción de artículos defectuosos cuando se realiza un embarque.
Consideremos el problema de probar la hipótesis de que la proporción de éxitos
en un experimento binomial es igual a algún valor especifico. Es decir, probaremos
la hipótesis nula H0, que p = p0 donde p es el parámetro de la distribución
binomial. La hipótesis alternativa puede ser una de las alternativas bilaterales
usuales: H0: p=p0H1: p< p
En la Prueba Sobre una Sola Proporción utilizamos la distribución binomial para
calcular el valor p P=P (X≤x) cuando p=p0El valor x es el numero de éxitos en
nuestra muestra de tamaño n. si este valor P es menor que o igual a α, nuestra
prueba es significativa en el nivel α y rechazamos H0 a favor de H1. De manera
similar, para probar la hipótesisH0: p=p0H1: p> p0
En el nivel de significancia α, P=P(X≥x) Cuando p=p0Y rechazamos H0 a favor de
H1 si este valor P es menor que o igual a α. Finalmente, para probar la
hipótesis.H0: p=p0H1: p≠p0al nivel de significancia α, calculamos= 2P(X ≤ x
cuando p=p0) si x < np0, o P= 2P(X ≥ x cuando p=p0)Si x> np0 y se rechaza
H0 a favor deH1 si el valor P calculado es menor o igual a α.
9. Comparando media de dos poblaciones usando muestras pareadas
En este caso se trata de comparar dos métodos o tratamientos, pero se
quiere que las unidades experimentales donde se aplican los tratamientos sean
las mismas, o los más parecidas posibles, para evitar influencia de otros factores
en la comparación, como por ejemplo cuando se desea comparar dos
medicamentos para curar una enfermedad es bastante obvio que el sujeto al cual
se aplica los medicamentos influye sustancialmente en la comparación de los
mismos. Otro ejemplo es en educación, supongamos que se da un seminario
sobre un tópico en particular y queremos luego evaluar la efectividad del
seminario. Es natural pensar que algunos individuos entenderán mejor el material
que otra tal vez, debido a la preparación que tienen de antemano. Así que lo más
justo es dar un test antes y después del seminario y comparar estos resultados
individuo por individuo.
Sea Xi
el valor del tratamiento I y Yi
el valor del tratamiento II en el i-ésimo
sujeto. Consideremos di
=Xi
-Yi
la diferencia de los tratamientos en el i-ésimo sujeto.
Las inferencias que se hacen son acerca del promedio poblacional μd
de las di
. Si
μd
=0, entonces significa que no hay diferencia entre los dos tratamientos.