SlideShare une entreprise Scribd logo
1  sur  9
INGENIERIA EN ADMINISTRACION
ESTADISTICA II
ING.JOSE GUADALUPE RODRIGUEZ RAMOS
CUARTO SEMESTRE
Elizabeth Paniagua Tegchi
UNIDAD I
PRUEBA DE HIPOTESIS
La experiencia sobre el comportamiento de algún índice de un proceso, o la
exigencia del cumplimiento de alguna norma nos lleva a realizar proposiciones
sobre el valor de algún parámetro estadístico.Estas proposiciones se deben
contrastar con la realidad (mediante el muestreo de datos) para tomar una
decisión entre aceptar o rechazar la proposiciónEstas proposiciones se denominan
Hipótesis y el procedimiento para decidir si se aceptan o se rechazan se denomina
Prueba de HipótesisUna prueba de hipótesis es una herramienta de análisis de
datos que puede en general formar parte de un experimento comparativo más
completo.
Procedimiento general para la prueba de Hipótesis
Antes de Examinar los datos muestrales:
1. Identificar el parámetro de interés
2. Establecer la Hipótesis Nula H0
3. Especificar una Hipótesis alternativa adecuada H1
4. Seleccionar un nivel de significancia a
Usando los datos muestrales:
5. Establecer un estadístico de prueba adecuado
6. Establecer una región de rechazo
7. Calcular todas las cantidades muestrales necesarias para el estadístico
8. Decidir si debe o no rechazarse H0
HIPOTESIS ESTADISTICAS
Una hipótesis Estadística es un proposición sobre los parámetros de una
población o sobre la distribución de probabilidad de una variable aleatoria.
Una hipótesis estadística es afirmación respecto a una característica de una
población. Contrastar una hipótesis es comparar las predicciones que se deducen
de ella con la realidad que observamos: si hay coincidencia, dentro del margen de
error admisible, mantendremos la hipótesis; en caso contrario, la rechazaremos.
Rechazar una hipótesis implica sustituirla por otra capaz de explicar los datos
observados.
Las siguientes afirmaciones son hipótesis estadísticas:
 El tabaco produce cáncer de pulmón.
 Disminuir los impuestos disminuye el fraude fiscal.
 Las mujeres son más apasionadas que los hombres.
Estas tres hipótesis no se refieren a individuos particulares, sino al conjunto de
elementos de una o varias poblaciones. En estos ejemplos vemos que el contraste
de hipótesis requiere, como pasos
previos:
 Especificar la población de interés
 Definir la variable a que nos referimos y como medirla.
 Relacionar la hipótesis con los parámetros de la o las poblaciones.
Para llegar a tomar decisiones, conviene hacer determinados supuestos o
conjeturas acerca de las
poblaciones que se estudian. Tales supuestos que pueden ser o no ciertos se
llaman hipótesis estadísticas y, en general, lo son sobre las distribuciones de
probabilidad de las poblaciones.
En muchos casos se formulan las hipótesis estadísticas con el solo propósito de
rechazarlas o invalidarlas. Por ejemplo, si se quiere decidir si una moneda está
cargada, se formula la hipótesis de que la moneda está bien, es decir, p : 0.5;
donde p es la probabilidad de cara. Análogamente, si se quiere decidir sobre si un
procedimiento es mejor que otro, se formula la hipótesis de que no hay
diferencia entre los procedimientos (es decir, cualquier diferencia observada se
debe meramente a fluctuaciones en el muestreo de la misma población).Tales
hipótesis se llaman también hipótesis nulas y se denotan por Ho. .
Cualquier hipótesis que difiera de una hipótesis dada se llama hipótesis
alternativa. Por ejemplo:
Si una hipótesis es p=0.5, hipótesis alternativas son p=O.7; p#O.5;
p>0.5.Unahipótesisalternativa de la hipótesis nula se denota por H1
Ejemplo: Se tiene interés en la rapidez de combustión de un agente propulsor para
los sistemas de salida de emergencia en aeronaves. (esta rapidez es una variable
aleatoria con alguna distribución de probabilidad). Especialmente interesa la
rapidez de combustión promedio (que es un parámetro (m) de dicha distribución).
De manera más específica, interesa decidir si esta rapidez promedio es o no 50
cm/seg.
El planteamiento formal de la situación se realiza en términos de una Hipótesis
Nula (que es la proposición que se quiere poner a prueba) y una Hipótesis
Alternativa, la cual se aceptará si se rechaza la hipótesis nula:
Hipótesis Nula: H0: Promedio = 50 cm/seg
Hipótesis Alternativa: H1 Promedio  50 cm/seg
ERRORES TIPO I Y TIPO II
Al comprobar una hipótesis nos puede llevar a dos conclusiones erróneas.
Erros Tipo I.- Se rechaza H0 cuando ésta es verdadera
Error Tipo II.- Se acepta H0 cuando ésta es falsa
Error Tipo I
A la probabilidad de cometer un error de Tipo I se denota por a, y se le llama el
nivel o tamaño de significancia de la prueba es decir
a = P(error Tipo I)= P(rechazar H0 | H0 es verdadera)
Ejemplo: Calcular a para el ejemplo de la rapidez de combustión para una muestra
de N=10 datos, suponiendo que la desviación estándar de la rapidez de
combustión es s=2.5 cm/seg.
Solución: en este caso a = P( x caiga en la región crítica | m=50), es decir:
a = P( x< 48.5) + P( x > 51.5)
Recordando que la distribución de x es Normal con media m=50 y desviación
estándar s/N =0.79
Esto significa que el 5.76% de las muestras de tamaño 10 conducirán al rechazo
de la Hipótesis H0: m=50 cm/seg, cuando ésta es verdadera.
Es claro que a se puede reducir de dos maneras:
 - Aumentando la región de aceptación.
 - Aumentando el tamaño de la muestra
ERROR TIPO II
Para evaluar un experimento de prueba de hipótesis también se requiere calcular
la probabilidad del error de Tipo II, denotada por b, es decir
b = P (error Tipo II) = P(aceptar H0 | H0 es falsa)
La probabilidad máxima con la que en el ensayo de una hipótesis se puede
cometer un error del
Tipo I se llama nivel de significación del ensayo. Esta probabilidad se denota
frecuentemente por a; generalmente se fija antes de la extracción de las muestras,
de modo que los resultados obtenidos no influyen en la elección.
Sin embargo, no es posible calcular b si no se tiene una hipótesis alternativa
específica, es decir, un valor particular del parámetro bajo prueba en lugar de un
rango de valores
Por ejemplo, supongamos que es importante rechazar H0 si la rapidez promedio
de combustión m es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la
simetría sólo se requiere evaluar la probabilidad de aceptar H0: m=50 cuando el
valor verdadero es m=52.
En la práctica se acostumbra a utilizar niveles de significación del 0.05 ó 0.01,
aunque igualmente pueden emplearse otros valores. Si, por ejemplo se elige un
nivel de significación del O.05 ó 5%, al diseñar un ensayo de hipótesis, entonces
hay aproximadamente 5 ocasiones en 100 en que se rechazaría la hipótesis
cuando debería ser aceptada, es decir, se está con un 95% de confianza de que
se toma la decisión adecuada. En tal caso se dice que la hipótesis ha sido
rechazada aI nivel de significación del O.O5,lo que significa que se puede cometer
error con una probabilidad de 0.05.
H0 es Verdadera H0 es Falsa
Se acepta H0 Decisión correcta Error tipo II
Se rechaza H0 Error tipo I Decisión tipo II
PRUEBAS UNILATERALES Y BILATERALES
Valor estadístico de prueba
Valor determinado a partir de la información muestral, que se utiliza para
determinar si se rechaza la hipótesis nula., existen muchos estadísticos de prueba
para nuestro caso utilizaremos los estadísticos z y t. La elección de uno de estos
depende de la cantidad de muestras que se toman, si las muestras son de la
prueba son iguales a 30 o más se utiliza el estadístico z, en caso contrario se
utiliza el estadístico t.
Tipos de prueba
a) Prueba bilateral o de dos extremos: la hipótesis planteada se formula con la
igualdad
Ejemplo
H0 : µ = 200
H1 : µ ≠ 200
b) Pruebas unilateral o de un extremo: la hipótesis planteada se formula con ≥ o
≤
H0 : µ ≥ 200 H0 : µ ≤ 200
H1 : µ < 200 H1 : µ > 200
En las pruebas de hipótesis para la media (μ), cuando se conoce la desviación
estándar (σ) poblacional, o cuando el valor de la muestra es grande (30 o más), el
valor estadístico de prueba es z y se determina a partir de:
El valor estadístico z, para muestra grande y desviación estándar poblacional
desconocida se determina por la ecuación:
En la prueba para una media poblacional con muestra pequeña y desviación
estándar poblacional desconocida se utiliza el valor estadístico t.
Prueba sobre dos medias con distribución
Normal y “t” Student
Distribución t de Student
En probabilidad y estadística la distribución t (de Student) es una distribución de
probabilidad que surge del problema de estimar la media de una
poblaciónnormalmente distribuida cuando el tamaño de la muestra es pequeño.
Aparece de manera natural al realizar la prueba t de Student para la determinación
de las diferencias entre dos medias muestrales y para la construcción del intervalo
de confianza para la diferencia entre las medias de dos poblaciones cuando se
desconoce la desviación típica de una población y ésta debe ser estimada a partir
de los datos de una muestra.
Distribución normal
La distribución normal fue reconocida por primera vez por el francés Abraham de
Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró
desarrollos más profundos y formuló la ecuación de la curva; de ahí que también
se la conozca, más comúnmente, como la "campana de Gauss". La distribución
de una variable normal está completamente determinada por dos parámetros, su
media y su desviación estándar, denotadas generalmente por y .
Propiedades de la distribución normal:
La distribución normal posee ciertas propiedades importantes que conviene
destacar:
i. Tiene una única moda, que coincide con su media y su mediana.
ii. La curva normal es asintótica al eje de abscisas. Por ello, cualquier
valor entre y es teóricamente posible. El área total bajo la
curva es, por tanto, igual a 1.
iii. Es simétrica con respecto a su media . Según esto, para este tipo
de variables existe una probabilidad de un 50% de observar un dato
mayor que la media, y un 50% de observar un dato menor.
iv. La distancia entre la línea trazada en la media y el punto de inflexión
de la curva es igual a una desviación típica ( ). Cuanto mayor sea
, más aplanada será la curva de la densidad.
v. El área bajo la curva comprendida entre los valores situados
aproximadamente a dos desviaciones estándar de la media es igual
a 0.95. En concreto, existe un 95% de posibilidades de observar un
valor comprendido en el intervalo .
vi. La forma de la campana de Gauss depende de los parámetros y
. La media indica la posición de la campana, de modo que para
diferentes valores de la gráfica es desplazada a lo largo del eje
horizontal. Por otra parte, la desviación estándar determina el grado
de apuntamiento de la curva. Cuanto mayor sea el valor de , más
se dispersarán los datos en torno a la media y la curva será más
plana.
Prueba sobre una sola proporción
Prueba Sobre una Sola Proporción.
Las pruebas de hipótesis que se relacionan con proporciones son muy utilizadas
en muchas áreas. El político se interesa en conocer que fracción de votantes lo
favorecerá en la siguiente elección. Todas las empresas fabricantes se preocupan
por la proporción de artículos defectuosos cuando se realiza un embarque.
Consideremos el problema de probar la hipótesis de que la proporción de éxitos
en un experimento binomial es igual a algún valor especifico. Es decir, probaremos
la hipótesis nula H0, que p = p0 donde p es el parámetro de la distribución
binomial. La hipótesis alternativa puede ser una de las alternativas bilaterales
usuales: H0: p=p0H1: p&lt; p
En la Prueba Sobre una Sola Proporción utilizamos la distribución binomial para
calcular el valor p P=P (X≤x) cuando p=p0El valor x es el numero de éxitos en
nuestra muestra de tamaño n. si este valor P es menor que o igual a α, nuestra
prueba es significativa en el nivel α y rechazamos H0 a favor de H1. De manera
similar, para probar la hipótesisH0: p=p0H1: p&gt; p0
En el nivel de significancia α, P=P(X≥x) Cuando p=p0Y rechazamos H0 a favor de
H1 si este valor P es menor que o igual a α. Finalmente, para probar la
hipótesis.H0: p=p0H1: p≠p0al nivel de significancia α, calculamos= 2P(X ≤ x
cuando p=p0) si x &lt; np0, o P= 2P(X ≥ x cuando p=p0)Si x&gt; np0 y se rechaza
H0 a favor deH1 si el valor P calculado es menor o igual a α.
Comparando media de dos poblaciones usando muestras pareadas
En este caso se trata de comparar dos métodos o tratamientos, pero se
quiere que las unidades experimentales donde se aplican los tratamientos sean
las mismas, o los más parecidas posibles, para evitar influencia de otros factores
en la comparación, como por ejemplo cuando se desea comparar dos
medicamentos para curar una enfermedad es bastante obvio que el sujeto al cual
se aplica los medicamentos influye sustancialmente en la comparación de los
mismos. Otro ejemplo es en educación, supongamos que se da un seminario
sobre un tópico en particular y queremos luego evaluar la efectividad del
seminario. Es natural pensar que algunos individuos entenderán mejor el material
que otra tal vez, debido a la preparación que tienen de antemano. Así que lo más
justo es dar un test antes y después del seminario y comparar estos resultados
individuo por individuo.
Sea Xi
el valor del tratamiento I y Yi
el valor del tratamiento II en el i-ésimo
sujeto. Consideremos di
=Xi
-Yi
la diferencia de los tratamientos en el i-ésimo sujeto.
Las inferencias que se hacen son acerca del promedio poblacional μd
de las di
. Si
μd
=0, entonces significa que no hay diferencia entre los dos tratamientos.

Contenu connexe

Tendances

metodo de estimacion y docima de hipotesis
metodo de estimacion y docima de hipotesismetodo de estimacion y docima de hipotesis
metodo de estimacion y docima de hipotesiskyori035
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesisLennysNJ
 
Prueba de Hipótesis para una media y proporción-estadistica
Prueba de Hipótesis para una media y proporción-estadisticaPrueba de Hipótesis para una media y proporción-estadistica
Prueba de Hipótesis para una media y proporción-estadisticaYanina C.J
 
Plantamiento de la hipotesis
Plantamiento de la hipotesisPlantamiento de la hipotesis
Plantamiento de la hipotesisEQUIPO7
 
Prueba de hipotesis(1)
Prueba de hipotesis(1)Prueba de hipotesis(1)
Prueba de hipotesis(1)amy Lopez
 
Test de Hipótesis I
Test de Hipótesis ITest de Hipótesis I
Test de Hipótesis IHector Funes
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesisalerioz
 
PLANTEAMIENTO DE HIPOTESIS PARA UNA POBLACION (MEDIA)
PLANTEAMIENTO DE HIPOTESIS PARA UNA POBLACION (MEDIA)PLANTEAMIENTO DE HIPOTESIS PARA UNA POBLACION (MEDIA)
PLANTEAMIENTO DE HIPOTESIS PARA UNA POBLACION (MEDIA)Luis Angel Vanegas
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesisCarol Ramos
 
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias FranciscoExposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias FranciscoAriel Saenz
 

Tendances (20)

Pruebas de hipótesis
Pruebas de hipótesisPruebas de hipótesis
Pruebas de hipótesis
 
metodo de estimacion y docima de hipotesis
metodo de estimacion y docima de hipotesismetodo de estimacion y docima de hipotesis
metodo de estimacion y docima de hipotesis
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
 
Prueba de Hipótesis para una media y proporción-estadistica
Prueba de Hipótesis para una media y proporción-estadisticaPrueba de Hipótesis para una media y proporción-estadistica
Prueba de Hipótesis para una media y proporción-estadistica
 
Plantamiento de la hipotesis
Plantamiento de la hipotesisPlantamiento de la hipotesis
Plantamiento de la hipotesis
 
Estadistica 9
Estadistica 9Estadistica 9
Estadistica 9
 
Prueba de hipotesis(1)
Prueba de hipotesis(1)Prueba de hipotesis(1)
Prueba de hipotesis(1)
 
7 prueba de hipotesis
7 prueba de hipotesis7 prueba de hipotesis
7 prueba de hipotesis
 
Prueba de hipotesis estadistica
Prueba de hipotesis estadisticaPrueba de hipotesis estadistica
Prueba de hipotesis estadistica
 
Test de Hipótesis I
Test de Hipótesis ITest de Hipótesis I
Test de Hipótesis I
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
PLANTEAMIENTO DE HIPOTESIS PARA UNA POBLACION (MEDIA)
PLANTEAMIENTO DE HIPOTESIS PARA UNA POBLACION (MEDIA)PLANTEAMIENTO DE HIPOTESIS PARA UNA POBLACION (MEDIA)
PLANTEAMIENTO DE HIPOTESIS PARA UNA POBLACION (MEDIA)
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias FranciscoExposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
Exposicion 5.3 Prueba de Hipotesis Equipo Ramirez Elias Francisco
 
estadistica
estadisticaestadistica
estadistica
 
Presentación hipotesis
Presentación hipotesisPresentación hipotesis
Presentación hipotesis
 
Inferencia estadistica
Inferencia estadisticaInferencia estadistica
Inferencia estadistica
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
 
Inferencia Estadística
Inferencia EstadísticaInferencia Estadística
Inferencia Estadística
 

En vedette

Unidad 1. Probabilidad
Unidad 1. ProbabilidadUnidad 1. Probabilidad
Unidad 1. ProbabilidadMarielba Lazo
 
9. diferencia entre p de hipótesis e intervalos de confianza
9.  diferencia entre p de hipótesis e intervalos de confianza9.  diferencia entre p de hipótesis e intervalos de confianza
9. diferencia entre p de hipótesis e intervalos de confianzaYerko Bravo
 
Probabilidad (mapa conceptual)
Probabilidad (mapa conceptual)Probabilidad (mapa conceptual)
Probabilidad (mapa conceptual)ferchoalb
 
Mapa conceptual tipos de distribuciones de probabilidad
Mapa conceptual   tipos de distribuciones de probabilidadMapa conceptual   tipos de distribuciones de probabilidad
Mapa conceptual tipos de distribuciones de probabilidadJose Hernandez Landa
 
Ensayo de teoria de probabilidad estadistica
Ensayo de teoria de probabilidad estadisticaEnsayo de teoria de probabilidad estadistica
Ensayo de teoria de probabilidad estadisticajacpier
 
Experimentos aleatorios, espacio muestral y eventos
Experimentos aleatorios, espacio muestral y eventosExperimentos aleatorios, espacio muestral y eventos
Experimentos aleatorios, espacio muestral y eventosJoan Fernando Chipia Lobo
 

En vedette (8)

Unidad 1. Probabilidad
Unidad 1. ProbabilidadUnidad 1. Probabilidad
Unidad 1. Probabilidad
 
Modulo probabilidad i 2010
Modulo probabilidad i 2010Modulo probabilidad i 2010
Modulo probabilidad i 2010
 
9. diferencia entre p de hipótesis e intervalos de confianza
9.  diferencia entre p de hipótesis e intervalos de confianza9.  diferencia entre p de hipótesis e intervalos de confianza
9. diferencia entre p de hipótesis e intervalos de confianza
 
Probabilidad (mapa conceptual)
Probabilidad (mapa conceptual)Probabilidad (mapa conceptual)
Probabilidad (mapa conceptual)
 
Mapa conceptual tipos de distribuciones de probabilidad
Mapa conceptual   tipos de distribuciones de probabilidadMapa conceptual   tipos de distribuciones de probabilidad
Mapa conceptual tipos de distribuciones de probabilidad
 
Prueba de Hipotesis para Muestras Pequeñas Est ind clase03
Prueba de Hipotesis para Muestras Pequeñas Est ind clase03Prueba de Hipotesis para Muestras Pequeñas Est ind clase03
Prueba de Hipotesis para Muestras Pequeñas Est ind clase03
 
Ensayo de teoria de probabilidad estadistica
Ensayo de teoria de probabilidad estadisticaEnsayo de teoria de probabilidad estadistica
Ensayo de teoria de probabilidad estadistica
 
Experimentos aleatorios, espacio muestral y eventos
Experimentos aleatorios, espacio muestral y eventosExperimentos aleatorios, espacio muestral y eventos
Experimentos aleatorios, espacio muestral y eventos
 

Similaire à RESUMEN UNIDAD 1

Similaire à RESUMEN UNIDAD 1 (20)

¿Qué cosas importantes crees que deberías aprender para trabajar en el siglo ...
¿Qué cosas importantes crees que deberías aprender para trabajar en el siglo ...¿Qué cosas importantes crees que deberías aprender para trabajar en el siglo ...
¿Qué cosas importantes crees que deberías aprender para trabajar en el siglo ...
 
Hipotesis2
Hipotesis2Hipotesis2
Hipotesis2
 
Presentación4
Presentación4Presentación4
Presentación4
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
1.1 prueba de hipotesis
1.1 prueba de hipotesis1.1 prueba de hipotesis
1.1 prueba de hipotesis
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
 
Intervalos de confianza y pruebas de hipótesis
Intervalos de confianza y pruebas de hipótesisIntervalos de confianza y pruebas de hipótesis
Intervalos de confianza y pruebas de hipótesis
 
Pruebas de hipotesis
Pruebas de hipotesisPruebas de hipotesis
Pruebas de hipotesis
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Biometria clase 8
Biometria clase 8Biometria clase 8
Biometria clase 8
 
Biometria clase 8
Biometria clase 8Biometria clase 8
Biometria clase 8
 
3 a evaluación
3 a evaluación3 a evaluación
3 a evaluación
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Capítulo viii
Capítulo viiiCapítulo viii
Capítulo viii
 
Introducción a la Inferencia Estadística
Introducción a la Inferencia EstadísticaIntroducción a la Inferencia Estadística
Introducción a la Inferencia Estadística
 
Probabilidad
Probabilidad Probabilidad
Probabilidad
 
Biometria clase 7
Biometria clase 7Biometria clase 7
Biometria clase 7
 
Plantamiento de la hipotesis
Plantamiento de la hipotesisPlantamiento de la hipotesis
Plantamiento de la hipotesis
 

RESUMEN UNIDAD 1

  • 1. INGENIERIA EN ADMINISTRACION ESTADISTICA II ING.JOSE GUADALUPE RODRIGUEZ RAMOS CUARTO SEMESTRE Elizabeth Paniagua Tegchi UNIDAD I PRUEBA DE HIPOTESIS La experiencia sobre el comportamiento de algún índice de un proceso, o la exigencia del cumplimiento de alguna norma nos lleva a realizar proposiciones sobre el valor de algún parámetro estadístico.Estas proposiciones se deben contrastar con la realidad (mediante el muestreo de datos) para tomar una decisión entre aceptar o rechazar la proposiciónEstas proposiciones se denominan Hipótesis y el procedimiento para decidir si se aceptan o se rechazan se denomina Prueba de HipótesisUna prueba de hipótesis es una herramienta de análisis de datos que puede en general formar parte de un experimento comparativo más completo. Procedimiento general para la prueba de Hipótesis Antes de Examinar los datos muestrales: 1. Identificar el parámetro de interés 2. Establecer la Hipótesis Nula H0 3. Especificar una Hipótesis alternativa adecuada H1 4. Seleccionar un nivel de significancia a Usando los datos muestrales: 5. Establecer un estadístico de prueba adecuado 6. Establecer una región de rechazo 7. Calcular todas las cantidades muestrales necesarias para el estadístico 8. Decidir si debe o no rechazarse H0
  • 2. HIPOTESIS ESTADISTICAS Una hipótesis Estadística es un proposición sobre los parámetros de una población o sobre la distribución de probabilidad de una variable aleatoria. Una hipótesis estadística es afirmación respecto a una característica de una población. Contrastar una hipótesis es comparar las predicciones que se deducen de ella con la realidad que observamos: si hay coincidencia, dentro del margen de error admisible, mantendremos la hipótesis; en caso contrario, la rechazaremos. Rechazar una hipótesis implica sustituirla por otra capaz de explicar los datos observados. Las siguientes afirmaciones son hipótesis estadísticas:  El tabaco produce cáncer de pulmón.  Disminuir los impuestos disminuye el fraude fiscal.  Las mujeres son más apasionadas que los hombres. Estas tres hipótesis no se refieren a individuos particulares, sino al conjunto de elementos de una o varias poblaciones. En estos ejemplos vemos que el contraste de hipótesis requiere, como pasos previos:  Especificar la población de interés  Definir la variable a que nos referimos y como medirla.  Relacionar la hipótesis con los parámetros de la o las poblaciones. Para llegar a tomar decisiones, conviene hacer determinados supuestos o conjeturas acerca de las poblaciones que se estudian. Tales supuestos que pueden ser o no ciertos se llaman hipótesis estadísticas y, en general, lo son sobre las distribuciones de probabilidad de las poblaciones. En muchos casos se formulan las hipótesis estadísticas con el solo propósito de rechazarlas o invalidarlas. Por ejemplo, si se quiere decidir si una moneda está cargada, se formula la hipótesis de que la moneda está bien, es decir, p : 0.5; donde p es la probabilidad de cara. Análogamente, si se quiere decidir sobre si un procedimiento es mejor que otro, se formula la hipótesis de que no hay diferencia entre los procedimientos (es decir, cualquier diferencia observada se debe meramente a fluctuaciones en el muestreo de la misma población).Tales hipótesis se llaman también hipótesis nulas y se denotan por Ho. . Cualquier hipótesis que difiera de una hipótesis dada se llama hipótesis alternativa. Por ejemplo: Si una hipótesis es p=0.5, hipótesis alternativas son p=O.7; p#O.5; p>0.5.Unahipótesisalternativa de la hipótesis nula se denota por H1
  • 3. Ejemplo: Se tiene interés en la rapidez de combustión de un agente propulsor para los sistemas de salida de emergencia en aeronaves. (esta rapidez es una variable aleatoria con alguna distribución de probabilidad). Especialmente interesa la rapidez de combustión promedio (que es un parámetro (m) de dicha distribución). De manera más específica, interesa decidir si esta rapidez promedio es o no 50 cm/seg. El planteamiento formal de la situación se realiza en términos de una Hipótesis Nula (que es la proposición que se quiere poner a prueba) y una Hipótesis Alternativa, la cual se aceptará si se rechaza la hipótesis nula: Hipótesis Nula: H0: Promedio = 50 cm/seg Hipótesis Alternativa: H1 Promedio  50 cm/seg ERRORES TIPO I Y TIPO II Al comprobar una hipótesis nos puede llevar a dos conclusiones erróneas. Erros Tipo I.- Se rechaza H0 cuando ésta es verdadera Error Tipo II.- Se acepta H0 cuando ésta es falsa Error Tipo I A la probabilidad de cometer un error de Tipo I se denota por a, y se le llama el nivel o tamaño de significancia de la prueba es decir a = P(error Tipo I)= P(rechazar H0 | H0 es verdadera) Ejemplo: Calcular a para el ejemplo de la rapidez de combustión para una muestra de N=10 datos, suponiendo que la desviación estándar de la rapidez de combustión es s=2.5 cm/seg. Solución: en este caso a = P( x caiga en la región crítica | m=50), es decir: a = P( x< 48.5) + P( x > 51.5) Recordando que la distribución de x es Normal con media m=50 y desviación estándar s/N =0.79
  • 4. Esto significa que el 5.76% de las muestras de tamaño 10 conducirán al rechazo de la Hipótesis H0: m=50 cm/seg, cuando ésta es verdadera. Es claro que a se puede reducir de dos maneras:  - Aumentando la región de aceptación.  - Aumentando el tamaño de la muestra ERROR TIPO II Para evaluar un experimento de prueba de hipótesis también se requiere calcular la probabilidad del error de Tipo II, denotada por b, es decir b = P (error Tipo II) = P(aceptar H0 | H0 es falsa) La probabilidad máxima con la que en el ensayo de una hipótesis se puede cometer un error del Tipo I se llama nivel de significación del ensayo. Esta probabilidad se denota frecuentemente por a; generalmente se fija antes de la extracción de las muestras, de modo que los resultados obtenidos no influyen en la elección. Sin embargo, no es posible calcular b si no se tiene una hipótesis alternativa específica, es decir, un valor particular del parámetro bajo prueba en lugar de un rango de valores Por ejemplo, supongamos que es importante rechazar H0 si la rapidez promedio de combustión m es mayor que 52 cm/seg o menor que 48 cm/seg. Dada la simetría sólo se requiere evaluar la probabilidad de aceptar H0: m=50 cuando el valor verdadero es m=52. En la práctica se acostumbra a utilizar niveles de significación del 0.05 ó 0.01, aunque igualmente pueden emplearse otros valores. Si, por ejemplo se elige un nivel de significación del O.05 ó 5%, al diseñar un ensayo de hipótesis, entonces hay aproximadamente 5 ocasiones en 100 en que se rechazaría la hipótesis cuando debería ser aceptada, es decir, se está con un 95% de confianza de que se toma la decisión adecuada. En tal caso se dice que la hipótesis ha sido rechazada aI nivel de significación del O.O5,lo que significa que se puede cometer error con una probabilidad de 0.05.
  • 5. H0 es Verdadera H0 es Falsa Se acepta H0 Decisión correcta Error tipo II Se rechaza H0 Error tipo I Decisión tipo II PRUEBAS UNILATERALES Y BILATERALES Valor estadístico de prueba Valor determinado a partir de la información muestral, que se utiliza para determinar si se rechaza la hipótesis nula., existen muchos estadísticos de prueba para nuestro caso utilizaremos los estadísticos z y t. La elección de uno de estos depende de la cantidad de muestras que se toman, si las muestras son de la prueba son iguales a 30 o más se utiliza el estadístico z, en caso contrario se utiliza el estadístico t. Tipos de prueba a) Prueba bilateral o de dos extremos: la hipótesis planteada se formula con la igualdad Ejemplo H0 : µ = 200 H1 : µ ≠ 200 b) Pruebas unilateral o de un extremo: la hipótesis planteada se formula con ≥ o ≤
  • 6. H0 : µ ≥ 200 H0 : µ ≤ 200 H1 : µ < 200 H1 : µ > 200 En las pruebas de hipótesis para la media (μ), cuando se conoce la desviación estándar (σ) poblacional, o cuando el valor de la muestra es grande (30 o más), el valor estadístico de prueba es z y se determina a partir de: El valor estadístico z, para muestra grande y desviación estándar poblacional desconocida se determina por la ecuación: En la prueba para una media poblacional con muestra pequeña y desviación estándar poblacional desconocida se utiliza el valor estadístico t. Prueba sobre dos medias con distribución Normal y “t” Student
  • 7. Distribución t de Student En probabilidad y estadística la distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una poblaciónnormalmente distribuida cuando el tamaño de la muestra es pequeño. Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra. Distribución normal La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más comúnmente, como la "campana de Gauss". La distribución de una variable normal está completamente determinada por dos parámetros, su media y su desviación estándar, denotadas generalmente por y . Propiedades de la distribución normal: La distribución normal posee ciertas propiedades importantes que conviene destacar: i. Tiene una única moda, que coincide con su media y su mediana. ii. La curva normal es asintótica al eje de abscisas. Por ello, cualquier valor entre y es teóricamente posible. El área total bajo la curva es, por tanto, igual a 1. iii. Es simétrica con respecto a su media . Según esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor. iv. La distancia entre la línea trazada en la media y el punto de inflexión de la curva es igual a una desviación típica ( ). Cuanto mayor sea , más aplanada será la curva de la densidad. v. El área bajo la curva comprendida entre los valores situados aproximadamente a dos desviaciones estándar de la media es igual a 0.95. En concreto, existe un 95% de posibilidades de observar un valor comprendido en el intervalo . vi. La forma de la campana de Gauss depende de los parámetros y . La media indica la posición de la campana, de modo que para diferentes valores de la gráfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviación estándar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de , más
  • 8. se dispersarán los datos en torno a la media y la curva será más plana. Prueba sobre una sola proporción Prueba Sobre una Sola Proporción. Las pruebas de hipótesis que se relacionan con proporciones son muy utilizadas en muchas áreas. El político se interesa en conocer que fracción de votantes lo favorecerá en la siguiente elección. Todas las empresas fabricantes se preocupan por la proporción de artículos defectuosos cuando se realiza un embarque. Consideremos el problema de probar la hipótesis de que la proporción de éxitos en un experimento binomial es igual a algún valor especifico. Es decir, probaremos la hipótesis nula H0, que p = p0 donde p es el parámetro de la distribución binomial. La hipótesis alternativa puede ser una de las alternativas bilaterales usuales: H0: p=p0H1: p&lt; p En la Prueba Sobre una Sola Proporción utilizamos la distribución binomial para calcular el valor p P=P (X≤x) cuando p=p0El valor x es el numero de éxitos en nuestra muestra de tamaño n. si este valor P es menor que o igual a α, nuestra prueba es significativa en el nivel α y rechazamos H0 a favor de H1. De manera similar, para probar la hipótesisH0: p=p0H1: p&gt; p0 En el nivel de significancia α, P=P(X≥x) Cuando p=p0Y rechazamos H0 a favor de H1 si este valor P es menor que o igual a α. Finalmente, para probar la hipótesis.H0: p=p0H1: p≠p0al nivel de significancia α, calculamos= 2P(X ≤ x cuando p=p0) si x &lt; np0, o P= 2P(X ≥ x cuando p=p0)Si x&gt; np0 y se rechaza H0 a favor deH1 si el valor P calculado es menor o igual a α.
  • 9. Comparando media de dos poblaciones usando muestras pareadas En este caso se trata de comparar dos métodos o tratamientos, pero se quiere que las unidades experimentales donde se aplican los tratamientos sean las mismas, o los más parecidas posibles, para evitar influencia de otros factores en la comparación, como por ejemplo cuando se desea comparar dos medicamentos para curar una enfermedad es bastante obvio que el sujeto al cual se aplica los medicamentos influye sustancialmente en la comparación de los mismos. Otro ejemplo es en educación, supongamos que se da un seminario sobre un tópico en particular y queremos luego evaluar la efectividad del seminario. Es natural pensar que algunos individuos entenderán mejor el material que otra tal vez, debido a la preparación que tienen de antemano. Así que lo más justo es dar un test antes y después del seminario y comparar estos resultados individuo por individuo. Sea Xi el valor del tratamiento I y Yi el valor del tratamiento II en el i-ésimo sujeto. Consideremos di =Xi -Yi la diferencia de los tratamientos en el i-ésimo sujeto. Las inferencias que se hacen son acerca del promedio poblacional μd de las di . Si μd =0, entonces significa que no hay diferencia entre los dos tratamientos.