1. UNIVERSIDAD TECNOLÓGICA DE TORREÓN.
Licenciado: Edgar Gerardo Mata
Ortíz
Alumna: América Iveth Valverde
Medina
Temas:
1.Pruba de Hipótesis
2.Intervalos de Confianza
2. Tenemos que empezar por definir que es una
hipótesis y que es prueba de hipótesis.
Hipótesis es una aseveración de una población
elaborado con el propósito de poner aprueba, para
verificar si la afirmación es razonable se usan datos.
En el análisis estadístico se hace una aseveración, es
decir, se plantea una hipótesis, después se hacen las
pruebas para verificar la aseveración o para
determinar que no es verdadera.
Por tanto, la prueba de hipótesis es un procedimiento
basado en la evidencia muestral y la teoría de
probabilidad; se emplea para determinar si la
hipótesis es una afirmación razonable.
Prueba de una hipótesis: se realiza mediante un
procedimiento sistemático de cinco paso:
3.
4. Siguiendo este procedimiento sistemático, al
llegar al paso cinco se puede o no rechazar la
hipótesis, pero debemos de tener cuidado con
esta determinación ya que en la consideración
de estadística no proporciona evidencia de que
algo sea verdadero. Esta prueba aporta una clase
de prueba más allá de una duda razonable.
Analizaremos cada paso en detalle
Objetivo de la prueba de hipótesis.
El propósito de la prueba de hipótesis no es
cuestionar el valor calculado del estadístico
(muestral), sino hacer
un juicio con respecto a la diferencia entre
estadístico de muestra y un valor planteado del
parámetro.
5. PROPÓSITO DE LA PRUEBA DE HIPÓTESIS
El propósito de la prueba de hipótesis no es
cuestionar el valor calculado del estadístico
(muestral), sino hacer
un juicio con respecto a la diferencia entre
estadístico de muestra y un valor planteado del
parámetro.
3.- Procedimiento sistemático para una prueba de
hipótesis de una muestra
.Paso 1: Plantear la hipótesis nula Ho y la hipótesis
alternativa H1.
Cualquier investigación estadística implica la
existencia de hipótesis o afirmaciones acerca de las
poblaciones que se estudian.
La hipótesis nula (Ho) se refiere siempre a un valor
especificado del parámetro de población, no a una
estadística de muestra. La letra H significa hipótesis y
el subíndice cero no hay diferencia. Por lo general
hay un "no" en la hipótesis nula que indica que "no
hay cambio" Podemos rechazar o aceptar Ho.
6. La hipótesis nula (Ho) se refiere siempre a un valor
especificado del parámetro de población, no a una
estadística de muestra. La letra H significa hipótesis
y el subíndice cero no hay diferencia. Por lo general
hay un "no" en la hipótesis nula que indica que "no
hay cambio" Podemos rechazar o aceptar Ho.
7.
8.
9. a) Prueba bilateral o de dos extremos: la hipótesis planteada se
formula con la igualdad
Ejemplo
H0 : µ = 200
H1 : µ ≠ 200
10. b) Pruebas unilateral o de un extremo: la hipótesis
planteada se formula con ≥ o ≤
H0 : µ ≥ 200 H0 : µ ≤ 200
H1 : µ < 200 H1 : µ > 200
11. En las pruebas de hipótesis para la media (μ), cuando se conoce la
desviación estándar (σ) poblacional, o cuando el valor de la muestra
es grande (30 o más), el valor estadístico de prueba es z y se
determina a partir de:
El valor estadístico z, para muestra grande y desviación estándar
poblacional desconocida se determina por la ecuación:
En la prueba para una media poblacional con muestra pequeña y
desviación estándar poblacional desconocida se utiliza el valor
estadístico t.
12. Eljefe de la Biblioteca Especializada de la
Facultad de Ingeniería Eléctrica y Electrónica
de la UNAC manifiesta que el número
promedio de lectores por día es de 350. Para
confirmar o no este supuesto se controla la
cantidad de lectores que utilizaron la
biblioteca durante 30 días. Se considera el
nivel de significancia de 0.05
14. Se trata de un problema con una media poblacional: muestra
grande y desviación estándar poblacional desconocida.
Paso 01: Seleccionamos la hipótesis nula y la hipótesis
alternativa
Ho: μ═350
Ha: μ≠ 350
Paso 02: Nivel de confianza o significancia 95%
α═0.05
Paso 03: Calculamos o determinamos el valor estadístico de
prueba
De los datos determinamos: que el estadístico de prueba es
t, debido a que el numero de muestras es igual a 30, conocemos
la media de la población, pero la desviación estándar de la
población es desconocida, en este caso determinamos la
desviación estándar de la muestra y la utilizamos en la formula
reemplazando a la desviación estándar de la población.
15. Columna1
Media 372.8
Error típico 9.56951578
Mediana 381
Moda 405
Desviación estándar 52.4143965
Varianza de la muestra 2747.26897
Curtosis 0.36687081
Coeficiente de asimetría 0.04706877
Rango 234
Mínimo 276
Máximo 510
Suma 11184
Cuenta 30
Nivel de confianza (95.0%) 19.571868
16. Paso 04: Formulación de la regla de decisión.
La regla de decisión la formulamos teniendo en cuenta que esta es
una prueba de dos colas, la mitad de 0.05, es decir 0.025, esta en
cada cola. el área en la que no se rechaza Ho esta entre las dos
colas, es por consiguiente 0.95. El valor critico para 0.05 da un valor
de Zc = 1.96.
Por consiguiente la regla de decisión: es rechazar la hipótesis nula y
aceptar la hipótesis alternativa, si el valor Z calculado no queda en la
región comprendida entre -1.96 y +1.96. En caso contrario no se
rechaza la hipótesis nula si Z queda entre -1.96 y +1.96.
Paso 05: Toma de decisión.
En este ultimo paso comparamos el estadístico de prueba calculado
mediante el Software Minitab que es igual a Z = 2.38 y lo comparamos
con el valor critico de Zc = 1.96. Como el estadístico de prueba
calculado cae a la derecha del valor critico de Z, se rechaza Ho. Por
tanto no se confirma el supuesto del Jefe de la Biblioteca.
One-Sample Z
Test of mu = 350 vs not = 350
The assumed standard deviation = 52.414
N Mean SE Mean 95% CI Z P
30 372.800 9.569 (354.044, 391.556) 2.38 0.017
17. Etapa 1.- Planear la hipótesis nula y la hipótesis alternativa. La hipótesis nula (H0) es el valor hipotético del
parámetro que se compra con el resultado muestral resulta muy poco probable cuando la hipótesis es cierta.
Etapa 2.- Especificar el nivel de significancia que se va a utilizar. El nivel de significancia del 5%, entonces se
rechaza la hipótesis nula solamente si el resultado muestral es tan diferente del valor hipotético que una
diferencia de esa magnitud o mayor, pudiera ocurrir aleatoria mente con una probabilidad de 1.05 o menos.
Etapa 3.- Elegir la estadística de prueba. La estadística de prueba puede ser la estadística muestral (el
estimador no segado del parámetro que se prueba) o una versión transformada de esa estadística muestral. Por
ejemplo, para probar el valor hipotético de una media poblacional, se toma la media de una muestra aleatoria de
esa distribución normal, entonces es común que se transforme la media en un valor z el cual, a su vez, sirve
como estadística de prueba.
Etapa 4.- Establecer el valor o valores críticos de la estadística de prueba. Habiendo especificado la hipótesis
nula, el nivel de significancia y la estadística de prueba que se van a utilizar, se produce a establecer el o los
valores críticos de estadística de prueba. Puede haber uno o más de esos valores, dependiendo de si se va a
realizar una prueba de uno o dos extremos.
Etapa 5.- Determinar el valor real de la estadística de prueba. Por ejemplo, al probar un valor hipotético de la
media poblacional, se toma una muestra aleatoria y se determina el valor de la media muestral. Si el valor crítico
que se establece es un valor de z, entonces se transforma la media muestral en un valor de z.
Etapa 6.- Tomar la decisión. Se compara el valor observado de la estadística muestral con el valor (o valores)
críticos de la estadística de prueba. Después se acepta o se rechaza la hipótesis nula. Si se rechaza ésta, se
acepta la alternativa; a su vez, esta decisión tendrá efecto sobre otras decisiones de los administradores
operativos, como por ejemplo, mantener o no un estándar de desempeño o cuál de dos estrategias de
mercadotecnia utilizar.
18. La distribución apropiada de la prueba estadística se
divide en dos regiones: una región de rechazo y una de
no rechazo. Si la prueba estadística cae en esta última
región no se puede rechazar la hipótesis nula y se llega a
la conclusión de que el proceso funciona correctamente.
Al tomar la decisión con respecto a la hipótesis nula, se
debe determinar el valor crítico en la distribución
estadística que divide la región del rechazo (en la cual la
hipótesis nula no se puede rechazar) de la región de
rechazo. A hora bien el valor crítico depende del tamaño
de la región de rechazo.
PASOS DE LA PRUEBA DE HIPÓTESIS
Expresar la hipótesis nula
Expresar la hipótesis alternativa
Especificar el nivel de significancía
Determinar el tamaño de la muestra
Establecer los valores críticos que establecen las
regiones de rechazo de las de no rechazo.
Determinar la prueba estadística.
19. 1) Una empresa está interesada en lanzar un nuevo producto al mercado.
Tras realizar una campaña publicitaria, se toma la muestra de 1 000
habitantes, de los cuales, 25 no conocían el producto. A un nivel de
significación del 1% ¿apoya el estudio las siguientes hipótesis?
a. Más del 3% de la población no conoce el nuevo producto.
b. Menos del 2% de la población no conoce el nuevo producto
Datos:
n = 1000
x = 25
20. Donde:
x = ocurrencias
n = observaciones
= proporción de la muestra
= proporción propuesta
a)
a = 0,01
21. H0es aceptada, ya que Z prueba (-0,93) es
menor que Z tabla (2,326), por e lo que no es
cierto que más del 3% de la población no
conoce el nuevo producto.
23. Un gerente de ventas de libros universitarios
afirma que en promedio sus representantes de
ventas realiza 40 visitas a profesores por
semana. Varios de estos representantes piensan
que realizan un número de visitas promedio
superior a 40. Una muestra tomada al azar
durante 8 semanas reveló un promedio de 42
visitas semanales y una desviación estándar de 2
visitas. Utilice un nivel de confianza del 99%
para aclarar esta cuestión.
Datos:
( = 40
n = 8
Nivel de confianza del 99%
24. Nivel de significación = (100%-99%)/2 = 0,5% = 0,005
Solución:
H0: ( = 40
H1: ( > 40
Grados de libertad: n-1 = 8-1 =7
a = 0,005
25. H0 es aceptada, ya que tprueba (2,83) es menor que ttabla (3,499), por lo que no es
acertado pensar que están realizando un número de visitas promedio superior a 40.
26. investigación de mercados cree que la media es
mayor y para probar su hipótesis toma una
muestra de 64 observaciones procedentes de la
misma población, obteniendo como resultado
una media de 25. Si se utiliza un nivel de
significación del 5%. Verifique si la afirmación
del investigador es realmente cierta.
Datos:
n = 64
a = 5% = 0,05
28. Cuando las ventas medias, por establecimiento
autorizado, de una marca de relojes caen por debajo
de las 170,000 unidades mensuales, se considera
razón suficiente para lanzar una campaña
publicitaria que active las ventas de esta marca. Para
conocer la evolución de las ventas, el departamento
de marketing realiza una encuesta a 51
establecimientos autorizados, seleccionados
aleatoriamente, que facilitan la cifra de ventas del
último mes en relojes de esta marca. A partir de
estas cifras se obtienen los siguientes resultados:
media = 169.411,8 unidades., desviación estándar =
32.827,5 unidades. Suponiendo que las ventas
mensuales por establecimiento se distribuyen
normalmente; con un nivel de significación del 5 % y
en vista a la situación reflejada en los datos. ¿Se
considerará oportuno lanzar una nueva campaña
publicitaria
29. Datos:
Solución:
H0: ( = 170000
n = 51
H1: ( < 170000
a = 0,05
30.
31.
32.
33. En el contexto de estimar un parámetro poblacional, un
intervalo de confianza es un rango de valores (calculado en
una muestra) en el cual se encuentra el verdadero valor
del parámetro, con una probabilidad determinada.
La probabilidad de que el verdadero valor del parámetro se
encuentre en el intervalo construido se denomina nivel de
confianza, y se denota 1- . La probabilidad de
equivocarnos se llama nivel de significancia y se simboliza
. Generalmente se construyen intervalos con confianza 1-
=95% (o significancia =5%). Menos frecuentes son los
intervalos con =10% o =1%.
Para construir un intervalo de confianza, se puede
comprobar que la distribución Normal Estándar cumple 1:
P(-1.96 < z < 1.96) = 0.95
(lo anterior se puede comprobar con una tabla de
probabilidades o un programa computacional que calcule
probabilidades normales).
34. Luego, si una variable X tiene distribución N( , ), entonces el 95% de las
veces se cumple:
Despejando en la ecuación se tiene:
El resultado es un intervalo que incluye al el 95% de las veces. Es decir, es
un intervalo de confianza al 95% para la media cuando la variable X es
normal y es conocido.
II- Intervalo de confianza para un promedio:
Generalmente, cuando se quiere construir un intervalo de confianza para la
media poblacional , la varianza poblacional es desconocida, por lo que el
intervalo para construido al final de II es muy poco práctico.
Si en el intervalo se reemplaza la desviación estándar poblacional por la
desviación estándar muestral s, el intervalo de confianza
35.
36. 2
a
φ(2,31) = 1 -
2
a ; buscamos en la tabla de la distribución N(0,1) y obtenemos que φ(2,31)
= 0,9896
Luego 0,9896 = 1 -
2
a ; despejando: α = 0,0208 ; Por tanto el nivel de confianza es 1 – α = 1 –
0,0208 = 0,9792 = 97,92 %
37. En un hospital se ha tomado la temperatura a una muestra de 64 pacientes
para estimar la temperatura media de sus
enfermos. La media de la muestra ha sido 37,1 oC y se sabe que la
desviacion tipica de toda la poblacion es 1,04 oC.
a) Obtenga un intervalo de confianza, al 90 %, para la media poblacional.
b) .Con que nivel de confianza podemos afirmar que la media de la poblacion
esta comprendida entre 36,8oC y 37,4 oC?
(Propuesto para selectividad Andalucia 2003)
RESOLUCION
X = temperatura ; n = 64 ; x = 37,1 ; X → N(μ ; 1,04) , es decir σ = 1,04
a) Nivel de confianza = 1 – α = 0,9 ; α = 0,1; Intervalo de confianza I = ( x - E ,
x +E) , siendo E = zα/2 .
n
s
Sabemos que φ(zα/2) = 1 -
2
a = 1 - 0,1
2
= 0,95 ; usando la tabla de la distribucion Z → N(0,1) , obtenemos zα/2 =
1,645
E = 1,645 . 1,04
64
= 0,21385 ; I = (37,1 – 0,21385 ; 37,1 + 0,21385) ; I = (36,89 ; 37,31)
-------------------------------------------------------------------------------------------------------
------------
b) Nos dicen que el intervalo de confianza es I = (36,8 ; 37,4) ; tenemos que
calcular el nivel de confianza = 1 - α
Usamos, por ejemplo, la amplitud del intervalo: A = 2E = 2. zα/2 .
n
s = 2. zα/2 . 1,04
64
= 37,4 – 36,8 = 0,6
Despejando obtenemos zα/2 = 2,31 . Sustituimos en la formula φ(zα/2) = 1-
38. b) Queremos que se cumpla que E ≤ 0,75 a un nivel de
confianza = 1 – α = 0,98 ; α = 0,02
Sabemos que φ(zα/2) = 1 -
2
a = 1 - 0,02
2
= 0,99 ; usando la tabla de la distribución Z → N(0,1)
, obtenemos zα/2 = 2,33
E = zα/2 .
n
s ≤ 0,75 ; sustituimos:
2,33 . 2
n
≤ 0,75 ; 2,33 . 2
0,75
≤ n ; 6,21 ≤ n elevamos al cuadrado ; 38,6 ≤ n ; Tamaño
mínimo: 39
39. El índice de resistencia a la rotura, expresado en kg, de un determinado tipo de cuerda sigue una
distribución Normal con
desviación típica 15.6 kg. Con una muestra de 5 de estas cuerdas, seleccionadas al azar, se obtuvieron los
siguientes índices:
280, 240, 270, 285, 270.
a) Obtenga un intervalo de confianza para la media del índice de resistencia a la rotura de este tipo de
cuerdas, utilizando un nivel de
confianza del 95%.
b) Si, con el mismo nivel de confianza, se desea obtener un error máximo en la estimación de la media de 5
kg, .será suficiente con elegir
una muestra de 30 cuerdas? (Propuesto para selectividad Andalucia 2005)
RESOLUCION
X = Índice de resistencia a la rotura ; X → N(μ ; 15,6) ; es decir σ = 15,6 ; n = tamaño muestral = 5
La media muestral es x =
280 240 270 285 270
5
++++
= 269
a) Nivel de confianza = 1 – α = 0,95 ; α = 0,05; Intervalo de confianza I = ( x - E , x +E) , siendo E = zα/2 .
n
s
Sabemos que φ(zα/2) = p(Z < zα/2 ) = 1-
2
a = 1- 0,05
2
= 0,975 ; usando la tabla de la distribución Z → N(0,1) , obtenemos zα/2 = 1,96
40. Para calcular el tamaño muestral, n , podemos usar que la amplitud del intervalo
de confianza es A = 2E
A = 2E = 2. zα/2 .
n
s = 2. 1,96 . 60
n
= 392,2 – 372,6 = 19,6 ; 2. 1,96 . 60
19,6
= n ; 12 = n ; n = 144
----------------------------------------------------------------------------------------------------
----------
b) n = 225 , Nivel de confianza = 1 – α = 0,869 ; α = 0,131
Sabemos que φ(zα/2) = 1 -
2
a = 1 - 0,131
2
= 0,9345 ; usando la tabla de la distribución Z → N(0,1) , obtenemos zα/2 = 1,51
El error es E = zα/2 .
n
s = 1,51 . 60
225
; E = 6,04
41. Un fabricante de pilas alcalinas sabe que el tiempo de duracion, en horas, de
las pilas que fabrica sigue una distribucion
Normal de media desconocida y varianza 3 600. Con una muestra de su
produccion, elegida al azar, y un nivel de confianza del 95 % ha
obtenido para la media el intervalo de confianza (372,6 ; 392,2).
a) Calcule el valor que obtuvo para la media de la muestra y el tamano
muestral utilizado.
b) .Cual seria el error de su estimacion, si hubiese utilizado una muestra de
tamano 225 y un nivel de confianza del 86,9 %?
(Propuesto y puesto en selectividad Andalucia 2004)
RESOLUCION
X = tiempo de duracion de las pilas ; X → N(μ ; 3600 ) = N(μ ; 60) ; es decir σ
= 60
Intervalo de confianza = I = (372,6 ; 392,2) ; Nivel de confianza = 1 – α = 0,95
; α = 0,05
Sabemos que φ(zα/2) = p(Z < zα/2 ) = 1-
2
a = 1 - 0,05
2
= 0,975 ; usando la tabla de la distribucion Z → N(0,1) , zα/2 = 1,96
a) Sabemos que la media de la muestra, x , es el punto medio del intervalo de
confianza, luego x = 372,6 392, 2
2
+ ; x = 382,4
42. b) Nos dicen que el intervalo de confianza es I = (36,8 ; 37,4) ;
tenemos que calcular el nivel de confianza = 1 - α
Usamos, por ejemplo, la amplitud del intervalo: A = 2E = 2.
zα/2 .
n
s = 2. zα/2 . 1,04
64
= 37,4 – 36,8 = 0,6
Despejando obtenemos zα/2 = 2,31 . Sustituimos en la formula
φ(zα/2) = 1-
2
a
φ(2,31) = 1 -
2
a ; buscamos en la tabla de la distribucion N(0,1) y obtenemos
que φ(2,31) = 0,9896
Luego 0,9896 = 1 -
2
a ; despejando: α = 0,0208 ; Por tanto el nivel de confianza es
1 – α = 1 – 0,0208 = 0,9792 = 97,92 %
43. En un hospital se ha tomado la temperatura a una muestra de 64 pacientes para estimar la
temperatura media de sus
enfermos. La media de la muestra ha sido 37,1 oC y se sabe que la desviación típica de
toda la población es 1,04 oC.
a) Obtenga un intervalo de confianza, al 90 %, para la media poblacional.
b) .Con que nivel de confianza podemos afirmar que la media de la población esta
comprendida entre 36,8oC y 37,4 oC?
(Propuesto para selectividad Andalucia 2003)
RESOLUCION
X = temperatura ; n = 64 ; x = 37,1 ; X → N(μ ; 1,04) , es decir σ = 1,04
a) Nivel de confianza = 1 – α = 0,9 ; α = 0,1; Intervalo de confianza I = ( x - E , x +E) , siendo
E = zα/2 .
n
s
Sabemos que φ(zα/2) = 1 -
2
a = 1 - 0,1
2
= 0,95 ; usando la tabla de la distribución Z → N(0,1) , obtenemos zα/2 = 1,645
E = 1,645 . 1,04
64
= 0,21385 ; I = (37,1 – 0,21385 ; 37,1 + 0,21385) ; I = (36,89 ; 37,31)