Ponencia II congreso Pedagógico Municipal. Municipio Torres estado Lara.
Prueba de hipotesis
1. INFERENCIA ESTADISTICA.
La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de sacar
conclusiones de una población en estudio, a partir de la información que proporciona una
muestra representativa de la misma. También es denominada Estadística Inductiva o
Inferencia Inductiva ya que es un procedimiento para generar nuevo conocimiento
científico.
CARACTERISTICAS DE LA INFERENCIA ESTADISTICA.
La muestra se obtiene por observación o experimentación. La necesidad de obtener
un subconjunto reducido de la población es obvia si se tiene presente los costes
económicos de la experimentación.
Toda inferencia inductiva exacta es imposible ya que se dispone de información de
información parcial, sin embargo es posible realizar inferencias inseguras y medir el
grado de inseguridad si el experimento se ha realizado de acuerdo con determinados
principios.
Uno de los propósitos de la inferencia Estadística es el de conseguir técnicas para
hacer inferencias inductivas y medir el grado de incertidumbre de tales inferencias.
La medida de la incertidumbre se realiza en términos de probabilidad.
CONCEPTOS BÁSICOS EN EL CONTEXTO DE LA ESTADÍSTICA.
Población: Colección de individuos o elementos que representan el objeto de interés (seres
vivos o inanimados).
Tamaño de la población: Cantidad de elementos que abarca la población. En casi todos
los textos se representa con el símbolo “N”.
Muestra: Cualquier subconjunto de la población tomado para su estudio.
Muestreo: Procedimiento mediante el cual se extrae una muestra.
Tamaño de muestra: Cantidad de elementos contenidos en la muestra. En casi todos los
textos se representa con el símbolo “n”.
Variable o característica: Es el signo o detalle que interesa caracterizar en la población.
2. El estudio de la Inferencia Estadística puede abordarse en dos apartados bien
diferenciados.
1.De acuerdo con el conocimiento sobre la distribución en la población:
Inferencia Paramétrica:
Se conoce la forma de la distribución (Normal, Binomial, Poisson, etc.....) pero se
desconocen sus parámetros. Se realizan inferencias sobre los parámetros desconocidos de la
distribución conocida.
Inferencia No Paramétrica:
Forma y parámetros desconocidos. Se realizan inferencias sobre características que no
tienen porque ser parámetros de una distribución conocida (Mediana, Estadísticos de
Orden).
2. De acuerdo con la forma en que se estudian los parámetros:
Estimación: Se intenta dar estimaciones de los parámetros desconocidos sin hacer
hipótesis previas sobre posibles valores de los mismos.
Estimación puntual: Un único valor para cada parámetro.
Estimación por intervalos: Intervalo de valores probables para el parámetro.
ESTIMACION POR INTERVALOS.
En el campo de la estadística, se denomina intervalo de confianza a un par de números
entre los cuales se estima que estará cierto valor desconocido con una determinada
probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se
calcula a partir de datos de una muestra, y el valor desconocido es un parámetro
poblacional.
La probabilidad de éxito en la estimación se representa con 1 - α y se denomina nivel de
confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación,
esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo.
El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un
intervalo más amplio tendrá más posibilidades de acierto (mayor nivel de confianza),
mientras que para un intervalo más pequeño, que ofrece una estimación más precisa,
aumentan sus posibilidades de error.
Para la construcción de un determinado intervalo de confianza es necesario conocer la
distribución teórica que sigue el parámetro a estimar, θ. Es habitual que el parámetro
presente una distribución normal. Acosta, M (2.009)
3. Por otro lado, si se tiene una muestra aleatoria X1, X2, ... , Xn , de una población con
función de densidad f(x;q) Un intervalo de confianza, de extremos L1 y L2, para el
parámetro q de la poblaciónes “un par ordenado de funciones reales de las n medidas de la
nuestra q = [L1(X1,K,X n );L1(X1,K,X n )]construidas de forma que la probabilidad de que
los extremos contengan al verdaderovalor del parámetro es un valor prefijado 1 - a.”
Al número 1 - a se le denomina “nivelde confianza”.El nivel de confianza suele ser 0,95
(95%) ó 0,99 (99%). La interpretación práctica essencilla, por ejemplo si el nivel de
confianza es del 95%, significa que en el 95% de las veces que repitiéramos el
experimento, el intervalo de confianza calculado contendría alverdadero valor del
parámetro y en el 5% restante el intervalo no contendría el verdaderovalor.
Una vez que el intervalo de confianza ha sido particularizado para una muestra concreta,
elintervalo obtenido contiene o no contiene al verdadero valor del parámetro,
conprobabilidad 1, por esa razón, cuando ya tenemos un valor concreto hablamos de
confianzay no de probabilidad. Confiamos en que el intervalo que hemos calculado sea del
95% quecontiene el verdadero valor.
Estimación por intervalos de confianza.
Una estimación por intervalos consiste en construir un intervalo alrededor de la
estimación puntual de manera que se pueda garantizar que el parámetro estimado está
dentro de dicho intervalo con una probabilidad escogida de antemano; a esa probabilidad,
representada como 1-α, se le denomina nivel de confianza, y al intervalo construido se le
llama entonces intervalo de confianza.
La construcción del intervalo de confianza se basa en encontrar el par de valores que
delimiteneste intervalo para un nivel de confianza prefijado, lo cual se basa en la
distribución muestral del estimador. El intervalo es, por tanto, de extremos variables, ya
que sus límites pueden cambiar según el resultado de la estimación puntual sobre la
muestra. El nivel de confianza lo decide elinvestigador, o el estadístico; en la práctica, en
estudios económicos y sociales, los niveles de confianza más usados suelen ser: 0.90, 0.95,
0.98, 0.99.
Al crearse el intervalo de confianza, si 1-α representa la probabilidad con que se quiere que
el mismo contenga al parámetro, α representará la probabilidad de que el verdadero valor
4. del parámetro no esté en el intervalo, y los intervalos suelen construirse de forma tal que
esta probabilidad α se reparta simétricamente, como se muestra gráficamente:
Utilizando el método habitual para la construcción de los intervalos –la repartición
simétrica dela probabilidad α a ambos lados-, cuando la distribución muestral del estimador
es a su vez simétrica –por ejemplo normal o t’Student- los límites del intervalo resultan
también simétricos respecto a la estimación puntual tomada como partida, y a la distancia
desde el centro del intervalo hasta cada límite, que simboliza con la letra d, se le denomina
entonces error máximo admitido
Por otra parte, es fácil darse cuenta al examinar las expresiones para los intervalos de
confianza que:
Mientras más grande es el tamaño de la muestra menor es el ancho del intervalo.
Para niveles de confianza (1 - α) más grandes, mayor es el ancho del intervalo.
Ambos resultados son lógicos ya que un tamaño grande de la muestra disminuirá la
varianza del estimador, y un nivel de confianza grande incrementará el valor del coeficiente
de confianza, es decir, el estadístico de la distribución de probabilidad del estimador, lo
quedará como resultado en cada caso un intervalo más amplio. Finalmente, una importante
aplicación de las expresiones para los intervalos de confianza es el empleo de éstas para
determinar el tamaño de muestra mínimo necesario para que el error en una estimación no
sobrepase un valor decidido de antemano.
LONGITUD DEL INTERVALO Y ERROR EN LA ESTIMACIÓN
5. En la práctica hemos de tratar de que la longitud del intervalo de confianza sea lo más
pequeña posible, es decir, que el error en la estimación sea lo mas pequeño posible.
Esto puede conseguirse modificando las distintas cantidades que aparecen en la fórmula: el
nivel de confianza, a través del valor crítico, la variabilidad y el tamaño muestral.
-NIVEL DE CONFIANZA
La longitud del intervalo de confianza aumenta al aumentar el nivel de confianza ya que el
valor crítico de la distribución es mayor. Si consideramos un nivel de confianza del
100%,el intervalo de confianza será [-¥;+¥] que, evidentemente contiene al verdadero valor
del parámetro pero no es de ninguna utilidad en la práctica. Si disminuimos el nivel de
confianza también disminuye la longitud, sin embargo conviene mantenerlo en unos límites
razonables que suelen ser del 95% o del 99% en la mayor parte de las aplicaciones.
-VARIANZA
La longitud del intervalo de confianza disminuye con la varianza, es decir, la estimación
será más precisa cuanto menor sea la variabilidad en la población, lo que significa que la
población es más homogénea. En la práctica es posible obtener estimaciones más precisas,
por ejemplo, restringiendo la población a conjuntos lo más homogéneos posible.
TAMAÑO MUESTRAL
La longitud del intervalo de confianza disminuye al aumentar el tamaño muestral, lo que
significa que se obtienen estimaciones más precisas cuanto mayor sea el tamaño muestral.
Debido a consideraciones prácticas de coste y tiempo, en general no es posible aumentar
indefinidamente el tamaño muestral para obtener estimaciones más precisas, es por ello que
en la práctica se selecciona el tamaño muestral necesario para obtener una determinada
precisión, establecida a priori.
EJERCICIOS PARA CALCULAR EL INTERVALO DE CONFIANZA.
Ejemplo 1.
En una determinada localidad se obtuvo la siguiente muestra aleatoria, correspondiente a
lacantidad de personas por núcleos familiares en 37 viviendas:
4256656667554428468
522554367655565461
Se quiere una estimación por intervalos de la proporción de los núcleos familiares con 4 ó
másintegrantes, para un nivel de confiabilidad del 90%.
Solución:
6. X: Núcleos familiares con 4 ó más integrantes.
Se tiene que:
pˆ = Xn/n = 31/37 = 0.84 Y: σpˆ = pq/n = 0.84 ⋅0.16 / 37 = 0.0036 = 0.060
Entonces: p = pˆ ± Z(1−α/2) pq / n = 0.84 ± 1.64(0.060) = 0.84 ± 0.0988
Por tanto el intervalo de confianza será: 0.7412 ≤ p ≤ 0.9388
Esto indica que el 90% de las veces el valor de la proporción muestral se encontrará entre
0.74
y 0.94
Ejemplo 2
En una muestra simple aleatoria de 64 piezas de un mismo tipo, extraídas de un almacén,
seencontraron 13 piezas defectuosas. Dé una estimación por intervalo con un nivel de
confianzadel 95% para la proporción de piezas defectuosas en el almacén.
Solución:
n = 64 pˆ = 13/64 = 0.20
p = pˆ ± Z(1−α/2) pq / n = 0.20 ±1.96 0.20(0.8)/ 64 = 0.20 ± 1.96 0.0025 = 0.20 ±
1.96(0.05)
O sea: p = 0.20 ± 0.098
Por tanto, el intervalo será: 0.102 ≤ p ≤ 0.298, indicando que el 95% de las veces el
verdaderovalor de la proporción poblacional se encontrará entre 0.102 y 0.298.
PRUEBA DE HIPÓTESIS
Una prueba de hipótesis suele girar en torno al valor de uno o varios parámetros
poblacionales–o al comportamiento de la distribución de la población–, sobre lo cual se
tiene alguna suposición previa basada en evidencia empírica o teórica. Para verificar si la
suposición es cierta o no se debe, entonces, tomar una muestra de la población y calcular
sobre ella una estimación del parámetro o parámetros en cuestión; a partir de esas
estimaciones, y teniendo en cuenta el comportamiento probabilístico de los estimadores
usados, se puede llegar a una conclusión sobre la suposición o hipótesis de partida.
CARACTERÍSTICAS GENERALES DE UNA PRUEBA DE HIPÓTESIS:
7. Si el desarrollo de una prueba requiere del conocimiento de parámetros o características de
la distribución de la población, se le clasifica como prueba paramétrica; si, por el
contrario, estos datos no son requeridos, se hablará de una prueba no paramétrica
En el proceso de desarrollar una prueba de hipótesis a partir de una determinada suposición,
se busca como traducir dicha suposición a términos de algún parámetro o estadígrafo, y se
formula entonces lo que se llama hipótesis estadística.
En general, una hipótesis estadística siempre se subdivide en dos: una llamada hipótesis
nula (Ho) y otra llamada hipótesis alternativa (H1).
Hipótesis nula (Ho): Es una hipótesis de diferencias nulas; lo que equivale a decir que es
una Hipótesis que contiene una igualdad o algo similar.
Hipótesis alternativa (H1): Es la hipótesis que deberá ser aceptada si la nula se rechaza, y
tiene asociado algún tipo de desigualdad estricta.
Al plantear el par de hipótesis nula y alternativa surge alguno de los tres casos siguientes:
Ho: θ = θo ( ó Ho: θ ≤ θo ) O sea, se quiere verificar si el valor del
parámetro haaumentado, contraponiendo
H1: θ > θo esto a que se mantieneigual, o incluso
disminuyó.
Ho: θ = θo ( ó Ho: θ ≥ θo ) O sea, se quiere verificar si el valor del
parámetro hadisminuido, contraponiendo
H1: θ < θo esto a que se mantieneigual, o incluso
aumentó.
O sea, se quiere verificar si el valor del
parámetro havariado en algún sentido,
Ho: θ = θo contraponiendo esto a quese mantiene
H1: θ ≠ θo igual.
Comúnmente la hipótesis alternativa representa la hipótesis de investigación, lo que se
deseaverificar después de algún cambio en el sistema en estudio, y suele ser en muchos
casos la quese formula primero; la hipótesis nula, por el contrario, se asocia a la situación
8. que existía hastael momento del cambio, a lo ya conocido; por ello es esta última es la que
recoge la igualdad,estricta o no.En muchos casos Ho se formula con la intención expresa de
ser rechazada, ya que si Ho serechaza ello implica que H1 se acepta.
La decisión estadística se basa en estimaciones efectuadas sobre la muestra
aleatoriatomada, todo lo cual da lugar a los siguientes conceptos:
Estadístico o estadígrafo de prueba: Es el estimador (θˆ ), o alguna transformación de
éste,que se utiliza para tomar una decisión respecto al comportamiento del parámetro en
estudio.
Valor crítico (C o θc): Es un valor numérico que se calcula a partir del dato histórico
conocido yde la distribución probabilística del estimador, para que el estadígrafo de prueba
se comparecon él y se pueda tomar una decisión.La necesidad del valor crítico puede
entenderse por el hecho de que el estadígrafo de prueba,al ser el resultado de una
estimación, no se debe comparar directamente con el dato histórico,sino que se debe dejar
una especie de margen para los posibles errores de estimación.
Región crítica ó región de rechazo (W o Wc): Es el conjunto de valores del estadístico
deprueba a partir de los cuales se rechaza la hipótesis nula.La distribución del estadístico de
prueba se divide en dos partes la región de rechazo y la regiónde no rechazo o aceptación,
estando separadas ambas regiones por el valor crítico.La ubicación de la región crítica
respecto al dato histórico depende de la hipótesis alternativa, ypuede ser unilateral (a la
derecha o a la izquierda) o bilateral (a ambos lados), como serepresenta en los siguientes
esquemas:
Caso del posible aumento:
Si θˆ>θc, se rechazaría H0, adoptándose
H1; pero si θˆ ≤ θc, aunque sea θˆ > θ0,
no hay evidencia de un aumento
significativo.
Caso de posible reducción: Si θˆ <θc,
se rechazaría H0, adoptándose H1; pero si
θˆ ≥ θc, aunque sea θˆ < θ0, no hay
evidencia de una reducción significativa.
Caso de posible variación: Si θˆ < θc1 ó
θˆ> θc2, se rechazaría H0, adoptándose
H1; pero si θc1 ≤θˆ ≤ θc2, aun si θˆ ≠ θ0,
no hay evidencia de variación
significativa.
9. Planteamiento de la hipótesis estadística
La Hipótesis es la respuesta tentativa para la solución de la pregunta de investigación.
Al realizar inferencias estadísticas, se acostumbra adoptar un modelo de decisión. Este
modelo constade cuatro elementos:
Hipótesis nula (H0)
Hipótesis alterna (H1)
Nivel de significancia que ha de utilizarse en la prueba estadística
Regla de decisión
Hipótesis para Problemas de Comparación
En la prueba de hipótesis se trabaja con dos hipótesis estadísticas que deben
enunciarseexplícitamente: la hipótesis que debe probarse o hipótesis nula que se establece
con el propósito deser rechazada, y la hipótesis alterna que es la conclusión a la que se
espera llegar.
Con un nivel intervalar o de razón de la V. D. se comparan medias, la hipótesis nula plantea
que lasdos medias son iguales:
H0: X 1 = X 2
y la hipótesis alterna plantea que las medias son diferentes:
H1: X 1 ≠ X 2
Otro planteamiento sería:
H0: X 1 – X 2 = 0
Cuando se tienen medianas (nivel ordinal de la V. D.), entonces:
H0: Md1 = Md2
H1: Md1 Md2
O con proporciones o porcentajes (nivel nominal de la V. D.):
H0: P1 = P2
10. H1: P1 P2
Hipótesis para Problemas de Asociación
Cuando se tiene un problema de asociación la hipótesis nula niega la correlación:
H0: r = 0
La hipótesis alterna afirma que hay correlación:
H1: r 0
Construcción de hipótesis de acuerdo al nivel de medición
Las hipótesis estadísticas tienen que incluir la variable dependiente en primer lugar y
laindependiente en seguida. Para la redacción de dichas hipótesis se toma en cuenta el nivel
demedición utilizado de las variables del estudio.
Para los problemas de comparación:
Nivel NOMINAL: Aquí se habla de proporciones y / o categorías.
¿Cómo es la relación entre fumar o no y morir por cáncer pulmonar?
H0: La proporción de sujetos que mueren por cáncer pulmonar es igual entre fumadores y
nofumadores.
H1: La proporción de sujetos que mueren por cáncer pulmonar es diferente entre fumadores
y no
Fumadores.
Nivel ORDINAL: Aquí se habla de jerarquías y / o niveles.
¿Cómo es el nivel de creatividad entre los niños de comunidades rurales, urbanas e
indígenas?
H0: El nivel de creatividad es igual entre niños de comunidades rurales, urbanas e
indígenas.
H1: El nivel de creatividad es diferente entre niños de comunidades rurales, urbanas e
indígenas.
Nivel INTERVALAR: Se comparan las medias y también se habla de niveles.
Se desea conocer cómo el nivel de estrés de los sujetos afecta su nivel de irritabilidad hacia
suscompañeros de trabajo. Para ello se conformaron tres grupos, bajo estrés, estrés regular
y alto estrés,con 7 profesionistas cada uno, a quienes se les evaluó su nivel de irritabilidad
11. preguntándoles en unaescala de 0 a 10 que indique: “cotidianamente ¿qué tan irritable se
muestra con sus compañeros detrabajo?”
H0: El nivel de irritabilidad hacia los compañeros de trabajo es igual entre los tres grupos
de estrés.
H1: El nivel de irritabilidad hacia los compañeros de trabajo es diferente entre los tres
grupos deestrés.
Para el caso de los problemas de asociación se identifica la relación entre las variables, y
elconcepto de asociación o relación se debe incluir en las hipótesis.
¿Qué relación hay entre la edad en años de los sujetos y su inteligencia?
H0: No hay asociación lineal entre la edad y la inteligencia.
H1: Hay asociación lineal entre la edad y la inteligencia.
NOTA: La hipótesis alterna no se acepta ni se rechaza, es la hipótesis nula la que se somete
a prueba.
Los planteamientos anteriores se refieren a pruebas de dos colas, que son problemas en los
que no esposible anticipar la dirección de las diferencias, es decir, no se sabe cuál grupo es
el que tendrá elnivel o la proporción de casos mayor, o cual es el sentido de la relación
entre variables.
Sin embargo, pueden existir hipótesis alternas en las que se puede anticipar cual grupo
presenta unadesviación mayor o menor con respecto al otro. Este tipo se refiere a
problemas de una cola odirección.
En estos casos, con un nivel intervalar o de razón de la V. D., la hipótesis nula plantea que
las dosmedias son iguales:
H0: X 1 = X 2
y la hipótesis alterna plantea que un grupo tiene una media mayor o menor que otro u otros:
H1: X 1 >X 2
H1: X 1 <X 2
Cuando se tienen medianas (nivel ordinal de la V. D.), entonces:
H0: Md1 = Md2
12. H1: Md1 >Md2
óH1: Md1 <Md2
O con proporciones o porcentajes (nivel nominal de la V. D.):
H0: P1 = P2
H1: P1 >P2
óH1: P1 <P2
Para esta guía se presentarán únicamente planteamientos para hipótesis de dos colas.
¿Cuál es el sentido del nivel de significancia o la probabilidad?
La probabilidad (p) de que un evento ocurra oscila entre 0 y 1, donde 0 significa la
imposibilidad deocurrencia y 1 la certeza de que ocurra el fenómeno. Al lanzar al aire una
moneda no cargada, laprobabilidad de que salga “águila” es de 0.5 y la probabilidad de que
la moneda caiga en “sol”también es de 0.5. Con un dado, la probabilidad de obtener
cualquiera de sus lados al lanzarlo es de1/6=0.1667. La suma de probabilidades siempre es
de 1.
Aplicando el concepto de la probabilidad a la distribución muestral, el área de ésta
corresponde a laprobabilidad total (p = 1), y consecuentemente, cualquier área (porcentaje
bajo la curva) comprendidaentre dos puntos de la distribución corresponderá a la
probabilidad de la distribución al convertirla a proporciones (por ejemplo 25% = 0.25).
Para probar hipótesis inferenciales utilizando la media, el investigador debe evaluar si es
alta o baja la probabilidad de que la media de la muestra esté cerca de la media de la
distribución poblacional. Si es baja, el investigador dudará de generalizar a la población. Si
es alta el investigador podrá hacer generalizaciones. Es aquí donde entra el nivel de
significancia o nivel . El nivel es la probabilidad de equivocarse al probar las hipótesis
estadísticas.
El nivel de significancia de 0.05, implica que el investigador tiene un 95% de seguridad
para generalizar sin equivocarse y sólo 5% en contra. Este es el más utilizado en
investigación en Psicología, aunque se pueden utilizar niveles más bajos (0.01 o 0.001)
cuando se requiere un mayor grado de certeza.
Decisión estadística
La decisión e interpretación de un análisis estadístico se basa en la aceptación o rechazo de
la hipótesis nula, están estrechamente relacionados con la curva normal y las puntuaciones
z, una vez elegida la prueba estadística adecuada al nivel de medición y haber redactado la
13. hipótesis nula, se debe establecer un nivel de significancia o de certeza para rechazar esta
última sin cometer el error llamado del tipo I o , que se refiere a rechazar la hipótesis nula
siendo verdadera. En psicología normalmente se establece el nivel de significancia de 0.05
que, como se mencionó anteriormente, representa un 95% de certeza de generalizar los
resultados sin equivocarse. En este sentido, la decisión estadística es una decisión
probabilística. Si se desea mayor certeza, se debe utilizar otro nivel de significancia, como
puede ser a 0.01 que proporciona una certeza de 99% para generalizar los resultados sin
error, o a 0.001 que equivale al 99.9%.
Existe otro tipo de error el tipo II o , que al contrario del error I se refiere a aceptar la
hipótesis nula siendo falsa, en términos de decisión estadística es más grave cometer el
error tipo I, ya que afirmaríamos que hay diferencias entre los grupos cuando esto no es
verdad. Es una situación a la que es fácil llegar pues normalmente se espera que la
intervención que se haga sea la causa de las diferencias entre grupos.
Al representar el nivel de significancia bajo la curva normal se tienen un área de aceptación
de la hipótesis nula y una zona de rechazo, para una hipótesis de colas se reparte la
significancia entre los dos extremos de la curva y para la de una cola se considera sólo el
extremo positivo o negativo dependiendo de cuál es el grupo que se espera que tenga un
nivel o proporción mayor.
Al traducir las áreas a probabilidad, se tiene que hay un 0.05 de posibilidad para
equivocarse al rechazar la hipótesis nula. Entre menor sea el área de rechazo se tendrá más
certeza para generalizar los resultados a la población.
Para una prueba de dos colas, en términos de puntajes z, a 1.96 desviaciones estándar se
tiene el 95% del área bajo la curva en la región de aceptación de la hipótesis nula y el 5% o
0.05 de significancia () en la zona de rechazo, en 2.58 desviac iones el 99% ( = 0.01) y
en de 3.90 desviaciones el 99.9% ( = 0.001)
Para una prueba de una cola, a 1.64 desviaciones estándar en sentido negativo o positivo, se
tiene el95% del área bajo la curva en la región de aceptación de la hipótesis nula y el 5% o
0.05 designificancia () en la zona de rechazo, en 2.32 desviaciones el 99% ( = 0.01) y
en 3.70desviaciones el 99.9% ( = 0.001)
Para conocer si el valor de una prueba estadística permite rechazar la hipótesis nula, se
tiene queentre mayor sea este valor se entra más a la zona de rechazo de la hipótesis nula,
sin embargo, para lamayoría de las pruebas se debe considerar además en la decisión a los
grados de libertad, el númerode casos o se compara la probabilidad directamente.
Zona de Aceptación al
95% para una prueba dedos colas
14. 2.5 % 2.5 %
Zona de rechazo (5%)
Zona de Aceptación al 95%
para una prueba de una cola
en sentido positivo
5%
5%
Zona de rechazo (5%)
Zona de Aceptación al 95%para una prueba de una colaen sentido negativo
Grados de libertad
Son la libertad de variaciones que puede tener una variable, suponiendo que se tuvieran 4
puntuaciones cuya media es igual a 10 al tener los valores de las tres primeras, la última
estará determinada por las primeras, por ejemplo: 7, 12, 15, la última puntuación
necesariamente es 6. La cantidad de comparaciones independientes se determina a partir de
los grados de libertad, que normalmente se calcula teniendo el tamaño de la muestra menos
uno (gl= n – 1). Sin embargo los grados de libertad se obtienen de manera diferente para
cada prueba, por lo que se debe estar atento a cada uno de los procedimientos.
Reglas de decisión
El valor de las pruebas estadísticas se debe comparar con uno obtenido, con relación al
nivel de significancia y los grados de libertad, de una tabla de valores críticos. La regla de
decisión en estos casos es: el valor de la prueba debe ser mayor o igual al de la tabla
para rechazar la hipótesis nula. Esta regla puede cambiar, por lo que es necesario revisar
la regla de decisión especifica de cada procedimiento.
Los paquetes estadísticos presentan los valores de cada prueba junto con algunos datos
necesarios para el cálculo de ésta (medias o porcentajes, el número de casos, los grados de
libertad, etc.) y el nivel de significancia o probabilidad, éste representa la posición del valor
del estadístico en el área de rechazo, o aceptación, de la hipótesis nula.
Como regla de decisión, observando los resultados del paquete estadístico, a un nivel de
significancia establecido en 0.05: Si la probabilidad o nivel de significancia es menor o
igual a 0.05 se rechaza la hipótesis nula.