SlideShare une entreprise Scribd logo
1  sur  15
INFERENCIA ESTADISTICA.

La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de sacar
conclusiones de una población en estudio, a partir de la información que proporciona una
muestra representativa de la misma. También es denominada Estadística Inductiva o
Inferencia Inductiva ya que es un procedimiento para generar nuevo conocimiento
científico.

CARACTERISTICAS DE LA INFERENCIA ESTADISTICA.

       La muestra se obtiene por observación o experimentación. La necesidad de obtener
       un subconjunto reducido de la población es obvia si se tiene presente los costes
       económicos de la experimentación.

       Toda inferencia inductiva exacta es imposible ya que se dispone de información de
       información parcial, sin embargo es posible realizar inferencias inseguras y medir el
       grado de inseguridad si el experimento se ha realizado de acuerdo con determinados
       principios.

       Uno de los propósitos de la inferencia Estadística es el de conseguir técnicas para
       hacer inferencias inductivas y medir el grado de incertidumbre de tales inferencias.



        La medida de la incertidumbre se realiza en términos de probabilidad.

         CONCEPTOS BÁSICOS EN EL CONTEXTO DE LA ESTADÍSTICA.

Población: Colección de individuos o elementos que representan el objeto de interés (seres
vivos o inanimados).

Tamaño de la población: Cantidad de elementos que abarca la población. En casi todos
los textos se representa con el símbolo “N”.

Muestra: Cualquier subconjunto de la población tomado para su estudio.

Muestreo: Procedimiento mediante el cual se extrae una muestra.

Tamaño de muestra: Cantidad de elementos contenidos en la muestra. En casi todos los
textos se representa con el símbolo “n”.

Variable o característica: Es el signo o detalle que interesa caracterizar en la población.
El estudio de la Inferencia Estadística puede abordarse en dos apartados bien
diferenciados.

1.De acuerdo con el conocimiento sobre la distribución en la población:

       Inferencia Paramétrica:

Se conoce la forma de la distribución (Normal, Binomial, Poisson, etc.....) pero se
desconocen sus parámetros. Se realizan inferencias sobre los parámetros desconocidos de la
distribución conocida.

       Inferencia No Paramétrica:

Forma y parámetros desconocidos. Se realizan inferencias sobre características que no
tienen porque ser parámetros de una distribución conocida (Mediana, Estadísticos de
Orden).

2. De acuerdo con la forma en que se estudian los parámetros:

       Estimación: Se intenta dar estimaciones de los parámetros desconocidos sin hacer
       hipótesis previas sobre posibles valores de los mismos.
       Estimación puntual: Un único valor para cada parámetro.
       Estimación por intervalos: Intervalo de valores probables para el parámetro.

                              ESTIMACION POR INTERVALOS.

En el campo de la estadística, se denomina intervalo de confianza a un par de números
entre los cuales se estima que estará cierto valor desconocido con una determinada
probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se
calcula a partir de datos de una muestra, y el valor desconocido es un parámetro
poblacional.

La probabilidad de éxito en la estimación se representa con 1 - α y se denomina nivel de
confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación,
esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo.

El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un
intervalo más amplio tendrá más posibilidades de acierto (mayor nivel de confianza),
mientras que para un intervalo más pequeño, que ofrece una estimación más precisa,
aumentan sus posibilidades de error.

Para la construcción de un determinado intervalo de confianza es necesario conocer la
distribución teórica que sigue el parámetro a estimar, θ. Es habitual que el parámetro
presente una distribución normal. Acosta, M (2.009)
Por otro lado, si se tiene una muestra aleatoria X1, X2, ... , Xn , de una población con
función de densidad f(x;q) Un intervalo de confianza, de extremos L1 y L2, para el
parámetro q de la poblaciónes “un par ordenado de funciones reales de las n medidas de la
nuestra q = [L1(X1,K,X n );L1(X1,K,X n )]construidas de forma que la probabilidad de que
los extremos contengan al verdaderovalor del parámetro es un valor prefijado 1 - a.”

 Al número 1 - a se le denomina “nivelde confianza”.El nivel de confianza suele ser 0,95
(95%) ó 0,99 (99%). La interpretación práctica essencilla, por ejemplo si el nivel de
confianza es del 95%, significa que en el 95% de las veces que repitiéramos el
experimento, el intervalo de confianza calculado contendría alverdadero valor del
parámetro y en el 5% restante el intervalo no contendría el verdaderovalor.

Una vez que el intervalo de confianza ha sido particularizado para una muestra concreta,
elintervalo obtenido contiene o no contiene al verdadero valor del parámetro,
conprobabilidad 1, por esa razón, cuando ya tenemos un valor concreto hablamos de
confianzay no de probabilidad. Confiamos en que el intervalo que hemos calculado sea del
95% quecontiene el verdadero valor.

Estimación por intervalos de confianza.

Una estimación por intervalos consiste en construir un intervalo alrededor de la
estimación puntual de manera que se pueda garantizar que el parámetro estimado está
dentro de dicho intervalo con una probabilidad escogida de antemano; a esa probabilidad,
representada como 1-α, se le denomina nivel de confianza, y al intervalo construido se le
llama entonces intervalo de confianza.




La construcción del intervalo de confianza se basa en encontrar el par de valores que
delimiteneste intervalo para un nivel de confianza prefijado, lo cual se basa en la
distribución muestral del estimador. El intervalo es, por tanto, de extremos variables, ya
que sus límites pueden cambiar según el resultado de la estimación puntual sobre la
muestra. El nivel de confianza lo decide elinvestigador, o el estadístico; en la práctica, en
estudios económicos y sociales, los niveles de confianza más usados suelen ser: 0.90, 0.95,
0.98, 0.99.

Al crearse el intervalo de confianza, si 1-α representa la probabilidad con que se quiere que
el mismo contenga al parámetro, α representará la probabilidad de que el verdadero valor
del parámetro no esté en el intervalo, y los intervalos suelen construirse de forma tal que
esta probabilidad α se reparta simétricamente, como se muestra gráficamente:




Utilizando el método habitual para la construcción de los intervalos –la repartición
simétrica dela probabilidad α a ambos lados-, cuando la distribución muestral del estimador
es a su vez simétrica –por ejemplo normal o t’Student- los límites del intervalo resultan
también simétricos respecto a la estimación puntual tomada como partida, y a la distancia
desde el centro del intervalo hasta cada límite, que simboliza con la letra d, se le denomina
entonces error máximo admitido




Por otra parte, es fácil darse cuenta al examinar las expresiones para los intervalos de
confianza que:

       Mientras más grande es el tamaño de la muestra menor es el ancho del intervalo.
       Para niveles de confianza (1 - α) más grandes, mayor es el ancho del intervalo.

Ambos resultados son lógicos ya que un tamaño grande de la muestra disminuirá la
varianza del estimador, y un nivel de confianza grande incrementará el valor del coeficiente
de confianza, es decir, el estadístico de la distribución de probabilidad del estimador, lo
quedará como resultado en cada caso un intervalo más amplio. Finalmente, una importante
aplicación de las expresiones para los intervalos de confianza es el empleo de éstas para
determinar el tamaño de muestra mínimo necesario para que el error en una estimación no
sobrepase un valor decidido de antemano.

LONGITUD DEL INTERVALO Y ERROR EN LA ESTIMACIÓN
En la práctica hemos de tratar de que la longitud del intervalo de confianza sea lo más
pequeña posible, es decir, que el error en la estimación sea lo mas pequeño posible.

Esto puede conseguirse modificando las distintas cantidades que aparecen en la fórmula: el
nivel de confianza, a través del valor crítico, la variabilidad y el tamaño muestral.

-NIVEL DE CONFIANZA

La longitud del intervalo de confianza aumenta al aumentar el nivel de confianza ya que el
valor crítico de la distribución es mayor. Si consideramos un nivel de confianza del
100%,el intervalo de confianza será [-¥;+¥] que, evidentemente contiene al verdadero valor
del parámetro pero no es de ninguna utilidad en la práctica. Si disminuimos el nivel de
confianza también disminuye la longitud, sin embargo conviene mantenerlo en unos límites
razonables que suelen ser del 95% o del 99% en la mayor parte de las aplicaciones.

-VARIANZA

La longitud del intervalo de confianza disminuye con la varianza, es decir, la estimación
será más precisa cuanto menor sea la variabilidad en la población, lo que significa que la
población es más homogénea. En la práctica es posible obtener estimaciones más precisas,
por ejemplo, restringiendo la población a conjuntos lo más homogéneos posible.

TAMAÑO MUESTRAL

La longitud del intervalo de confianza disminuye al aumentar el tamaño muestral, lo que
significa que se obtienen estimaciones más precisas cuanto mayor sea el tamaño muestral.
Debido a consideraciones prácticas de coste y tiempo, en general no es posible aumentar
indefinidamente el tamaño muestral para obtener estimaciones más precisas, es por ello que
en la práctica se selecciona el tamaño muestral necesario para obtener una determinada
precisión, establecida a priori.

EJERCICIOS PARA CALCULAR EL INTERVALO DE CONFIANZA.

Ejemplo 1.

En una determinada localidad se obtuvo la siguiente muestra aleatoria, correspondiente a
lacantidad de personas por núcleos familiares en 37 viviendas:

4256656667554428468

522554367655565461

Se quiere una estimación por intervalos de la proporción de los núcleos familiares con 4 ó
másintegrantes, para un nivel de confiabilidad del 90%.

Solución:
X: Núcleos familiares con 4 ó más integrantes.

Se tiene que:

pˆ = Xn/n = 31/37 = 0.84 Y: σpˆ = pq/n = 0.84 ⋅0.16 / 37 = 0.0036 = 0.060

Entonces: p = pˆ ± Z(1−α/2) pq / n = 0.84 ± 1.64(0.060) = 0.84 ± 0.0988

Por tanto el intervalo de confianza será: 0.7412 ≤ p ≤ 0.9388

Esto indica que el 90% de las veces el valor de la proporción muestral se encontrará entre
0.74

y 0.94

Ejemplo 2

En una muestra simple aleatoria de 64 piezas de un mismo tipo, extraídas de un almacén,
seencontraron 13 piezas defectuosas. Dé una estimación por intervalo con un nivel de
confianzadel 95% para la proporción de piezas defectuosas en el almacén.

Solución:

n = 64 pˆ = 13/64 = 0.20

p = pˆ ± Z(1−α/2) pq / n = 0.20 ±1.96 0.20(0.8)/ 64 = 0.20 ± 1.96 0.0025 = 0.20 ±
1.96(0.05)

O sea: p = 0.20 ± 0.098

Por tanto, el intervalo será: 0.102 ≤ p ≤ 0.298, indicando que el 95% de las veces el
verdaderovalor de la proporción poblacional se encontrará entre 0.102 y 0.298.



                                PRUEBA DE HIPÓTESIS

Una prueba de hipótesis suele girar en torno al valor de uno o varios parámetros
poblacionales–o al comportamiento de la distribución de la población–, sobre lo cual se
tiene alguna suposición previa basada en evidencia empírica o teórica. Para verificar si la
suposición es cierta o no se debe, entonces, tomar una muestra de la población y calcular
sobre ella una estimación del parámetro o parámetros en cuestión; a partir de esas
estimaciones, y teniendo en cuenta el comportamiento probabilístico de los estimadores
usados, se puede llegar a una conclusión sobre la suposición o hipótesis de partida.

CARACTERÍSTICAS GENERALES DE UNA PRUEBA DE HIPÓTESIS:
Si el desarrollo de una prueba requiere del conocimiento de parámetros o características de
la distribución de la población, se le clasifica como prueba paramétrica; si, por el
contrario, estos datos no son requeridos, se hablará de una prueba no paramétrica

En el proceso de desarrollar una prueba de hipótesis a partir de una determinada suposición,
se busca como traducir dicha suposición a términos de algún parámetro o estadígrafo, y se
formula entonces lo que se llama hipótesis estadística.

En general, una hipótesis estadística siempre se subdivide en dos: una llamada hipótesis
nula (Ho) y otra llamada hipótesis alternativa (H1).

Hipótesis nula (Ho): Es una hipótesis de diferencias nulas; lo que equivale a decir que es
una Hipótesis que contiene una igualdad o algo similar.

Hipótesis alternativa (H1): Es la hipótesis que deberá ser aceptada si la nula se rechaza, y
tiene asociado algún tipo de desigualdad estricta.

Al plantear el par de hipótesis nula y alternativa surge alguno de los tres casos siguientes:



Ho: θ = θo ( ó Ho: θ ≤ θo )                        O sea, se quiere verificar si el valor del
                                                   parámetro haaumentado, contraponiendo
H1: θ > θo                                         esto a que se mantieneigual, o incluso
                                                   disminuyó.



Ho: θ = θo ( ó Ho: θ ≥ θo )                        O sea, se quiere verificar si el valor del
                                                   parámetro hadisminuido, contraponiendo
H1: θ < θo                                         esto a que se mantieneigual, o incluso
                                                   aumentó.



                                                   O sea, se quiere verificar si el valor del
                                                   parámetro havariado en algún sentido,
Ho: θ = θo                                         contraponiendo esto a quese mantiene
H1: θ ≠ θo                                         igual.



Comúnmente la hipótesis alternativa representa la hipótesis de investigación, lo que se
deseaverificar después de algún cambio en el sistema en estudio, y suele ser en muchos
casos la quese formula primero; la hipótesis nula, por el contrario, se asocia a la situación
que existía hastael momento del cambio, a lo ya conocido; por ello es esta última es la que
recoge la igualdad,estricta o no.En muchos casos Ho se formula con la intención expresa de
ser rechazada, ya que si Ho serechaza ello implica que H1 se acepta.

La decisión estadística se basa en estimaciones efectuadas sobre la muestra
aleatoriatomada, todo lo cual da lugar a los siguientes conceptos:

Estadístico o estadígrafo de prueba: Es el estimador (θˆ ), o alguna transformación de
éste,que se utiliza para tomar una decisión respecto al comportamiento del parámetro en
estudio.

Valor crítico (C o θc): Es un valor numérico que se calcula a partir del dato histórico
conocido yde la distribución probabilística del estimador, para que el estadígrafo de prueba
se comparecon él y se pueda tomar una decisión.La necesidad del valor crítico puede
entenderse por el hecho de que el estadígrafo de prueba,al ser el resultado de una
estimación, no se debe comparar directamente con el dato histórico,sino que se debe dejar
una especie de margen para los posibles errores de estimación.

Región crítica ó región de rechazo (W o Wc): Es el conjunto de valores del estadístico
deprueba a partir de los cuales se rechaza la hipótesis nula.La distribución del estadístico de
prueba se divide en dos partes la región de rechazo y la regiónde no rechazo o aceptación,
estando separadas ambas regiones por el valor crítico.La ubicación de la región crítica
respecto al dato histórico depende de la hipótesis alternativa, ypuede ser unilateral (a la
derecha o a la izquierda) o bilateral (a ambos lados), como serepresenta en los siguientes
esquemas:

Caso del posible aumento:

Si θˆ>θc, se rechazaría H0, adoptándose
H1; pero si θˆ ≤ θc, aunque sea θˆ > θ0,
no hay evidencia de un aumento
significativo.

Caso de posible reducción: Si θˆ <θc,

se rechazaría H0, adoptándose H1; pero si
θˆ ≥ θc, aunque sea θˆ < θ0, no hay
evidencia de una reducción significativa.
Caso de posible variación: Si θˆ < θc1 ó

θˆ> θc2, se rechazaría H0, adoptándose
H1; pero si θc1 ≤θˆ ≤ θc2, aun si θˆ ≠ θ0,
no hay evidencia de variación
significativa.
Planteamiento de la hipótesis estadística

La Hipótesis es la respuesta tentativa para la solución de la pregunta de investigación.

Al realizar inferencias estadísticas, se acostumbra adoptar un modelo de decisión. Este
modelo constade cuatro elementos:

       Hipótesis nula (H0)
       Hipótesis alterna (H1)
       Nivel de significancia que ha de utilizarse en la prueba estadística
       Regla de decisión

Hipótesis para Problemas de Comparación

En la prueba de hipótesis se trabaja con dos hipótesis estadísticas que deben
enunciarseexplícitamente: la hipótesis que debe probarse o hipótesis nula que se establece
con el propósito deser rechazada, y la hipótesis alterna que es la conclusión a la que se
espera llegar.

Con un nivel intervalar o de razón de la V. D. se comparan medias, la hipótesis nula plantea
que lasdos medias son iguales:

H0: X 1 = X 2

y la hipótesis alterna plantea que las medias son diferentes:

H1: X 1 ≠ X 2

Otro planteamiento sería:

H0: X 1 – X 2 = 0

Cuando se tienen medianas (nivel ordinal de la V. D.), entonces:

H0: Md1 = Md2

H1: Md1 Md2

O con proporciones o porcentajes (nivel nominal de la V. D.):

H0: P1 = P2
H1: P1 P2

Hipótesis para Problemas de Asociación

Cuando se tiene un problema de asociación la hipótesis nula niega la correlación:

H0: r = 0

La hipótesis alterna afirma que hay correlación:

H1: r  0

Construcción de hipótesis de acuerdo al nivel de medición

Las hipótesis estadísticas tienen que incluir la variable dependiente en primer lugar y
laindependiente en seguida. Para la redacción de dichas hipótesis se toma en cuenta el nivel
demedición utilizado de las variables del estudio.

Para los problemas de comparación:

Nivel NOMINAL: Aquí se habla de proporciones y / o categorías.

¿Cómo es la relación entre fumar o no y morir por cáncer pulmonar?

H0: La proporción de sujetos que mueren por cáncer pulmonar es igual entre fumadores y
nofumadores.

H1: La proporción de sujetos que mueren por cáncer pulmonar es diferente entre fumadores
y no

Fumadores.

Nivel ORDINAL: Aquí se habla de jerarquías y / o niveles.

¿Cómo es el nivel de creatividad entre los niños de comunidades rurales, urbanas e
indígenas?

H0: El nivel de creatividad es igual entre niños de comunidades rurales, urbanas e
indígenas.

H1: El nivel de creatividad es diferente entre niños de comunidades rurales, urbanas e
indígenas.

Nivel INTERVALAR: Se comparan las medias y también se habla de niveles.

Se desea conocer cómo el nivel de estrés de los sujetos afecta su nivel de irritabilidad hacia
suscompañeros de trabajo. Para ello se conformaron tres grupos, bajo estrés, estrés regular
y alto estrés,con 7 profesionistas cada uno, a quienes se les evaluó su nivel de irritabilidad
preguntándoles en unaescala de 0 a 10 que indique: “cotidianamente ¿qué tan irritable se
muestra con sus compañeros detrabajo?”

H0: El nivel de irritabilidad hacia los compañeros de trabajo es igual entre los tres grupos
de estrés.

H1: El nivel de irritabilidad hacia los compañeros de trabajo es diferente entre los tres
grupos deestrés.



Para el caso de los problemas de asociación se identifica la relación entre las variables, y
elconcepto de asociación o relación se debe incluir en las hipótesis.

¿Qué relación hay entre la edad en años de los sujetos y su inteligencia?

H0: No hay asociación lineal entre la edad y la inteligencia.

H1: Hay asociación lineal entre la edad y la inteligencia.

NOTA: La hipótesis alterna no se acepta ni se rechaza, es la hipótesis nula la que se somete
a prueba.

Los planteamientos anteriores se refieren a pruebas de dos colas, que son problemas en los
que no esposible anticipar la dirección de las diferencias, es decir, no se sabe cuál grupo es
el que tendrá elnivel o la proporción de casos mayor, o cual es el sentido de la relación
entre variables.

Sin embargo, pueden existir hipótesis alternas en las que se puede anticipar cual grupo
presenta unadesviación mayor o menor con respecto al otro. Este tipo se refiere a
problemas de una cola odirección.

En estos casos, con un nivel intervalar o de razón de la V. D., la hipótesis nula plantea que
las dosmedias son iguales:

H0: X 1 = X 2

y la hipótesis alterna plantea que un grupo tiene una media mayor o menor que otro u otros:

H1: X 1 >X 2

H1: X 1 <X 2

Cuando se tienen medianas (nivel ordinal de la V. D.), entonces:

H0: Md1 = Md2
H1: Md1 >Md2

óH1: Md1 <Md2

O con proporciones o porcentajes (nivel nominal de la V. D.):

H0: P1 = P2

H1: P1 >P2

óH1: P1 <P2

Para esta guía se presentarán únicamente planteamientos para hipótesis de dos colas.

¿Cuál es el sentido del nivel de significancia o la probabilidad?

La probabilidad (p) de que un evento ocurra oscila entre 0 y 1, donde 0 significa la
imposibilidad deocurrencia y 1 la certeza de que ocurra el fenómeno. Al lanzar al aire una
moneda no cargada, laprobabilidad de que salga “águila” es de 0.5 y la probabilidad de que
la moneda caiga en “sol”también es de 0.5. Con un dado, la probabilidad de obtener
cualquiera de sus lados al lanzarlo es de1/6=0.1667. La suma de probabilidades siempre es
de 1.

Aplicando el concepto de la probabilidad a la distribución muestral, el área de ésta
corresponde a laprobabilidad total (p = 1), y consecuentemente, cualquier área (porcentaje
bajo la curva) comprendidaentre dos puntos de la distribución corresponderá a la
probabilidad de la distribución al convertirla a proporciones (por ejemplo 25% = 0.25).

Para probar hipótesis inferenciales utilizando la media, el investigador debe evaluar si es
alta o baja la probabilidad de que la media de la muestra esté cerca de la media de la
distribución poblacional. Si es baja, el investigador dudará de generalizar a la población. Si
es alta el investigador podrá hacer generalizaciones. Es aquí donde entra el nivel de
significancia o nivel . El nivel es la probabilidad de equivocarse al probar las hipótesis
estadísticas.

El nivel de significancia de 0.05, implica que el investigador tiene un 95% de seguridad
para generalizar sin equivocarse y sólo 5% en contra. Este es el más utilizado en
investigación en Psicología, aunque se pueden utilizar niveles más bajos (0.01 o 0.001)
cuando se requiere un mayor grado de certeza.

Decisión estadística

La decisión e interpretación de un análisis estadístico se basa en la aceptación o rechazo de
la hipótesis nula, están estrechamente relacionados con la curva normal y las puntuaciones
z, una vez elegida la prueba estadística adecuada al nivel de medición y haber redactado la
hipótesis nula, se debe establecer un nivel de significancia o de certeza para rechazar esta
última sin cometer el error llamado del tipo I o , que se refiere a rechazar la hipótesis nula
siendo verdadera. En psicología normalmente se establece el nivel de significancia de 0.05
que, como se mencionó anteriormente, representa un 95% de certeza de generalizar los
resultados sin equivocarse. En este sentido, la decisión estadística es una decisión
probabilística. Si se desea mayor certeza, se debe utilizar otro nivel de significancia, como
puede ser a 0.01 que proporciona una certeza de 99% para generalizar los resultados sin
error, o a 0.001 que equivale al 99.9%.

Existe otro tipo de error el tipo II o , que al contrario del error I se refiere a aceptar la
hipótesis nula siendo falsa, en términos de decisión estadística es más grave cometer el
error tipo I, ya que afirmaríamos que hay diferencias entre los grupos cuando esto no es
verdad. Es una situación a la que es fácil llegar pues normalmente se espera que la
intervención que se haga sea la causa de las diferencias entre grupos.

Al representar el nivel de significancia bajo la curva normal se tienen un área de aceptación
de la hipótesis nula y una zona de rechazo, para una hipótesis de colas se reparte la
significancia entre los dos extremos de la curva y para la de una cola se considera sólo el
extremo positivo o negativo dependiendo de cuál es el grupo que se espera que tenga un
nivel o proporción mayor.

Al traducir las áreas a probabilidad, se tiene que hay un 0.05 de posibilidad para
equivocarse al rechazar la hipótesis nula. Entre menor sea el área de rechazo se tendrá más
certeza para generalizar los resultados a la población.

Para una prueba de dos colas, en términos de puntajes z, a 1.96 desviaciones estándar se
tiene el 95% del área bajo la curva en la región de aceptación de la hipótesis nula y el 5% o
0.05 de significancia () en la zona de rechazo, en 2.58 desviac  iones el 99% ( = 0.01) y
en de 3.90 desviaciones el 99.9% ( = 0.001)

Para una prueba de una cola, a 1.64 desviaciones estándar en sentido negativo o positivo, se
tiene el95% del área bajo la curva en la región de aceptación de la hipótesis nula y el 5% o
0.05 designificancia () en la zona de rechazo, en 2.32 desviaciones el 99% ( = 0.01) y
en 3.70desviaciones el 99.9% ( = 0.001)

Para conocer si el valor de una prueba estadística permite rechazar la hipótesis nula, se
tiene queentre mayor sea este valor se entra más a la zona de rechazo de la hipótesis nula,
sin embargo, para lamayoría de las pruebas se debe considerar además en la decisión a los
grados de libertad, el númerode casos o se compara la probabilidad directamente.

Zona de Aceptación al

95% para una prueba dedos colas
2.5 % 2.5 %

Zona de rechazo (5%)

Zona de Aceptación al 95%

para una prueba de una cola

en sentido positivo

5%

5%

Zona de rechazo (5%)

Zona de Aceptación al 95%para una prueba de una colaen sentido negativo

Grados de libertad

Son la libertad de variaciones que puede tener una variable, suponiendo que se tuvieran 4
puntuaciones cuya media es igual a 10 al tener los valores de las tres primeras, la última
estará determinada por las primeras, por ejemplo: 7, 12, 15, la última puntuación
necesariamente es 6. La cantidad de comparaciones independientes se determina a partir de
los grados de libertad, que normalmente se calcula teniendo el tamaño de la muestra menos
uno (gl= n – 1). Sin embargo los grados de libertad se obtienen de manera diferente para
cada prueba, por lo que se debe estar atento a cada uno de los procedimientos.

Reglas de decisión

El valor de las pruebas estadísticas se debe comparar con uno obtenido, con relación al
nivel de significancia y los grados de libertad, de una tabla de valores críticos. La regla de
decisión en estos casos es: el valor de la prueba debe ser mayor o igual al de la tabla
para rechazar la hipótesis nula. Esta regla puede cambiar, por lo que es necesario revisar
la regla de decisión especifica de cada procedimiento.

Los paquetes estadísticos presentan los valores de cada prueba junto con algunos datos
necesarios para el cálculo de ésta (medias o porcentajes, el número de casos, los grados de
libertad, etc.) y el nivel de significancia o probabilidad, éste representa la posición del valor
del estadístico en el área de rechazo, o aceptación, de la hipótesis nula.

Como regla de decisión, observando los resultados del paquete estadístico, a un nivel de
significancia establecido en 0.05: Si la probabilidad o nivel de significancia es menor o
igual a 0.05 se rechaza la hipótesis nula.
Prueba de hipotesis

Contenu connexe

Tendances

Estimación de Parámetros y Tamaño de muestra-esta
Estimación de Parámetros y Tamaño de muestra-estaEstimación de Parámetros y Tamaño de muestra-esta
Estimación de Parámetros y Tamaño de muestra-estaYanina C.J
 
Estimacion Puntual E Intervalos.Ppt [Compatibility M
Estimacion  Puntual E Intervalos.Ppt [Compatibility MEstimacion  Puntual E Intervalos.Ppt [Compatibility M
Estimacion Puntual E Intervalos.Ppt [Compatibility MLuis Baquero
 
Intervalos de confianza-1
Intervalos de confianza-1Intervalos de confianza-1
Intervalos de confianza-1Hector Funes
 
estimacion de confianza por intervalos
estimacion de confianza por intervalosestimacion de confianza por intervalos
estimacion de confianza por intervalosROSALESBAUTISTAJEANP
 
Intervalos de confianza 2
Intervalos de confianza 2Intervalos de confianza 2
Intervalos de confianza 2Hector Funes
 
PRUEBAS DE HIPÓTESIS
PRUEBAS DE HIPÓTESIS PRUEBAS DE HIPÓTESIS
PRUEBAS DE HIPÓTESIS Roza Meza
 
Pruebas de hipótesis Por mi
Pruebas de hipótesis Por miPruebas de hipótesis Por mi
Pruebas de hipótesis Por miGonzalo Vazquez
 
Tarea7 intervalosdeconfianza-10
Tarea7 intervalosdeconfianza-10Tarea7 intervalosdeconfianza-10
Tarea7 intervalosdeconfianza-10CUR
 
Testing Of Hypothesis
Testing Of HypothesisTesting Of Hypothesis
Testing Of HypothesisSWATI SINGH
 
Distribución t student
Distribución t studentDistribución t student
Distribución t studentecruzo
 
Ejercicios prueba de hipótesis estadística
Ejercicios prueba de hipótesis estadísticaEjercicios prueba de hipótesis estadística
Ejercicios prueba de hipótesis estadísticaMark Ardiles Alegre
 
Estimacion puntual y por intervalos
Estimacion puntual y por intervalos Estimacion puntual y por intervalos
Estimacion puntual y por intervalos Brayan Barboza Torrez
 
Familia exponencial
Familia exponencialFamilia exponencial
Familia exponencialDiony17
 

Tendances (20)

Estimación de Parámetros y Tamaño de muestra-esta
Estimación de Parámetros y Tamaño de muestra-estaEstimación de Parámetros y Tamaño de muestra-esta
Estimación de Parámetros y Tamaño de muestra-esta
 
Estimacion Puntual E Intervalos.Ppt [Compatibility M
Estimacion  Puntual E Intervalos.Ppt [Compatibility MEstimacion  Puntual E Intervalos.Ppt [Compatibility M
Estimacion Puntual E Intervalos.Ppt [Compatibility M
 
Contrastes de hipótesis estadísticas
Contrastes de hipótesis estadísticasContrastes de hipótesis estadísticas
Contrastes de hipótesis estadísticas
 
Intervalos de confianza-1
Intervalos de confianza-1Intervalos de confianza-1
Intervalos de confianza-1
 
estimacion de confianza por intervalos
estimacion de confianza por intervalosestimacion de confianza por intervalos
estimacion de confianza por intervalos
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Pruebas de hipotesis
Pruebas de hipotesisPruebas de hipotesis
Pruebas de hipotesis
 
Intervalos de confianza 2
Intervalos de confianza 2Intervalos de confianza 2
Intervalos de confianza 2
 
PRUEBAS DE HIPÓTESIS
PRUEBAS DE HIPÓTESIS PRUEBAS DE HIPÓTESIS
PRUEBAS DE HIPÓTESIS
 
Pruebas No Parametricas
Pruebas No ParametricasPruebas No Parametricas
Pruebas No Parametricas
 
Pruebas de hipótesis Por mi
Pruebas de hipótesis Por miPruebas de hipótesis Por mi
Pruebas de hipótesis Por mi
 
Tarea7 intervalosdeconfianza-10
Tarea7 intervalosdeconfianza-10Tarea7 intervalosdeconfianza-10
Tarea7 intervalosdeconfianza-10
 
Testing Of Hypothesis
Testing Of HypothesisTesting Of Hypothesis
Testing Of Hypothesis
 
Distribución t student
Distribución t studentDistribución t student
Distribución t student
 
Ejercicios prueba de hipótesis estadística
Ejercicios prueba de hipótesis estadísticaEjercicios prueba de hipótesis estadística
Ejercicios prueba de hipótesis estadística
 
Estimacion puntual y por intervalos
Estimacion puntual y por intervalos Estimacion puntual y por intervalos
Estimacion puntual y por intervalos
 
Estimación de Parámetros
Estimación de ParámetrosEstimación de Parámetros
Estimación de Parámetros
 
Familia exponencial
Familia exponencialFamilia exponencial
Familia exponencial
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
 
Pruebas de hipótesis
Pruebas de hipótesisPruebas de hipótesis
Pruebas de hipótesis
 

En vedette

Ejercicios prueba de hipótesis
Ejercicios prueba de hipótesisEjercicios prueba de hipótesis
Ejercicios prueba de hipótesisalimacni
 
Prueba De Hipotesis
Prueba De HipotesisPrueba De Hipotesis
Prueba De HipotesisHero Valrey
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesisCarol Ramos
 
La psicologia y la estadistica descriptiva
La psicologia y la estadistica descriptivaLa psicologia y la estadistica descriptiva
La psicologia y la estadistica descriptivajavalencia
 
Prueba de hipotesis estadistica
Prueba de hipotesis estadisticaPrueba de hipotesis estadistica
Prueba de hipotesis estadisticaLennysNJ
 
Pruebas de hipotesis
Pruebas de hipotesisPruebas de hipotesis
Pruebas de hipotesiseraperez
 
2. ejercicios de prueba de hipótesis
2. ejercicios de prueba de hipótesis2. ejercicios de prueba de hipótesis
2. ejercicios de prueba de hipótesisluiisalbertoo-laga
 
Pruebas de hipótesis para una muestra
Pruebas de hipótesis para una muestraPruebas de hipótesis para una muestra
Pruebas de hipótesis para una muestraAlejandro Ruiz
 

En vedette (10)

Ejercicios prueba de hipótesis
Ejercicios prueba de hipótesisEjercicios prueba de hipótesis
Ejercicios prueba de hipótesis
 
Prueba De Hipotesis
Prueba De HipotesisPrueba De Hipotesis
Prueba De Hipotesis
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Pruebas de hipotesis
Pruebas de hipotesisPruebas de hipotesis
Pruebas de hipotesis
 
La psicologia y la estadistica descriptiva
La psicologia y la estadistica descriptivaLa psicologia y la estadistica descriptiva
La psicologia y la estadistica descriptiva
 
Prueba de los signos
Prueba de los signosPrueba de los signos
Prueba de los signos
 
Prueba de hipotesis estadistica
Prueba de hipotesis estadisticaPrueba de hipotesis estadistica
Prueba de hipotesis estadistica
 
Pruebas de hipotesis
Pruebas de hipotesisPruebas de hipotesis
Pruebas de hipotesis
 
2. ejercicios de prueba de hipótesis
2. ejercicios de prueba de hipótesis2. ejercicios de prueba de hipótesis
2. ejercicios de prueba de hipótesis
 
Pruebas de hipótesis para una muestra
Pruebas de hipótesis para una muestraPruebas de hipótesis para una muestra
Pruebas de hipótesis para una muestra
 

Similaire à Prueba de hipotesis

Intervalo de confianza
Intervalo de confianzaIntervalo de confianza
Intervalo de confianzalobouami
 
Estimación e intervalos de confianza
Estimación e intervalos de confianzaEstimación e intervalos de confianza
Estimación e intervalos de confianzaYhunary Solano
 
Prueba de hipótesis dc
Prueba de hipótesis dcPrueba de hipótesis dc
Prueba de hipótesis dcPaToDoMunos
 
Prueba de hipótesis dc
Prueba de hipótesis dcPrueba de hipótesis dc
Prueba de hipótesis dcPaToDoMunos
 
Intervalo de confianza 4
Intervalo de confianza 4Intervalo de confianza 4
Intervalo de confianza 4guest8a3c19
 
Intervalo de confianza 4
Intervalo de confianza 4Intervalo de confianza 4
Intervalo de confianza 4guest8a3c19
 
Intervalos de confianz adocx
Intervalos de confianz adocxIntervalos de confianz adocx
Intervalos de confianz adocxAGENCIAS2
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesisPaToDoMunos
 
Intervalos de confianz adocx
Intervalos de confianz adocxIntervalos de confianz adocx
Intervalos de confianz adocxAGENCIAS2
 
Presentación estadistica 2.0.pptx
Presentación estadistica 2.0.pptxPresentación estadistica 2.0.pptx
Presentación estadistica 2.0.pptxGusEH1
 
130447032 inferencia-estadistica-unidad-ii (1)
130447032 inferencia-estadistica-unidad-ii (1)130447032 inferencia-estadistica-unidad-ii (1)
130447032 inferencia-estadistica-unidad-ii (1)EstesoyyoEmanuel Gonzalez
 
Intervalos de confianza
Intervalos de confianzaIntervalos de confianza
Intervalos de confianzapatente13
 
Intervalos de confianza
Intervalos de confianzaIntervalos de confianza
Intervalos de confianzazooneerborre
 

Similaire à Prueba de hipotesis (20)

Intervalo de confianza
Intervalo de confianzaIntervalo de confianza
Intervalo de confianza
 
Estimación e intervalos de confianza
Estimación e intervalos de confianzaEstimación e intervalos de confianza
Estimación e intervalos de confianza
 
utt
uttutt
utt
 
Prueba de hipótesis dc
Prueba de hipótesis dcPrueba de hipótesis dc
Prueba de hipótesis dc
 
Prueba de hipótesis dc
Prueba de hipótesis dcPrueba de hipótesis dc
Prueba de hipótesis dc
 
Intervalo de confianza 4
Intervalo de confianza 4Intervalo de confianza 4
Intervalo de confianza 4
 
Intervalo de confianza 4
Intervalo de confianza 4Intervalo de confianza 4
Intervalo de confianza 4
 
Intervalos de confianz adocx
Intervalos de confianz adocxIntervalos de confianz adocx
Intervalos de confianz adocx
 
Prueba de hipótesis
Prueba de hipótesisPrueba de hipótesis
Prueba de hipótesis
 
Intervalos de confianz adocx
Intervalos de confianz adocxIntervalos de confianz adocx
Intervalos de confianz adocx
 
Intervalos de confianza
Intervalos de confianzaIntervalos de confianza
Intervalos de confianza
 
3. intervalos de confianza
3. intervalos de confianza3. intervalos de confianza
3. intervalos de confianza
 
Presentación estadistica 2.0.pptx
Presentación estadistica 2.0.pptxPresentación estadistica 2.0.pptx
Presentación estadistica 2.0.pptx
 
Trabajo de la unidad 3
Trabajo de la unidad 3Trabajo de la unidad 3
Trabajo de la unidad 3
 
130447032 inferencia-estadistica-unidad-ii (1)
130447032 inferencia-estadistica-unidad-ii (1)130447032 inferencia-estadistica-unidad-ii (1)
130447032 inferencia-estadistica-unidad-ii (1)
 
Intervalos de confianza
Intervalos de confianzaIntervalos de confianza
Intervalos de confianza
 
Intervalos de confianza
Intervalos de confianzaIntervalos de confianza
Intervalos de confianza
 
Intervalos de confianza
Intervalos de confianzaIntervalos de confianza
Intervalos de confianza
 
Intervalos
IntervalosIntervalos
Intervalos
 
Intervalos de confianza
Intervalos de confianzaIntervalos de confianza
Intervalos de confianza
 

Plus de LennysNJ

Planificacion 1 ero a
Planificacion 1 ero aPlanificacion 1 ero a
Planificacion 1 ero aLennysNJ
 
Plan cada familia una escuela.
Plan cada familia una escuela.Plan cada familia una escuela.
Plan cada familia una escuela.LennysNJ
 
100 actividades para ejecutar en casa
100 actividades para ejecutar en casa100 actividades para ejecutar en casa
100 actividades para ejecutar en casaLennysNJ
 
Cada familia una escuela
Cada familia una escuelaCada familia una escuela
Cada familia una escuelaLennysNJ
 
Proyecto yamileth
Proyecto yamilethProyecto yamileth
Proyecto yamilethLennysNJ
 
Acto protocolar 6 to grado yenny
Acto protocolar 6 to grado  yennyActo protocolar 6 to grado  yenny
Acto protocolar 6 to grado yennyLennysNJ
 
PROYECTO DE APRENDIZAJE DIRIGIDO A 6TO GRADO
PROYECTO DE APRENDIZAJE DIRIGIDO A 6TO GRADOPROYECTO DE APRENDIZAJE DIRIGIDO A 6TO GRADO
PROYECTO DE APRENDIZAJE DIRIGIDO A 6TO GRADOLennysNJ
 
Á 4TO GRADO SECCION A. U.E.ANDRES BELLO DE CARORA.
Á 4TO GRADO SECCION A. U.E.ANDRES BELLO DE CARORA.Á 4TO GRADO SECCION A. U.E.ANDRES BELLO DE CARORA.
Á 4TO GRADO SECCION A. U.E.ANDRES BELLO DE CARORA.LennysNJ
 
PROYECTO DE APRENDIZAJE 5 TO GRADO .NIVEL PRIMARIA
PROYECTO DE APRENDIZAJE 5 TO GRADO .NIVEL PRIMARIAPROYECTO DE APRENDIZAJE 5 TO GRADO .NIVEL PRIMARIA
PROYECTO DE APRENDIZAJE 5 TO GRADO .NIVEL PRIMARIALennysNJ
 
PROYECTO DE APRENDIZAJE. 1ER GRADO (A y B)
PROYECTO DE APRENDIZAJE. 1ER GRADO (A y B)PROYECTO DE APRENDIZAJE. 1ER GRADO (A y B)
PROYECTO DE APRENDIZAJE. 1ER GRADO (A y B)LennysNJ
 
Cuaderno de Planificacion
Cuaderno de PlanificacionCuaderno de Planificacion
Cuaderno de PlanificacionLennysNJ
 
Composicion centesimal 2019
Composicion centesimal 2019Composicion centesimal 2019
Composicion centesimal 2019LennysNJ
 
Plan de Accion II lPeriodo 3er grado.
Plan de Accion II lPeriodo 3er grado.  Plan de Accion II lPeriodo 3er grado.
Plan de Accion II lPeriodo 3er grado. LennysNJ
 
Proyecto por areas 6to a,
Proyecto por areas 6to a,Proyecto por areas 6to a,
Proyecto por areas 6to a,LennysNJ
 
“VIAJANDO POR VENEZUELA A TRAVÉS DEL COMPUTADOR CANAIMA VALORAMOS NUESTRA ID...
“VIAJANDO POR  VENEZUELA A TRAVÉS DEL COMPUTADOR CANAIMA VALORAMOS NUESTRA ID...“VIAJANDO POR  VENEZUELA A TRAVÉS DEL COMPUTADOR CANAIMA VALORAMOS NUESTRA ID...
“VIAJANDO POR VENEZUELA A TRAVÉS DEL COMPUTADOR CANAIMA VALORAMOS NUESTRA ID...LennysNJ
 
La colección bicentenario como herramienta para el trabajo en el aula
La colección bicentenario como herramienta para el trabajo en el aulaLa colección bicentenario como herramienta para el trabajo en el aula
La colección bicentenario como herramienta para el trabajo en el aulaLennysNJ
 
Taller proyecto de aprendizaje lennys.
Taller proyecto de aprendizaje lennys.Taller proyecto de aprendizaje lennys.
Taller proyecto de aprendizaje lennys.LennysNJ
 
Ponencia II congreso Pedagógico Municipal. Municipio Torres estado Lara.
Ponencia  II congreso Pedagógico Municipal. Municipio Torres estado Lara.Ponencia  II congreso Pedagógico Municipal. Municipio Torres estado Lara.
Ponencia II congreso Pedagógico Municipal. Municipio Torres estado Lara.LennysNJ
 

Plus de LennysNJ (20)

Planificacion 1 ero a
Planificacion 1 ero aPlanificacion 1 ero a
Planificacion 1 ero a
 
Covid 19
Covid 19Covid 19
Covid 19
 
Plan cada familia una escuela.
Plan cada familia una escuela.Plan cada familia una escuela.
Plan cada familia una escuela.
 
100 actividades para ejecutar en casa
100 actividades para ejecutar en casa100 actividades para ejecutar en casa
100 actividades para ejecutar en casa
 
Cada familia una escuela
Cada familia una escuelaCada familia una escuela
Cada familia una escuela
 
Proyecto yamileth
Proyecto yamilethProyecto yamileth
Proyecto yamileth
 
Pa norys
Pa norysPa norys
Pa norys
 
Acto protocolar 6 to grado yenny
Acto protocolar 6 to grado  yennyActo protocolar 6 to grado  yenny
Acto protocolar 6 to grado yenny
 
PROYECTO DE APRENDIZAJE DIRIGIDO A 6TO GRADO
PROYECTO DE APRENDIZAJE DIRIGIDO A 6TO GRADOPROYECTO DE APRENDIZAJE DIRIGIDO A 6TO GRADO
PROYECTO DE APRENDIZAJE DIRIGIDO A 6TO GRADO
 
Á 4TO GRADO SECCION A. U.E.ANDRES BELLO DE CARORA.
Á 4TO GRADO SECCION A. U.E.ANDRES BELLO DE CARORA.Á 4TO GRADO SECCION A. U.E.ANDRES BELLO DE CARORA.
Á 4TO GRADO SECCION A. U.E.ANDRES BELLO DE CARORA.
 
PROYECTO DE APRENDIZAJE 5 TO GRADO .NIVEL PRIMARIA
PROYECTO DE APRENDIZAJE 5 TO GRADO .NIVEL PRIMARIAPROYECTO DE APRENDIZAJE 5 TO GRADO .NIVEL PRIMARIA
PROYECTO DE APRENDIZAJE 5 TO GRADO .NIVEL PRIMARIA
 
PROYECTO DE APRENDIZAJE. 1ER GRADO (A y B)
PROYECTO DE APRENDIZAJE. 1ER GRADO (A y B)PROYECTO DE APRENDIZAJE. 1ER GRADO (A y B)
PROYECTO DE APRENDIZAJE. 1ER GRADO (A y B)
 
Cuaderno de Planificacion
Cuaderno de PlanificacionCuaderno de Planificacion
Cuaderno de Planificacion
 
Composicion centesimal 2019
Composicion centesimal 2019Composicion centesimal 2019
Composicion centesimal 2019
 
Plan de Accion II lPeriodo 3er grado.
Plan de Accion II lPeriodo 3er grado.  Plan de Accion II lPeriodo 3er grado.
Plan de Accion II lPeriodo 3er grado.
 
Proyecto por areas 6to a,
Proyecto por areas 6to a,Proyecto por areas 6to a,
Proyecto por areas 6to a,
 
“VIAJANDO POR VENEZUELA A TRAVÉS DEL COMPUTADOR CANAIMA VALORAMOS NUESTRA ID...
“VIAJANDO POR  VENEZUELA A TRAVÉS DEL COMPUTADOR CANAIMA VALORAMOS NUESTRA ID...“VIAJANDO POR  VENEZUELA A TRAVÉS DEL COMPUTADOR CANAIMA VALORAMOS NUESTRA ID...
“VIAJANDO POR VENEZUELA A TRAVÉS DEL COMPUTADOR CANAIMA VALORAMOS NUESTRA ID...
 
La colección bicentenario como herramienta para el trabajo en el aula
La colección bicentenario como herramienta para el trabajo en el aulaLa colección bicentenario como herramienta para el trabajo en el aula
La colección bicentenario como herramienta para el trabajo en el aula
 
Taller proyecto de aprendizaje lennys.
Taller proyecto de aprendizaje lennys.Taller proyecto de aprendizaje lennys.
Taller proyecto de aprendizaje lennys.
 
Ponencia II congreso Pedagógico Municipal. Municipio Torres estado Lara.
Ponencia  II congreso Pedagógico Municipal. Municipio Torres estado Lara.Ponencia  II congreso Pedagógico Municipal. Municipio Torres estado Lara.
Ponencia II congreso Pedagógico Municipal. Municipio Torres estado Lara.
 

Prueba de hipotesis

  • 1. INFERENCIA ESTADISTICA. La Inferencia Estadística es aquella rama de la Estadística mediante la cual se trata de sacar conclusiones de una población en estudio, a partir de la información que proporciona una muestra representativa de la misma. También es denominada Estadística Inductiva o Inferencia Inductiva ya que es un procedimiento para generar nuevo conocimiento científico. CARACTERISTICAS DE LA INFERENCIA ESTADISTICA. La muestra se obtiene por observación o experimentación. La necesidad de obtener un subconjunto reducido de la población es obvia si se tiene presente los costes económicos de la experimentación. Toda inferencia inductiva exacta es imposible ya que se dispone de información de información parcial, sin embargo es posible realizar inferencias inseguras y medir el grado de inseguridad si el experimento se ha realizado de acuerdo con determinados principios. Uno de los propósitos de la inferencia Estadística es el de conseguir técnicas para hacer inferencias inductivas y medir el grado de incertidumbre de tales inferencias. La medida de la incertidumbre se realiza en términos de probabilidad. CONCEPTOS BÁSICOS EN EL CONTEXTO DE LA ESTADÍSTICA. Población: Colección de individuos o elementos que representan el objeto de interés (seres vivos o inanimados). Tamaño de la población: Cantidad de elementos que abarca la población. En casi todos los textos se representa con el símbolo “N”. Muestra: Cualquier subconjunto de la población tomado para su estudio. Muestreo: Procedimiento mediante el cual se extrae una muestra. Tamaño de muestra: Cantidad de elementos contenidos en la muestra. En casi todos los textos se representa con el símbolo “n”. Variable o característica: Es el signo o detalle que interesa caracterizar en la población.
  • 2. El estudio de la Inferencia Estadística puede abordarse en dos apartados bien diferenciados. 1.De acuerdo con el conocimiento sobre la distribución en la población: Inferencia Paramétrica: Se conoce la forma de la distribución (Normal, Binomial, Poisson, etc.....) pero se desconocen sus parámetros. Se realizan inferencias sobre los parámetros desconocidos de la distribución conocida. Inferencia No Paramétrica: Forma y parámetros desconocidos. Se realizan inferencias sobre características que no tienen porque ser parámetros de una distribución conocida (Mediana, Estadísticos de Orden). 2. De acuerdo con la forma en que se estudian los parámetros: Estimación: Se intenta dar estimaciones de los parámetros desconocidos sin hacer hipótesis previas sobre posibles valores de los mismos. Estimación puntual: Un único valor para cada parámetro. Estimación por intervalos: Intervalo de valores probables para el parámetro. ESTIMACION POR INTERVALOS. En el campo de la estadística, se denomina intervalo de confianza a un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto. Formalmente, estos números determinan un intervalo, que se calcula a partir de datos de una muestra, y el valor desconocido es un parámetro poblacional. La probabilidad de éxito en la estimación se representa con 1 - α y se denomina nivel de confianza. En estas circunstancias, α es el llamado error aleatorio o nivel de significación, esto es, una medida de las posibilidades de fallar en la estimación mediante tal intervalo. El nivel de confianza y la amplitud del intervalo varían conjuntamente, de forma que un intervalo más amplio tendrá más posibilidades de acierto (mayor nivel de confianza), mientras que para un intervalo más pequeño, que ofrece una estimación más precisa, aumentan sus posibilidades de error. Para la construcción de un determinado intervalo de confianza es necesario conocer la distribución teórica que sigue el parámetro a estimar, θ. Es habitual que el parámetro presente una distribución normal. Acosta, M (2.009)
  • 3. Por otro lado, si se tiene una muestra aleatoria X1, X2, ... , Xn , de una población con función de densidad f(x;q) Un intervalo de confianza, de extremos L1 y L2, para el parámetro q de la poblaciónes “un par ordenado de funciones reales de las n medidas de la nuestra q = [L1(X1,K,X n );L1(X1,K,X n )]construidas de forma que la probabilidad de que los extremos contengan al verdaderovalor del parámetro es un valor prefijado 1 - a.” Al número 1 - a se le denomina “nivelde confianza”.El nivel de confianza suele ser 0,95 (95%) ó 0,99 (99%). La interpretación práctica essencilla, por ejemplo si el nivel de confianza es del 95%, significa que en el 95% de las veces que repitiéramos el experimento, el intervalo de confianza calculado contendría alverdadero valor del parámetro y en el 5% restante el intervalo no contendría el verdaderovalor. Una vez que el intervalo de confianza ha sido particularizado para una muestra concreta, elintervalo obtenido contiene o no contiene al verdadero valor del parámetro, conprobabilidad 1, por esa razón, cuando ya tenemos un valor concreto hablamos de confianzay no de probabilidad. Confiamos en que el intervalo que hemos calculado sea del 95% quecontiene el verdadero valor. Estimación por intervalos de confianza. Una estimación por intervalos consiste en construir un intervalo alrededor de la estimación puntual de manera que se pueda garantizar que el parámetro estimado está dentro de dicho intervalo con una probabilidad escogida de antemano; a esa probabilidad, representada como 1-α, se le denomina nivel de confianza, y al intervalo construido se le llama entonces intervalo de confianza. La construcción del intervalo de confianza se basa en encontrar el par de valores que delimiteneste intervalo para un nivel de confianza prefijado, lo cual se basa en la distribución muestral del estimador. El intervalo es, por tanto, de extremos variables, ya que sus límites pueden cambiar según el resultado de la estimación puntual sobre la muestra. El nivel de confianza lo decide elinvestigador, o el estadístico; en la práctica, en estudios económicos y sociales, los niveles de confianza más usados suelen ser: 0.90, 0.95, 0.98, 0.99. Al crearse el intervalo de confianza, si 1-α representa la probabilidad con que se quiere que el mismo contenga al parámetro, α representará la probabilidad de que el verdadero valor
  • 4. del parámetro no esté en el intervalo, y los intervalos suelen construirse de forma tal que esta probabilidad α se reparta simétricamente, como se muestra gráficamente: Utilizando el método habitual para la construcción de los intervalos –la repartición simétrica dela probabilidad α a ambos lados-, cuando la distribución muestral del estimador es a su vez simétrica –por ejemplo normal o t’Student- los límites del intervalo resultan también simétricos respecto a la estimación puntual tomada como partida, y a la distancia desde el centro del intervalo hasta cada límite, que simboliza con la letra d, se le denomina entonces error máximo admitido Por otra parte, es fácil darse cuenta al examinar las expresiones para los intervalos de confianza que: Mientras más grande es el tamaño de la muestra menor es el ancho del intervalo. Para niveles de confianza (1 - α) más grandes, mayor es el ancho del intervalo. Ambos resultados son lógicos ya que un tamaño grande de la muestra disminuirá la varianza del estimador, y un nivel de confianza grande incrementará el valor del coeficiente de confianza, es decir, el estadístico de la distribución de probabilidad del estimador, lo quedará como resultado en cada caso un intervalo más amplio. Finalmente, una importante aplicación de las expresiones para los intervalos de confianza es el empleo de éstas para determinar el tamaño de muestra mínimo necesario para que el error en una estimación no sobrepase un valor decidido de antemano. LONGITUD DEL INTERVALO Y ERROR EN LA ESTIMACIÓN
  • 5. En la práctica hemos de tratar de que la longitud del intervalo de confianza sea lo más pequeña posible, es decir, que el error en la estimación sea lo mas pequeño posible. Esto puede conseguirse modificando las distintas cantidades que aparecen en la fórmula: el nivel de confianza, a través del valor crítico, la variabilidad y el tamaño muestral. -NIVEL DE CONFIANZA La longitud del intervalo de confianza aumenta al aumentar el nivel de confianza ya que el valor crítico de la distribución es mayor. Si consideramos un nivel de confianza del 100%,el intervalo de confianza será [-¥;+¥] que, evidentemente contiene al verdadero valor del parámetro pero no es de ninguna utilidad en la práctica. Si disminuimos el nivel de confianza también disminuye la longitud, sin embargo conviene mantenerlo en unos límites razonables que suelen ser del 95% o del 99% en la mayor parte de las aplicaciones. -VARIANZA La longitud del intervalo de confianza disminuye con la varianza, es decir, la estimación será más precisa cuanto menor sea la variabilidad en la población, lo que significa que la población es más homogénea. En la práctica es posible obtener estimaciones más precisas, por ejemplo, restringiendo la población a conjuntos lo más homogéneos posible. TAMAÑO MUESTRAL La longitud del intervalo de confianza disminuye al aumentar el tamaño muestral, lo que significa que se obtienen estimaciones más precisas cuanto mayor sea el tamaño muestral. Debido a consideraciones prácticas de coste y tiempo, en general no es posible aumentar indefinidamente el tamaño muestral para obtener estimaciones más precisas, es por ello que en la práctica se selecciona el tamaño muestral necesario para obtener una determinada precisión, establecida a priori. EJERCICIOS PARA CALCULAR EL INTERVALO DE CONFIANZA. Ejemplo 1. En una determinada localidad se obtuvo la siguiente muestra aleatoria, correspondiente a lacantidad de personas por núcleos familiares en 37 viviendas: 4256656667554428468 522554367655565461 Se quiere una estimación por intervalos de la proporción de los núcleos familiares con 4 ó másintegrantes, para un nivel de confiabilidad del 90%. Solución:
  • 6. X: Núcleos familiares con 4 ó más integrantes. Se tiene que: pˆ = Xn/n = 31/37 = 0.84 Y: σpˆ = pq/n = 0.84 ⋅0.16 / 37 = 0.0036 = 0.060 Entonces: p = pˆ ± Z(1−α/2) pq / n = 0.84 ± 1.64(0.060) = 0.84 ± 0.0988 Por tanto el intervalo de confianza será: 0.7412 ≤ p ≤ 0.9388 Esto indica que el 90% de las veces el valor de la proporción muestral se encontrará entre 0.74 y 0.94 Ejemplo 2 En una muestra simple aleatoria de 64 piezas de un mismo tipo, extraídas de un almacén, seencontraron 13 piezas defectuosas. Dé una estimación por intervalo con un nivel de confianzadel 95% para la proporción de piezas defectuosas en el almacén. Solución: n = 64 pˆ = 13/64 = 0.20 p = pˆ ± Z(1−α/2) pq / n = 0.20 ±1.96 0.20(0.8)/ 64 = 0.20 ± 1.96 0.0025 = 0.20 ± 1.96(0.05) O sea: p = 0.20 ± 0.098 Por tanto, el intervalo será: 0.102 ≤ p ≤ 0.298, indicando que el 95% de las veces el verdaderovalor de la proporción poblacional se encontrará entre 0.102 y 0.298. PRUEBA DE HIPÓTESIS Una prueba de hipótesis suele girar en torno al valor de uno o varios parámetros poblacionales–o al comportamiento de la distribución de la población–, sobre lo cual se tiene alguna suposición previa basada en evidencia empírica o teórica. Para verificar si la suposición es cierta o no se debe, entonces, tomar una muestra de la población y calcular sobre ella una estimación del parámetro o parámetros en cuestión; a partir de esas estimaciones, y teniendo en cuenta el comportamiento probabilístico de los estimadores usados, se puede llegar a una conclusión sobre la suposición o hipótesis de partida. CARACTERÍSTICAS GENERALES DE UNA PRUEBA DE HIPÓTESIS:
  • 7. Si el desarrollo de una prueba requiere del conocimiento de parámetros o características de la distribución de la población, se le clasifica como prueba paramétrica; si, por el contrario, estos datos no son requeridos, se hablará de una prueba no paramétrica En el proceso de desarrollar una prueba de hipótesis a partir de una determinada suposición, se busca como traducir dicha suposición a términos de algún parámetro o estadígrafo, y se formula entonces lo que se llama hipótesis estadística. En general, una hipótesis estadística siempre se subdivide en dos: una llamada hipótesis nula (Ho) y otra llamada hipótesis alternativa (H1). Hipótesis nula (Ho): Es una hipótesis de diferencias nulas; lo que equivale a decir que es una Hipótesis que contiene una igualdad o algo similar. Hipótesis alternativa (H1): Es la hipótesis que deberá ser aceptada si la nula se rechaza, y tiene asociado algún tipo de desigualdad estricta. Al plantear el par de hipótesis nula y alternativa surge alguno de los tres casos siguientes: Ho: θ = θo ( ó Ho: θ ≤ θo ) O sea, se quiere verificar si el valor del parámetro haaumentado, contraponiendo H1: θ > θo esto a que se mantieneigual, o incluso disminuyó. Ho: θ = θo ( ó Ho: θ ≥ θo ) O sea, se quiere verificar si el valor del parámetro hadisminuido, contraponiendo H1: θ < θo esto a que se mantieneigual, o incluso aumentó. O sea, se quiere verificar si el valor del parámetro havariado en algún sentido, Ho: θ = θo contraponiendo esto a quese mantiene H1: θ ≠ θo igual. Comúnmente la hipótesis alternativa representa la hipótesis de investigación, lo que se deseaverificar después de algún cambio en el sistema en estudio, y suele ser en muchos casos la quese formula primero; la hipótesis nula, por el contrario, se asocia a la situación
  • 8. que existía hastael momento del cambio, a lo ya conocido; por ello es esta última es la que recoge la igualdad,estricta o no.En muchos casos Ho se formula con la intención expresa de ser rechazada, ya que si Ho serechaza ello implica que H1 se acepta. La decisión estadística se basa en estimaciones efectuadas sobre la muestra aleatoriatomada, todo lo cual da lugar a los siguientes conceptos: Estadístico o estadígrafo de prueba: Es el estimador (θˆ ), o alguna transformación de éste,que se utiliza para tomar una decisión respecto al comportamiento del parámetro en estudio. Valor crítico (C o θc): Es un valor numérico que se calcula a partir del dato histórico conocido yde la distribución probabilística del estimador, para que el estadígrafo de prueba se comparecon él y se pueda tomar una decisión.La necesidad del valor crítico puede entenderse por el hecho de que el estadígrafo de prueba,al ser el resultado de una estimación, no se debe comparar directamente con el dato histórico,sino que se debe dejar una especie de margen para los posibles errores de estimación. Región crítica ó región de rechazo (W o Wc): Es el conjunto de valores del estadístico deprueba a partir de los cuales se rechaza la hipótesis nula.La distribución del estadístico de prueba se divide en dos partes la región de rechazo y la regiónde no rechazo o aceptación, estando separadas ambas regiones por el valor crítico.La ubicación de la región crítica respecto al dato histórico depende de la hipótesis alternativa, ypuede ser unilateral (a la derecha o a la izquierda) o bilateral (a ambos lados), como serepresenta en los siguientes esquemas: Caso del posible aumento: Si θˆ>θc, se rechazaría H0, adoptándose H1; pero si θˆ ≤ θc, aunque sea θˆ > θ0, no hay evidencia de un aumento significativo. Caso de posible reducción: Si θˆ <θc, se rechazaría H0, adoptándose H1; pero si θˆ ≥ θc, aunque sea θˆ < θ0, no hay evidencia de una reducción significativa. Caso de posible variación: Si θˆ < θc1 ó θˆ> θc2, se rechazaría H0, adoptándose H1; pero si θc1 ≤θˆ ≤ θc2, aun si θˆ ≠ θ0, no hay evidencia de variación significativa.
  • 9. Planteamiento de la hipótesis estadística La Hipótesis es la respuesta tentativa para la solución de la pregunta de investigación. Al realizar inferencias estadísticas, se acostumbra adoptar un modelo de decisión. Este modelo constade cuatro elementos: Hipótesis nula (H0) Hipótesis alterna (H1) Nivel de significancia que ha de utilizarse en la prueba estadística Regla de decisión Hipótesis para Problemas de Comparación En la prueba de hipótesis se trabaja con dos hipótesis estadísticas que deben enunciarseexplícitamente: la hipótesis que debe probarse o hipótesis nula que se establece con el propósito deser rechazada, y la hipótesis alterna que es la conclusión a la que se espera llegar. Con un nivel intervalar o de razón de la V. D. se comparan medias, la hipótesis nula plantea que lasdos medias son iguales: H0: X 1 = X 2 y la hipótesis alterna plantea que las medias son diferentes: H1: X 1 ≠ X 2 Otro planteamiento sería: H0: X 1 – X 2 = 0 Cuando se tienen medianas (nivel ordinal de la V. D.), entonces: H0: Md1 = Md2 H1: Md1 Md2 O con proporciones o porcentajes (nivel nominal de la V. D.): H0: P1 = P2
  • 10. H1: P1 P2 Hipótesis para Problemas de Asociación Cuando se tiene un problema de asociación la hipótesis nula niega la correlación: H0: r = 0 La hipótesis alterna afirma que hay correlación: H1: r  0 Construcción de hipótesis de acuerdo al nivel de medición Las hipótesis estadísticas tienen que incluir la variable dependiente en primer lugar y laindependiente en seguida. Para la redacción de dichas hipótesis se toma en cuenta el nivel demedición utilizado de las variables del estudio. Para los problemas de comparación: Nivel NOMINAL: Aquí se habla de proporciones y / o categorías. ¿Cómo es la relación entre fumar o no y morir por cáncer pulmonar? H0: La proporción de sujetos que mueren por cáncer pulmonar es igual entre fumadores y nofumadores. H1: La proporción de sujetos que mueren por cáncer pulmonar es diferente entre fumadores y no Fumadores. Nivel ORDINAL: Aquí se habla de jerarquías y / o niveles. ¿Cómo es el nivel de creatividad entre los niños de comunidades rurales, urbanas e indígenas? H0: El nivel de creatividad es igual entre niños de comunidades rurales, urbanas e indígenas. H1: El nivel de creatividad es diferente entre niños de comunidades rurales, urbanas e indígenas. Nivel INTERVALAR: Se comparan las medias y también se habla de niveles. Se desea conocer cómo el nivel de estrés de los sujetos afecta su nivel de irritabilidad hacia suscompañeros de trabajo. Para ello se conformaron tres grupos, bajo estrés, estrés regular y alto estrés,con 7 profesionistas cada uno, a quienes se les evaluó su nivel de irritabilidad
  • 11. preguntándoles en unaescala de 0 a 10 que indique: “cotidianamente ¿qué tan irritable se muestra con sus compañeros detrabajo?” H0: El nivel de irritabilidad hacia los compañeros de trabajo es igual entre los tres grupos de estrés. H1: El nivel de irritabilidad hacia los compañeros de trabajo es diferente entre los tres grupos deestrés. Para el caso de los problemas de asociación se identifica la relación entre las variables, y elconcepto de asociación o relación se debe incluir en las hipótesis. ¿Qué relación hay entre la edad en años de los sujetos y su inteligencia? H0: No hay asociación lineal entre la edad y la inteligencia. H1: Hay asociación lineal entre la edad y la inteligencia. NOTA: La hipótesis alterna no se acepta ni se rechaza, es la hipótesis nula la que se somete a prueba. Los planteamientos anteriores se refieren a pruebas de dos colas, que son problemas en los que no esposible anticipar la dirección de las diferencias, es decir, no se sabe cuál grupo es el que tendrá elnivel o la proporción de casos mayor, o cual es el sentido de la relación entre variables. Sin embargo, pueden existir hipótesis alternas en las que se puede anticipar cual grupo presenta unadesviación mayor o menor con respecto al otro. Este tipo se refiere a problemas de una cola odirección. En estos casos, con un nivel intervalar o de razón de la V. D., la hipótesis nula plantea que las dosmedias son iguales: H0: X 1 = X 2 y la hipótesis alterna plantea que un grupo tiene una media mayor o menor que otro u otros: H1: X 1 >X 2 H1: X 1 <X 2 Cuando se tienen medianas (nivel ordinal de la V. D.), entonces: H0: Md1 = Md2
  • 12. H1: Md1 >Md2 óH1: Md1 <Md2 O con proporciones o porcentajes (nivel nominal de la V. D.): H0: P1 = P2 H1: P1 >P2 óH1: P1 <P2 Para esta guía se presentarán únicamente planteamientos para hipótesis de dos colas. ¿Cuál es el sentido del nivel de significancia o la probabilidad? La probabilidad (p) de que un evento ocurra oscila entre 0 y 1, donde 0 significa la imposibilidad deocurrencia y 1 la certeza de que ocurra el fenómeno. Al lanzar al aire una moneda no cargada, laprobabilidad de que salga “águila” es de 0.5 y la probabilidad de que la moneda caiga en “sol”también es de 0.5. Con un dado, la probabilidad de obtener cualquiera de sus lados al lanzarlo es de1/6=0.1667. La suma de probabilidades siempre es de 1. Aplicando el concepto de la probabilidad a la distribución muestral, el área de ésta corresponde a laprobabilidad total (p = 1), y consecuentemente, cualquier área (porcentaje bajo la curva) comprendidaentre dos puntos de la distribución corresponderá a la probabilidad de la distribución al convertirla a proporciones (por ejemplo 25% = 0.25). Para probar hipótesis inferenciales utilizando la media, el investigador debe evaluar si es alta o baja la probabilidad de que la media de la muestra esté cerca de la media de la distribución poblacional. Si es baja, el investigador dudará de generalizar a la población. Si es alta el investigador podrá hacer generalizaciones. Es aquí donde entra el nivel de significancia o nivel . El nivel es la probabilidad de equivocarse al probar las hipótesis estadísticas. El nivel de significancia de 0.05, implica que el investigador tiene un 95% de seguridad para generalizar sin equivocarse y sólo 5% en contra. Este es el más utilizado en investigación en Psicología, aunque se pueden utilizar niveles más bajos (0.01 o 0.001) cuando se requiere un mayor grado de certeza. Decisión estadística La decisión e interpretación de un análisis estadístico se basa en la aceptación o rechazo de la hipótesis nula, están estrechamente relacionados con la curva normal y las puntuaciones z, una vez elegida la prueba estadística adecuada al nivel de medición y haber redactado la
  • 13. hipótesis nula, se debe establecer un nivel de significancia o de certeza para rechazar esta última sin cometer el error llamado del tipo I o , que se refiere a rechazar la hipótesis nula siendo verdadera. En psicología normalmente se establece el nivel de significancia de 0.05 que, como se mencionó anteriormente, representa un 95% de certeza de generalizar los resultados sin equivocarse. En este sentido, la decisión estadística es una decisión probabilística. Si se desea mayor certeza, se debe utilizar otro nivel de significancia, como puede ser a 0.01 que proporciona una certeza de 99% para generalizar los resultados sin error, o a 0.001 que equivale al 99.9%. Existe otro tipo de error el tipo II o , que al contrario del error I se refiere a aceptar la hipótesis nula siendo falsa, en términos de decisión estadística es más grave cometer el error tipo I, ya que afirmaríamos que hay diferencias entre los grupos cuando esto no es verdad. Es una situación a la que es fácil llegar pues normalmente se espera que la intervención que se haga sea la causa de las diferencias entre grupos. Al representar el nivel de significancia bajo la curva normal se tienen un área de aceptación de la hipótesis nula y una zona de rechazo, para una hipótesis de colas se reparte la significancia entre los dos extremos de la curva y para la de una cola se considera sólo el extremo positivo o negativo dependiendo de cuál es el grupo que se espera que tenga un nivel o proporción mayor. Al traducir las áreas a probabilidad, se tiene que hay un 0.05 de posibilidad para equivocarse al rechazar la hipótesis nula. Entre menor sea el área de rechazo se tendrá más certeza para generalizar los resultados a la población. Para una prueba de dos colas, en términos de puntajes z, a 1.96 desviaciones estándar se tiene el 95% del área bajo la curva en la región de aceptación de la hipótesis nula y el 5% o 0.05 de significancia () en la zona de rechazo, en 2.58 desviac iones el 99% ( = 0.01) y en de 3.90 desviaciones el 99.9% ( = 0.001) Para una prueba de una cola, a 1.64 desviaciones estándar en sentido negativo o positivo, se tiene el95% del área bajo la curva en la región de aceptación de la hipótesis nula y el 5% o 0.05 designificancia () en la zona de rechazo, en 2.32 desviaciones el 99% ( = 0.01) y en 3.70desviaciones el 99.9% ( = 0.001) Para conocer si el valor de una prueba estadística permite rechazar la hipótesis nula, se tiene queentre mayor sea este valor se entra más a la zona de rechazo de la hipótesis nula, sin embargo, para lamayoría de las pruebas se debe considerar además en la decisión a los grados de libertad, el númerode casos o se compara la probabilidad directamente. Zona de Aceptación al 95% para una prueba dedos colas
  • 14. 2.5 % 2.5 % Zona de rechazo (5%) Zona de Aceptación al 95% para una prueba de una cola en sentido positivo 5% 5% Zona de rechazo (5%) Zona de Aceptación al 95%para una prueba de una colaen sentido negativo Grados de libertad Son la libertad de variaciones que puede tener una variable, suponiendo que se tuvieran 4 puntuaciones cuya media es igual a 10 al tener los valores de las tres primeras, la última estará determinada por las primeras, por ejemplo: 7, 12, 15, la última puntuación necesariamente es 6. La cantidad de comparaciones independientes se determina a partir de los grados de libertad, que normalmente se calcula teniendo el tamaño de la muestra menos uno (gl= n – 1). Sin embargo los grados de libertad se obtienen de manera diferente para cada prueba, por lo que se debe estar atento a cada uno de los procedimientos. Reglas de decisión El valor de las pruebas estadísticas se debe comparar con uno obtenido, con relación al nivel de significancia y los grados de libertad, de una tabla de valores críticos. La regla de decisión en estos casos es: el valor de la prueba debe ser mayor o igual al de la tabla para rechazar la hipótesis nula. Esta regla puede cambiar, por lo que es necesario revisar la regla de decisión especifica de cada procedimiento. Los paquetes estadísticos presentan los valores de cada prueba junto con algunos datos necesarios para el cálculo de ésta (medias o porcentajes, el número de casos, los grados de libertad, etc.) y el nivel de significancia o probabilidad, éste representa la posición del valor del estadístico en el área de rechazo, o aceptación, de la hipótesis nula. Como regla de decisión, observando los resultados del paquete estadístico, a un nivel de significancia establecido en 0.05: Si la probabilidad o nivel de significancia es menor o igual a 0.05 se rechaza la hipótesis nula.