Introduccion a la_probabilidad (1)

Universidad Latina de Panamá
Estadística II
Profesora Lumys T. Ortega G.
Teléfonos: 212-7353; 6436-2725
Correo electrónico:
lumysortegag@hotmail.com

OBJETIVOS GENERALES
• Conocer las técnicas fundamentales y los
conceptos de probabilidad necesarios para
comprender la inferencia estadística.
• Reconocer la importancia del tema de las
probabilidades en el desarrollo de su
capacidad analítica.
• Proporcionar los conocimientos y conceptos
básicos sobre los tópicos de mayor utilidad
práctica de inferencia estadística.
• Aplicar las técnicas de regresión correlación
en el proceso de estimación de variables
relacionadas.

Objetivos Específicos
• Explicar el objetivo del análisis de regresión.
• Establecer los supuestos bajo los cuales se basa el análisis de regresión.
• Calcular la regresión lineal e indicadores correlación.
• Conocer los conceptos básicos sobre probabilidades con el propósito de utilizarlos en los temas de inferencia
estadística.
• Definir los enfoques de la probabilidad.
• Aplicar los axiomas de probabilidad en a resolución del problemas.
• Interpretar el concepto de independencia estadística.
• Analizar el concepto de estadística matemática de una variable aleatoria.
• Explicar que es una distribución de probabilidad.
• Distinguir entre una distribución discreta y una continua.
• Expresar las características de las distribución Binomial y Normal.
• Emplear tablas y fórmulas de la distribución Binomial para resolver problemas de probabilidad.
• Convertir cualquier distribución normal en una distribución normal estándar.
• Estudiar el muestreo como un enfoque sistemático para seleccionar más elementos de un grupo de datos a fin de
hacer algunas inferencias sobre el grupo total.
• Estimar las características de una población observándolas de la muestra.
• Determinar cuando es razonable concluir a partir del análisis de una muestra, que la población posee determinada
propiedad y cuando no es razonable llegar a tal conclusión.

Contenido
1. Elementos de Probabilidad
1.1. Introducción
1.1.1.Definición.
1.1.2.Conceptos Básicos.
1.1.3.Eventos.
1.1.4.Espacio y Punto Muestral.
1.2. Enfoque de la Probabilidad.
1.2.1. Objetivo.
1.2.2. Subjetivo
1.3. Axiomas de la Teoría Probabilística.
1.4. Probabilidades Condicionadas.
1.5. Reglas para la Adición y Multiplicación
de Probabilidades.
1.6. Independencia Estadística.
1.7. Esperanza Matemática y Variable
Aleatoria.
2. Distribuciones de Probabilidad
2.1. Funciones de Distribución.
2.1.1. Distribución de Variables
Discretas Discontinuas.
2.1.1.1 Distribución Binomial.
2.1.1.2 Características.
2.2. Distribución de Variables Continuas.
2.3. La Distribución Normal.
2.3.1. Características.
2.4. La Distribución Normal Como una
Aproximación de la Distribución Binomial.
2.5. La Distribución Normal Estandarizada.
2.6. Determinación de Probabilidades usando
la Estandarizada.
3. Distribución Muestral
3.1. Muestras y Distribuciones Muéstrales.
3.1.1. Introducción.
3.1.2. Tipos de Muestreo
3.1.2.1 Aleatorio Simple.
3.1.2.2 Sistemático.
3.1.2.3 Estratificado.
3.1.2.4 Por Conglomerado.
3.1.3. Determinación del Tamaño de la
Muestra.
3.2. Distribuciones Muéstrales.
3.2.1. Distribución Muestral.
3.2.1.1 De la Medida.
3.2.1.2 De la Varianza.
3.2.1.3 De la Desviación Típica.
3.2.2. Significado de las Distribuciones
Muéstrales.

Contenido
4. Inducción Estadística
4.1. Los Parámetros y sus Estimadores.
4.2. Estimación Puntual.
4.3. Estimación de la Medida por Intervalos.
4.4. Estimación de las Diferentes Medidas.
4.5. Estimación de las Diferentes Proporciones.
4.6. Estimación de Proporciones por Intervalos.
5. Prueba de Hipótesis
5.1. Teoría de la Decisión (Contraste de Hipótesis).
5.1.1. Introducción.
5.1.2. El Problema de la Decisión.
5.1.3. Hipótesis Nula y Contraste de Significado.
6. Análisis de Regresión y Correlación Simple
6.1. Introducción.
6.1.1. Función de ajustes.
6.1.2. Tipos de Variables.
6.2. Regresión Simple.
6.2.1. Diagrama de Esparcimiento.
6.2.2. Principio de Mínimos Cuadrados para la Estimación de Parámetros.
6.3. Correlación.
6.3.1. Varianza de Regresión.
6.3.2. Coeficiente de Determinación.
6.3.3. Coeficiente de Correlación.

Evaluación
• Detalles Porcentaje
• Asistencia y participación en clases 10%
• 2 Exámenes Parciales (15% cada uno) 30%
• 2 Trabajos grupales: lecturas obligatorias, tareas 20%
• Estudio de casos, investigaciones 10%
• Proyecto Final 30%
• Total 100%

Bibliografía recomendada
• Levin y Rubin. Estadística para Administración y
Economía. Pearson – Prentice Hall. Séptima Edición.
2004
• Lind, Douglas, (2008). Estadistica, Treceava Edición,
México: McGraw-Hill
• Berenson, Mark; Levinci, Davidy Kreltbiel, Timothy,
(2001). Estadística para la Administración, 2001 Edición,
México: Pearson Education.
• Mason y Lind. Estadística para Administración y
Economía. Alfa Omega.

Introducción a la
probabilidad

Introducción a la probabilidad
• Probabilidad: Posibilidad numérica medida entre cero
y uno, de que ocurra un evento.
• Probabilidad de que un cliente no pague a tiempo sus cuentas.
• Probabilidad de comprar un artículo defectuoso.
• Probabilidad de que llueva mañana.
• La probabilidad puede ser expresada como
proporción: valore entre cero y uno; y en porcentaje si
es multiplicada por 100.
• La teoría de probabilidad estudia las leyes de la
naturaleza y los problemas de la vida cotidiana.

Conceptos
Ejemplo:
– Inspección de cajas de artículos.
– Lanzamiento de un dado
– Medición de la percepción sobre el sistema de
compensación
– Observar el estado del tiempo (llueve o no llueve).
– Observación del sexo del nacimiento de un (a) bebé.
Experimento aleatorio: Es la actividad que produce uno o varios
resultados. Es la observación de alguna actividad o la acción de efectuar
una medición.

Conceptos
• Resultado: Un experimento es toda acción bien
definida que conlleva a un resultado único bien
definido.
• Espacio muestral: Conjunto de todos los posibles
resultados para un experimento.
1. Espacio muestral finito: S={1,2,3,4,5,6}
2. Espacio muestral infinito contable: S={1,2,3,4,....}
3. Espacio muestral infinito no contable: S={0≤ X ≤ 1}
Observación:
1 y 2, corresponden a espacios muestrales discretos;
3, es un espacio muestral no discreto o continuo.
Evento o suceso: Es el o los resultados de un experimento o la
descripción de un resultado potencial. ( Los eventos se denotan con
letras mayúsculas (A, B, C, E). hay eventos simples y eventos
compuestos.

•Eventos mutuamente excluyentes: la ocurrencia
de un evento denota que ningún otro evento pueda
ocurrir al mismo tiempo.
•Eventos no mutuamente excluyentes: dos o más
eventos pueden ocurrir simultáneamente.
•Eventos colectivamente exhaustivos: por lo
menos uno de los eventos ocurre cuando se realiza
un experimento.
•Eventos equiprobables: eventos cuya
probabilidad de ocurrencia es la misma. Igualmente
probables.
Negro
Color
Palo Rojo Total
As 2 2 4
No-As 24 24 48
Total 26 26 52

Probabilidad Clásica
Basada en resultados posibles
e igualm ente probables
Probabilidad Em pírica
B asada en frecuencias relativas
O bjetivo
P arte de inform ación disponible o
subjetiva
Subjetivo
E nfoques de probabilidad

Enfoques de la Probabilidad
Probabilidad Objetiva:
– Probabilidad Clásica o a priori: Considera que los
resultados de un experimento son igualmente
posibles y mutuamente excluyentes.
Se calcula
P(E) = número de resultados favorables
número de resultados posibles
P(E), significa: probabilidad de ocurrencia del evento E.
La letra E, es una representación simbólica de un evento.
Ejemplo: E: sale cara

Enfoque clásico
• Ejemplo: Se desea
conocer la probabilidad de
obtener un “seis” en el
lado superior en el
lanzamiento de un dado.
• Como el dado tiene seis
lados, numerados del 1 al
6. Los posibles resultados
en el lanzamiento de un
dado son:
S = {1, 2, 3, 4, 5, 6}
Resultado
(Ei)
No. De
veces que
puede
salir
P(Ei)
Sale “1” 1 1/6
Sale “2” 1 1/6
Sale “3” 1 1/6
Sale “4” 1 1/6
Sale “5” 1 1/6
Sale “6” 1 1/6
Estos eventos son equiprobables, mutuamente excluyentes y colectivamente
exhaustivos.

Enfoque de probabilidad
Frecuentista
Número de veces que ha ocurrido el evento en el pasado
Número total de observaciones
P(E) =
P(E), significa: probabilidad de ocurrencia del evento E.
La letra E, es una representación simbólica de un evento.
Ejemplo: E: .. vender 5 computadoras hoy.

Enfoque Frecuentista
• Ejemplo: Un importador
de cristal irlandés de
Nueva York recibe envíos
de cajas de tres artículos.
Los datos para las últimas
100 cajas indicaron el
número de artículos
dañados que había en
cada caja. Los datos se
resumen a continuación:
Resultado
(E) Número
de defectos
Númer
o de
cajas
P(Ej)
0 40 40/100=0.4
1 27 27/100=0.27
2 21 21/100=0.21
3 12 12/100=0.12

Enfoques de la Probabilidad Subjetivo
Probabilidad Subjetiva: Se refiere a
la probabilidad de que suceda un
evento, asignado por una persona con
base a información de que disponga.
(información subjetiva)
– Ejemplos: Posibilidad de comprar un automóvil
nuevo este año,
– Posibilidad de que usted obtenga A en el curso.

Taller1
1. Se va a sacar una carta al azar de un juego estándar de baraja de 52 cartas.
¿Cuál es la probabilidad de que la carta sea una reina?.
2. Los empleados de General Cement se les practica cada año un examen
médico de rutina como parte de un programa de servicios de salud. Se
encontró que 8% de los empleados necesitaba zapatos correctivos, 15%
necesitaba un trabajo dental mayor, y un 3% necesitaba las dos cosas,
zapatos correctivos y un trabajo dental mayor.
A. ¿Cuál es la probabilidad de que un empleado seleccionado al azar necesite
zapatos correctivos o un trabajo dental mayor?
B. Ilustre el problema en forma gráfica (Diagramas de Venn).

Taller1
3. Durante el año anterior, las ventas semanales en Petunia’s Pet Shoppe han
sido “bajas” durante 16 semanas, “considerables”, durante 27 semanas y
“altas” el resto de las semanas. ¿Cuál es la probabilidad de que las ventas de
esta semana sean:
A. Considerables,
B. Bajas
C. Altas
4. Una carta se extrae aleatoriamente de una baraja de 52 cartas. Hallar la
probabilidad de:
Un As
Una jota de corazones
Un tres de tréboles o un seis de diamantes
Un diez o corazón negro
Cualquiera menos de corazones
5. Encontrar la probabilidad de no obtener un total de 7 u 11 en ninguno de los
dos lanzamientos de un par de dados normales.

Problemas para resolver
• La siguiente tabla muestra el número de computadoras
vendidos diariamente por una tienda minorista:
Número de computadoras
vendidas
Número de días
0 12
1 43
2 18
3 20
4 25
Determine la probabilidad de que el número de computadores que se vendan
hoy sea:
a. 2 b. Menos de 3 c. Más de 1

Axiomas o Reglas de probabilidad
• 0 ≤ P(E) ≤ 1, La probabilidad es siempre positiva
• P (S)= 1, Certidumbre o suceso seguro.
REGLAS DE ADICIÓN
PARA EVENTOS MUTUAMENTE EXCLUYENTES
P (A U B) = P (A) + P (B)
Esto expresa la probabilidad de que ocurra A ó ocurra B.
Cuando los eventos son mutuamente excluyentes, no pueden ocurrir simultáneamente.
Esto significa que no existe intersección.
Una extensión de la probabilidad: P (A U B U C) = P (A) + P (B) + P (C)
BA
P (A ∩ B) = 0

Ejemplo
• Un estudio de 200 cadenas de tiendas reveló estos ingresos,
después del pago de impuestos:
Ingresos después de
impuestos
Número de
empresas
TOTAL 200
(A) Menos de un millón 102
(B) De un millón a menos
de 20 millones
61
(C) 20 millones ó más 37
a) Cuál es la probabilidad de que una
cadena de tiendas tenga menos de
un millón de dólares en ingresos
después de pagar impuestos.
P(A) = 102 / 200 = 0.51 = 51%
b) Cuál es la probabilidad de que una cadena de tiendas tenga ingresos de un millón a menos de 20, ó
que tenga ingresos de 20 millones ó más.
P(B U C) = 61/ 200 + 37/ 200 = 0.305 + 0.185 =0.49 = 49%
c) Qué regla de probabilidad se aplicó. Se aplicó la regla de adición para eventos mutuamente
excluyentes

PARA EVENTOS NO MUTUAMENTE
EXCLUYENTES
P (A U B) = P (A) + P (B) – P(A ∩B)
A B
A ∩ B
EJEMPLO. Una carta de una baraja americana de 52 naipes se va a seleccionar en forma
aleatoria (al azar). Cuál es la probabilidad de que la carta seleccionada sea un rey o negra?
•La probabilidad de escoger un rey es P( R ) = 4 / 52
•La probabilidad de escoger una carta negra es P(N) = 26 / 52
•Los eventos no son mutuamente excluyentes, existe la posibilidad de extraer una carta que
tenga ambas características. Existen 2 reyes negros en un juego de cartas americanas.
•La Probabilidad de escoger un rey o una carta negra:
P( R U N) = P ( R ) + P ( N ) – P (R ∩ N)
= 4 / 52 + 26/ 52 – 2 / 52

• P (A U B U C) = P (A) + P (B) + P (C) – P(A∩B) – P(A∩C)– P (B∩C) + P(A ∩ B ∩C)
A B
C
A ∩ B
A∩C B∩C
A∩B∩C
REGLA DEL COMPLEMENTO
P(A)= 1 - P ( A’ )
DONDE LOS EVENTOS SON MUTUAMENTE EXCLUYENTES Y
COLECTIVAMENTE EXHAUSTIVOS

Taller 2.
1. Se entrevistará a un grupo de 2000 empelados de una compañía para preguntarles sobre un nuevo
plan de pensiones. Los empleados clasificaron como sigue:
Clasificación Evento N° de empleados
Supervisores A 120
De Mantenimiento B 50
De Producción C 1460
De Gerencia D 302
Secretarial E 68
a) Cuál es la probabilidad de que la primera seleccionada sea de mantenimiento ?
b) Cuál es la probabilidad de que sea de secretaria ?
c) Cuál es la probabilidad de que sea alguien de mantenimiento o secretaría?
d) Qué regla de probabilidad se aplicó en la pregunta anterior ?
e) Estos eventos son mutuamente excluyentes ?
f ) Cuál es la probabilidad de no seleccionar a una persona de mantenimiento?

2. Determine el espacio muestral para el lanzamiento de dos dados.
a) Cuál es la probabilidad de que ambos dados sumen 7 puntos
b) Cuál es la probabilidad de que ambos sumen un número par de puntos.
c) Cuál es la probabilidad de que sumen más de 8.

3. En una encuesta realizada en algunos países acerca de los productos de mayor
exportación, se encontró que: 10 países exportaban café; 15, petróleo y 13, frutas;
solamente 6 exportaban frutas y petróleo; 4, sólo frutas y café; 3, sólo café y petróleo; y 2
exportaban los tres productos.
a) Cuántos países fueron encuestados
b) Cuántos países exportaban sólo petróleo
c) Cuántos países exportaban sólo café.

4. En cierta empresa, 45 empleados que no aprobaron el entrenamiento en el uso de un sistema
de gestión administrativa, 32 dijeron que no aprobaron por no estudiar el manual; 18 porque no
le entendieron al instructor; y 9 por causas diferentes a estas dos. Encuentre la probabilidad de
los siguientes eventos:
a) Reprobó porque no estudió o porque no le entiende al instructor.
b) Reprobó porque no estudió y no le entiende al instructor
c) Reprobó porque no estudió y no porque no le entiende al instructor
d) Reprobó porque no le entiende al instructor y no porque no estudió.
9
14
18
4
45 – 9 = 36
32+18-36 = 14
32-14 =18
18-14= 4

REGLAS DE MULTIPLICACIÓN
Para eventos independientes ( La ocurrencia de un evento no tiene efecto en la
probabilidad de ocurrencia de cualquier otro)
P (A ∩ B) = P(A) * P(B) Probabilidad Conjunta, es decir que ocurra A y B
simultaneamente es igual al producto de las probabilidades de los eventos.
Para tres eventos A, B y C
P(A ∩ B ∩ C) = P(A) * P(B) *P(C)
Para eventos dependientes ( La ocurrencia de un evento tiene efecto en la
probabilidad de ocurrencia de cualquier otro)
P (A ∩ B) = P(A) * P(B / A) La probabilidad conjunta es igual a la probabilidad de A
por la probabilidad de B dado que ocurrió A, esta es la probabilidad condicional.
P(B/A) = P (A ∩ B) / P(A)
Para tres eventos A, B y C
P(A ∩ B ∩ C) = P(A) * P(B / A) *P(C / A ∩ B)

Ejemplos
Se lanzan al aire dos monedas. Cuál es la probabilidad de que ambas
salgan sello?
Entonces P(S) = 0.5 es la probabilidad de un sello. Los sucesos son
independientes ya que el hecho de que caiga sello en el primer
lanzamiento, no afecta la probabilidad de ocurrencia de un resultado
sello en el segundo segundo lanzamiento.
Probabilidad de que ambas caigan sello
P(S ∩ S ) = P(S ) * P(S) = 0.5 *0.5 = 0.25
Esto puede demostrarse enlistando los posibles resultados del lanzamiento
de dos monedas:
S = ( cc ; cs ; sc ; ss )
De los cuatro posibles resultados, uno sólo cumple con la condición de que
ambos sean sello. La probabilidad es uno de cuatro, es decir 0.25

• Práctica
• 1. Un inversionista compró 100 acciones en el HSBC y 25 de la Universidad
Latina de Panamá. La probabilidad de que las acciones del banco
incrementen su valor en un año es de 0.70. La probabilidad de que las
utilidades de la universidad se incrementen en el mismo periodo es de 0.60.
• .a) Cual es la probabilidad de que las dos acciones aumenten de precio
durante el período?
• .b) Cuál es la probabilidad de que las acciones del banco incremente su
precio, aunque las utilidades de la universidad no.
• .c) Cual es la probabilidad de que ambas acciones no aumenten?

sexo edad
B.R H 18
C.C M 19
C.G H 19
G.P M 20
M.P M 21
J.L H 20
L.A. M 21
N.D M 21
V.C H 22
V.F. H 19
L.L. H 18
J.N. M 21
J.P. M 21
U.P M 18
2. Sean los Sucesos
A = ser hombre (H)
B = edad< 20
A= Hombre Ac
= Mujer
B= < 20
Bc
= 20 o más
Probabilidades
P(A) =
4
62
2
6/14 = 0.43
P(B) = 6/14 = 0.43
P(A ∩ B) = 4/14 = 0.29
P(A ∪B) =
6/14 + 6/14 - 4/14 = 0.43+ 0.43 - 0.29 = 0.57
P(AB) = 4/6 = 0.67
P(A) + P(B) - P(A ∩ B)

3. Hay 10 rollos de película en una caja y 3 de ellos son defectuosos.
Se van a seleccionar 2 rollos, uno después de otro y sin reemplazo.
a) Cuál es la probabilidad de que ambos rollos sean defectuosos.
b) Cuál es la probabilidad de que exactamente uno sea defectuoso.
c) Si se eligen tres rollos, cuál es la probabilidad de que los dos
primeros sean buenos y el último salga defectuoso.

4. Una muestra aleatoria de empleados de una empresa
manufacturera se seleccionó para determinar sus planes de retiro
después de cumplir 65 años. Los seleccionados en la muestra se
dividieron en gerencia y producción. Los resultados fueron:
Empleados Planes después de
los 65 años
Total
Se
retira
No se
retira
Gerencia 5 15 20
Producción 30 50 80
Total 35 65 100
a) Trace un diagrama de arbol y
determine las probabilidad
conjunta ( sig. Diapositiva)
b) Cuál es la probabilidad de que un
empleado elegido al azar sea de
producción y no se retire después
de cumplidos los 65 años
P(P ∩ NR) = 50/100
c) Cuál es la probabilidad de que el
empleado se retire dado que sea
de gerencia
P( R/G)= 5/20

P(G) = 20 / 100
P(P) = 80 / 100
P(R/G) = 5/20
P(NR/G) = 15/20
P(R/P) = 30/80
P(NR/P) = 50 / 80
Probabilidad
Condicional
Probabilidad Conjunta ( La suma
de las probabilidades conjuntas da
la unidad o el 100%)
P(G ∩ R) = P(G) P(R/G) = (20 / 100) *(5/20)= 5/100
P(P ∩ NR) = P(P) P(NR/P) = (80 / 100) *(50/80)=
50/100
P(P ∩ R) = P(P) P(R/P) = (80 / 100) *(30/80)= 30/100
P(G ∩ NR) = P(G) P(NR/G) = (20 / 100) *(15/20)= 15/100
P Producción
G Gerencia
R Retirarse
NR No retirarse
Probabilidad
Marginal

Cuatro tipos de probabilidad
Marginal
La probabilidad
de que ocurra
X
Unión
La probabilidad
de que ocurra
X o Y
Conjunta
La probabilidad
de que ocurra
X e Y
Condicional
La probabilidad
de que ocurra
X sabiendo que
ha ocurrido Y
YX YX
Y
X
P X( ) P X Y( )∪ P X Y( )∩ P X Y( | )

Distribuciones de
Probabilidad

Distribuciones de Probabilidad
• Una distribución de probabilidad es un modelo matemático
que asocia valores de una variable aleatoria con sus
respectivas probabilidades, es decir:
• Las distribuciones se caracterizan por una fórmula que
determina el tipo de distribución y por un conjunto de
parámetros, que son propios de cada espacio muestral.
Probabilidad de x = Función de x

• En el caso de una variable discreta , la distribución puede
describirse mediante una función de probabilidad, que para cada
valor de x de la variable X determina la probabilidad de ser
asumido:
P( X= x) = p (x)
• o bien por medio de una función de distribución de probabilidad
acumulada o simplemente función de distribución, la que, para
cada valor provee la probabilidad de no ser superado superado
P( X≤ x) = F (x)
• evidentemente, el valor de la función de distribución es igual a la suma
de todos los valores de la función de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive

Ejemplo: Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales (2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12)

Se prepara una distribución de frecuencias de
los resultados

Tabla de distribución de probabilidad
X f (x) p(X=x)
P( X< x)
F (x) X * p(X) X
2
* p(X)
2 1 0.03 0.03 0.06 0.11
3 2 0.06 0.08 0.17 0.50
4 3 0.08 0.17 0.33 1.33
5 4 0.11 0.28 0.56 2.78
6 5 0.14 0.42 0.83 5.00
7 6 0.17 0.58 1.17 8.17
8 5 0.14 0.72 1.11 8.89
9 4 0.11 0.83 1.00 9.00
10 3 0.08 0.92 0.83 8.33
11 2 0.06 0.97 0.61 6.72
12 1 0.03 1.00 0.33 4.00
36 1.00 7.00 54.83
E(X) = µ = ∑ X p(X)
= 7.00
V(X) = σ2
= E(X 2
) – (E(X)) 2
= 54.83 – (7) 2
= 54.83-49
= 5.83
Valor esperado
Varianza

Distribución de X
0
1
2
3
4
5
6
7
2 3 4 5 6 7 8 9 10 11 12
X
F(x)
X
Grafica de la distribución de
probabilidad

Discretas Discontinuas o
Discretas

Distribución Binomial- Fórmula
Obsérvese que la fórmula incluye el término nCr
(combinaciones), p = probabilidad del éxito y
(1-p) es la probabilidad del fracaso.
• p y n, son los parámetros de esta distribución.
• La media y la varianza en esta distribución son:
∀ µ = n.p (media) y σ2
= n.p.(1-p) (varianza)
xnx
ppnCrxXP
pnxb
−
−== )1(.)(
),;(

Probabilidad Binomial
• Cuando el experimento se repite varias veces (ensayos), donde cada
ensayo tiene sólo dos posibilidades (éxitos o fracaso), entonces se puede
construir una distribución de probabilidad binomial.
• Para ello se debe conocer el número de ensayos que se realiza o el
número de muestras (n) y la probabilidad de éxito en cada ensayo.
• Su aplicación se da en variables discretas o no continuas, cuyas
respuestas son dicotómicas (dos alternativas como respuestas), es decir:
éxito o fracaso, ocurre o no ocurre el evento investigado.
• Su fórmula es sencilla para los cálculos de probabilidades donde el
número de veces que se repite el experimento es pequeño.

Distribución Binomial - Ejemplo
• En una situación binomial n=4 y p=0.25. Determine la
siguiente probabilidad utilizando la fórmula binomial.
– x=2 y obtenga la media para esta distribución.
Solución
P(x=2) = 4C2 (0.25)2
(1-0.25)(4-2)
= 6 * (0.0625) * (0.75) (2)
= 0.375 * 0.5625
= 0.2109
= 21.09%
Media = n.p = 4*0.25 = 1.0

Distribución de Poisson
• La distribución de Poisson se emplea cuando se
cuentan los eventos o entidades, distribuidos al azar
en espacio o tiempo.
• Supuestos:
– Las ocurrencias de los eventos son independientes.
– Teóricamente, es posible la ocurrencia de un evento un
número infinito de veces dentro del intervalo.
– La probabilidad de una sola ocurrencia del evento en un
intervalo dado es proporcional a la dimensión del intervalo.
– En cualquier fracción infinitesimal del intervalo, la probabilidad
de más de una ocurrencia del evento es insignificante.

Fórmula
• La función de probabilidad de la variable que
sigue una distribución de Poisson, se expresa;
!
)(
);(
x
e
xXP
xp
x
λ
λ
λ−
==
Donde: λ (parámetro) es el número de ocurrencias del
evento aleatorio dentro del intervalo de tiempo o
espacio.
e, es la constante (con cuatro decimales) 2.7183

Problemas
• Si el número promedio de accidentes graves por año en
una fábrica grande (donde el número de empleados es
constante) es de cinco, calcúlese la probabilidad de que
en el año en curso haya:
– Exactamente siete accidentes
– Diez o más accidentes
– Cero accidentes
• El cable utilizado para asegurar las estructuras de los
puentes tiene un promedio de 3 defectos por cada 100
yardas. Si usted necesita 50 yardas, ¿cuál es la
probabilidad de que haya una defectuosa?

Distribución de probabilidad
continua

Distribución de probabilidad (caso de
v.a.c)
• De todas las distribuciones de probabilidad que
se analizan, la distribución normal es la más
importante, dada su característica en forma de
campana y la forma como se relaciona con la
regla empírica.
fi
X

La función de distribución
• Puede existir un número infinito de distribuciones
normales posibles, cada una con su propia media y su
desviación estándar. Ya que obviamente no se puede
analizar un número tan grande de posibilidades es
necesario convertir todas estas distribuciones normales
a una forma estándar. Generando la distribución normal
estándar.
• El uso de esta distribución es útil cuando se desea,
además, eliminar la unidad de medida.

Función de distribución Normal
estándar
• Parámetros: µ (media) y σ (desviación estándar)
• para ∝<z< ∝
2/2
2
1
)( z
ezf −
=
π
Función de Distribución normal, para ∝<x< ∝
22
2/)(
2
1
)( σµ
πσ
−−
= x
exf

Cálculo de probabilidades con la
distribución normal estándar
• Transformación de la variable X a Z
σ
µ−
=
X
Z
Ejemplo:
Sea µ= 2.2 y σ=0.8, calcule la probabilidad de, X>3.3
0838.0
)38.1(
8.0
2.23.3
)3.3(
=
>=





 −
>=>
ZP
ZPXP

Resuelva
• P(z=0)
• P(z>=0.55)
• P(z<-2.33)
• P(z>-0.55)
• P(-1.96<=z<=1.96)
• P(z=0.74)

Resuelva
• Un estudio reciente de salario por hora de los equipos de
mantenimiento en las principales líneas aéreas demostró que el
salario promedio por hora fue 16.50 por hora, con una desviación
estándar de 3.50 dólares. Si se selecciona la azar al miembro de un
equipo, ¿Cuál es la probabilidad de que ese miembro gane:
– Entre 16.50 y 20.00 dólares por hora.
– Más de 20.00 dólares por hora.
– Menos de 15.00 dólares por hora.
• Una población normal tiene una media de 50.0 y una desviación
estándar de 4.0.
a) Calcule la probabilidad que el valor este entre 44.0 y 55.0
b) Calcule la Probabilidad de un valor mayor a 55.0
c) Calcule la Probabilidad de un valor entre 52.0 y 55.0

Aproximación normal a la
binomial
• Utilizar la distribución normal (una distribución continua)
como sustituto de una distribución binomial (una
distribución discreta) para valores grandes de n, parece
razonable porque conforme n aumenta, una distribución
binomial se acerca más a una distribución normal.
• La distribución de probabilidad normal, en general, se
considera una buena aproximación a la binomial
cuando
• np y n(1 -p ) son ambos mayores que 5.
7-18

Aproximación normal continuación
• Recuerde el experimento binomial :
– existen sólo dos resultados mutualmente excluyentes
(éxito o fracaso) en cada ensayo.
– una distribución binomial es el resultado de contar el
número de éxitos en una cantidad fija de ensayos.
– cada ensayo es independiente.
– la probabilidad es fija de un ensayo a otro, y el número
de ensayos n también es fijo.
7-19

Distribución binomial para n igual a 3 y 20, donde p =.50
7-20
n=3
0
0,1
0,2
0,3
0,4
0 1 2 3
número de eventos
P(x)
n=20
0
0,05
0,1
0,15
0,2
2 4 6 8 10 12 14 16 18 20
número de eventos
P(x)

Factor de corrección por
continuidad
• El valor .5 se resta o se suma,
dependiendo del problema, a un valor
seleccionado cuando una distribución de
probabilidad binomial (una distribución
discreta) se aproxima por una
distribución de probabilidad continua (la
distribución normal).
7-21

EJEMPLO 6
• Un estudio reciente de una compañía
de investigación de mercados mostró
que 15% de las casas en Estados
Unidos poseen una cámara de video.
Se obtuvo una muestra de 200 casas.
• De las 200 casas en la muestra
¿cuántas se espera que tengan una
cámara de video?
30)200)(15(. === npµ
7-22

EJEMPLO
• ¿Cuál es la variancia?
• ¿Cuál es la desviación estándar?
• ¿Cuál es la probabilidad de que menos de 40 casas de la
muestra tengan cámara de video?
• Se necesita P(X<40) = P(X< 39). Así, Al usar la aproximación
normal,
P(X<39.5) = P [z (39.5-30)/5.0498] =
P(z< 1.8812) P(z<1.88)=.5+.4699 +.9699
5.25)15.1)(30()1(2
=−=−= pnpσ
σ= =255 5 0498. .
≈
≤ ≤
7-23

- 5
0 . 4
0 . 3
0 . 2
0 . 1
. 0
f(x
r a l i t r b u i o n : µ = 0 , σ2
= 1
EJEMPLO
0 1 2 3 4
P(z = 1.88)
.5 + .4699
= .9699
z = 1.88
© 2001 Alfaomega Grupo Editor

“Distribución Muestral e
Intervalos de Confianza”

¿Por qué obtener muestras de la
población?
• Existe una imposibilidad física de verificar todos
los elementos de la población.
• El costo de estudiar todos los elementos de una
población es alto.
• Los resultados de la muestra suelen ser
adecuados.
• Contactar a toda la población es tardado, por la
naturaleza destructiva de ciertas pruebas.
8-3

Muestra aleatoria
• Una muestra aleatoria es una muestra
seleccionada de manera que cada
elemento o persona en la población que
se estudia tiene una probabilidad
conocida de quedar incluido en la
muestra.
8-4

Métodos de muestreo aleatorio
• Muestra aleatoria simple: muestra formulada
de manera que cada elemento o persona en la
población tiene la misma oportunidad de
quedar incluida.
• Muetra aleatoria sistemática: los artículos o
individuos de la población se colocan en cierto
orden. Se elige un punto de partida aleatorio y
después se selecciona uno cada k-ésimo
elemento de la población para la muestra.
8-5

Métodos de muestreo aleatorio
• Muestreo aleatorio estratificado: se divide la
población en subgrupos, llamados estratos,
y se selecciona una muestra de cada
estrato.
• Muestreo por conglomeración: primero se
divide la población en subgrupos (estratos),
y se selecciona un estrato. La muestra se
toma del estrato seleccionado.
• El error de muestreo es la diferencia entre
un estadístico muestral y su parámetro
correspondiente.
8-6

Distribución de muestreo de
medias muestrales
• La distribución de muestreo de medias
muestrales es la distribución de
probabilidad de todas la medias
muestrales posibles de un tamaño de
muestra dado, seleccionadas de una
población, y la probabilidad de
ocurrencia asociada con cada media
muestral.
8-7

EJEMPLO 1
• El despacho de abogados HERR &
Asociados tiene cinco socios. En su junta de
socios semanal cada uno informa el número
de horas que cobraron a los clientes por sus
servicios la semana anterior.
• Si se seleccionan al azar dos socios,
¿cuántas muestras diferentes son posibles?
Socio Horas
TITO 22
TONI 26
REY 30
TIFFANY 26
LISBETH 22
8-8

EJEMPLO 1 continuación
• Ésta es la combinación de 5 objectos
tomados de 2 en 2. Es decir,
5 2 5 2 3 10c = =( !) /[( !)( !)]
Socios Total Media
1,2 48 24
1,3 52 26
1,4 48 24
1,5 44 22
2,3 56 28
2,4 52 26
2,5 48 24
3,4 56 28
3,5 52 26
4,5 48 24
8-9

• Organice las medias muestrales en una
distribución de muestreo.
Media
muestral
Frecuencia Frecuencia
relativa
22 1 1/10
24 4 4/10
26 3 3/10
28 2 2/10
8-10

• Calcule la media de las medias
muestrales y compárela con la media
poblacional:
– media de las medias muestrales = [(22)(1) +
(24)(4) + (26)(3) + (28)(2)]/10=25.2
– media poblacional = (22+26+30+26+22)/5 =
25.2
– observe que la media de las medias
muestrales es igual a la media poblacional.
8-11

Teorema del límite central
• Para una población con media µ y variancia
σ2
, la distribución de muestreo de las medias
de todas las muestras posibles de tamaño n
obtenidas de una población tendrá una
distribución normal aproximada — con la
media de la distribución de muestreo igual a
µ y la variancia igual a σ2
/n — si se supone
que el tamaño de la muestra es
suficientemente grande.
8-12

Estimaciones puntuales
• Una estimación puntual es un valor (punto) que se
usa para estimar un parámetro de la población.
• Ejemplos de estimaciones puntuales son media
muestral, desviación estándar muestral, variancia
muestral, relación proporcional de la muestra, ...
• EJEMPLO 2: se registra el número de defectos
producidos durante 5 horas seleccionadas al azar
en una semana de 40 horas. Los defectos
observados fueron 12, 4, 7, 14 y 10. La media
muestral es 9.4. Entonces la estimación puntual
para el promedio de defectos por hora es 9.4.
8-13

Estimaciones de intervalo
• Una estimación de intervalo
establece la amplitud en la que quizá
se encuentre un parámetro
poblacional.
• El intervalo dentro del cual se espera
que esté un parámetro poblacional se
llama intervalo de confianza.
• Los dos intervalos de confianza que
más se usan son 95% y 99%.
8-14

Estimaciones de intervalo
(continuación)
• Un intervalo de confianza de 95% significa que
cerca de 95% de los intervalos similares
contendrán el parámetro que se quiere estimar, o
95% de las medias muestrales para un tamaño de
muestra dado estarán dentro de 1.96 desviaciones
estándar de la media poblacional hipotética.
• Para el intervalo de confianza de 99%, un 99% de
las medias muestrales para un tamaño de muestra
dado estará dentro de 2.58 desviaciones estándar
de la media poblacional hipotética.
8-15

Error estándar de la media muestral
• El error estándar de las medias muestrales es
la desviación estándar de la distribución de
muestreo de las medias muestrales.
• Se calcula mediante
∀ σx es el símbolo del error estándar de las
medias muestrales.
∀ σ es la desviación estándar de la población.
• n es el tamaño de la muestra.
σ
σ
x
n
=
8-16

Error estándar de la media muestral
• Si σ no se conoce y n ≥ 30, la desviación
estándar de la muestra, denotada por s,
se usa para aproximar la desviación
estándar poblacional. La fórmula para el
error estándar se convierte en:
s
s
nx =
8-17

Intervalos de confianza de 95% y 99% para µ
• Los intervalos de confianza de 95% y 99% para
µ cuando n ≥ 30 se forman como sigue:
el IC de 95% para la media poblacional está
dado por
• el IC de 99% para la media poblacional está
dado por
X
s
n
±196.
X
s
n
±2 58.
8-18

Construcción general de IC para µ
• En general, un intervalo de confianza para
la media se calcula mediante:
X Z
s
n
±
8-19

EJEMPLO 3
• El director de la escuela de administración
desea estimar el número medio de horas por
semana que estudian los alumnos. Una
muestra de 49 estudiantes dio una media de
24 h con desviación estándar de 4 h.
• La estimación puntual es 24 h (media
muestral).
• ¿Cuál es el intervalo de confianza de 95%
para el número promedio de horas por
semana que estudian los alumnos?
8-20

• Si se usa un IC de 95% para la media
poblacional, se tiene
• Los puntos terminales del intervalo de
confianza son los límites de confianza. El límite
inferior de confianza es 22.88 y el límite
superior de confianza es 25.12
12.25a88.22)7/4(96.124 =±
8-21

Intervalo de confianza para una relación
proporcional de población
8-22
• El intervalo de confianza para una
relación proporcional de una población
se estima como:
• donde es el error estándar de la
proporción:
σp
σp
p p
n
=
−( )1
p z p± σ

EJEMPLO 4
• Luis Broce, planificador financiero, estudia los
planes de retiro para jóvenes ejecutivos. Una
muestra de 500 ejecutivos que son dueños de sus
casas reveló que 175 planean venderlas y
retirarse en Coronado. Desarrolle un intervalo de
confianza de 98% para la proporción de ejecutivos
que planean vender e irse a Coronado.
• Aquí, n = 500, p =175/500=0.35 y z = 2.33
• el IC de 98% es
497.035.0o
500
)65.0)(35.0(
33.235.0 ±±
8-23

Factor de corrección de población finita
• Se dice que una población con una cota
superior fija es finita.
• Para una población finita, donde el número
total de objetos es N y el tamaño de la
muestra es n, se hace el siguiente ajuste a
los errores estándar de las medias
muestrales y a las proporciones:
• Error estándar de las medias
muestrales:
σ
σ
x
n
N n
N
=
−
−1
8-24

Factor de corrección de población finita
8-25
• Error estándar de las proporciones de las
muestras:
• Este ajuste se llama factor de corrección de
población finita.
• Nota: si n/N < 0.05, el factor de corrección de
población finita se ignora.
1
)1(
=σ
N
nN
n
pp
p

EJEMPLO 5
8-26
• Dada la información del EJEMPLO 4, construya un
intervalo de confianza de 95% para el número medio de
horas estudiadas por semana si hay sólo 500
estudiantes en la escuela.
• Dado que n/N = 49/500 = 0.098>0.05, se tiene que usar
el factor de corrección de población finita.
24 196
4
49
500 49
500 1
22 9352 250648±
−
−
=. ( )( ) [ . , . ]

Selección del tamaño de muestra
• Existen 3 factores que determinan el tamaño
de una muestra, ninguno de ellos tiene una
relación directa con el tamaño de la
población. Los factores son:
• El grado de confianza elegido.
– El error máximo permitido.
– La variación en la población.
8-27

Variación en la población
• Tamaño de la muestra para la media: una
fórmula computacional conveniente para
determinar n es:
• donde: E es el error permitido, Z es el valor
normal estándar asociado con el grado de
confianza seleccionado y S es la desviación
estándar estimada del estudio piloto.
n
Z S
E
=
•





2
8-28

EJEMPLO 6
• Un grupo de consumidores desea estimar la
media mensual en los recibos de luz para
una casa unifamiliar. Según estudios
similares la desviación estándar se estima
en $20.00. Se desea un nivel de confianza
de 99%, con una precisión de ±$5.00.
¿Qué tamaño de muestra se requiere?
n = = ≈[( . )( ) / ] .2 58 20 5 106 5024 1072
8-29

Tamaño de la muestra para
proporciones
8-30
• La fórmula para determinar el tamaño de la muestra en
el caso de una proporción es:
• donde p es la proporción estimada, basada en la experiencia o en
un estudio piloto; z es el valor asociado con el nivel de confianza
deseado; E es el error máximo que tolerará el investigador.
n p p
Z
E
= −





( )1
2

EJEMPLO 7
• El club canino de Panamá desea estimar la
proporción de niños que tienen un perro
como mascota. Si el club quiere la
estimación dentro de 3% de la relación
proporcional, ¿cuántos niños deberán
contactar? Suponga 95% de nivel de
confianza y que el club estimó que 30% de
los niños tienen un perro como mascota.
8973.896)03.0/96.1)(70.0)(30.0( 2
≈==n
8-31

Pruebas de Hipótesis.Pruebas de Hipótesis.

Hipótesis.Hipótesis.
Puede definirse como: Una Frase o una Proposición que
es una afirmación de que algo es verdadero.
En estadística se distinguen dos tipos de Hipótesis:
Hipótesis Nula, Ho: Es la hipótesis que se prueba (se
rechaza o no se rechaza la afirmación). Esta es el
punto inicial de la investigación.
Hipótesis Alternativa, Ha: Es la afirmación que
representa el interés del investigador, y está
relacionada con el mismo parámetro de la población
de la Hipótesis Nula. A veces la hipótesis alternativa se
denomina hipótesis de investigación.
La hipótesis nula y alternativa son opuestas la una a la
otra.

Ejemplo.Ejemplo.
Supóngase que realizará un fiesta, y se quiere demostrar
el éxito de la misma. Usted, podría pensar o estar casi
seguro de una alta probabilidad de que ésta sea un
éxito.
Entonces la hipótesis opuesta (Nula) a la de su interés en
probar, es:
Ho: “La fiesta será un fracaso”,
mientras que su hipótesis alternativa (de investigación) es
que:
Ha: “La fiesta será un éxito”.

Hipótesis Estadística.
• Como las hipótesis, se relacionan con un parámetro poblacional,
media, proporción o varianzas, entonces una forma de expresar la
hipótesis estadísticamente es por ejemplo:
– Ho: µ = µ o.
– Ha: µ ≠ µ o.
• Expresado literalmente es:
– Ho: La media es igual a un valor µ o.
– Ha: La media es distinta de un valor µ o.
• Obsérvese que µ o es un valor específico de interés o de
comparación para determinar el “rechazo” o” no rechazo” de Ho.

Error Tipo I y Tipo II.
Una forma de ver este concepto, es a través del
siguiente cuadro.
Decisión
Hipótesis nula
Verdadera Falsa
No rechazar Ho
Rechazar Ho
Decisión correcta tipo A
Error tipo I
Error de tipo II
Decisión correcta de tipo
B.
Las pruebas de hipótesis consideran datos muestrales para la
obtención de estimaciones de los parámetros poblaciones. Por lo
tanto, hay un riesgo asociado con la decisión que se tome.

Error Tipo I y Tipo II.
El riesgo, es una probabilidad, veamos
Cuando se toma una decisión, sería agradable escoger siempre la opción
correcta. Sin embargo, esto no es posible en estadística, ya que la decisión se
toma con base en la información muestral. Lo mejor que puede esperarse es
controlar la probabilidad con que ocurre un error. La probabilidad asignada al
error tipo I se denomina α “alfa”. La probabilidad del error tipo II se denomina
β “beta” (alfa y beta, son las dos primeras letras del alfabeto griego).
Error en la
decisión
Tipo Probabilidad Decisión correcta Tipo Probabilidad
Se rechaza
una Ho
verdadera
I α No se rechaza
una Ho verdadera
A 1-α
No se rechaza
una Ho falsa
II β Se rechaza una
Ho falsa
B 1-β

Nivel de significancia (Nivel de significancia (αα).).
Es la probabilidad de cometer el error tipo I.
Establecer el nivel de significancia puede interpretarse
como una “decisión gerencial”. Por lo general, alguien a
cargo determina el nivel de probabilidad con que desea
arriesgar un error tipo I.

Estadística de prueba.Estadística de prueba.
Es la variable aleatoria cuyo valor se calcula a partir de
los datos muestrales y que se utiliza para tomar la
decisión de “no rechazar Ho” o “rechazar Ho”
El valor de la estadística de prueba es calculado, según
la distribución del parámetro a probar “z” o “t”
calculado y se utiliza junto con una regla de decisión
para determinar si “se rechaza Ho” o “no se rechaza
Ho”.

Regla de decisión.Regla de decisión.
La regla de decisión debe ser establecida antes de
recolectar los datos y después de planteado las hipótesis.
Además especifica cómo se llegará a una decisión.
En la regla de decisión se compara, generalmente un
valor calculado con el estadístico de prueba, con un
valor crítico (o coeficiente de una distribución “z” o “t”,
obtenido con la probabilidad de cometer el error tipo I o
nivel de significación).

Regla de decisión.Regla de decisión.
Generalmente, se distinguen dos situaciones:
a. Pruebas de hipótesis de dos colas, (dos valores
críticos) para la toma de decisiones.
b. Pruebas de hipótesis de una cola, (un solo valor
crítico) para la toma de decisiones.

Regla de decisión. Pruebas deRegla de decisión. Pruebas de
hipótesis de dos colas.hipótesis de dos colas.
Específicamente, se utiliza cuando la hipótesis del investigador, considera la
relación “diferente” ó “≠ ”.
Recordemos que la distribución del parámetro media o proporción, siguen
distribuciones en forma de campana simétricas.
c representa el valor crítico del estadístico de prueba y se obtiene a partir del nivel
de significancia α, establecido. Tiene dos regiones de rechazo de Ho, (cola 1 y
cola 2).
-c c
Cola 1. Cola 2.
Caso donde las
Hipótesis son:
Ho: µ = µ o.
Ha: µ ≠ µ o.

hipótesis de una cola.hipótesis de una cola.
Específicamente, se utiliza cuando la hipótesis del
investigador, considera la relación “menor que”.
-c
Cola 1.
Caso donde las
Hipótesis son:
Ho: µ = µ o.
Ha: µ < µ o.
El valor crítico, es
uno solo y la
región de rechazo
de Ho, se ubica del
lado izquierdo de
la curva (cola 1).

hipótesis de una cola.hipótesis de una cola.
Recordemos, que el valor crítico depende del estadístico de prueba a
utilizar y del nivel de significancia. Estos valores se encuentran en
las tablas de distribuciones de probabilidad t-student, Z-Normal
estándar, según sea el caso.
c
Cola 2.
Caso donde las
Hipótesis son:
Ho: µ = µ o.
Ha: µ > µ o.
Relación “mayor que”

Procedimiento de cinco pasos. PruebaProcedimiento de cinco pasos. Prueba
de Hipótesis clásica.de Hipótesis clásica.
Procedimiento de cinco pasos. PruebaProcedimiento de cinco pasos. Prueba
de Hipótesis clásica.de Hipótesis clásica.
1. Describir el parámetro de la población de interés.
2. Establecer la hipótesis nula (Ho) y alternativa Ha).
3. Especificar los criterios de prueba.
a. Comprobar los supuestos.
b. Identificar la estadística de prueba a utilizar.
c. Determinar el nivel de significancia, α.
d. Determinar la(s) región (regiones) crítica(s) y el (los) valores
crítico(s).
4. Recolectar y presentar los hechos muestrales.
a. Recolectar la información muestral.
b. Calcular el valor de la estadística de prueba.
5. Determinar los resultados
a. Determinar si el valor de la estadística de prueba está o no en la región
crítica.
b. Tomar una decisión sobre Ho.
c. Escribir una conclusión sobre Ha.

Pruebas de Hipótesis. UnaPruebas de Hipótesis. Una
población.población.
1. Pruebas de Hipótesis de la media µ (σ
conocida): Enfoque clásico.
Supuesto para pruebas de hipótesis sobre la media µ
usando una σ conocida: la distribución muestral de la media
muestral, está contenida en la distribución muestral de medias
muestrales y en el Teorema de Límite Central. (Visto
anteriormente en clases).

Un grupo de abogados, que protegen los intereses de los
consumidores, desea refutar la afirmación que hace un
fabricante de gasolina sobre un modelo de automóvil
que promedia 24 millas por galón de gasolina.
Específicamente, el grupo quiere demostrar que las
millas medias por galón son considerablemente menores
que las 24 millas que dice el fabricante. Establecer la
hipótesis nula y la alternativa.
Veamos esta prueba de hipótesis con una ilustración:
Ejemplo

SoluciónSolución
Datos:
• El parámetro de población en cuestión es: “el número medio de
millas recorridas logrado por este modelo de automóvil”
• 24 millas por galón, es el valor específico de interés o de
comparación del parámetro, es decir, µo .
• La relación propuesta por los abogados es, “el número medio de
millas recorridas logrado por este modelo de automóvil” es
menor que 24 millas por galón, es decir: µ < 24.

Solución (continuación)Solución (continuación)
Datos (continuación):
• La afirmación opuesta a lo propuesto por los abogados, es:
“el número medio de millas recorridas logrado por este
modelo de automóvil no es menor que 24 millas por
galón”, es decir, µ ≥ (mayor o igual que) 24.
• Recuerde que la hipótesis nula contiene el signo “igual”.

Solución (conclusión)Solución (conclusión)
Datos (continuación):
• Las Hipótesis, planteadas son:
•Ho: El número medio de millas recorridas logrado por
este modelo de automólvil es mayor o igual que 24.
•Ha: El número medio de millas recorridas logrado
por este modelo de automólvil es menor que 24.
• Estadísticamente,
•Ho: µ ≥ 24 ó ( µ = 24) y Ha: µ < 24

Estadístico de Prueba deEstadístico de Prueba de
Hipótesis de la mediaHipótesis de la media µµ, con, con σσ
conocidaconocida
El estadístico de prueba en este caso, se define como, “zeta
estrella” ó z*
n
x
z
/
*
σ
µ−
=
Bajo el supuesto de que los las medias muestrales siguen una
distribución normal y cumpliendo con el Teorema de Límite
Central, además considerando la varianza poblacional ( σ )
conocida.

Nivel de significaciónNivel de significación
(alfa)(alfa)
El nivel de significancia, α, generalmente se establece de
acuerdo al rigor en la decisión deseado del
investigador, en 0.05 ó 0.01. (probabilidad de cometer
el error tipo I). Y se busca en las tablas de distribución
t ó Z, según sea el caso, tal como se hizo al elaborar
intervalos de confianza.

Ejemplo:Ejemplo:
Se afirma que el peso medio de las estudiantes de una
universidad es de 54.4 kg. El profesor Hart no cree en esta
afirmación y trata de demostrar lo contrario. Para probar la
afirmación, recolecta una muestra aleatoria de 100 pesos
entre las alumnas universitarias. Obtiene una media de la
muestra de 53.75 kg. ¿este hecho es suficiente para que el
profesor Hart rechace la afirmación?. Use α =0.05 y
σ=5.4kg.
Datos: n= 100, µo= 54.4 kg., α =0.05 y σ=5.4kg.

Ejemplo: Solución.Ejemplo: Solución.
Datos: n= 100, µo= 54.4 kg., α =0.05 y σ=5.4kg.
Paso 1. El parámetro de interés: µ, el peso
medio de todas las estudiantes de una
universidad.
El parámetro de interés: µ, el peso
medio de todas las estudiantes de una
universidad.
Paso 2. La hipótesis nula y alternativa son:
Ho: El peso medio de las estudiantes de
una universidad es igual a 54.4 kg.
Ha. El peso medio de las estudiantes de
una universidad no es igual a 54.4 kg.
La hipótesis nula y alternativa son:
Ho: El peso medio de las estudiantes de
una universidad es igual a 54.4 kg.
Ha. El peso medio de las estudiantes de
una universidad no es igual a 54.4 kg.

Paso 2.
Estadísticamente, las hipótesis son expresadas
como:
Ho. µ = 54.4 kg.
Ha. µ ≠ 54.4 kg.
Estadísticamente, las hipótesis son expresadas
como:
Ho. µ = 54.4 kg.
Ha. µ ≠ 54.4 kg.
Paso 3.
Los criterios de prueba son:
a. Los pesos de un grupo de estudiantes siguen
una distribución aproximadamente norma,
debido a que la muestra es suficientemente
grande (n=100).
b. La estadística de prueba, por tanto, a utilizar es
z*
a. Los pesos de un grupo de estudiantes siguen
una distribución aproximadamente norma,
debido a que la muestra es suficientemente
grande (n=100).
b. La estadística de prueba, por tanto, a utilizar es
z*

Paso 3.
c. El nivel de significancia planteado es: α = 0.05
(dado en el problema).
d. Las regiones críticas (valores críticos), se
determinan, con el nivel de significancia entre
dos, ya que se trata de una prueba de hipótesis
de dos colas, entonces el nivel de significancia
es 0.025.
c. El nivel de significancia planteado es: α = 0.05
(dado en el problema).
d. Las regiones críticas (valores críticos), se
determinan, con el nivel de significancia entre
dos, ya que se trata de una prueba de hipótesis
de dos colas, entonces el nivel de significancia
es 0.025.
-c c
α/2=0.025 α/2=0.025

Paso 3.
Luego, buscando en la tabla Normal estándar, el valor
crítico, para α/2 = 0.025 y para (1- α/2)= 0.975, ó
simplemente para (1- α/2)= 0.975, ya que la
distribución normal es simétrica.
Entonces, el valor de z, para 0.975, es 1.96.
Reempalzando en –c y c. La región de decisión, se
determina como: -1.96 y 1.96.
Si el estadístico z*, se encuentra entre –1.96 y 1.96 no se
rechaza Ho.
Luego, buscando en la tabla Normal estándar, el valor
crítico, para α/2 = 0.025 y para (1- α/2)= 0.975, ó
simplemente para (1- α/2)= 0.975, ya que la
distribución normal es simétrica.
Entonces, el valor de z, para 0.975, es 1.96.
Reempalzando en –c y c. La región de decisión, se
determina como: -1.96 y 1.96.
Si el estadístico z*, se encuentra entre –1.96 y 1.96 no se
rechaza Ho.
-1.96 1.96
α/2=0.025 (α/2)=0.025
Región de
no rechazo
de Ho.

Paso 4.
a. La información muestral es: media muestral “equis
barra” es 53.75 y n=100.
b. El cálculo del estadístico de prueba, al aplicar la
fórmula es:
a. La información muestral es: media muestral “equis
barra” es 53.75 y n=100.
b. El cálculo del estadístico de prueba, al aplicar la
fórmula es:
-1.96 1.96
α/2=0.025 (α/2)=0.025
Región de
no rechazo
de Ho.
20.1
100/4.5
4.5475.53
/
* −=
−
=
−
=
n
x
z
σ
µ

Paso 5.
a. Decisión: Como z*=-1.20, se encuentra en la región
de no rechazo de Ho.
b. En conclusión, No hay suficientes hechos al nivel de
significancia 0.05 que demuestren que las
estudiantes tienen un peso medio diferente de los
54.4 kg indicados. En otras palabras, no hay hechos
estadísticos que sustenten los argumentos del
profesor Hart.
a. Decisión: Como z*=-1.20, se encuentra en la región
de no rechazo de Ho.
b. En conclusión, No hay suficientes hechos al nivel de
significancia 0.05 que demuestren que las
estudiantes tienen un peso medio diferente de los
54.4 kg indicados. En otras palabras, no hay hechos
estadísticos que sustenten los argumentos del
profesor Hart.
-1.96 1.96
α/2=0.025 (α/2)=0.025
Región de
no rechazo
de Ho.

Pruebas de Hipótesis de laPruebas de Hipótesis de la
mediamedia µµ ((σσ desconocida):desconocida):
El estadístico de prueba, a utilizar es:
ns
x
t x
n
/
1
µ−
=−
Cuando la varianza poblacional no es conocida, se utiliza
el estadístico t-student. Recordemos, que usualmente, la
varianza poblacional es desconocida y que se utiliza la
varianza estimada S. El estadístico t, sigue una distribución
t-student con n-1 grados de libertad.

3. Pruebas de Hipótesis para3. Pruebas de Hipótesis para
proporciones.proporciones.
El estadístico de prueba, para el caso de proporciones en
una sola muestra, es:
n
pp
pp
Z o
)1( −
−
=
p, es el número de éxitos en la muestra entre el tamaño
de la muestra: x/n.
po, es el valor específico de interés o de comparación.

Análisis de Correlación y
Regresión Lineal

Suposiciones fundamentales de
regresión lineal
• Para cada valor de X, existe un grupo de valores de Y
que tienen una distribución normal.
• Las medias de estas distribuciones normales de
valores de Y deben estar sobre la recta de regresión.
• Las desviaciones estándar de estas distribuciones
normales son iguales.
• Los valores de Y son estadísticamente independientes.
Es decir, que en la selección de una muestra, los
valores elegidos de Y para un valor particular de X no
depende de los valores de Y para otro valor de X.

Método estadístico de regresión
lineal simple
• Se determina el valor de la recta y = a + bx,
calculada mediante la fórmula de los mínimos
cuadrados obteniendo la línea que mejor se
ajuste al nube de puntos que representa dos
variables: una dependiente y una
independiente
• Pasos:
1) Elaborar diagrama de dispersión.
2) Calcular coeficientes de correlación.
3) Realizar el Análisis de regresión.
4) Verificar la línea de tendencia.
0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10 12

Generalidades del Análisis de
correlación
• Análisis de correlación: se usa un grupo
de técnicas estadísticas para medir la
fuerza de la relación (correlación) entre
dos variables.
• Diagrama de dispersión: gráfica que
describe la relación entre las dos variables
de interés.
• Variable dependiente: la variable que se
pronostica o estima.
• Variable independiente: la variable que
proporciona la base para la estimación. Es
la variable predictora.

Coeficiente de correlación, r
• El coeficiente de correlación (r) es una medida de
la intensidad de la relación entre dos variables o
más
• Requiere datos con escala de intervalo o de razón (variables).
• Puede tomar valores entre -1.00 y 1.00. (-100% y 100%)
• Valores de -1.00 o 1.00 indican correlación fuerte y perfecta.
• Valores cercanos a 0 indican correlación débil.
• Valores negativos indican una relación inversa y valores positivos
indican una relación directa.
Interpretación
• Este coeficiente de correlación nos indica la medida en que están
relacionados las variables. Si es muy cercano a 100% la relación es
lineal, fuerte y directa.
• Es decir que a medida que aumenta una también aumenta la otra
• Si es cercana a 0, no significa ausencia de relación, sino que podría
existir otro tipo de relación distinta a la lineal ( parabólica, exponencial,
logarítmica)

Correlación negativa perfecta
0 1 2 3 4 5 6 7 8 9 10
10
9
8
7
6
5
4
3
2
1
0
X
Y

Correlación positiva perfecta
0 1 2 3 4 5 6 7 8 9 10
10
9
8
7
6
5
4
3
2
1
0
X
Y

Correlación cero
0 1 2 3 4 5 6 7 8 9 10
10
9
8
7
6
5
4
3
2
1
0
X
Y

Correlación positiva fuerte
0 1 2 3 4 5 6 7 8 9 10
10
9
8
7
6
5
4
3
2
1
0
X
Y

Fórmula para r (Coeficiente de
Correlación)
[ ] ( ) ( )[ ]2222
)()(
))(()(
=
YYnXXn
YXXYn
r
Σ−ΣΣ−Σ
ΣΣ−Σ
-1 -0.75 - 0.5 0 0.5 0.75 1
Perfecta Fuerte Moderada Nula Moderada Fuerte Perfecta
inversa directa

Coeficiente de determinación R
= r2
• El coeficiente de determinación, r2
es la
proporción de la variación total en la variable
dependiente Y que está explicada por, o se
debe a la variación en la variable independiente
X.
• El coeficiente de determinación es el cuadrado
del coeficiente de correlación, y toma valores
de 0 a 1. (0% a 100%)
• Mientras más alto más explicativa es la variable
independiente.

Ejemplo. Realizar el análisis de
correlación
Puntos (X)
Salario Actual
Y
183 300.00
263 328.00
276 400.00
313 400.50
356 410.00
404 410.00
417 430.00
546 490.00
547 520.00
3,305 3,688.50
Dibujar el diagrama de
dispersión
Diagrama de Dispersión
0
100
200
300
400
500
600
0 100 200 300 400 500 600
Puntos
SalarioActual
El diagrama de dispersión nos indica
que existe una relación lineal directa y
fuerte entre los puntajes y los salarios.

Ejemplo. Realizar el análisis de
correlación
Puntos (X)
Salario Actual
Y X2 Y2 XY
183 300.00 33,489.0 90,000.0 54,900.0
263 328.00 69,169.0 107,584.0 86,264.0
276 400.00 76,176.0 160,000.0 110,400.0
313 400.50 97,969.0 160,400.3 125,356.5
356 410.00 126,736.0 168,100.0 145,960.0
404 410.00 163,216.0 168,100.0 165,640.0
417 430.00 173,889.0 184,900.0 179,310.0
546 490.00 298,116.0 240,100.0 267,540.0
547 520.00 299,209.0 270,400.0 284,440.0
3305 3,688.50 1,337,969.00 1,549,584.25 1,419,810.5
[ ] ( ) ( )[ ]2222
)()(
))(()(
=
YYnXXn
YXXYn
r
Σ−ΣΣ−Σ
ΣΣ−Σ
9 (1,419,810.5) – (3,305)(3,688.5)
9 (1,337,969) - (3,305)2
9 (1,549,584.25) - (3,688.5)2
r = = 0.95
Tabla 2.

El Análisis de regresión
• Propósito: determinar la ecuación de
regresión; se usa para predecir el valor de
la variable dependiente (Y) basado en la
variable independiente (X).
• Procedimiento: seleccionar una muestra
de la población y enumerar los datos por
pares para cada observación; dibujar un
diagrama de dispersión para visualizar la
relación; determinar la ecuación de
regresión.

Análisis de regresión
• La ecuación de regresión: Yi’= a + b Xi donde:
• Yi’ es el valor promedio pronosticado de Y para cualquier valor
de Xi.
• a es la intercepción en Y, o el valor estimado de Y cuando X = 0
• b es la pendiente de la recta, o cambio promedio en Y’ por cada
cambio de una unidad en X. (cambio promedio en salario por
cada unidad de cambio en puntos)
• Se usa el principio de mínimos cuadrados para obtener
los parámetros a y b:
b
n XY X Y
n X X
a
Y
n
b
X
n
=
−
−
= −
( ) ( )( )
( ) ( )
Σ Σ Σ
Σ Σ
Σ Σ
2 2

Continuación del EJEMPLO
b
n XY X Y
n X X
a
Y
n
b
X
n
=
−
−
= −
( ) ( )( )
( ) ( )
Σ Σ Σ
Σ Σ
Σ Σ
2 2
9 (1,419,810.5) – (3,305)(3,688.5) 587,802
9 (1,337,969) - (3,305)2
1,118,696
.b = = = 0.5254
(3,688.5) - 0.5254 (3,305)
9 9
a.=
Utilizando las fórmulas para los
parámetros y reemplazando los
valores obtenidos en la tabla 2.
Calculamos:
= 216.89
La ecuación de regresión: Yi’= a + b Xi
Salario = 216.89 + 0.52 Puntos
Sirve de base referencial para estimar el salario en función del puntaje del puesto de
trabajo para este grupo en específico.

Error estándar de la estimación
• El error estándar de la estimación mide la
dispersión de los valores observados
alrededor de la recta de regresión.
• Fórmulas usadas para calcular el error
estándar:
S
Y Y
n
Y a Y b XY
n
Y X⋅ =
−
−
=
− −
−
Σ
Σ Σ Σ
( ')
( ) ( )
2
2
2
2

Taller
Aplicación de herramientas para el
análisis de Excel para el análisis de
regresión y correlación lineal.

Introduccion a la_probabilidad (1)

Recommandé

Recommandé

Contenu connexe

Tendances

Tendances (20)

En vedette

En vedette (20)

Similaire à Introduccion a la_probabilidad (1)

Similaire à Introduccion a la_probabilidad (1) (20)

Dernier

Dernier (20)

Introduccion a la_probabilidad (1)