SlideShare une entreprise Scribd logo
1  sur  146
Universidad Latina de Panamá
Estadística II
Profesora Lumys T. Ortega G.
Teléfonos: 212-7353; 6436-2725
Correo electrónico:
lumysortegag@hotmail.com
OBJETIVOS GENERALES
• Conocer las técnicas fundamentales y los
conceptos de probabilidad necesarios para
comprender la inferencia estadística.
• Reconocer la importancia del tema de las
probabilidades en el desarrollo de su
capacidad analítica.
• Proporcionar los conocimientos y conceptos
básicos sobre los tópicos de mayor utilidad
práctica de inferencia estadística.
• Aplicar las técnicas de regresión correlación
en el proceso de estimación de variables
relacionadas.
Objetivos Específicos
• Explicar el objetivo del análisis de regresión.
• Establecer los supuestos bajo los cuales se basa el análisis de regresión.
• Calcular la regresión lineal e indicadores correlación.
• Conocer los conceptos básicos sobre probabilidades con el propósito de utilizarlos en los temas de inferencia
estadística.
• Definir los enfoques de la probabilidad.
• Aplicar los axiomas de probabilidad en a resolución del problemas.
• Interpretar el concepto de independencia estadística.
• Analizar el concepto de estadística matemática de una variable aleatoria.
• Explicar que es una distribución de probabilidad.
• Distinguir entre una distribución discreta y una continua.
• Expresar las características de las distribución Binomial y Normal.
• Emplear tablas y fórmulas de la distribución Binomial para resolver problemas de probabilidad.
• Convertir cualquier distribución normal en una distribución normal estándar.
• Estudiar el muestreo como un enfoque sistemático para seleccionar más elementos de un grupo de datos a fin de
hacer algunas inferencias sobre el grupo total.
• Estimar las características de una población observándolas de la muestra.
• Determinar cuando es razonable concluir a partir del análisis de una muestra, que la población posee determinada
propiedad y cuando no es razonable llegar a tal conclusión.
Contenido
1. Elementos de Probabilidad
1.1. Introducción
1.1.1.Definición.
1.1.2.Conceptos Básicos.
1.1.3.Eventos.
1.1.4.Espacio y Punto Muestral.
1.2. Enfoque de la Probabilidad.
1.2.1. Objetivo.
1.2.2. Subjetivo
1.3. Axiomas de la Teoría Probabilística.
1.4. Probabilidades Condicionadas.
1.5. Reglas para la Adición y Multiplicación
de Probabilidades.
1.6. Independencia Estadística.
1.7. Esperanza Matemática y Variable
Aleatoria.
2. Distribuciones de Probabilidad
2.1. Funciones de Distribución.
2.1.1. Distribución de Variables
Discretas Discontinuas.
2.1.1.1 Distribución Binomial.
2.1.1.2 Características.
2.2. Distribución de Variables Continuas.
2.3. La Distribución Normal.
2.3.1. Características.
2.4. La Distribución Normal Como una
Aproximación de la Distribución Binomial.
2.5. La Distribución Normal Estandarizada.
2.6. Determinación de Probabilidades usando
la Estandarizada.
3. Distribución Muestral
3.1. Muestras y Distribuciones Muéstrales.
3.1.1. Introducción.
3.1.2. Tipos de Muestreo
3.1.2.1 Aleatorio Simple.
3.1.2.2 Sistemático.
3.1.2.3 Estratificado.
3.1.2.4 Por Conglomerado.
3.1.3. Determinación del Tamaño de la
Muestra.
3.2. Distribuciones Muéstrales.
3.2.1. Distribución Muestral.
3.2.1.1 De la Medida.
3.2.1.2 De la Varianza.
3.2.1.3 De la Desviación Típica.
3.2.2. Significado de las Distribuciones
Muéstrales.
Contenido
4. Inducción Estadística
4.1. Los Parámetros y sus Estimadores.
4.2. Estimación Puntual.
4.3. Estimación de la Medida por Intervalos.
4.4. Estimación de las Diferentes Medidas.
4.5. Estimación de las Diferentes Proporciones.
4.6. Estimación de Proporciones por Intervalos.
5. Prueba de Hipótesis
5.1. Teoría de la Decisión (Contraste de Hipótesis).
5.1.1. Introducción.
5.1.2. El Problema de la Decisión.
5.1.3. Hipótesis Nula y Contraste de Significado.
6. Análisis de Regresión y Correlación Simple
6.1. Introducción.
6.1.1. Función de ajustes.
6.1.2. Tipos de Variables.
6.2. Regresión Simple.
6.2.1. Diagrama de Esparcimiento.
6.2.2. Principio de Mínimos Cuadrados para la Estimación de Parámetros.
6.3. Correlación.
6.3.1. Varianza de Regresión.
6.3.2. Coeficiente de Determinación.
6.3.3. Coeficiente de Correlación.
Evaluación
• Detalles Porcentaje
• Asistencia y participación en clases 10%
• 2 Exámenes Parciales (15% cada uno) 30%
• 2 Trabajos grupales: lecturas obligatorias, tareas 20%
• Estudio de casos, investigaciones 10%
• Proyecto Final 30%
• Total 100%
Bibliografía recomendada
• Levin y Rubin. Estadística para Administración y
Economía. Pearson – Prentice Hall. Séptima Edición.
2004
• Lind, Douglas, (2008). Estadistica, Treceava Edición,
México: McGraw-Hill
• Berenson, Mark; Levinci, Davidy Kreltbiel, Timothy,
(2001). Estadística para la Administración, 2001 Edición,
México: Pearson Education.
• Mason y Lind. Estadística para Administración y
Economía. Alfa Omega.
Introducción a la
probabilidad
Introducción a la probabilidad
• Probabilidad: Posibilidad numérica medida entre cero
y uno, de que ocurra un evento.
• Probabilidad de que un cliente no pague a tiempo sus cuentas.
• Probabilidad de comprar un artículo defectuoso.
• Probabilidad de que llueva mañana.
• La probabilidad puede ser expresada como
proporción: valore entre cero y uno; y en porcentaje si
es multiplicada por 100.
• La teoría de probabilidad estudia las leyes de la
naturaleza y los problemas de la vida cotidiana.
Conceptos
Ejemplo:
– Inspección de cajas de artículos.
– Lanzamiento de un dado
– Medición de la percepción sobre el sistema de
compensación
– Observar el estado del tiempo (llueve o no llueve).
– Observación del sexo del nacimiento de un (a) bebé.
Experimento aleatorio: Es la actividad que produce uno o varios
resultados. Es la observación de alguna actividad o la acción de efectuar
una medición.
Conceptos
• Resultado: Un experimento es toda acción bien
definida que conlleva a un resultado único bien
definido.
• Espacio muestral: Conjunto de todos los posibles
resultados para un experimento.
1. Espacio muestral finito: S={1,2,3,4,5,6}
2. Espacio muestral infinito contable: S={1,2,3,4,....}
3. Espacio muestral infinito no contable: S={0≤ X ≤ 1}
Observación:
1 y 2, corresponden a espacios muestrales discretos;
3, es un espacio muestral no discreto o continuo.
Evento o suceso: Es el o los resultados de un experimento o la
descripción de un resultado potencial. ( Los eventos se denotan con
letras mayúsculas (A, B, C, E). hay eventos simples y eventos
compuestos.
•Eventos mutuamente excluyentes: la ocurrencia
de un evento denota que ningún otro evento pueda
ocurrir al mismo tiempo.
•Eventos no mutuamente excluyentes: dos o más
eventos pueden ocurrir simultáneamente.
•Eventos colectivamente exhaustivos: por lo
menos uno de los eventos ocurre cuando se realiza
un experimento.
•Eventos equiprobables: eventos cuya
probabilidad de ocurrencia es la misma. Igualmente
probables.
Negro
Color
Palo Rojo Total
As 2 2 4
No-As 24 24 48
Total 26 26 52
Probabilidad Clásica
Basada en resultados posibles
e igualm ente probables
Probabilidad Em pírica
B asada en frecuencias relativas
O bjetivo
P arte de inform ación disponible o
subjetiva
Subjetivo
E nfoques de probabilidad
Enfoques de la Probabilidad
Probabilidad Objetiva:
– Probabilidad Clásica o a priori: Considera que los
resultados de un experimento son igualmente
posibles y mutuamente excluyentes.
Se calcula
P(E) = número de resultados favorables
número de resultados posibles
P(E), significa: probabilidad de ocurrencia del evento E.
La letra E, es una representación simbólica de un evento.
Ejemplo: E: sale cara
Enfoque clásico
• Ejemplo: Se desea
conocer la probabilidad de
obtener un “seis” en el
lado superior en el
lanzamiento de un dado.
• Como el dado tiene seis
lados, numerados del 1 al
6. Los posibles resultados
en el lanzamiento de un
dado son:
S = {1, 2, 3, 4, 5, 6}
Resultado
(Ei)
No. De
veces que
puede
salir
P(Ei)
Sale “1” 1 1/6
Sale “2” 1 1/6
Sale “3” 1 1/6
Sale “4” 1 1/6
Sale “5” 1 1/6
Sale “6” 1 1/6
Estos eventos son equiprobables, mutuamente excluyentes y colectivamente
exhaustivos.
Enfoque de probabilidad
Frecuentista
Número de veces que ha ocurrido el evento en el pasado
Número total de observaciones
P(E) =
P(E), significa: probabilidad de ocurrencia del evento E.
La letra E, es una representación simbólica de un evento.
Ejemplo: E: .. vender 5 computadoras hoy.
Enfoque Frecuentista
• Ejemplo: Un importador
de cristal irlandés de
Nueva York recibe envíos
de cajas de tres artículos.
Los datos para las últimas
100 cajas indicaron el
número de artículos
dañados que había en
cada caja. Los datos se
resumen a continuación:
Resultado
(E) Número
de defectos
Númer
o de
cajas
P(Ej)
0 40 40/100=0.4
1 27 27/100=0.27
2 21 21/100=0.21
3 12 12/100=0.12
Enfoques de la Probabilidad Subjetivo
Probabilidad Subjetiva: Se refiere a
la probabilidad de que suceda un
evento, asignado por una persona con
base a información de que disponga.
(información subjetiva)
– Ejemplos: Posibilidad de comprar un automóvil
nuevo este año,
– Posibilidad de que usted obtenga A en el curso.
Taller1
1. Se va a sacar una carta al azar de un juego estándar de baraja de 52 cartas.
¿Cuál es la probabilidad de que la carta sea una reina?.
2. Los empleados de General Cement se les practica cada año un examen
médico de rutina como parte de un programa de servicios de salud. Se
encontró que 8% de los empleados necesitaba zapatos correctivos, 15%
necesitaba un trabajo dental mayor, y un 3% necesitaba las dos cosas,
zapatos correctivos y un trabajo dental mayor.
A. ¿Cuál es la probabilidad de que un empleado seleccionado al azar necesite
zapatos correctivos o un trabajo dental mayor?
B. Ilustre el problema en forma gráfica (Diagramas de Venn).
Taller1
3. Durante el año anterior, las ventas semanales en Petunia’s Pet Shoppe han
sido “bajas” durante 16 semanas, “considerables”, durante 27 semanas y
“altas” el resto de las semanas. ¿Cuál es la probabilidad de que las ventas de
esta semana sean:
A. Considerables,
B. Bajas
C. Altas
4. Una carta se extrae aleatoriamente de una baraja de 52 cartas. Hallar la
probabilidad de:
Un As
Una jota de corazones
Un tres de tréboles o un seis de diamantes
Un diez o corazón negro
Cualquiera menos de corazones
5. Encontrar la probabilidad de no obtener un total de 7 u 11 en ninguno de los
dos lanzamientos de un par de dados normales.
Problemas para resolver
• La siguiente tabla muestra el número de computadoras
vendidos diariamente por una tienda minorista:
Número de computadoras
vendidas
Número de días
0 12
1 43
2 18
3 20
4 25
Determine la probabilidad de que el número de computadores que se vendan
hoy sea:
a. 2 b. Menos de 3 c. Más de 1
Axiomas o Reglas de probabilidad
• 0 ≤ P(E) ≤ 1, La probabilidad es siempre positiva
• P (S)= 1, Certidumbre o suceso seguro.
REGLAS DE ADICIÓN
PARA EVENTOS MUTUAMENTE EXCLUYENTES
P (A U B) = P (A) + P (B)
Esto expresa la probabilidad de que ocurra A ó ocurra B.
Cuando los eventos son mutuamente excluyentes, no pueden ocurrir simultáneamente.
Esto significa que no existe intersección.
Una extensión de la probabilidad: P (A U B U C) = P (A) + P (B) + P (C)
BA
P (A ∩ B) = 0
Ejemplo
• Un estudio de 200 cadenas de tiendas reveló estos ingresos,
después del pago de impuestos:
Ingresos después de
impuestos
Número de
empresas
TOTAL 200
(A) Menos de un millón 102
(B) De un millón a menos
de 20 millones
61
(C) 20 millones ó más 37
a) Cuál es la probabilidad de que una
cadena de tiendas tenga menos de
un millón de dólares en ingresos
después de pagar impuestos.
P(A) = 102 / 200 = 0.51 = 51%
b) Cuál es la probabilidad de que una cadena de tiendas tenga ingresos de un millón a menos de 20, ó
que tenga ingresos de 20 millones ó más.
P(B U C) = 61/ 200 + 37/ 200 = 0.305 + 0.185 =0.49 = 49%
c) Qué regla de probabilidad se aplicó. Se aplicó la regla de adición para eventos mutuamente
excluyentes
PARA EVENTOS NO MUTUAMENTE
EXCLUYENTES
P (A U B) = P (A) + P (B) – P(A ∩B)
A B
A ∩ B
EJEMPLO. Una carta de una baraja americana de 52 naipes se va a seleccionar en forma
aleatoria (al azar). Cuál es la probabilidad de que la carta seleccionada sea un rey o negra?
•La probabilidad de escoger un rey es P( R ) = 4 / 52
•La probabilidad de escoger una carta negra es P(N) = 26 / 52
•Los eventos no son mutuamente excluyentes, existe la posibilidad de extraer una carta que
tenga ambas características. Existen 2 reyes negros en un juego de cartas americanas.
•La Probabilidad de escoger un rey o una carta negra:
P( R U N) = P ( R ) + P ( N ) – P (R ∩ N)
= 4 / 52 + 26/ 52 – 2 / 52
• P (A U B U C) = P (A) + P (B) + P (C) – P(A∩B) – P(A∩C)– P (B∩C) + P(A ∩ B ∩C)
A B
C
A ∩ B
A∩C B∩C
A∩B∩C
REGLA DEL COMPLEMENTO
P(A)= 1 - P ( A’ )
DONDE LOS EVENTOS SON MUTUAMENTE EXCLUYENTES Y
COLECTIVAMENTE EXHAUSTIVOS
Taller 2.
1. Se entrevistará a un grupo de 2000 empelados de una compañía para preguntarles sobre un nuevo
plan de pensiones. Los empleados clasificaron como sigue:
Clasificación Evento N° de empleados
Supervisores A 120
De Mantenimiento B 50
De Producción C 1460
De Gerencia D 302
Secretarial E 68
a) Cuál es la probabilidad de que la primera seleccionada sea de mantenimiento ?
b) Cuál es la probabilidad de que sea de secretaria ?
c) Cuál es la probabilidad de que sea alguien de mantenimiento o secretaría?
d) Qué regla de probabilidad se aplicó en la pregunta anterior ?
e) Estos eventos son mutuamente excluyentes ?
f ) Cuál es la probabilidad de no seleccionar a una persona de mantenimiento?
2. Determine el espacio muestral para el lanzamiento de dos dados.
a) Cuál es la probabilidad de que ambos dados sumen 7 puntos
b) Cuál es la probabilidad de que ambos sumen un número par de puntos.
c) Cuál es la probabilidad de que sumen más de 8.
3. En una encuesta realizada en algunos países acerca de los productos de mayor
exportación, se encontró que: 10 países exportaban café; 15, petróleo y 13, frutas;
solamente 6 exportaban frutas y petróleo; 4, sólo frutas y café; 3, sólo café y petróleo; y 2
exportaban los tres productos.
a) Cuántos países fueron encuestados
b) Cuántos países exportaban sólo petróleo
c) Cuántos países exportaban sólo café.
4. En cierta empresa, 45 empleados que no aprobaron el entrenamiento en el uso de un sistema
de gestión administrativa, 32 dijeron que no aprobaron por no estudiar el manual; 18 porque no
le entendieron al instructor; y 9 por causas diferentes a estas dos. Encuentre la probabilidad de
los siguientes eventos:
a) Reprobó porque no estudió o porque no le entiende al instructor.
b) Reprobó porque no estudió y no le entiende al instructor
c) Reprobó porque no estudió y no porque no le entiende al instructor
d) Reprobó porque no le entiende al instructor y no porque no estudió.
9
14
18
4
45 – 9 = 36
32+18-36 = 14
32-14 =18
18-14= 4
REGLAS DE MULTIPLICACIÓN
Para eventos independientes ( La ocurrencia de un evento no tiene efecto en la
probabilidad de ocurrencia de cualquier otro)
P (A ∩ B) = P(A) * P(B) Probabilidad Conjunta, es decir que ocurra A y B
simultaneamente es igual al producto de las probabilidades de los eventos.
Para tres eventos A, B y C
P(A ∩ B ∩ C) = P(A) * P(B) *P(C)
Para eventos dependientes ( La ocurrencia de un evento tiene efecto en la
probabilidad de ocurrencia de cualquier otro)
P (A ∩ B) = P(A) * P(B / A) La probabilidad conjunta es igual a la probabilidad de A
por la probabilidad de B dado que ocurrió A, esta es la probabilidad condicional.
P(B/A) = P (A ∩ B) / P(A)
Para tres eventos A, B y C
P(A ∩ B ∩ C) = P(A) * P(B / A) *P(C / A ∩ B)
Ejemplos
Se lanzan al aire dos monedas. Cuál es la probabilidad de que ambas
salgan sello?
Entonces P(S) = 0.5 es la probabilidad de un sello. Los sucesos son
independientes ya que el hecho de que caiga sello en el primer
lanzamiento, no afecta la probabilidad de ocurrencia de un resultado
sello en el segundo segundo lanzamiento.
Probabilidad de que ambas caigan sello
P(S ∩ S ) = P(S ) * P(S) = 0.5 *0.5 = 0.25
Esto puede demostrarse enlistando los posibles resultados del lanzamiento
de dos monedas:
S = ( cc ; cs ; sc ; ss )
De los cuatro posibles resultados, uno sólo cumple con la condición de que
ambos sean sello. La probabilidad es uno de cuatro, es decir 0.25
• Práctica
• 1. Un inversionista compró 100 acciones en el HSBC y 25 de la Universidad
Latina de Panamá. La probabilidad de que las acciones del banco
incrementen su valor en un año es de 0.70. La probabilidad de que las
utilidades de la universidad se incrementen en el mismo periodo es de 0.60.
• .a) Cual es la probabilidad de que las dos acciones aumenten de precio
durante el período?
• .b) Cuál es la probabilidad de que las acciones del banco incremente su
precio, aunque las utilidades de la universidad no.
• .c) Cual es la probabilidad de que ambas acciones no aumenten?
sexo edad
B.R H 18
C.C M 19
C.G H 19
G.P M 20
M.P M 21
J.L H 20
L.A. M 21
N.D M 21
V.C H 22
V.F. H 19
L.L. H 18
J.N. M 21
J.P. M 21
U.P M 18
2. Sean los Sucesos
A = ser hombre (H)
B = edad< 20
A= Hombre Ac
= Mujer
B= < 20
Bc
= 20 o más
Probabilidades
P(A) =
4
62
2
6/14 = 0.43
P(B) = 6/14 = 0.43
P(A ∩ B) = 4/14 = 0.29
P(A ∪B) =
6/14 + 6/14 - 4/14 = 0.43+ 0.43 - 0.29 = 0.57
P(AB) = 4/6 = 0.67
P(A) + P(B) - P(A ∩ B)
3. Hay 10 rollos de película en una caja y 3 de ellos son defectuosos.
Se van a seleccionar 2 rollos, uno después de otro y sin reemplazo.
a) Cuál es la probabilidad de que ambos rollos sean defectuosos.
b) Cuál es la probabilidad de que exactamente uno sea defectuoso.
c) Si se eligen tres rollos, cuál es la probabilidad de que los dos
primeros sean buenos y el último salga defectuoso.
4. Una muestra aleatoria de empleados de una empresa
manufacturera se seleccionó para determinar sus planes de retiro
después de cumplir 65 años. Los seleccionados en la muestra se
dividieron en gerencia y producción. Los resultados fueron:
Empleados Planes después de
los 65 años
Total
Se
retira
No se
retira
Gerencia 5 15 20
Producción 30 50 80
Total 35 65 100
a) Trace un diagrama de arbol y
determine las probabilidad
conjunta ( sig. Diapositiva)
b) Cuál es la probabilidad de que un
empleado elegido al azar sea de
producción y no se retire después
de cumplidos los 65 años
P(P ∩ NR) = 50/100
c) Cuál es la probabilidad de que el
empleado se retire dado que sea
de gerencia
P( R/G)= 5/20
P(G) = 20 / 100
P(P) = 80 / 100
P(R/G) = 5/20
P(NR/G) = 15/20
P(R/P) = 30/80
P(NR/P) = 50 / 80
Probabilidad
Condicional
Probabilidad Conjunta ( La suma
de las probabilidades conjuntas da
la unidad o el 100%)
P(G ∩ R) = P(G) P(R/G) = (20 / 100) *(5/20)= 5/100
P(P ∩ NR) = P(P) P(NR/P) = (80 / 100) *(50/80)=
50/100
P(P ∩ R) = P(P) P(R/P) = (80 / 100) *(30/80)= 30/100
P(G ∩ NR) = P(G) P(NR/G) = (20 / 100) *(15/20)= 15/100
P Producción
G Gerencia
R Retirarse
NR No retirarse
Probabilidad
Marginal
Cuatro tipos de probabilidad
Marginal
La probabilidad
de que ocurra
X
Unión
La probabilidad
de que ocurra
X o Y
Conjunta
La probabilidad
de que ocurra
X e Y
Condicional
La probabilidad
de que ocurra
X sabiendo que
ha ocurrido Y
YX YX
Y
X
P X( ) P X Y( )∪ P X Y( )∩ P X Y( | )
Taller 3
Distribuciones de
Probabilidad
Distribuciones de Probabilidad
• Una distribución de probabilidad es un modelo matemático
que asocia valores de una variable aleatoria con sus
respectivas probabilidades, es decir:
• Las distribuciones se caracterizan por una fórmula que
determina el tipo de distribución y por un conjunto de
parámetros, que son propios de cada espacio muestral.
Probabilidad de x = Función de x
• En el caso de una variable discreta , la distribución puede
describirse mediante una función de probabilidad, que para cada
valor de x de la variable X determina la probabilidad de ser
asumido:
P( X= x) = p (x)
• o bien por medio de una función de distribución de probabilidad
acumulada o simplemente función de distribución, la que, para
cada valor provee la probabilidad de no ser superado superado
P( X≤ x) = F (x)
• evidentemente, el valor de la función de distribución es igual a la suma
de todos los valores de la función de probabilidad desde el extremo
inferior del dominio de la variable hasta x inclusive
Ejemplo: Al lanzar dos dados la suma de ambos puede asumir 11 valores
diferentes en 36 puntos muestrales (2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12)
Se prepara una distribución de frecuencias de
los resultados
Tabla de distribución de probabilidad
X f (x) p(X=x)
P( X< x)
F (x) X * p(X) X
2
* p(X)
2 1 0.03 0.03 0.06 0.11
3 2 0.06 0.08 0.17 0.50
4 3 0.08 0.17 0.33 1.33
5 4 0.11 0.28 0.56 2.78
6 5 0.14 0.42 0.83 5.00
7 6 0.17 0.58 1.17 8.17
8 5 0.14 0.72 1.11 8.89
9 4 0.11 0.83 1.00 9.00
10 3 0.08 0.92 0.83 8.33
11 2 0.06 0.97 0.61 6.72
12 1 0.03 1.00 0.33 4.00
36 1.00 7.00 54.83
E(X) = µ = ∑ X p(X)
= 7.00
V(X) = σ2
= E(X 2
) – (E(X)) 2
= 54.83 – (7) 2
= 54.83-49
= 5.83
Valor esperado
Varianza
Distribución de X
0
1
2
3
4
5
6
7
2 3 4 5 6 7 8 9 10 11 12
X
F(x)
X
Grafica de la distribución de
probabilidad
Taller
Discretas Discontinuas o
Discretas
Distribución Binomial- Fórmula
Obsérvese que la fórmula incluye el término nCr
(combinaciones), p = probabilidad del éxito y
(1-p) es la probabilidad del fracaso.
• p y n, son los parámetros de esta distribución.
• La media y la varianza en esta distribución son:
∀ µ = n.p (media) y σ2
= n.p.(1-p) (varianza)
xnx
ppnCrxXP
pnxb
−
−== )1(.)(
),;(
Probabilidad Binomial
• Cuando el experimento se repite varias veces (ensayos), donde cada
ensayo tiene sólo dos posibilidades (éxitos o fracaso), entonces se puede
construir una distribución de probabilidad binomial.
• Para ello se debe conocer el número de ensayos que se realiza o el
número de muestras (n) y la probabilidad de éxito en cada ensayo.
• Su aplicación se da en variables discretas o no continuas, cuyas
respuestas son dicotómicas (dos alternativas como respuestas), es decir:
éxito o fracaso, ocurre o no ocurre el evento investigado.
• Su fórmula es sencilla para los cálculos de probabilidades donde el
número de veces que se repite el experimento es pequeño.
Distribución Binomial - Ejemplo
• En una situación binomial n=4 y p=0.25. Determine la
siguiente probabilidad utilizando la fórmula binomial.
– x=2 y obtenga la media para esta distribución.
Solución
P(x=2) = 4C2 (0.25)2
(1-0.25)(4-2)
= 6 * (0.0625) * (0.75) (2)
= 0.375 * 0.5625
= 0.2109
= 21.09%
Media = n.p = 4*0.25 = 1.0
Distribución de Poisson
• La distribución de Poisson se emplea cuando se
cuentan los eventos o entidades, distribuidos al azar
en espacio o tiempo.
• Supuestos:
– Las ocurrencias de los eventos son independientes.
– Teóricamente, es posible la ocurrencia de un evento un
número infinito de veces dentro del intervalo.
– La probabilidad de una sola ocurrencia del evento en un
intervalo dado es proporcional a la dimensión del intervalo.
– En cualquier fracción infinitesimal del intervalo, la probabilidad
de más de una ocurrencia del evento es insignificante.
Fórmula
• La función de probabilidad de la variable que
sigue una distribución de Poisson, se expresa;
!
)(
);(
x
e
xXP
xp
x
λ
λ
λ−
==
Donde: λ (parámetro) es el número de ocurrencias del
evento aleatorio dentro del intervalo de tiempo o
espacio.
e, es la constante (con cuatro decimales) 2.7183
Problemas
• Si el número promedio de accidentes graves por año en
una fábrica grande (donde el número de empleados es
constante) es de cinco, calcúlese la probabilidad de que
en el año en curso haya:
– Exactamente siete accidentes
– Diez o más accidentes
– Cero accidentes
• El cable utilizado para asegurar las estructuras de los
puentes tiene un promedio de 3 defectos por cada 100
yardas. Si usted necesita 50 yardas, ¿cuál es la
probabilidad de que haya una defectuosa?
Taller
Distribución de probabilidad
continua
Distribución de probabilidad (caso de
v.a.c)
• De todas las distribuciones de probabilidad que
se analizan, la distribución normal es la más
importante, dada su característica en forma de
campana y la forma como se relaciona con la
regla empírica.
fi
X
La función de distribución
• Puede existir un número infinito de distribuciones
normales posibles, cada una con su propia media y su
desviación estándar. Ya que obviamente no se puede
analizar un número tan grande de posibilidades es
necesario convertir todas estas distribuciones normales
a una forma estándar. Generando la distribución normal
estándar.
• El uso de esta distribución es útil cuando se desea,
además, eliminar la unidad de medida.
Función de distribución Normal
estándar
• Parámetros: µ (media) y σ (desviación estándar)
• para ∝<z< ∝
2/2
2
1
)( z
ezf −
=
π
Función de Distribución normal, para ∝<x< ∝
22
2/)(
2
1
)( σµ
πσ
−−
= x
exf
Cálculo de probabilidades con la
distribución normal estándar
• Transformación de la variable X a Z
σ
µ−
=
X
Z
Ejemplo:
Sea µ= 2.2 y σ=0.8, calcule la probabilidad de, X>3.3
0838.0
)38.1(
8.0
2.23.3
)3.3(
=
>=





 −
>=>
ZP
ZPXP
Resuelva
• P(z=0)
• P(z>=0.55)
• P(z<-2.33)
• P(z>-0.55)
• P(-1.96<=z<=1.96)
• P(z=0.74)
Resuelva
• Un estudio reciente de salario por hora de los equipos de
mantenimiento en las principales líneas aéreas demostró que el
salario promedio por hora fue 16.50 por hora, con una desviación
estándar de 3.50 dólares. Si se selecciona la azar al miembro de un
equipo, ¿Cuál es la probabilidad de que ese miembro gane:
– Entre 16.50 y 20.00 dólares por hora.
– Más de 20.00 dólares por hora.
– Menos de 15.00 dólares por hora.
• Una población normal tiene una media de 50.0 y una desviación
estándar de 4.0.
a) Calcule la probabilidad que el valor este entre 44.0 y 55.0
b) Calcule la Probabilidad de un valor mayor a 55.0
c) Calcule la Probabilidad de un valor entre 52.0 y 55.0
Aproximación normal a la
binomial
• Utilizar la distribución normal (una distribución continua)
como sustituto de una distribución binomial (una
distribución discreta) para valores grandes de n, parece
razonable porque conforme n aumenta, una distribución
binomial se acerca más a una distribución normal.
• La distribución de probabilidad normal, en general, se
considera una buena aproximación a la binomial
cuando
• np y n(1 -p ) son ambos mayores que 5.
7-18
Aproximación normal continuación
• Recuerde el experimento binomial :
– existen sólo dos resultados mutualmente excluyentes
(éxito o fracaso) en cada ensayo.
– una distribución binomial es el resultado de contar el
número de éxitos en una cantidad fija de ensayos.
– cada ensayo es independiente.
– la probabilidad es fija de un ensayo a otro, y el número
de ensayos n también es fijo.
7-19
Distribución binomial para n igual a 3 y 20, donde p =.50
7-20
n=3
0
0,1
0,2
0,3
0,4
0 1 2 3
número de eventos
P(x)
n=20
0
0,05
0,1
0,15
0,2
2 4 6 8 10 12 14 16 18 20
número de eventos
P(x)
Factor de corrección por
continuidad
• El valor .5 se resta o se suma,
dependiendo del problema, a un valor
seleccionado cuando una distribución de
probabilidad binomial (una distribución
discreta) se aproxima por una
distribución de probabilidad continua (la
distribución normal).
7-21
EJEMPLO 6
• Un estudio reciente de una compañía
de investigación de mercados mostró
que 15% de las casas en Estados
Unidos poseen una cámara de video.
Se obtuvo una muestra de 200 casas.
• De las 200 casas en la muestra
¿cuántas se espera que tengan una
cámara de video?
30)200)(15(. === npµ
7-22
EJEMPLO
• ¿Cuál es la variancia?
• ¿Cuál es la desviación estándar?
• ¿Cuál es la probabilidad de que menos de 40 casas de la
muestra tengan cámara de video?
• Se necesita P(X<40) = P(X< 39). Así, Al usar la aproximación
normal,
P(X<39.5) = P [z (39.5-30)/5.0498] =
P(z< 1.8812) P(z<1.88)=.5+.4699 +.9699
5.25)15.1)(30()1(2
=−=−= pnpσ
σ= =255 5 0498. .
≈
≤ ≤
7-23
- 5
0 . 4
0 . 3
0 . 2
0 . 1
. 0
f(x
r a l i t r b u i o n : µ = 0 , σ2
= 1
EJEMPLO
0 1 2 3 4
P(z = 1.88)
.5 + .4699
= .9699
z = 1.88
© 2001 Alfaomega Grupo Editor
“Distribución Muestral e
Intervalos de Confianza”
¿Por qué obtener muestras de la
población?
• Existe una imposibilidad física de verificar todos
los elementos de la población.
• El costo de estudiar todos los elementos de una
población es alto.
• Los resultados de la muestra suelen ser
adecuados.
• Contactar a toda la población es tardado, por la
naturaleza destructiva de ciertas pruebas.
8-3
Muestra aleatoria
• Una muestra aleatoria es una muestra
seleccionada de manera que cada
elemento o persona en la población que
se estudia tiene una probabilidad
conocida de quedar incluido en la
muestra.
8-4
Métodos de muestreo aleatorio
• Muestra aleatoria simple: muestra formulada
de manera que cada elemento o persona en la
población tiene la misma oportunidad de
quedar incluida.
• Muetra aleatoria sistemática: los artículos o
individuos de la población se colocan en cierto
orden. Se elige un punto de partida aleatorio y
después se selecciona uno cada k-ésimo
elemento de la población para la muestra.
8-5
Métodos de muestreo aleatorio
• Muestreo aleatorio estratificado: se divide la
población en subgrupos, llamados estratos,
y se selecciona una muestra de cada
estrato.
• Muestreo por conglomeración: primero se
divide la población en subgrupos (estratos),
y se selecciona un estrato. La muestra se
toma del estrato seleccionado.
• El error de muestreo es la diferencia entre
un estadístico muestral y su parámetro
correspondiente.
8-6
Distribución de muestreo de
medias muestrales
• La distribución de muestreo de medias
muestrales es la distribución de
probabilidad de todas la medias
muestrales posibles de un tamaño de
muestra dado, seleccionadas de una
población, y la probabilidad de
ocurrencia asociada con cada media
muestral.
8-7
EJEMPLO 1
• El despacho de abogados HERR &
Asociados tiene cinco socios. En su junta de
socios semanal cada uno informa el número
de horas que cobraron a los clientes por sus
servicios la semana anterior.
• Si se seleccionan al azar dos socios,
¿cuántas muestras diferentes son posibles?
Socio Horas
TITO 22
TONI 26
REY 30
TIFFANY 26
LISBETH 22
8-8
EJEMPLO 1 continuación
• Ésta es la combinación de 5 objectos
tomados de 2 en 2. Es decir,
5 2 5 2 3 10c = =( !) /[( !)( !)]
Socios Total Media
1,2 48 24
1,3 52 26
1,4 48 24
1,5 44 22
2,3 56 28
2,4 52 26
2,5 48 24
3,4 56 28
3,5 52 26
4,5 48 24
8-9
EJEMPLO 1 continuación
• Organice las medias muestrales en una
distribución de muestreo.
Media
muestral
Frecuencia Frecuencia
relativa
22 1 1/10
24 4 4/10
26 3 3/10
28 2 2/10
8-10
EJEMPLO 1 continuación
• Calcule la media de las medias
muestrales y compárela con la media
poblacional:
– media de las medias muestrales = [(22)(1) +
(24)(4) + (26)(3) + (28)(2)]/10=25.2
– media poblacional = (22+26+30+26+22)/5 =
25.2
– observe que la media de las medias
muestrales es igual a la media poblacional.
8-11
Teorema del límite central
• Para una población con media µ y variancia
σ2
, la distribución de muestreo de las medias
de todas las muestras posibles de tamaño n
obtenidas de una población tendrá una
distribución normal aproximada — con la
media de la distribución de muestreo igual a
µ y la variancia igual a σ2
/n — si se supone
que el tamaño de la muestra es
suficientemente grande.
8-12
Estimaciones puntuales
• Una estimación puntual es un valor (punto) que se
usa para estimar un parámetro de la población.
• Ejemplos de estimaciones puntuales son media
muestral, desviación estándar muestral, variancia
muestral, relación proporcional de la muestra, ...
• EJEMPLO 2: se registra el número de defectos
producidos durante 5 horas seleccionadas al azar
en una semana de 40 horas. Los defectos
observados fueron 12, 4, 7, 14 y 10. La media
muestral es 9.4. Entonces la estimación puntual
para el promedio de defectos por hora es 9.4.
8-13
Estimaciones de intervalo
• Una estimación de intervalo
establece la amplitud en la que quizá
se encuentre un parámetro
poblacional.
• El intervalo dentro del cual se espera
que esté un parámetro poblacional se
llama intervalo de confianza.
• Los dos intervalos de confianza que
más se usan son 95% y 99%.
8-14
Estimaciones de intervalo
(continuación)
• Un intervalo de confianza de 95% significa que
cerca de 95% de los intervalos similares
contendrán el parámetro que se quiere estimar, o
95% de las medias muestrales para un tamaño de
muestra dado estarán dentro de 1.96 desviaciones
estándar de la media poblacional hipotética.
• Para el intervalo de confianza de 99%, un 99% de
las medias muestrales para un tamaño de muestra
dado estará dentro de 2.58 desviaciones estándar
de la media poblacional hipotética.
8-15
Error estándar de la media muestral
• El error estándar de las medias muestrales es
la desviación estándar de la distribución de
muestreo de las medias muestrales.
• Se calcula mediante
∀ σx es el símbolo del error estándar de las
medias muestrales.
∀ σ es la desviación estándar de la población.
• n es el tamaño de la muestra.
σ
σ
x
n
=
8-16
Error estándar de la media muestral
• Si σ no se conoce y n ≥ 30, la desviación
estándar de la muestra, denotada por s,
se usa para aproximar la desviación
estándar poblacional. La fórmula para el
error estándar se convierte en:
s
s
nx =
8-17
Intervalos de confianza de 95% y 99% para µ
• Los intervalos de confianza de 95% y 99% para
µ cuando n ≥ 30 se forman como sigue:
el IC de 95% para la media poblacional está
dado por
• el IC de 99% para la media poblacional está
dado por
X
s
n
±196.
X
s
n
±2 58.
8-18
Construcción general de IC para µ
• En general, un intervalo de confianza para
la media se calcula mediante:
X Z
s
n
±
8-19
EJEMPLO 3
• El director de la escuela de administración
desea estimar el número medio de horas por
semana que estudian los alumnos. Una
muestra de 49 estudiantes dio una media de
24 h con desviación estándar de 4 h.
• La estimación puntual es 24 h (media
muestral).
• ¿Cuál es el intervalo de confianza de 95%
para el número promedio de horas por
semana que estudian los alumnos?
8-20
EJEMPLO 3 continuación
• Si se usa un IC de 95% para la media
poblacional, se tiene
• Los puntos terminales del intervalo de
confianza son los límites de confianza. El límite
inferior de confianza es 22.88 y el límite
superior de confianza es 25.12
12.25a88.22)7/4(96.124 =±
8-21
Intervalo de confianza para una relación
proporcional de población
8-22
• El intervalo de confianza para una
relación proporcional de una población
se estima como:
• donde es el error estándar de la
proporción:
σp
σp
p p
n
=
−( )1
p z p± σ
EJEMPLO 4
• Luis Broce, planificador financiero, estudia los
planes de retiro para jóvenes ejecutivos. Una
muestra de 500 ejecutivos que son dueños de sus
casas reveló que 175 planean venderlas y
retirarse en Coronado. Desarrolle un intervalo de
confianza de 98% para la proporción de ejecutivos
que planean vender e irse a Coronado.
• Aquí, n = 500, p =175/500=0.35 y z = 2.33
• el IC de 98% es
497.035.0o
500
)65.0)(35.0(
33.235.0 ±±
8-23
Factor de corrección de población finita
• Se dice que una población con una cota
superior fija es finita.
• Para una población finita, donde el número
total de objetos es N y el tamaño de la
muestra es n, se hace el siguiente ajuste a
los errores estándar de las medias
muestrales y a las proporciones:
• Error estándar de las medias
muestrales:
σ
σ
x
n
N n
N
=
−
−1
8-24
Factor de corrección de población finita
8-25
• Error estándar de las proporciones de las
muestras:
• Este ajuste se llama factor de corrección de
población finita.
• Nota: si n/N < 0.05, el factor de corrección de
población finita se ignora.
1
)1(
=σ
N
nN
n
pp
p
EJEMPLO 5
8-26
• Dada la información del EJEMPLO 4, construya un
intervalo de confianza de 95% para el número medio de
horas estudiadas por semana si hay sólo 500
estudiantes en la escuela.
• Dado que n/N = 49/500 = 0.098>0.05, se tiene que usar
el factor de corrección de población finita.
24 196
4
49
500 49
500 1
22 9352 250648±
−
−
=. ( )( ) [ . , . ]
Selección del tamaño de muestra
• Existen 3 factores que determinan el tamaño
de una muestra, ninguno de ellos tiene una
relación directa con el tamaño de la
población. Los factores son:
• El grado de confianza elegido.
– El error máximo permitido.
– La variación en la población.
8-27
Variación en la población
• Tamaño de la muestra para la media: una
fórmula computacional conveniente para
determinar n es:
• donde: E es el error permitido, Z es el valor
normal estándar asociado con el grado de
confianza seleccionado y S es la desviación
estándar estimada del estudio piloto.
n
Z S
E
=
•





2
8-28
EJEMPLO 6
• Un grupo de consumidores desea estimar la
media mensual en los recibos de luz para
una casa unifamiliar. Según estudios
similares la desviación estándar se estima
en $20.00. Se desea un nivel de confianza
de 99%, con una precisión de ±$5.00.
¿Qué tamaño de muestra se requiere?
n = = ≈[( . )( ) / ] .2 58 20 5 106 5024 1072
8-29
Tamaño de la muestra para
proporciones
8-30
• La fórmula para determinar el tamaño de la muestra en
el caso de una proporción es:
• donde p es la proporción estimada, basada en la experiencia o en
un estudio piloto; z es el valor asociado con el nivel de confianza
deseado; E es el error máximo que tolerará el investigador.
n p p
Z
E
= −





( )1
2
EJEMPLO 7
• El club canino de Panamá desea estimar la
proporción de niños que tienen un perro
como mascota. Si el club quiere la
estimación dentro de 3% de la relación
proporcional, ¿cuántos niños deberán
contactar? Suponga 95% de nivel de
confianza y que el club estimó que 30% de
los niños tienen un perro como mascota.
8973.896)03.0/96.1)(70.0)(30.0( 2
≈==n
8-31
Pruebas de Hipótesis.Pruebas de Hipótesis.
Hipótesis.Hipótesis.
Puede definirse como: Una Frase o una Proposición que
es una afirmación de que algo es verdadero.
En estadística se distinguen dos tipos de Hipótesis:
Hipótesis Nula, Ho: Es la hipótesis que se prueba (se
rechaza o no se rechaza la afirmación). Esta es el
punto inicial de la investigación.
Hipótesis Alternativa, Ha: Es la afirmación que
representa el interés del investigador, y está
relacionada con el mismo parámetro de la población
de la Hipótesis Nula. A veces la hipótesis alternativa se
denomina hipótesis de investigación.
La hipótesis nula y alternativa son opuestas la una a la
otra.
Ejemplo.Ejemplo.
Supóngase que realizará un fiesta, y se quiere demostrar
el éxito de la misma. Usted, podría pensar o estar casi
seguro de una alta probabilidad de que ésta sea un
éxito.
Entonces la hipótesis opuesta (Nula) a la de su interés en
probar, es:
Ho: “La fiesta será un fracaso”,
mientras que su hipótesis alternativa (de investigación) es
que:
Ha: “La fiesta será un éxito”.
Hipótesis Estadística.
• Como las hipótesis, se relacionan con un parámetro poblacional,
media, proporción o varianzas, entonces una forma de expresar la
hipótesis estadísticamente es por ejemplo:
– Ho: µ = µ o.
– Ha: µ ≠ µ o.
• Expresado literalmente es:
– Ho: La media es igual a un valor µ o.
– Ha: La media es distinta de un valor µ o.
• Obsérvese que µ o es un valor específico de interés o de
comparación para determinar el “rechazo” o” no rechazo” de Ho.
Error Tipo I y Tipo II.
Una forma de ver este concepto, es a través del
siguiente cuadro.
Decisión
Hipótesis nula
Verdadera Falsa
No rechazar Ho
Rechazar Ho
Decisión correcta tipo A
Error tipo I
Error de tipo II
Decisión correcta de tipo
B.
Las pruebas de hipótesis consideran datos muestrales para la
obtención de estimaciones de los parámetros poblaciones. Por lo
tanto, hay un riesgo asociado con la decisión que se tome.
Error Tipo I y Tipo II.
El riesgo, es una probabilidad, veamos
Cuando se toma una decisión, sería agradable escoger siempre la opción
correcta. Sin embargo, esto no es posible en estadística, ya que la decisión se
toma con base en la información muestral. Lo mejor que puede esperarse es
controlar la probabilidad con que ocurre un error. La probabilidad asignada al
error tipo I se denomina α “alfa”. La probabilidad del error tipo II se denomina
β “beta” (alfa y beta, son las dos primeras letras del alfabeto griego).
Error en la
decisión
Tipo Probabilidad Decisión correcta Tipo Probabilidad
Se rechaza
una Ho
verdadera
I α No se rechaza
una Ho verdadera
A 1-α
No se rechaza
una Ho falsa
II β Se rechaza una
Ho falsa
B 1-β
Nivel de significancia (Nivel de significancia (αα).).
Es la probabilidad de cometer el error tipo I.
Establecer el nivel de significancia puede interpretarse
como una “decisión gerencial”. Por lo general, alguien a
cargo determina el nivel de probabilidad con que desea
arriesgar un error tipo I.
Estadística de prueba.Estadística de prueba.
Es la variable aleatoria cuyo valor se calcula a partir de
los datos muestrales y que se utiliza para tomar la
decisión de “no rechazar Ho” o “rechazar Ho”
El valor de la estadística de prueba es calculado, según
la distribución del parámetro a probar “z” o “t”
calculado y se utiliza junto con una regla de decisión
para determinar si “se rechaza Ho” o “no se rechaza
Ho”.
Regla de decisión.Regla de decisión.
La regla de decisión debe ser establecida antes de
recolectar los datos y después de planteado las hipótesis.
Además especifica cómo se llegará a una decisión.
En la regla de decisión se compara, generalmente un
valor calculado con el estadístico de prueba, con un
valor crítico (o coeficiente de una distribución “z” o “t”,
obtenido con la probabilidad de cometer el error tipo I o
nivel de significación).
Regla de decisión.Regla de decisión.
Generalmente, se distinguen dos situaciones:
a. Pruebas de hipótesis de dos colas, (dos valores
críticos) para la toma de decisiones.
b. Pruebas de hipótesis de una cola, (un solo valor
crítico) para la toma de decisiones.
Regla de decisión. Pruebas deRegla de decisión. Pruebas de
hipótesis de dos colas.hipótesis de dos colas.
Específicamente, se utiliza cuando la hipótesis del investigador, considera la
relación “diferente” ó “≠ ”.
Recordemos que la distribución del parámetro media o proporción, siguen
distribuciones en forma de campana simétricas.
c representa el valor crítico del estadístico de prueba y se obtiene a partir del nivel
de significancia α, establecido. Tiene dos regiones de rechazo de Ho, (cola 1 y
cola 2).
-c c
Cola 1. Cola 2.
Caso donde las
Hipótesis son:
Ho: µ = µ o.
Ha: µ ≠ µ o.
Regla de decisión. Pruebas deRegla de decisión. Pruebas de
hipótesis de una cola.hipótesis de una cola.
Específicamente, se utiliza cuando la hipótesis del
investigador, considera la relación “menor que”.
-c
Cola 1.
Caso donde las
Hipótesis son:
Ho: µ = µ o.
Ha: µ < µ o.
El valor crítico, es
uno solo y la
región de rechazo
de Ho, se ubica del
lado izquierdo de
la curva (cola 1).
Regla de decisión. Pruebas deRegla de decisión. Pruebas de
hipótesis de una cola.hipótesis de una cola.
Recordemos, que el valor crítico depende del estadístico de prueba a
utilizar y del nivel de significancia. Estos valores se encuentran en
las tablas de distribuciones de probabilidad t-student, Z-Normal
estándar, según sea el caso.
c
Cola 2.
Caso donde las
Hipótesis son:
Ho: µ = µ o.
Ha: µ > µ o.
Relación “mayor que”
Procedimiento de cinco pasos. PruebaProcedimiento de cinco pasos. Prueba
de Hipótesis clásica.de Hipótesis clásica.
Procedimiento de cinco pasos. PruebaProcedimiento de cinco pasos. Prueba
de Hipótesis clásica.de Hipótesis clásica.
1. Describir el parámetro de la población de interés.
2. Establecer la hipótesis nula (Ho) y alternativa Ha).
3. Especificar los criterios de prueba.
a. Comprobar los supuestos.
b. Identificar la estadística de prueba a utilizar.
c. Determinar el nivel de significancia, α.
d. Determinar la(s) región (regiones) crítica(s) y el (los) valores
crítico(s).
4. Recolectar y presentar los hechos muestrales.
a. Recolectar la información muestral.
b. Calcular el valor de la estadística de prueba.
5. Determinar los resultados
a. Determinar si el valor de la estadística de prueba está o no en la región
crítica.
b. Tomar una decisión sobre Ho.
c. Escribir una conclusión sobre Ha.
Pruebas de Hipótesis. UnaPruebas de Hipótesis. Una
población.población.
1. Pruebas de Hipótesis de la media µ (σ
conocida): Enfoque clásico.
Supuesto para pruebas de hipótesis sobre la media µ
usando una σ conocida: la distribución muestral de la media
muestral, está contenida en la distribución muestral de medias
muestrales y en el Teorema de Límite Central. (Visto
anteriormente en clases).
Un grupo de abogados, que protegen los intereses de los
consumidores, desea refutar la afirmación que hace un
fabricante de gasolina sobre un modelo de automóvil
que promedia 24 millas por galón de gasolina.
Específicamente, el grupo quiere demostrar que las
millas medias por galón son considerablemente menores
que las 24 millas que dice el fabricante. Establecer la
hipótesis nula y la alternativa.
Veamos esta prueba de hipótesis con una ilustración:
Ejemplo
SoluciónSolución
Datos:
• El parámetro de población en cuestión es: “el número medio de
millas recorridas logrado por este modelo de automóvil”
• 24 millas por galón, es el valor específico de interés o de
comparación del parámetro, es decir, µo .
• La relación propuesta por los abogados es, “el número medio de
millas recorridas logrado por este modelo de automóvil” es
menor que 24 millas por galón, es decir: µ < 24.
Solución (continuación)Solución (continuación)
Datos (continuación):
• La afirmación opuesta a lo propuesto por los abogados, es:
“el número medio de millas recorridas logrado por este
modelo de automóvil no es menor que 24 millas por
galón”, es decir, µ ≥ (mayor o igual que) 24.
• Recuerde que la hipótesis nula contiene el signo “igual”.
Solución (conclusión)Solución (conclusión)
Datos (continuación):
• Las Hipótesis, planteadas son:
•Ho: El número medio de millas recorridas logrado por
este modelo de automólvil es mayor o igual que 24.
•Ha: El número medio de millas recorridas logrado
por este modelo de automólvil es menor que 24.
• Estadísticamente,
•Ho: µ ≥ 24 ó ( µ = 24) y Ha: µ < 24
Estadístico de Prueba deEstadístico de Prueba de
Hipótesis de la mediaHipótesis de la media µµ, con, con σσ
conocidaconocida
El estadístico de prueba en este caso, se define como, “zeta
estrella” ó z*
n
x
z
/
*
σ
µ−
=
Bajo el supuesto de que los las medias muestrales siguen una
distribución normal y cumpliendo con el Teorema de Límite
Central, además considerando la varianza poblacional ( σ )
conocida.
Nivel de significaciónNivel de significación
(alfa)(alfa)
El nivel de significancia, α, generalmente se establece de
acuerdo al rigor en la decisión deseado del
investigador, en 0.05 ó 0.01. (probabilidad de cometer
el error tipo I). Y se busca en las tablas de distribución
t ó Z, según sea el caso, tal como se hizo al elaborar
intervalos de confianza.
Ejemplo:Ejemplo:
Se afirma que el peso medio de las estudiantes de una
universidad es de 54.4 kg. El profesor Hart no cree en esta
afirmación y trata de demostrar lo contrario. Para probar la
afirmación, recolecta una muestra aleatoria de 100 pesos
entre las alumnas universitarias. Obtiene una media de la
muestra de 53.75 kg. ¿este hecho es suficiente para que el
profesor Hart rechace la afirmación?. Use α =0.05 y
σ=5.4kg.
Datos: n= 100, µo= 54.4 kg., α =0.05 y σ=5.4kg.
Ejemplo: Solución.Ejemplo: Solución.
Datos: n= 100, µo= 54.4 kg., α =0.05 y σ=5.4kg.
Paso 1. El parámetro de interés: µ, el peso
medio de todas las estudiantes de una
universidad.
El parámetro de interés: µ, el peso
medio de todas las estudiantes de una
universidad.
Paso 2. La hipótesis nula y alternativa son:
Ho: El peso medio de las estudiantes de
una universidad es igual a 54.4 kg.
Ha. El peso medio de las estudiantes de
una universidad no es igual a 54.4 kg.
La hipótesis nula y alternativa son:
Ho: El peso medio de las estudiantes de
una universidad es igual a 54.4 kg.
Ha. El peso medio de las estudiantes de
una universidad no es igual a 54.4 kg.
Ejemplo: Solución.Ejemplo: Solución.
Paso 2.
Estadísticamente, las hipótesis son expresadas
como:
Ho. µ = 54.4 kg.
Ha. µ ≠ 54.4 kg.
Estadísticamente, las hipótesis son expresadas
como:
Ho. µ = 54.4 kg.
Ha. µ ≠ 54.4 kg.
Paso 3.
Los criterios de prueba son:
a. Los pesos de un grupo de estudiantes siguen
una distribución aproximadamente norma,
debido a que la muestra es suficientemente
grande (n=100).
b. La estadística de prueba, por tanto, a utilizar es
z*
Los criterios de prueba son:
a. Los pesos de un grupo de estudiantes siguen
una distribución aproximadamente norma,
debido a que la muestra es suficientemente
grande (n=100).
b. La estadística de prueba, por tanto, a utilizar es
z*
Ejemplo: Solución.Ejemplo: Solución.
Paso 3.
Los criterios de prueba son:
c. El nivel de significancia planteado es: α = 0.05
(dado en el problema).
d. Las regiones críticas (valores críticos), se
determinan, con el nivel de significancia entre
dos, ya que se trata de una prueba de hipótesis
de dos colas, entonces el nivel de significancia
es 0.025.
Los criterios de prueba son:
c. El nivel de significancia planteado es: α = 0.05
(dado en el problema).
d. Las regiones críticas (valores críticos), se
determinan, con el nivel de significancia entre
dos, ya que se trata de una prueba de hipótesis
de dos colas, entonces el nivel de significancia
es 0.025.
-c c
α/2=0.025 α/2=0.025
Ejemplo: Solución.Ejemplo: Solución.
Paso 3.
Luego, buscando en la tabla Normal estándar, el valor
crítico, para α/2 = 0.025 y para (1- α/2)= 0.975, ó
simplemente para (1- α/2)= 0.975, ya que la
distribución normal es simétrica.
Entonces, el valor de z, para 0.975, es 1.96.
Reempalzando en –c y c. La región de decisión, se
determina como: -1.96 y 1.96.
Si el estadístico z*, se encuentra entre –1.96 y 1.96 no se
rechaza Ho.
Luego, buscando en la tabla Normal estándar, el valor
crítico, para α/2 = 0.025 y para (1- α/2)= 0.975, ó
simplemente para (1- α/2)= 0.975, ya que la
distribución normal es simétrica.
Entonces, el valor de z, para 0.975, es 1.96.
Reempalzando en –c y c. La región de decisión, se
determina como: -1.96 y 1.96.
Si el estadístico z*, se encuentra entre –1.96 y 1.96 no se
rechaza Ho.
-1.96 1.96
α/2=0.025 (α/2)=0.025
Región de
no rechazo
de Ho.
Ejemplo: Solución.Ejemplo: Solución.
Paso 4.
a. La información muestral es: media muestral “equis
barra” es 53.75 y n=100.
b. El cálculo del estadístico de prueba, al aplicar la
fórmula es:
a. La información muestral es: media muestral “equis
barra” es 53.75 y n=100.
b. El cálculo del estadístico de prueba, al aplicar la
fórmula es:
-1.96 1.96
α/2=0.025 (α/2)=0.025
Región de
no rechazo
de Ho.
20.1
100/4.5
4.5475.53
/
* −=
−
=
−
=
n
x
z
σ
µ
Ejemplo: Solución.Ejemplo: Solución.
Paso 5.
a. Decisión: Como z*=-1.20, se encuentra en la región
de no rechazo de Ho.
b. En conclusión, No hay suficientes hechos al nivel de
significancia 0.05 que demuestren que las
estudiantes tienen un peso medio diferente de los
54.4 kg indicados. En otras palabras, no hay hechos
estadísticos que sustenten los argumentos del
profesor Hart.
a. Decisión: Como z*=-1.20, se encuentra en la región
de no rechazo de Ho.
b. En conclusión, No hay suficientes hechos al nivel de
significancia 0.05 que demuestren que las
estudiantes tienen un peso medio diferente de los
54.4 kg indicados. En otras palabras, no hay hechos
estadísticos que sustenten los argumentos del
profesor Hart.
-1.96 1.96
α/2=0.025 (α/2)=0.025
Región de
no rechazo
de Ho.
Pruebas de Hipótesis de laPruebas de Hipótesis de la
mediamedia µµ ((σσ desconocida):desconocida):
El estadístico de prueba, a utilizar es:
ns
x
t x
n
/
1
µ−
=−
Cuando la varianza poblacional no es conocida, se utiliza
el estadístico t-student. Recordemos, que usualmente, la
varianza poblacional es desconocida y que se utiliza la
varianza estimada S. El estadístico t, sigue una distribución
t-student con n-1 grados de libertad.
3. Pruebas de Hipótesis para3. Pruebas de Hipótesis para
proporciones.proporciones.
El estadístico de prueba, para el caso de proporciones en
una sola muestra, es:
n
pp
pp
Z o
)1( −
−
=
p, es el número de éxitos en la muestra entre el tamaño
de la muestra: x/n.
po, es el valor específico de interés o de comparación.
Análisis de Correlación y
Regresión Lineal
Suposiciones fundamentales de
regresión lineal
• Para cada valor de X, existe un grupo de valores de Y
que tienen una distribución normal.
• Las medias de estas distribuciones normales de
valores de Y deben estar sobre la recta de regresión.
• Las desviaciones estándar de estas distribuciones
normales son iguales.
• Los valores de Y son estadísticamente independientes.
Es decir, que en la selección de una muestra, los
valores elegidos de Y para un valor particular de X no
depende de los valores de Y para otro valor de X.
Método estadístico de regresión
lineal simple
• Se determina el valor de la recta y = a + bx,
calculada mediante la fórmula de los mínimos
cuadrados obteniendo la línea que mejor se
ajuste al nube de puntos que representa dos
variables: una dependiente y una
independiente
• Pasos:
1) Elaborar diagrama de dispersión.
2) Calcular coeficientes de correlación.
3) Realizar el Análisis de regresión.
4) Verificar la línea de tendencia.
0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10 12
Generalidades del Análisis de
correlación
• Análisis de correlación: se usa un grupo
de técnicas estadísticas para medir la
fuerza de la relación (correlación) entre
dos variables.
• Diagrama de dispersión: gráfica que
describe la relación entre las dos variables
de interés.
• Variable dependiente: la variable que se
pronostica o estima.
• Variable independiente: la variable que
proporciona la base para la estimación. Es
la variable predictora.
Coeficiente de correlación, r
• El coeficiente de correlación (r) es una medida de
la intensidad de la relación entre dos variables o
más
• Requiere datos con escala de intervalo o de razón (variables).
• Puede tomar valores entre -1.00 y 1.00. (-100% y 100%)
• Valores de -1.00 o 1.00 indican correlación fuerte y perfecta.
• Valores cercanos a 0 indican correlación débil.
• Valores negativos indican una relación inversa y valores positivos
indican una relación directa.
Interpretación
• Este coeficiente de correlación nos indica la medida en que están
relacionados las variables. Si es muy cercano a 100% la relación es
lineal, fuerte y directa.
• Es decir que a medida que aumenta una también aumenta la otra
• Si es cercana a 0, no significa ausencia de relación, sino que podría
existir otro tipo de relación distinta a la lineal ( parabólica, exponencial,
logarítmica)
Correlación negativa perfecta
0 1 2 3 4 5 6 7 8 9 10
10
9
8
7
6
5
4
3
2
1
0
X
Y
Correlación positiva perfecta
0 1 2 3 4 5 6 7 8 9 10
10
9
8
7
6
5
4
3
2
1
0
X
Y
Correlación cero
0 1 2 3 4 5 6 7 8 9 10
10
9
8
7
6
5
4
3
2
1
0
X
Y
Correlación positiva fuerte
0 1 2 3 4 5 6 7 8 9 10
10
9
8
7
6
5
4
3
2
1
0
X
Y
Fórmula para r (Coeficiente de
Correlación)
[ ] ( ) ( )[ ]2222
)()(
))(()(
=
YYnXXn
YXXYn
r
Σ−ΣΣ−Σ
ΣΣ−Σ
-1 -0.75 - 0.5 0 0.5 0.75 1
Perfecta Fuerte Moderada Nula Moderada Fuerte Perfecta
inversa directa
Coeficiente de determinación R
= r2
• El coeficiente de determinación, r2
es la
proporción de la variación total en la variable
dependiente Y que está explicada por, o se
debe a la variación en la variable independiente
X.
• El coeficiente de determinación es el cuadrado
del coeficiente de correlación, y toma valores
de 0 a 1. (0% a 100%)
• Mientras más alto más explicativa es la variable
independiente.
Ejemplo. Realizar el análisis de
correlación
Puntos (X)
Salario Actual
Y
183 300.00
263 328.00
276 400.00
313 400.50
356 410.00
404 410.00
417 430.00
546 490.00
547 520.00
3,305 3,688.50
Dibujar el diagrama de
dispersión
Diagrama de Dispersión
0
100
200
300
400
500
600
0 100 200 300 400 500 600
Puntos
SalarioActual
El diagrama de dispersión nos indica
que existe una relación lineal directa y
fuerte entre los puntajes y los salarios.
Ejemplo. Realizar el análisis de
correlación
Puntos (X)
Salario Actual
Y X2 Y2 XY
183 300.00 33,489.0 90,000.0 54,900.0
263 328.00 69,169.0 107,584.0 86,264.0
276 400.00 76,176.0 160,000.0 110,400.0
313 400.50 97,969.0 160,400.3 125,356.5
356 410.00 126,736.0 168,100.0 145,960.0
404 410.00 163,216.0 168,100.0 165,640.0
417 430.00 173,889.0 184,900.0 179,310.0
546 490.00 298,116.0 240,100.0 267,540.0
547 520.00 299,209.0 270,400.0 284,440.0
3305 3,688.50 1,337,969.00 1,549,584.25 1,419,810.5
[ ] ( ) ( )[ ]2222
)()(
))(()(
=
YYnXXn
YXXYn
r
Σ−ΣΣ−Σ
ΣΣ−Σ
9 (1,419,810.5) – (3,305)(3,688.5)
9 (1,337,969) - (3,305)2
9 (1,549,584.25) - (3,688.5)2
r = = 0.95
Tabla 2.
El Análisis de regresión
• Propósito: determinar la ecuación de
regresión; se usa para predecir el valor de
la variable dependiente (Y) basado en la
variable independiente (X).
• Procedimiento: seleccionar una muestra
de la población y enumerar los datos por
pares para cada observación; dibujar un
diagrama de dispersión para visualizar la
relación; determinar la ecuación de
regresión.
Análisis de regresión
• La ecuación de regresión: Yi’= a + b Xi donde:
• Yi’ es el valor promedio pronosticado de Y para cualquier valor
de Xi.
• a es la intercepción en Y, o el valor estimado de Y cuando X = 0
• b es la pendiente de la recta, o cambio promedio en Y’ por cada
cambio de una unidad en X. (cambio promedio en salario por
cada unidad de cambio en puntos)
• Se usa el principio de mínimos cuadrados para obtener
los parámetros a y b:
b
n XY X Y
n X X
a
Y
n
b
X
n
=
−
−
= −
( ) ( )( )
( ) ( )
Σ Σ Σ
Σ Σ
Σ Σ
2 2
Continuación del EJEMPLO
b
n XY X Y
n X X
a
Y
n
b
X
n
=
−
−
= −
( ) ( )( )
( ) ( )
Σ Σ Σ
Σ Σ
Σ Σ
2 2
9 (1,419,810.5) – (3,305)(3,688.5) 587,802
9 (1,337,969) - (3,305)2
1,118,696
.b = = = 0.5254
(3,688.5) - 0.5254 (3,305)
9 9
a.=
Utilizando las fórmulas para los
parámetros y reemplazando los
valores obtenidos en la tabla 2.
Calculamos:
= 216.89
La ecuación de regresión: Yi’= a + b Xi
Salario = 216.89 + 0.52 Puntos
Sirve de base referencial para estimar el salario en función del puntaje del puesto de
trabajo para este grupo en específico.
Error estándar de la estimación
• El error estándar de la estimación mide la
dispersión de los valores observados
alrededor de la recta de regresión.
• Fórmulas usadas para calcular el error
estándar:
S
Y Y
n
Y a Y b XY
n
Y X⋅ =
−
−
=
− −
−
Σ
Σ Σ Σ
( ')
( ) ( )
2
2
2
2
Taller
Aplicación de herramientas para el
análisis de Excel para el análisis de
regresión y correlación lineal.

Contenu connexe

Tendances

DistribucióN De Poisson
DistribucióN De PoissonDistribucióN De Poisson
DistribucióN De PoissonJesus Sanchez
 
Estimación e intervalos de confianza
Estimación e intervalos de confianzaEstimación e intervalos de confianza
Estimación e intervalos de confianzaAlejandro Ruiz
 
distribucion de fisher, ji-cuadrado, T student
distribucion de fisher, ji-cuadrado, T studentdistribucion de fisher, ji-cuadrado, T student
distribucion de fisher, ji-cuadrado, T studentJonatan Gabriel Linares
 
Estadistica probabilidad
Estadistica probabilidadEstadistica probabilidad
Estadistica probabilidadjennycol
 
Prueba de hipotesis sobre la media con varianza desconocida
Prueba de hipotesis sobre la media con varianza desconocidaPrueba de hipotesis sobre la media con varianza desconocida
Prueba de hipotesis sobre la media con varianza desconocidaKarina Ruiz
 
Distribucion muestral de proporciones
Distribucion muestral de proporcionesDistribucion muestral de proporciones
Distribucion muestral de proporcioneseraperez
 
Intervalos de confianza para la diferencia de proporciones
Intervalos de confianza para la diferencia de proporcionesIntervalos de confianza para la diferencia de proporciones
Intervalos de confianza para la diferencia de proporcionesYazmin Venegas
 
control estadistico de procesos-prueba de hipotesis
control estadistico de procesos-prueba de hipotesiscontrol estadistico de procesos-prueba de hipotesis
control estadistico de procesos-prueba de hipotesisSonia Ynés Huaripaucar G
 
Guia intervalos de confianza
Guia intervalos de confianzaGuia intervalos de confianza
Guia intervalos de confianzaAndres Oyarzun
 
probabilidad y estadistica 2/2 grupo 022 armad0o
probabilidad y estadistica 2/2 grupo 022 armad0oprobabilidad y estadistica 2/2 grupo 022 armad0o
probabilidad y estadistica 2/2 grupo 022 armad0oladronziitho
 
Problemas de determinación de tamaño de la muestra (9)
Problemas de determinación de tamaño de la muestra (9)Problemas de determinación de tamaño de la muestra (9)
Problemas de determinación de tamaño de la muestra (9)Luz Hernández
 
Ejercicios unidad 3 mata
Ejercicios unidad 3 mataEjercicios unidad 3 mata
Ejercicios unidad 3 mataKassandra Gomez
 

Tendances (20)

Tabla z
Tabla zTabla z
Tabla z
 
Taller 3
Taller 3Taller 3
Taller 3
 
Diseño factorial 2k...
Diseño factorial 2k...Diseño factorial 2k...
Diseño factorial 2k...
 
DistribucióN De Poisson
DistribucióN De PoissonDistribucióN De Poisson
DistribucióN De Poisson
 
Estimación e intervalos de confianza
Estimación e intervalos de confianzaEstimación e intervalos de confianza
Estimación e intervalos de confianza
 
distribucion de fisher, ji-cuadrado, T student
distribucion de fisher, ji-cuadrado, T studentdistribucion de fisher, ji-cuadrado, T student
distribucion de fisher, ji-cuadrado, T student
 
Estadistica probabilidad
Estadistica probabilidadEstadistica probabilidad
Estadistica probabilidad
 
U0304
U0304U0304
U0304
 
Prueba de hipotesis sobre la media con varianza desconocida
Prueba de hipotesis sobre la media con varianza desconocidaPrueba de hipotesis sobre la media con varianza desconocida
Prueba de hipotesis sobre la media con varianza desconocida
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
 
Distribucion muestral de proporciones
Distribucion muestral de proporcionesDistribucion muestral de proporciones
Distribucion muestral de proporciones
 
Intervalos de confianza para la diferencia de proporciones
Intervalos de confianza para la diferencia de proporcionesIntervalos de confianza para la diferencia de proporciones
Intervalos de confianza para la diferencia de proporciones
 
control estadistico de procesos-prueba de hipotesis
control estadistico de procesos-prueba de hipotesiscontrol estadistico de procesos-prueba de hipotesis
control estadistico de procesos-prueba de hipotesis
 
Guia intervalos de confianza
Guia intervalos de confianzaGuia intervalos de confianza
Guia intervalos de confianza
 
estadistica medias muestrales
estadistica medias muestralesestadistica medias muestrales
estadistica medias muestrales
 
Hipotesis2
Hipotesis2Hipotesis2
Hipotesis2
 
probabilidad y estadistica 2/2 grupo 022 armad0o
probabilidad y estadistica 2/2 grupo 022 armad0oprobabilidad y estadistica 2/2 grupo 022 armad0o
probabilidad y estadistica 2/2 grupo 022 armad0o
 
Problemas de determinación de tamaño de la muestra (9)
Problemas de determinación de tamaño de la muestra (9)Problemas de determinación de tamaño de la muestra (9)
Problemas de determinación de tamaño de la muestra (9)
 
Ejercicios unidad 3 mata
Ejercicios unidad 3 mataEjercicios unidad 3 mata
Ejercicios unidad 3 mata
 
Fundamentos de probabilidad
Fundamentos de probabilidadFundamentos de probabilidad
Fundamentos de probabilidad
 

En vedette

Bioestadística para biología y ciencias de la salud
Bioestadística para biología y ciencias de la saludBioestadística para biología y ciencias de la salud
Bioestadística para biología y ciencias de la saludCUR
 
Distribución de Probabilidad Discreta. Estadística, Douglas A. Lind, William ...
Distribución de Probabilidad Discreta. Estadística, Douglas A. Lind, William ...Distribución de Probabilidad Discreta. Estadística, Douglas A. Lind, William ...
Distribución de Probabilidad Discreta. Estadística, Douglas A. Lind, William ...Daday Rivas
 
Teoria de muestreo y prueba de hipotesis
Teoria de muestreo y prueba de hipotesisTeoria de muestreo y prueba de hipotesis
Teoria de muestreo y prueba de hipotesisZully Vèlez
 
Probabilidad basica
Probabilidad basicaProbabilidad basica
Probabilidad basicamatues
 
Estimación estadística
Estimación estadísticaEstimación estadística
Estimación estadísticagrcecilia2507
 
Ejercicios , para practica ESTADISTICA I UNIDAD V
Ejercicios , para practica ESTADISTICA I UNIDAD V Ejercicios , para practica ESTADISTICA I UNIDAD V
Ejercicios , para practica ESTADISTICA I UNIDAD V NGARZABAL
 
Muestreo y distrib muestrales de una media
Muestreo y distrib muestrales de una mediaMuestreo y distrib muestrales de una media
Muestreo y distrib muestrales de una mediaJuanito Vithore
 
Instrucciones reglas o normas del monopoly standard
Instrucciones reglas o normas del monopoly standardInstrucciones reglas o normas del monopoly standard
Instrucciones reglas o normas del monopoly standardJuan Fernández Moro
 
DETERMINACIÓN DE CONJUNTOS
DETERMINACIÓN DE CONJUNTOSDETERMINACIÓN DE CONJUNTOS
DETERMINACIÓN DE CONJUNTOSMiguel Angel
 
Semana 4 distribuciones de probabilidad discretas
Semana 4  distribuciones de probabilidad discretasSemana 4  distribuciones de probabilidad discretas
Semana 4 distribuciones de probabilidad discretasSergio Jurado
 
Estimacion puntual, propiedades de las estimaciones; estimacion por intervalo...
Estimacion puntual, propiedades de las estimaciones; estimacion por intervalo...Estimacion puntual, propiedades de las estimaciones; estimacion por intervalo...
Estimacion puntual, propiedades de las estimaciones; estimacion por intervalo...Alexander Flores Valencia
 
Formulas de probabilidades (3)
Formulas de probabilidades (3)Formulas de probabilidades (3)
Formulas de probabilidades (3)sistemas2013
 
Distribuciòn muestral de la media.
Distribuciòn muestral de la media.Distribuciòn muestral de la media.
Distribuciòn muestral de la media.maryanbalmaceda
 
Planeación de Proyectos - PERT & CPM
Planeación de Proyectos - PERT & CPMPlaneación de Proyectos - PERT & CPM
Planeación de Proyectos - PERT & CPMJose
 
Ejercicios deber estadistica
Ejercicios deber estadisticaEjercicios deber estadistica
Ejercicios deber estadisticaAlexandra Calero
 

En vedette (20)

estadistica
estadisticaestadistica
estadistica
 
Bioestadística para biología y ciencias de la salud
Bioestadística para biología y ciencias de la saludBioestadística para biología y ciencias de la salud
Bioestadística para biología y ciencias de la salud
 
Distribución de Probabilidad Discreta. Estadística, Douglas A. Lind, William ...
Distribución de Probabilidad Discreta. Estadística, Douglas A. Lind, William ...Distribución de Probabilidad Discreta. Estadística, Douglas A. Lind, William ...
Distribución de Probabilidad Discreta. Estadística, Douglas A. Lind, William ...
 
Teoria de muestreo y prueba de hipotesis
Teoria de muestreo y prueba de hipotesisTeoria de muestreo y prueba de hipotesis
Teoria de muestreo y prueba de hipotesis
 
1° encuentro teoria de conjuntos
1° encuentro   teoria de conjuntos1° encuentro   teoria de conjuntos
1° encuentro teoria de conjuntos
 
Probabilidad basica
Probabilidad basicaProbabilidad basica
Probabilidad basica
 
Estimación estadística
Estimación estadísticaEstimación estadística
Estimación estadística
 
Algebra conjuntoswm
Algebra conjuntoswmAlgebra conjuntoswm
Algebra conjuntoswm
 
Ejercicios , para practica ESTADISTICA I UNIDAD V
Ejercicios , para practica ESTADISTICA I UNIDAD V Ejercicios , para practica ESTADISTICA I UNIDAD V
Ejercicios , para practica ESTADISTICA I UNIDAD V
 
Muestreo y distrib muestrales de una media
Muestreo y distrib muestrales de una mediaMuestreo y distrib muestrales de una media
Muestreo y distrib muestrales de una media
 
Capítulo viii
Capítulo viiiCapítulo viii
Capítulo viii
 
Instrucciones reglas o normas del monopoly standard
Instrucciones reglas o normas del monopoly standardInstrucciones reglas o normas del monopoly standard
Instrucciones reglas o normas del monopoly standard
 
Conjuntos
ConjuntosConjuntos
Conjuntos
 
DETERMINACIÓN DE CONJUNTOS
DETERMINACIÓN DE CONJUNTOSDETERMINACIÓN DE CONJUNTOS
DETERMINACIÓN DE CONJUNTOS
 
Semana 4 distribuciones de probabilidad discretas
Semana 4  distribuciones de probabilidad discretasSemana 4  distribuciones de probabilidad discretas
Semana 4 distribuciones de probabilidad discretas
 
Estimacion puntual, propiedades de las estimaciones; estimacion por intervalo...
Estimacion puntual, propiedades de las estimaciones; estimacion por intervalo...Estimacion puntual, propiedades de las estimaciones; estimacion por intervalo...
Estimacion puntual, propiedades de las estimaciones; estimacion por intervalo...
 
Formulas de probabilidades (3)
Formulas de probabilidades (3)Formulas de probabilidades (3)
Formulas de probabilidades (3)
 
Distribuciòn muestral de la media.
Distribuciòn muestral de la media.Distribuciòn muestral de la media.
Distribuciòn muestral de la media.
 
Planeación de Proyectos - PERT & CPM
Planeación de Proyectos - PERT & CPMPlaneación de Proyectos - PERT & CPM
Planeación de Proyectos - PERT & CPM
 
Ejercicios deber estadistica
Ejercicios deber estadisticaEjercicios deber estadistica
Ejercicios deber estadistica
 

Similaire à Introduccion a la_probabilidad (1)

Distribuciones y Probabilidad y Estadistica
Distribuciones y Probabilidad y EstadisticaDistribuciones y Probabilidad y Estadistica
Distribuciones y Probabilidad y EstadisticaLeslieVillarreal12
 
Unidad 7 mates
Unidad 7 matesUnidad 7 mates
Unidad 7 matescesargrau
 
Ortega sergio act2
Ortega sergio act2Ortega sergio act2
Ortega sergio act2chaycoss
 
Estadistica probabilistica
Estadistica probabilisticaEstadistica probabilistica
Estadistica probabilisticaJoseGCordero
 
Distribucion binomial
Distribucion binomialDistribucion binomial
Distribucion binomialyessica-mora
 
Temario ii exámen, iii trimestre 8º,2013
Temario ii exámen, iii trimestre 8º,2013Temario ii exámen, iii trimestre 8º,2013
Temario ii exámen, iii trimestre 8º,2013Prof.Grettel _mate
 
Distribuciones probabilisticas lissette_saltos
Distribuciones probabilisticas lissette_saltosDistribuciones probabilisticas lissette_saltos
Distribuciones probabilisticas lissette_saltosLiLi Saltos
 
Introducción a la probabilidad
Introducción a la probabilidadIntroducción a la probabilidad
Introducción a la probabilidadrmagallon12
 
UTPL-ESTADÍSTICA I-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
UTPL-ESTADÍSTICA I-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)UTPL-ESTADÍSTICA I-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
UTPL-ESTADÍSTICA I-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)Videoconferencias UTPL
 
Gestion del riesgo
Gestion del riesgoGestion del riesgo
Gestion del riesgoEdwin Ortega
 
Libro_estadistica-aplicada a la ingenieria civil y otras ramas.pdf
Libro_estadistica-aplicada a la ingenieria civil y otras ramas.pdfLibro_estadistica-aplicada a la ingenieria civil y otras ramas.pdf
Libro_estadistica-aplicada a la ingenieria civil y otras ramas.pdfVeritoIlma
 
Estadística en la aplicación de recursos humanos
Estadística en la aplicación de recursos humanosEstadística en la aplicación de recursos humanos
Estadística en la aplicación de recursos humanosMyleidy Leon
 

Similaire à Introduccion a la_probabilidad (1) (20)

Separata probabilidad
Separata probabilidadSeparata probabilidad
Separata probabilidad
 
Distribuciones y Probabilidad y Estadistica
Distribuciones y Probabilidad y EstadisticaDistribuciones y Probabilidad y Estadistica
Distribuciones y Probabilidad y Estadistica
 
Unidad 7 mates
Unidad 7 matesUnidad 7 mates
Unidad 7 mates
 
Power tics
Power ticsPower tics
Power tics
 
Ortega sergio act2
Ortega sergio act2Ortega sergio act2
Ortega sergio act2
 
0tema 3
0tema 30tema 3
0tema 3
 
Incertidumbre
IncertidumbreIncertidumbre
Incertidumbre
 
Estadística educativa mhd 2013 2
Estadística educativa mhd 2013 2Estadística educativa mhd 2013 2
Estadística educativa mhd 2013 2
 
Estadistica probabilistica
Estadistica probabilisticaEstadistica probabilistica
Estadistica probabilistica
 
Distribucion binomial
Distribucion binomialDistribucion binomial
Distribucion binomial
 
Temario ii exámen, iii trimestre 8º,2013
Temario ii exámen, iii trimestre 8º,2013Temario ii exámen, iii trimestre 8º,2013
Temario ii exámen, iii trimestre 8º,2013
 
Ce ps 2-08.01.2011
Ce ps 2-08.01.2011Ce ps 2-08.01.2011
Ce ps 2-08.01.2011
 
Distribuciones probabilisticas lissette_saltos
Distribuciones probabilisticas lissette_saltosDistribuciones probabilisticas lissette_saltos
Distribuciones probabilisticas lissette_saltos
 
Introducción a la probabilidad
Introducción a la probabilidadIntroducción a la probabilidad
Introducción a la probabilidad
 
UTPL-ESTADÍSTICA I-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
UTPL-ESTADÍSTICA I-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)UTPL-ESTADÍSTICA I-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
UTPL-ESTADÍSTICA I-II-BIMESTRE-(OCTUBRE 2011-FEBRERO 2012)
 
Estadística inferencial
Estadística inferencialEstadística inferencial
Estadística inferencial
 
Gestion del riesgo
Gestion del riesgoGestion del riesgo
Gestion del riesgo
 
Libro_estadistica-aplicada a la ingenieria civil y otras ramas.pdf
Libro_estadistica-aplicada a la ingenieria civil y otras ramas.pdfLibro_estadistica-aplicada a la ingenieria civil y otras ramas.pdf
Libro_estadistica-aplicada a la ingenieria civil y otras ramas.pdf
 
Probabilidad
Probabilidad Probabilidad
Probabilidad
 
Estadística en la aplicación de recursos humanos
Estadística en la aplicación de recursos humanosEstadística en la aplicación de recursos humanos
Estadística en la aplicación de recursos humanos
 

Dernier

PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxPLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxJUANSIMONPACHIN
 
Fundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfFundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfsamyarrocha1
 
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxLINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxdanalikcruz2000
 
Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024IES Vicent Andres Estelles
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxEribertoPerezRamirez
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptxJunkotantik
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfAlfredoRamirez953210
 
PINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).ppt
PINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).pptPINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).ppt
PINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).pptAlberto Rubio
 
libro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación iniciallibro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación inicialLorenaSanchez350426
 
cuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicacuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicaGianninaValeskaContr
 
Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Angélica Soledad Vega Ramírez
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOweislaco
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressionsConsueloSantana3
 
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdfLA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdfNataliaMalky1
 
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfFisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfcoloncopias5
 
Los Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la SostenibilidadLos Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la SostenibilidadJonathanCovena1
 

Dernier (20)

PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docxPLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
PLANIFICACION ANUAL 2024 - INICIAL UNIDOCENTE.docx
 
Fundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdfFundamentos y Principios de Psicopedagogía..pdf
Fundamentos y Principios de Psicopedagogía..pdf
 
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptxLINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
LINEAMIENTOS INICIO DEL AÑO LECTIVO 2024-2025.pptx
 
Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024Metabolismo 3: Anabolismo y Fotosíntesis 2024
Metabolismo 3: Anabolismo y Fotosíntesis 2024
 
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docxPROGRAMACION ANUAL DE MATEMATICA 2024.docx
PROGRAMACION ANUAL DE MATEMATICA 2024.docx
 
La Función tecnológica del tutor.pptx
La  Función  tecnológica  del tutor.pptxLa  Función  tecnológica  del tutor.pptx
La Función tecnológica del tutor.pptx
 
TL/CNL – 2.ª FASE .
TL/CNL – 2.ª FASE                       .TL/CNL – 2.ª FASE                       .
TL/CNL – 2.ª FASE .
 
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdfEstrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
Estrategias de enseñanza - aprendizaje. Seminario de Tecnologia..pptx.pdf
 
PINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).ppt
PINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).pptPINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).ppt
PINTURA ITALIANA DEL CINQUECENTO (SIGLO XVI).ppt
 
VISITA À PROTEÇÃO CIVIL _
VISITA À PROTEÇÃO CIVIL                  _VISITA À PROTEÇÃO CIVIL                  _
VISITA À PROTEÇÃO CIVIL _
 
libro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación iniciallibro para colorear de Peppa pig, ideal para educación inicial
libro para colorear de Peppa pig, ideal para educación inicial
 
cuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básicacuadernillo de lectoescritura para niños de básica
cuadernillo de lectoescritura para niños de básica
 
Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...Contextualización y aproximación al objeto de estudio de investigación cualit...
Contextualización y aproximación al objeto de estudio de investigación cualit...
 
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJOTUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
TUTORIA II - CIRCULO DORADO UNIVERSIDAD CESAR VALLEJO
 
Sesión La luz brilla en la oscuridad.pdf
Sesión  La luz brilla en la oscuridad.pdfSesión  La luz brilla en la oscuridad.pdf
Sesión La luz brilla en la oscuridad.pdf
 
Aedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptxAedes aegypti + Intro to Coquies EE.pptx
Aedes aegypti + Intro to Coquies EE.pptx
 
Uses of simple past and time expressions
Uses of simple past and time expressionsUses of simple past and time expressions
Uses of simple past and time expressions
 
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdfLA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
LA OVEJITA QUE VINO A CENAR CUENTO INFANTIL.pdf
 
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdfFisiologia.Articular. 3 Kapandji.6a.Ed.pdf
Fisiologia.Articular. 3 Kapandji.6a.Ed.pdf
 
Los Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la SostenibilidadLos Nueve Principios del Desempeño de la Sostenibilidad
Los Nueve Principios del Desempeño de la Sostenibilidad
 

Introduccion a la_probabilidad (1)

  • 1. Universidad Latina de Panamá Estadística II Profesora Lumys T. Ortega G. Teléfonos: 212-7353; 6436-2725 Correo electrónico: lumysortegag@hotmail.com
  • 2. OBJETIVOS GENERALES • Conocer las técnicas fundamentales y los conceptos de probabilidad necesarios para comprender la inferencia estadística. • Reconocer la importancia del tema de las probabilidades en el desarrollo de su capacidad analítica. • Proporcionar los conocimientos y conceptos básicos sobre los tópicos de mayor utilidad práctica de inferencia estadística. • Aplicar las técnicas de regresión correlación en el proceso de estimación de variables relacionadas.
  • 3. Objetivos Específicos • Explicar el objetivo del análisis de regresión. • Establecer los supuestos bajo los cuales se basa el análisis de regresión. • Calcular la regresión lineal e indicadores correlación. • Conocer los conceptos básicos sobre probabilidades con el propósito de utilizarlos en los temas de inferencia estadística. • Definir los enfoques de la probabilidad. • Aplicar los axiomas de probabilidad en a resolución del problemas. • Interpretar el concepto de independencia estadística. • Analizar el concepto de estadística matemática de una variable aleatoria. • Explicar que es una distribución de probabilidad. • Distinguir entre una distribución discreta y una continua. • Expresar las características de las distribución Binomial y Normal. • Emplear tablas y fórmulas de la distribución Binomial para resolver problemas de probabilidad. • Convertir cualquier distribución normal en una distribución normal estándar. • Estudiar el muestreo como un enfoque sistemático para seleccionar más elementos de un grupo de datos a fin de hacer algunas inferencias sobre el grupo total. • Estimar las características de una población observándolas de la muestra. • Determinar cuando es razonable concluir a partir del análisis de una muestra, que la población posee determinada propiedad y cuando no es razonable llegar a tal conclusión.
  • 4. Contenido 1. Elementos de Probabilidad 1.1. Introducción 1.1.1.Definición. 1.1.2.Conceptos Básicos. 1.1.3.Eventos. 1.1.4.Espacio y Punto Muestral. 1.2. Enfoque de la Probabilidad. 1.2.1. Objetivo. 1.2.2. Subjetivo 1.3. Axiomas de la Teoría Probabilística. 1.4. Probabilidades Condicionadas. 1.5. Reglas para la Adición y Multiplicación de Probabilidades. 1.6. Independencia Estadística. 1.7. Esperanza Matemática y Variable Aleatoria. 2. Distribuciones de Probabilidad 2.1. Funciones de Distribución. 2.1.1. Distribución de Variables Discretas Discontinuas. 2.1.1.1 Distribución Binomial. 2.1.1.2 Características. 2.2. Distribución de Variables Continuas. 2.3. La Distribución Normal. 2.3.1. Características. 2.4. La Distribución Normal Como una Aproximación de la Distribución Binomial. 2.5. La Distribución Normal Estandarizada. 2.6. Determinación de Probabilidades usando la Estandarizada. 3. Distribución Muestral 3.1. Muestras y Distribuciones Muéstrales. 3.1.1. Introducción. 3.1.2. Tipos de Muestreo 3.1.2.1 Aleatorio Simple. 3.1.2.2 Sistemático. 3.1.2.3 Estratificado. 3.1.2.4 Por Conglomerado. 3.1.3. Determinación del Tamaño de la Muestra. 3.2. Distribuciones Muéstrales. 3.2.1. Distribución Muestral. 3.2.1.1 De la Medida. 3.2.1.2 De la Varianza. 3.2.1.3 De la Desviación Típica. 3.2.2. Significado de las Distribuciones Muéstrales.
  • 5. Contenido 4. Inducción Estadística 4.1. Los Parámetros y sus Estimadores. 4.2. Estimación Puntual. 4.3. Estimación de la Medida por Intervalos. 4.4. Estimación de las Diferentes Medidas. 4.5. Estimación de las Diferentes Proporciones. 4.6. Estimación de Proporciones por Intervalos. 5. Prueba de Hipótesis 5.1. Teoría de la Decisión (Contraste de Hipótesis). 5.1.1. Introducción. 5.1.2. El Problema de la Decisión. 5.1.3. Hipótesis Nula y Contraste de Significado. 6. Análisis de Regresión y Correlación Simple 6.1. Introducción. 6.1.1. Función de ajustes. 6.1.2. Tipos de Variables. 6.2. Regresión Simple. 6.2.1. Diagrama de Esparcimiento. 6.2.2. Principio de Mínimos Cuadrados para la Estimación de Parámetros. 6.3. Correlación. 6.3.1. Varianza de Regresión. 6.3.2. Coeficiente de Determinación. 6.3.3. Coeficiente de Correlación.
  • 6. Evaluación • Detalles Porcentaje • Asistencia y participación en clases 10% • 2 Exámenes Parciales (15% cada uno) 30% • 2 Trabajos grupales: lecturas obligatorias, tareas 20% • Estudio de casos, investigaciones 10% • Proyecto Final 30% • Total 100%
  • 7. Bibliografía recomendada • Levin y Rubin. Estadística para Administración y Economía. Pearson – Prentice Hall. Séptima Edición. 2004 • Lind, Douglas, (2008). Estadistica, Treceava Edición, México: McGraw-Hill • Berenson, Mark; Levinci, Davidy Kreltbiel, Timothy, (2001). Estadística para la Administración, 2001 Edición, México: Pearson Education. • Mason y Lind. Estadística para Administración y Economía. Alfa Omega.
  • 9. Introducción a la probabilidad • Probabilidad: Posibilidad numérica medida entre cero y uno, de que ocurra un evento. • Probabilidad de que un cliente no pague a tiempo sus cuentas. • Probabilidad de comprar un artículo defectuoso. • Probabilidad de que llueva mañana. • La probabilidad puede ser expresada como proporción: valore entre cero y uno; y en porcentaje si es multiplicada por 100. • La teoría de probabilidad estudia las leyes de la naturaleza y los problemas de la vida cotidiana.
  • 10. Conceptos Ejemplo: – Inspección de cajas de artículos. – Lanzamiento de un dado – Medición de la percepción sobre el sistema de compensación – Observar el estado del tiempo (llueve o no llueve). – Observación del sexo del nacimiento de un (a) bebé. Experimento aleatorio: Es la actividad que produce uno o varios resultados. Es la observación de alguna actividad o la acción de efectuar una medición.
  • 11. Conceptos • Resultado: Un experimento es toda acción bien definida que conlleva a un resultado único bien definido. • Espacio muestral: Conjunto de todos los posibles resultados para un experimento. 1. Espacio muestral finito: S={1,2,3,4,5,6} 2. Espacio muestral infinito contable: S={1,2,3,4,....} 3. Espacio muestral infinito no contable: S={0≤ X ≤ 1} Observación: 1 y 2, corresponden a espacios muestrales discretos; 3, es un espacio muestral no discreto o continuo. Evento o suceso: Es el o los resultados de un experimento o la descripción de un resultado potencial. ( Los eventos se denotan con letras mayúsculas (A, B, C, E). hay eventos simples y eventos compuestos.
  • 12. •Eventos mutuamente excluyentes: la ocurrencia de un evento denota que ningún otro evento pueda ocurrir al mismo tiempo. •Eventos no mutuamente excluyentes: dos o más eventos pueden ocurrir simultáneamente. •Eventos colectivamente exhaustivos: por lo menos uno de los eventos ocurre cuando se realiza un experimento. •Eventos equiprobables: eventos cuya probabilidad de ocurrencia es la misma. Igualmente probables. Negro Color Palo Rojo Total As 2 2 4 No-As 24 24 48 Total 26 26 52
  • 13. Probabilidad Clásica Basada en resultados posibles e igualm ente probables Probabilidad Em pírica B asada en frecuencias relativas O bjetivo P arte de inform ación disponible o subjetiva Subjetivo E nfoques de probabilidad
  • 14. Enfoques de la Probabilidad Probabilidad Objetiva: – Probabilidad Clásica o a priori: Considera que los resultados de un experimento son igualmente posibles y mutuamente excluyentes. Se calcula P(E) = número de resultados favorables número de resultados posibles P(E), significa: probabilidad de ocurrencia del evento E. La letra E, es una representación simbólica de un evento. Ejemplo: E: sale cara
  • 15. Enfoque clásico • Ejemplo: Se desea conocer la probabilidad de obtener un “seis” en el lado superior en el lanzamiento de un dado. • Como el dado tiene seis lados, numerados del 1 al 6. Los posibles resultados en el lanzamiento de un dado son: S = {1, 2, 3, 4, 5, 6} Resultado (Ei) No. De veces que puede salir P(Ei) Sale “1” 1 1/6 Sale “2” 1 1/6 Sale “3” 1 1/6 Sale “4” 1 1/6 Sale “5” 1 1/6 Sale “6” 1 1/6 Estos eventos son equiprobables, mutuamente excluyentes y colectivamente exhaustivos.
  • 16. Enfoque de probabilidad Frecuentista Número de veces que ha ocurrido el evento en el pasado Número total de observaciones P(E) = P(E), significa: probabilidad de ocurrencia del evento E. La letra E, es una representación simbólica de un evento. Ejemplo: E: .. vender 5 computadoras hoy.
  • 17. Enfoque Frecuentista • Ejemplo: Un importador de cristal irlandés de Nueva York recibe envíos de cajas de tres artículos. Los datos para las últimas 100 cajas indicaron el número de artículos dañados que había en cada caja. Los datos se resumen a continuación: Resultado (E) Número de defectos Númer o de cajas P(Ej) 0 40 40/100=0.4 1 27 27/100=0.27 2 21 21/100=0.21 3 12 12/100=0.12
  • 18. Enfoques de la Probabilidad Subjetivo Probabilidad Subjetiva: Se refiere a la probabilidad de que suceda un evento, asignado por una persona con base a información de que disponga. (información subjetiva) – Ejemplos: Posibilidad de comprar un automóvil nuevo este año, – Posibilidad de que usted obtenga A en el curso.
  • 19. Taller1 1. Se va a sacar una carta al azar de un juego estándar de baraja de 52 cartas. ¿Cuál es la probabilidad de que la carta sea una reina?. 2. Los empleados de General Cement se les practica cada año un examen médico de rutina como parte de un programa de servicios de salud. Se encontró que 8% de los empleados necesitaba zapatos correctivos, 15% necesitaba un trabajo dental mayor, y un 3% necesitaba las dos cosas, zapatos correctivos y un trabajo dental mayor. A. ¿Cuál es la probabilidad de que un empleado seleccionado al azar necesite zapatos correctivos o un trabajo dental mayor? B. Ilustre el problema en forma gráfica (Diagramas de Venn).
  • 20. Taller1 3. Durante el año anterior, las ventas semanales en Petunia’s Pet Shoppe han sido “bajas” durante 16 semanas, “considerables”, durante 27 semanas y “altas” el resto de las semanas. ¿Cuál es la probabilidad de que las ventas de esta semana sean: A. Considerables, B. Bajas C. Altas 4. Una carta se extrae aleatoriamente de una baraja de 52 cartas. Hallar la probabilidad de: Un As Una jota de corazones Un tres de tréboles o un seis de diamantes Un diez o corazón negro Cualquiera menos de corazones 5. Encontrar la probabilidad de no obtener un total de 7 u 11 en ninguno de los dos lanzamientos de un par de dados normales.
  • 21. Problemas para resolver • La siguiente tabla muestra el número de computadoras vendidos diariamente por una tienda minorista: Número de computadoras vendidas Número de días 0 12 1 43 2 18 3 20 4 25 Determine la probabilidad de que el número de computadores que se vendan hoy sea: a. 2 b. Menos de 3 c. Más de 1
  • 22. Axiomas o Reglas de probabilidad • 0 ≤ P(E) ≤ 1, La probabilidad es siempre positiva • P (S)= 1, Certidumbre o suceso seguro. REGLAS DE ADICIÓN PARA EVENTOS MUTUAMENTE EXCLUYENTES P (A U B) = P (A) + P (B) Esto expresa la probabilidad de que ocurra A ó ocurra B. Cuando los eventos son mutuamente excluyentes, no pueden ocurrir simultáneamente. Esto significa que no existe intersección. Una extensión de la probabilidad: P (A U B U C) = P (A) + P (B) + P (C) BA P (A ∩ B) = 0
  • 23. Ejemplo • Un estudio de 200 cadenas de tiendas reveló estos ingresos, después del pago de impuestos: Ingresos después de impuestos Número de empresas TOTAL 200 (A) Menos de un millón 102 (B) De un millón a menos de 20 millones 61 (C) 20 millones ó más 37 a) Cuál es la probabilidad de que una cadena de tiendas tenga menos de un millón de dólares en ingresos después de pagar impuestos. P(A) = 102 / 200 = 0.51 = 51% b) Cuál es la probabilidad de que una cadena de tiendas tenga ingresos de un millón a menos de 20, ó que tenga ingresos de 20 millones ó más. P(B U C) = 61/ 200 + 37/ 200 = 0.305 + 0.185 =0.49 = 49% c) Qué regla de probabilidad se aplicó. Se aplicó la regla de adición para eventos mutuamente excluyentes
  • 24. PARA EVENTOS NO MUTUAMENTE EXCLUYENTES P (A U B) = P (A) + P (B) – P(A ∩B) A B A ∩ B EJEMPLO. Una carta de una baraja americana de 52 naipes se va a seleccionar en forma aleatoria (al azar). Cuál es la probabilidad de que la carta seleccionada sea un rey o negra? •La probabilidad de escoger un rey es P( R ) = 4 / 52 •La probabilidad de escoger una carta negra es P(N) = 26 / 52 •Los eventos no son mutuamente excluyentes, existe la posibilidad de extraer una carta que tenga ambas características. Existen 2 reyes negros en un juego de cartas americanas. •La Probabilidad de escoger un rey o una carta negra: P( R U N) = P ( R ) + P ( N ) – P (R ∩ N) = 4 / 52 + 26/ 52 – 2 / 52
  • 25. • P (A U B U C) = P (A) + P (B) + P (C) – P(A∩B) – P(A∩C)– P (B∩C) + P(A ∩ B ∩C) A B C A ∩ B A∩C B∩C A∩B∩C REGLA DEL COMPLEMENTO P(A)= 1 - P ( A’ ) DONDE LOS EVENTOS SON MUTUAMENTE EXCLUYENTES Y COLECTIVAMENTE EXHAUSTIVOS
  • 26. Taller 2. 1. Se entrevistará a un grupo de 2000 empelados de una compañía para preguntarles sobre un nuevo plan de pensiones. Los empleados clasificaron como sigue: Clasificación Evento N° de empleados Supervisores A 120 De Mantenimiento B 50 De Producción C 1460 De Gerencia D 302 Secretarial E 68 a) Cuál es la probabilidad de que la primera seleccionada sea de mantenimiento ? b) Cuál es la probabilidad de que sea de secretaria ? c) Cuál es la probabilidad de que sea alguien de mantenimiento o secretaría? d) Qué regla de probabilidad se aplicó en la pregunta anterior ? e) Estos eventos son mutuamente excluyentes ? f ) Cuál es la probabilidad de no seleccionar a una persona de mantenimiento?
  • 27. 2. Determine el espacio muestral para el lanzamiento de dos dados. a) Cuál es la probabilidad de que ambos dados sumen 7 puntos b) Cuál es la probabilidad de que ambos sumen un número par de puntos. c) Cuál es la probabilidad de que sumen más de 8.
  • 28. 3. En una encuesta realizada en algunos países acerca de los productos de mayor exportación, se encontró que: 10 países exportaban café; 15, petróleo y 13, frutas; solamente 6 exportaban frutas y petróleo; 4, sólo frutas y café; 3, sólo café y petróleo; y 2 exportaban los tres productos. a) Cuántos países fueron encuestados b) Cuántos países exportaban sólo petróleo c) Cuántos países exportaban sólo café.
  • 29. 4. En cierta empresa, 45 empleados que no aprobaron el entrenamiento en el uso de un sistema de gestión administrativa, 32 dijeron que no aprobaron por no estudiar el manual; 18 porque no le entendieron al instructor; y 9 por causas diferentes a estas dos. Encuentre la probabilidad de los siguientes eventos: a) Reprobó porque no estudió o porque no le entiende al instructor. b) Reprobó porque no estudió y no le entiende al instructor c) Reprobó porque no estudió y no porque no le entiende al instructor d) Reprobó porque no le entiende al instructor y no porque no estudió. 9 14 18 4 45 – 9 = 36 32+18-36 = 14 32-14 =18 18-14= 4
  • 30. REGLAS DE MULTIPLICACIÓN Para eventos independientes ( La ocurrencia de un evento no tiene efecto en la probabilidad de ocurrencia de cualquier otro) P (A ∩ B) = P(A) * P(B) Probabilidad Conjunta, es decir que ocurra A y B simultaneamente es igual al producto de las probabilidades de los eventos. Para tres eventos A, B y C P(A ∩ B ∩ C) = P(A) * P(B) *P(C) Para eventos dependientes ( La ocurrencia de un evento tiene efecto en la probabilidad de ocurrencia de cualquier otro) P (A ∩ B) = P(A) * P(B / A) La probabilidad conjunta es igual a la probabilidad de A por la probabilidad de B dado que ocurrió A, esta es la probabilidad condicional. P(B/A) = P (A ∩ B) / P(A) Para tres eventos A, B y C P(A ∩ B ∩ C) = P(A) * P(B / A) *P(C / A ∩ B)
  • 31. Ejemplos Se lanzan al aire dos monedas. Cuál es la probabilidad de que ambas salgan sello? Entonces P(S) = 0.5 es la probabilidad de un sello. Los sucesos son independientes ya que el hecho de que caiga sello en el primer lanzamiento, no afecta la probabilidad de ocurrencia de un resultado sello en el segundo segundo lanzamiento. Probabilidad de que ambas caigan sello P(S ∩ S ) = P(S ) * P(S) = 0.5 *0.5 = 0.25 Esto puede demostrarse enlistando los posibles resultados del lanzamiento de dos monedas: S = ( cc ; cs ; sc ; ss ) De los cuatro posibles resultados, uno sólo cumple con la condición de que ambos sean sello. La probabilidad es uno de cuatro, es decir 0.25
  • 32. • Práctica • 1. Un inversionista compró 100 acciones en el HSBC y 25 de la Universidad Latina de Panamá. La probabilidad de que las acciones del banco incrementen su valor en un año es de 0.70. La probabilidad de que las utilidades de la universidad se incrementen en el mismo periodo es de 0.60. • .a) Cual es la probabilidad de que las dos acciones aumenten de precio durante el período? • .b) Cuál es la probabilidad de que las acciones del banco incremente su precio, aunque las utilidades de la universidad no. • .c) Cual es la probabilidad de que ambas acciones no aumenten?
  • 33. sexo edad B.R H 18 C.C M 19 C.G H 19 G.P M 20 M.P M 21 J.L H 20 L.A. M 21 N.D M 21 V.C H 22 V.F. H 19 L.L. H 18 J.N. M 21 J.P. M 21 U.P M 18 2. Sean los Sucesos A = ser hombre (H) B = edad< 20 A= Hombre Ac = Mujer B= < 20 Bc = 20 o más Probabilidades P(A) = 4 62 2 6/14 = 0.43 P(B) = 6/14 = 0.43 P(A ∩ B) = 4/14 = 0.29 P(A ∪B) = 6/14 + 6/14 - 4/14 = 0.43+ 0.43 - 0.29 = 0.57 P(AB) = 4/6 = 0.67 P(A) + P(B) - P(A ∩ B)
  • 34. 3. Hay 10 rollos de película en una caja y 3 de ellos son defectuosos. Se van a seleccionar 2 rollos, uno después de otro y sin reemplazo. a) Cuál es la probabilidad de que ambos rollos sean defectuosos. b) Cuál es la probabilidad de que exactamente uno sea defectuoso. c) Si se eligen tres rollos, cuál es la probabilidad de que los dos primeros sean buenos y el último salga defectuoso.
  • 35. 4. Una muestra aleatoria de empleados de una empresa manufacturera se seleccionó para determinar sus planes de retiro después de cumplir 65 años. Los seleccionados en la muestra se dividieron en gerencia y producción. Los resultados fueron: Empleados Planes después de los 65 años Total Se retira No se retira Gerencia 5 15 20 Producción 30 50 80 Total 35 65 100 a) Trace un diagrama de arbol y determine las probabilidad conjunta ( sig. Diapositiva) b) Cuál es la probabilidad de que un empleado elegido al azar sea de producción y no se retire después de cumplidos los 65 años P(P ∩ NR) = 50/100 c) Cuál es la probabilidad de que el empleado se retire dado que sea de gerencia P( R/G)= 5/20
  • 36. P(G) = 20 / 100 P(P) = 80 / 100 P(R/G) = 5/20 P(NR/G) = 15/20 P(R/P) = 30/80 P(NR/P) = 50 / 80 Probabilidad Condicional Probabilidad Conjunta ( La suma de las probabilidades conjuntas da la unidad o el 100%) P(G ∩ R) = P(G) P(R/G) = (20 / 100) *(5/20)= 5/100 P(P ∩ NR) = P(P) P(NR/P) = (80 / 100) *(50/80)= 50/100 P(P ∩ R) = P(P) P(R/P) = (80 / 100) *(30/80)= 30/100 P(G ∩ NR) = P(G) P(NR/G) = (20 / 100) *(15/20)= 15/100 P Producción G Gerencia R Retirarse NR No retirarse Probabilidad Marginal
  • 37. Cuatro tipos de probabilidad Marginal La probabilidad de que ocurra X Unión La probabilidad de que ocurra X o Y Conjunta La probabilidad de que ocurra X e Y Condicional La probabilidad de que ocurra X sabiendo que ha ocurrido Y YX YX Y X P X( ) P X Y( )∪ P X Y( )∩ P X Y( | )
  • 40. Distribuciones de Probabilidad • Una distribución de probabilidad es un modelo matemático que asocia valores de una variable aleatoria con sus respectivas probabilidades, es decir: • Las distribuciones se caracterizan por una fórmula que determina el tipo de distribución y por un conjunto de parámetros, que son propios de cada espacio muestral. Probabilidad de x = Función de x
  • 41. • En el caso de una variable discreta , la distribución puede describirse mediante una función de probabilidad, que para cada valor de x de la variable X determina la probabilidad de ser asumido: P( X= x) = p (x) • o bien por medio de una función de distribución de probabilidad acumulada o simplemente función de distribución, la que, para cada valor provee la probabilidad de no ser superado superado P( X≤ x) = F (x) • evidentemente, el valor de la función de distribución es igual a la suma de todos los valores de la función de probabilidad desde el extremo inferior del dominio de la variable hasta x inclusive
  • 42. Ejemplo: Al lanzar dos dados la suma de ambos puede asumir 11 valores diferentes en 36 puntos muestrales (2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12)
  • 43. Se prepara una distribución de frecuencias de los resultados
  • 44. Tabla de distribución de probabilidad X f (x) p(X=x) P( X< x) F (x) X * p(X) X 2 * p(X) 2 1 0.03 0.03 0.06 0.11 3 2 0.06 0.08 0.17 0.50 4 3 0.08 0.17 0.33 1.33 5 4 0.11 0.28 0.56 2.78 6 5 0.14 0.42 0.83 5.00 7 6 0.17 0.58 1.17 8.17 8 5 0.14 0.72 1.11 8.89 9 4 0.11 0.83 1.00 9.00 10 3 0.08 0.92 0.83 8.33 11 2 0.06 0.97 0.61 6.72 12 1 0.03 1.00 0.33 4.00 36 1.00 7.00 54.83 E(X) = µ = ∑ X p(X) = 7.00 V(X) = σ2 = E(X 2 ) – (E(X)) 2 = 54.83 – (7) 2 = 54.83-49 = 5.83 Valor esperado Varianza
  • 45. Distribución de X 0 1 2 3 4 5 6 7 2 3 4 5 6 7 8 9 10 11 12 X F(x) X Grafica de la distribución de probabilidad
  • 48. Distribución Binomial- Fórmula Obsérvese que la fórmula incluye el término nCr (combinaciones), p = probabilidad del éxito y (1-p) es la probabilidad del fracaso. • p y n, son los parámetros de esta distribución. • La media y la varianza en esta distribución son: ∀ µ = n.p (media) y σ2 = n.p.(1-p) (varianza) xnx ppnCrxXP pnxb − −== )1(.)( ),;(
  • 49. Probabilidad Binomial • Cuando el experimento se repite varias veces (ensayos), donde cada ensayo tiene sólo dos posibilidades (éxitos o fracaso), entonces se puede construir una distribución de probabilidad binomial. • Para ello se debe conocer el número de ensayos que se realiza o el número de muestras (n) y la probabilidad de éxito en cada ensayo. • Su aplicación se da en variables discretas o no continuas, cuyas respuestas son dicotómicas (dos alternativas como respuestas), es decir: éxito o fracaso, ocurre o no ocurre el evento investigado. • Su fórmula es sencilla para los cálculos de probabilidades donde el número de veces que se repite el experimento es pequeño.
  • 50. Distribución Binomial - Ejemplo • En una situación binomial n=4 y p=0.25. Determine la siguiente probabilidad utilizando la fórmula binomial. – x=2 y obtenga la media para esta distribución. Solución P(x=2) = 4C2 (0.25)2 (1-0.25)(4-2) = 6 * (0.0625) * (0.75) (2) = 0.375 * 0.5625 = 0.2109 = 21.09% Media = n.p = 4*0.25 = 1.0
  • 51. Distribución de Poisson • La distribución de Poisson se emplea cuando se cuentan los eventos o entidades, distribuidos al azar en espacio o tiempo. • Supuestos: – Las ocurrencias de los eventos son independientes. – Teóricamente, es posible la ocurrencia de un evento un número infinito de veces dentro del intervalo. – La probabilidad de una sola ocurrencia del evento en un intervalo dado es proporcional a la dimensión del intervalo. – En cualquier fracción infinitesimal del intervalo, la probabilidad de más de una ocurrencia del evento es insignificante.
  • 52. Fórmula • La función de probabilidad de la variable que sigue una distribución de Poisson, se expresa; ! )( );( x e xXP xp x λ λ λ− == Donde: λ (parámetro) es el número de ocurrencias del evento aleatorio dentro del intervalo de tiempo o espacio. e, es la constante (con cuatro decimales) 2.7183
  • 53. Problemas • Si el número promedio de accidentes graves por año en una fábrica grande (donde el número de empleados es constante) es de cinco, calcúlese la probabilidad de que en el año en curso haya: – Exactamente siete accidentes – Diez o más accidentes – Cero accidentes • El cable utilizado para asegurar las estructuras de los puentes tiene un promedio de 3 defectos por cada 100 yardas. Si usted necesita 50 yardas, ¿cuál es la probabilidad de que haya una defectuosa?
  • 56. Distribución de probabilidad (caso de v.a.c) • De todas las distribuciones de probabilidad que se analizan, la distribución normal es la más importante, dada su característica en forma de campana y la forma como se relaciona con la regla empírica. fi X
  • 57. La función de distribución • Puede existir un número infinito de distribuciones normales posibles, cada una con su propia media y su desviación estándar. Ya que obviamente no se puede analizar un número tan grande de posibilidades es necesario convertir todas estas distribuciones normales a una forma estándar. Generando la distribución normal estándar. • El uso de esta distribución es útil cuando se desea, además, eliminar la unidad de medida.
  • 58. Función de distribución Normal estándar • Parámetros: µ (media) y σ (desviación estándar) • para ∝<z< ∝ 2/2 2 1 )( z ezf − = π Función de Distribución normal, para ∝<x< ∝ 22 2/)( 2 1 )( σµ πσ −− = x exf
  • 59. Cálculo de probabilidades con la distribución normal estándar • Transformación de la variable X a Z σ µ− = X Z Ejemplo: Sea µ= 2.2 y σ=0.8, calcule la probabilidad de, X>3.3 0838.0 )38.1( 8.0 2.23.3 )3.3( = >=       − >=> ZP ZPXP
  • 60. Resuelva • P(z=0) • P(z>=0.55) • P(z<-2.33) • P(z>-0.55) • P(-1.96<=z<=1.96) • P(z=0.74)
  • 61. Resuelva • Un estudio reciente de salario por hora de los equipos de mantenimiento en las principales líneas aéreas demostró que el salario promedio por hora fue 16.50 por hora, con una desviación estándar de 3.50 dólares. Si se selecciona la azar al miembro de un equipo, ¿Cuál es la probabilidad de que ese miembro gane: – Entre 16.50 y 20.00 dólares por hora. – Más de 20.00 dólares por hora. – Menos de 15.00 dólares por hora. • Una población normal tiene una media de 50.0 y una desviación estándar de 4.0. a) Calcule la probabilidad que el valor este entre 44.0 y 55.0 b) Calcule la Probabilidad de un valor mayor a 55.0 c) Calcule la Probabilidad de un valor entre 52.0 y 55.0
  • 62. Aproximación normal a la binomial • Utilizar la distribución normal (una distribución continua) como sustituto de una distribución binomial (una distribución discreta) para valores grandes de n, parece razonable porque conforme n aumenta, una distribución binomial se acerca más a una distribución normal. • La distribución de probabilidad normal, en general, se considera una buena aproximación a la binomial cuando • np y n(1 -p ) son ambos mayores que 5. 7-18
  • 63. Aproximación normal continuación • Recuerde el experimento binomial : – existen sólo dos resultados mutualmente excluyentes (éxito o fracaso) en cada ensayo. – una distribución binomial es el resultado de contar el número de éxitos en una cantidad fija de ensayos. – cada ensayo es independiente. – la probabilidad es fija de un ensayo a otro, y el número de ensayos n también es fijo. 7-19
  • 64. Distribución binomial para n igual a 3 y 20, donde p =.50 7-20 n=3 0 0,1 0,2 0,3 0,4 0 1 2 3 número de eventos P(x) n=20 0 0,05 0,1 0,15 0,2 2 4 6 8 10 12 14 16 18 20 número de eventos P(x)
  • 65. Factor de corrección por continuidad • El valor .5 se resta o se suma, dependiendo del problema, a un valor seleccionado cuando una distribución de probabilidad binomial (una distribución discreta) se aproxima por una distribución de probabilidad continua (la distribución normal). 7-21
  • 66. EJEMPLO 6 • Un estudio reciente de una compañía de investigación de mercados mostró que 15% de las casas en Estados Unidos poseen una cámara de video. Se obtuvo una muestra de 200 casas. • De las 200 casas en la muestra ¿cuántas se espera que tengan una cámara de video? 30)200)(15(. === npµ 7-22
  • 67. EJEMPLO • ¿Cuál es la variancia? • ¿Cuál es la desviación estándar? • ¿Cuál es la probabilidad de que menos de 40 casas de la muestra tengan cámara de video? • Se necesita P(X<40) = P(X< 39). Así, Al usar la aproximación normal, P(X<39.5) = P [z (39.5-30)/5.0498] = P(z< 1.8812) P(z<1.88)=.5+.4699 +.9699 5.25)15.1)(30()1(2 =−=−= pnpσ σ= =255 5 0498. . ≈ ≤ ≤ 7-23
  • 68. - 5 0 . 4 0 . 3 0 . 2 0 . 1 . 0 f(x r a l i t r b u i o n : µ = 0 , σ2 = 1 EJEMPLO 0 1 2 3 4 P(z = 1.88) .5 + .4699 = .9699 z = 1.88 © 2001 Alfaomega Grupo Editor
  • 70. ¿Por qué obtener muestras de la población? • Existe una imposibilidad física de verificar todos los elementos de la población. • El costo de estudiar todos los elementos de una población es alto. • Los resultados de la muestra suelen ser adecuados. • Contactar a toda la población es tardado, por la naturaleza destructiva de ciertas pruebas. 8-3
  • 71. Muestra aleatoria • Una muestra aleatoria es una muestra seleccionada de manera que cada elemento o persona en la población que se estudia tiene una probabilidad conocida de quedar incluido en la muestra. 8-4
  • 72. Métodos de muestreo aleatorio • Muestra aleatoria simple: muestra formulada de manera que cada elemento o persona en la población tiene la misma oportunidad de quedar incluida. • Muetra aleatoria sistemática: los artículos o individuos de la población se colocan en cierto orden. Se elige un punto de partida aleatorio y después se selecciona uno cada k-ésimo elemento de la población para la muestra. 8-5
  • 73. Métodos de muestreo aleatorio • Muestreo aleatorio estratificado: se divide la población en subgrupos, llamados estratos, y se selecciona una muestra de cada estrato. • Muestreo por conglomeración: primero se divide la población en subgrupos (estratos), y se selecciona un estrato. La muestra se toma del estrato seleccionado. • El error de muestreo es la diferencia entre un estadístico muestral y su parámetro correspondiente. 8-6
  • 74. Distribución de muestreo de medias muestrales • La distribución de muestreo de medias muestrales es la distribución de probabilidad de todas la medias muestrales posibles de un tamaño de muestra dado, seleccionadas de una población, y la probabilidad de ocurrencia asociada con cada media muestral. 8-7
  • 75. EJEMPLO 1 • El despacho de abogados HERR & Asociados tiene cinco socios. En su junta de socios semanal cada uno informa el número de horas que cobraron a los clientes por sus servicios la semana anterior. • Si se seleccionan al azar dos socios, ¿cuántas muestras diferentes son posibles? Socio Horas TITO 22 TONI 26 REY 30 TIFFANY 26 LISBETH 22 8-8
  • 76. EJEMPLO 1 continuación • Ésta es la combinación de 5 objectos tomados de 2 en 2. Es decir, 5 2 5 2 3 10c = =( !) /[( !)( !)] Socios Total Media 1,2 48 24 1,3 52 26 1,4 48 24 1,5 44 22 2,3 56 28 2,4 52 26 2,5 48 24 3,4 56 28 3,5 52 26 4,5 48 24 8-9
  • 77. EJEMPLO 1 continuación • Organice las medias muestrales en una distribución de muestreo. Media muestral Frecuencia Frecuencia relativa 22 1 1/10 24 4 4/10 26 3 3/10 28 2 2/10 8-10
  • 78. EJEMPLO 1 continuación • Calcule la media de las medias muestrales y compárela con la media poblacional: – media de las medias muestrales = [(22)(1) + (24)(4) + (26)(3) + (28)(2)]/10=25.2 – media poblacional = (22+26+30+26+22)/5 = 25.2 – observe que la media de las medias muestrales es igual a la media poblacional. 8-11
  • 79. Teorema del límite central • Para una población con media µ y variancia σ2 , la distribución de muestreo de las medias de todas las muestras posibles de tamaño n obtenidas de una población tendrá una distribución normal aproximada — con la media de la distribución de muestreo igual a µ y la variancia igual a σ2 /n — si se supone que el tamaño de la muestra es suficientemente grande. 8-12
  • 80. Estimaciones puntuales • Una estimación puntual es un valor (punto) que se usa para estimar un parámetro de la población. • Ejemplos de estimaciones puntuales son media muestral, desviación estándar muestral, variancia muestral, relación proporcional de la muestra, ... • EJEMPLO 2: se registra el número de defectos producidos durante 5 horas seleccionadas al azar en una semana de 40 horas. Los defectos observados fueron 12, 4, 7, 14 y 10. La media muestral es 9.4. Entonces la estimación puntual para el promedio de defectos por hora es 9.4. 8-13
  • 81. Estimaciones de intervalo • Una estimación de intervalo establece la amplitud en la que quizá se encuentre un parámetro poblacional. • El intervalo dentro del cual se espera que esté un parámetro poblacional se llama intervalo de confianza. • Los dos intervalos de confianza que más se usan son 95% y 99%. 8-14
  • 82. Estimaciones de intervalo (continuación) • Un intervalo de confianza de 95% significa que cerca de 95% de los intervalos similares contendrán el parámetro que se quiere estimar, o 95% de las medias muestrales para un tamaño de muestra dado estarán dentro de 1.96 desviaciones estándar de la media poblacional hipotética. • Para el intervalo de confianza de 99%, un 99% de las medias muestrales para un tamaño de muestra dado estará dentro de 2.58 desviaciones estándar de la media poblacional hipotética. 8-15
  • 83. Error estándar de la media muestral • El error estándar de las medias muestrales es la desviación estándar de la distribución de muestreo de las medias muestrales. • Se calcula mediante ∀ σx es el símbolo del error estándar de las medias muestrales. ∀ σ es la desviación estándar de la población. • n es el tamaño de la muestra. σ σ x n = 8-16
  • 84. Error estándar de la media muestral • Si σ no se conoce y n ≥ 30, la desviación estándar de la muestra, denotada por s, se usa para aproximar la desviación estándar poblacional. La fórmula para el error estándar se convierte en: s s nx = 8-17
  • 85. Intervalos de confianza de 95% y 99% para µ • Los intervalos de confianza de 95% y 99% para µ cuando n ≥ 30 se forman como sigue: el IC de 95% para la media poblacional está dado por • el IC de 99% para la media poblacional está dado por X s n ±196. X s n ±2 58. 8-18
  • 86. Construcción general de IC para µ • En general, un intervalo de confianza para la media se calcula mediante: X Z s n ± 8-19
  • 87. EJEMPLO 3 • El director de la escuela de administración desea estimar el número medio de horas por semana que estudian los alumnos. Una muestra de 49 estudiantes dio una media de 24 h con desviación estándar de 4 h. • La estimación puntual es 24 h (media muestral). • ¿Cuál es el intervalo de confianza de 95% para el número promedio de horas por semana que estudian los alumnos? 8-20
  • 88. EJEMPLO 3 continuación • Si se usa un IC de 95% para la media poblacional, se tiene • Los puntos terminales del intervalo de confianza son los límites de confianza. El límite inferior de confianza es 22.88 y el límite superior de confianza es 25.12 12.25a88.22)7/4(96.124 =± 8-21
  • 89. Intervalo de confianza para una relación proporcional de población 8-22 • El intervalo de confianza para una relación proporcional de una población se estima como: • donde es el error estándar de la proporción: σp σp p p n = −( )1 p z p± σ
  • 90. EJEMPLO 4 • Luis Broce, planificador financiero, estudia los planes de retiro para jóvenes ejecutivos. Una muestra de 500 ejecutivos que son dueños de sus casas reveló que 175 planean venderlas y retirarse en Coronado. Desarrolle un intervalo de confianza de 98% para la proporción de ejecutivos que planean vender e irse a Coronado. • Aquí, n = 500, p =175/500=0.35 y z = 2.33 • el IC de 98% es 497.035.0o 500 )65.0)(35.0( 33.235.0 ±± 8-23
  • 91. Factor de corrección de población finita • Se dice que una población con una cota superior fija es finita. • Para una población finita, donde el número total de objetos es N y el tamaño de la muestra es n, se hace el siguiente ajuste a los errores estándar de las medias muestrales y a las proporciones: • Error estándar de las medias muestrales: σ σ x n N n N = − −1 8-24
  • 92. Factor de corrección de población finita 8-25 • Error estándar de las proporciones de las muestras: • Este ajuste se llama factor de corrección de población finita. • Nota: si n/N < 0.05, el factor de corrección de población finita se ignora. 1 )1( =σ N nN n pp p
  • 93. EJEMPLO 5 8-26 • Dada la información del EJEMPLO 4, construya un intervalo de confianza de 95% para el número medio de horas estudiadas por semana si hay sólo 500 estudiantes en la escuela. • Dado que n/N = 49/500 = 0.098>0.05, se tiene que usar el factor de corrección de población finita. 24 196 4 49 500 49 500 1 22 9352 250648± − − =. ( )( ) [ . , . ]
  • 94. Selección del tamaño de muestra • Existen 3 factores que determinan el tamaño de una muestra, ninguno de ellos tiene una relación directa con el tamaño de la población. Los factores son: • El grado de confianza elegido. – El error máximo permitido. – La variación en la población. 8-27
  • 95. Variación en la población • Tamaño de la muestra para la media: una fórmula computacional conveniente para determinar n es: • donde: E es el error permitido, Z es el valor normal estándar asociado con el grado de confianza seleccionado y S es la desviación estándar estimada del estudio piloto. n Z S E = •      2 8-28
  • 96. EJEMPLO 6 • Un grupo de consumidores desea estimar la media mensual en los recibos de luz para una casa unifamiliar. Según estudios similares la desviación estándar se estima en $20.00. Se desea un nivel de confianza de 99%, con una precisión de ±$5.00. ¿Qué tamaño de muestra se requiere? n = = ≈[( . )( ) / ] .2 58 20 5 106 5024 1072 8-29
  • 97. Tamaño de la muestra para proporciones 8-30 • La fórmula para determinar el tamaño de la muestra en el caso de una proporción es: • donde p es la proporción estimada, basada en la experiencia o en un estudio piloto; z es el valor asociado con el nivel de confianza deseado; E es el error máximo que tolerará el investigador. n p p Z E = −      ( )1 2
  • 98. EJEMPLO 7 • El club canino de Panamá desea estimar la proporción de niños que tienen un perro como mascota. Si el club quiere la estimación dentro de 3% de la relación proporcional, ¿cuántos niños deberán contactar? Suponga 95% de nivel de confianza y que el club estimó que 30% de los niños tienen un perro como mascota. 8973.896)03.0/96.1)(70.0)(30.0( 2 ≈==n 8-31
  • 100. Hipótesis.Hipótesis. Puede definirse como: Una Frase o una Proposición que es una afirmación de que algo es verdadero. En estadística se distinguen dos tipos de Hipótesis: Hipótesis Nula, Ho: Es la hipótesis que se prueba (se rechaza o no se rechaza la afirmación). Esta es el punto inicial de la investigación. Hipótesis Alternativa, Ha: Es la afirmación que representa el interés del investigador, y está relacionada con el mismo parámetro de la población de la Hipótesis Nula. A veces la hipótesis alternativa se denomina hipótesis de investigación. La hipótesis nula y alternativa son opuestas la una a la otra.
  • 101. Ejemplo.Ejemplo. Supóngase que realizará un fiesta, y se quiere demostrar el éxito de la misma. Usted, podría pensar o estar casi seguro de una alta probabilidad de que ésta sea un éxito. Entonces la hipótesis opuesta (Nula) a la de su interés en probar, es: Ho: “La fiesta será un fracaso”, mientras que su hipótesis alternativa (de investigación) es que: Ha: “La fiesta será un éxito”.
  • 102. Hipótesis Estadística. • Como las hipótesis, se relacionan con un parámetro poblacional, media, proporción o varianzas, entonces una forma de expresar la hipótesis estadísticamente es por ejemplo: – Ho: µ = µ o. – Ha: µ ≠ µ o. • Expresado literalmente es: – Ho: La media es igual a un valor µ o. – Ha: La media es distinta de un valor µ o. • Obsérvese que µ o es un valor específico de interés o de comparación para determinar el “rechazo” o” no rechazo” de Ho.
  • 103. Error Tipo I y Tipo II. Una forma de ver este concepto, es a través del siguiente cuadro. Decisión Hipótesis nula Verdadera Falsa No rechazar Ho Rechazar Ho Decisión correcta tipo A Error tipo I Error de tipo II Decisión correcta de tipo B. Las pruebas de hipótesis consideran datos muestrales para la obtención de estimaciones de los parámetros poblaciones. Por lo tanto, hay un riesgo asociado con la decisión que se tome.
  • 104. Error Tipo I y Tipo II. El riesgo, es una probabilidad, veamos Cuando se toma una decisión, sería agradable escoger siempre la opción correcta. Sin embargo, esto no es posible en estadística, ya que la decisión se toma con base en la información muestral. Lo mejor que puede esperarse es controlar la probabilidad con que ocurre un error. La probabilidad asignada al error tipo I se denomina α “alfa”. La probabilidad del error tipo II se denomina β “beta” (alfa y beta, son las dos primeras letras del alfabeto griego). Error en la decisión Tipo Probabilidad Decisión correcta Tipo Probabilidad Se rechaza una Ho verdadera I α No se rechaza una Ho verdadera A 1-α No se rechaza una Ho falsa II β Se rechaza una Ho falsa B 1-β
  • 105. Nivel de significancia (Nivel de significancia (αα).). Es la probabilidad de cometer el error tipo I. Establecer el nivel de significancia puede interpretarse como una “decisión gerencial”. Por lo general, alguien a cargo determina el nivel de probabilidad con que desea arriesgar un error tipo I.
  • 106. Estadística de prueba.Estadística de prueba. Es la variable aleatoria cuyo valor se calcula a partir de los datos muestrales y que se utiliza para tomar la decisión de “no rechazar Ho” o “rechazar Ho” El valor de la estadística de prueba es calculado, según la distribución del parámetro a probar “z” o “t” calculado y se utiliza junto con una regla de decisión para determinar si “se rechaza Ho” o “no se rechaza Ho”.
  • 107. Regla de decisión.Regla de decisión. La regla de decisión debe ser establecida antes de recolectar los datos y después de planteado las hipótesis. Además especifica cómo se llegará a una decisión. En la regla de decisión se compara, generalmente un valor calculado con el estadístico de prueba, con un valor crítico (o coeficiente de una distribución “z” o “t”, obtenido con la probabilidad de cometer el error tipo I o nivel de significación).
  • 108. Regla de decisión.Regla de decisión. Generalmente, se distinguen dos situaciones: a. Pruebas de hipótesis de dos colas, (dos valores críticos) para la toma de decisiones. b. Pruebas de hipótesis de una cola, (un solo valor crítico) para la toma de decisiones.
  • 109. Regla de decisión. Pruebas deRegla de decisión. Pruebas de hipótesis de dos colas.hipótesis de dos colas. Específicamente, se utiliza cuando la hipótesis del investigador, considera la relación “diferente” ó “≠ ”. Recordemos que la distribución del parámetro media o proporción, siguen distribuciones en forma de campana simétricas. c representa el valor crítico del estadístico de prueba y se obtiene a partir del nivel de significancia α, establecido. Tiene dos regiones de rechazo de Ho, (cola 1 y cola 2). -c c Cola 1. Cola 2. Caso donde las Hipótesis son: Ho: µ = µ o. Ha: µ ≠ µ o.
  • 110. Regla de decisión. Pruebas deRegla de decisión. Pruebas de hipótesis de una cola.hipótesis de una cola. Específicamente, se utiliza cuando la hipótesis del investigador, considera la relación “menor que”. -c Cola 1. Caso donde las Hipótesis son: Ho: µ = µ o. Ha: µ < µ o. El valor crítico, es uno solo y la región de rechazo de Ho, se ubica del lado izquierdo de la curva (cola 1).
  • 111. Regla de decisión. Pruebas deRegla de decisión. Pruebas de hipótesis de una cola.hipótesis de una cola. Recordemos, que el valor crítico depende del estadístico de prueba a utilizar y del nivel de significancia. Estos valores se encuentran en las tablas de distribuciones de probabilidad t-student, Z-Normal estándar, según sea el caso. c Cola 2. Caso donde las Hipótesis son: Ho: µ = µ o. Ha: µ > µ o. Relación “mayor que”
  • 112. Procedimiento de cinco pasos. PruebaProcedimiento de cinco pasos. Prueba de Hipótesis clásica.de Hipótesis clásica. Procedimiento de cinco pasos. PruebaProcedimiento de cinco pasos. Prueba de Hipótesis clásica.de Hipótesis clásica. 1. Describir el parámetro de la población de interés. 2. Establecer la hipótesis nula (Ho) y alternativa Ha). 3. Especificar los criterios de prueba. a. Comprobar los supuestos. b. Identificar la estadística de prueba a utilizar. c. Determinar el nivel de significancia, α. d. Determinar la(s) región (regiones) crítica(s) y el (los) valores crítico(s). 4. Recolectar y presentar los hechos muestrales. a. Recolectar la información muestral. b. Calcular el valor de la estadística de prueba. 5. Determinar los resultados a. Determinar si el valor de la estadística de prueba está o no en la región crítica. b. Tomar una decisión sobre Ho. c. Escribir una conclusión sobre Ha.
  • 113. Pruebas de Hipótesis. UnaPruebas de Hipótesis. Una población.población. 1. Pruebas de Hipótesis de la media µ (σ conocida): Enfoque clásico. Supuesto para pruebas de hipótesis sobre la media µ usando una σ conocida: la distribución muestral de la media muestral, está contenida en la distribución muestral de medias muestrales y en el Teorema de Límite Central. (Visto anteriormente en clases).
  • 114. Un grupo de abogados, que protegen los intereses de los consumidores, desea refutar la afirmación que hace un fabricante de gasolina sobre un modelo de automóvil que promedia 24 millas por galón de gasolina. Específicamente, el grupo quiere demostrar que las millas medias por galón son considerablemente menores que las 24 millas que dice el fabricante. Establecer la hipótesis nula y la alternativa. Veamos esta prueba de hipótesis con una ilustración: Ejemplo
  • 115. SoluciónSolución Datos: • El parámetro de población en cuestión es: “el número medio de millas recorridas logrado por este modelo de automóvil” • 24 millas por galón, es el valor específico de interés o de comparación del parámetro, es decir, µo . • La relación propuesta por los abogados es, “el número medio de millas recorridas logrado por este modelo de automóvil” es menor que 24 millas por galón, es decir: µ < 24.
  • 116. Solución (continuación)Solución (continuación) Datos (continuación): • La afirmación opuesta a lo propuesto por los abogados, es: “el número medio de millas recorridas logrado por este modelo de automóvil no es menor que 24 millas por galón”, es decir, µ ≥ (mayor o igual que) 24. • Recuerde que la hipótesis nula contiene el signo “igual”.
  • 117. Solución (conclusión)Solución (conclusión) Datos (continuación): • Las Hipótesis, planteadas son: •Ho: El número medio de millas recorridas logrado por este modelo de automólvil es mayor o igual que 24. •Ha: El número medio de millas recorridas logrado por este modelo de automólvil es menor que 24. • Estadísticamente, •Ho: µ ≥ 24 ó ( µ = 24) y Ha: µ < 24
  • 118. Estadístico de Prueba deEstadístico de Prueba de Hipótesis de la mediaHipótesis de la media µµ, con, con σσ conocidaconocida El estadístico de prueba en este caso, se define como, “zeta estrella” ó z* n x z / * σ µ− = Bajo el supuesto de que los las medias muestrales siguen una distribución normal y cumpliendo con el Teorema de Límite Central, además considerando la varianza poblacional ( σ ) conocida.
  • 119. Nivel de significaciónNivel de significación (alfa)(alfa) El nivel de significancia, α, generalmente se establece de acuerdo al rigor en la decisión deseado del investigador, en 0.05 ó 0.01. (probabilidad de cometer el error tipo I). Y se busca en las tablas de distribución t ó Z, según sea el caso, tal como se hizo al elaborar intervalos de confianza.
  • 120. Ejemplo:Ejemplo: Se afirma que el peso medio de las estudiantes de una universidad es de 54.4 kg. El profesor Hart no cree en esta afirmación y trata de demostrar lo contrario. Para probar la afirmación, recolecta una muestra aleatoria de 100 pesos entre las alumnas universitarias. Obtiene una media de la muestra de 53.75 kg. ¿este hecho es suficiente para que el profesor Hart rechace la afirmación?. Use α =0.05 y σ=5.4kg. Datos: n= 100, µo= 54.4 kg., α =0.05 y σ=5.4kg.
  • 121. Ejemplo: Solución.Ejemplo: Solución. Datos: n= 100, µo= 54.4 kg., α =0.05 y σ=5.4kg. Paso 1. El parámetro de interés: µ, el peso medio de todas las estudiantes de una universidad. El parámetro de interés: µ, el peso medio de todas las estudiantes de una universidad. Paso 2. La hipótesis nula y alternativa son: Ho: El peso medio de las estudiantes de una universidad es igual a 54.4 kg. Ha. El peso medio de las estudiantes de una universidad no es igual a 54.4 kg. La hipótesis nula y alternativa son: Ho: El peso medio de las estudiantes de una universidad es igual a 54.4 kg. Ha. El peso medio de las estudiantes de una universidad no es igual a 54.4 kg.
  • 122. Ejemplo: Solución.Ejemplo: Solución. Paso 2. Estadísticamente, las hipótesis son expresadas como: Ho. µ = 54.4 kg. Ha. µ ≠ 54.4 kg. Estadísticamente, las hipótesis son expresadas como: Ho. µ = 54.4 kg. Ha. µ ≠ 54.4 kg. Paso 3. Los criterios de prueba son: a. Los pesos de un grupo de estudiantes siguen una distribución aproximadamente norma, debido a que la muestra es suficientemente grande (n=100). b. La estadística de prueba, por tanto, a utilizar es z* Los criterios de prueba son: a. Los pesos de un grupo de estudiantes siguen una distribución aproximadamente norma, debido a que la muestra es suficientemente grande (n=100). b. La estadística de prueba, por tanto, a utilizar es z*
  • 123. Ejemplo: Solución.Ejemplo: Solución. Paso 3. Los criterios de prueba son: c. El nivel de significancia planteado es: α = 0.05 (dado en el problema). d. Las regiones críticas (valores críticos), se determinan, con el nivel de significancia entre dos, ya que se trata de una prueba de hipótesis de dos colas, entonces el nivel de significancia es 0.025. Los criterios de prueba son: c. El nivel de significancia planteado es: α = 0.05 (dado en el problema). d. Las regiones críticas (valores críticos), se determinan, con el nivel de significancia entre dos, ya que se trata de una prueba de hipótesis de dos colas, entonces el nivel de significancia es 0.025. -c c α/2=0.025 α/2=0.025
  • 124. Ejemplo: Solución.Ejemplo: Solución. Paso 3. Luego, buscando en la tabla Normal estándar, el valor crítico, para α/2 = 0.025 y para (1- α/2)= 0.975, ó simplemente para (1- α/2)= 0.975, ya que la distribución normal es simétrica. Entonces, el valor de z, para 0.975, es 1.96. Reempalzando en –c y c. La región de decisión, se determina como: -1.96 y 1.96. Si el estadístico z*, se encuentra entre –1.96 y 1.96 no se rechaza Ho. Luego, buscando en la tabla Normal estándar, el valor crítico, para α/2 = 0.025 y para (1- α/2)= 0.975, ó simplemente para (1- α/2)= 0.975, ya que la distribución normal es simétrica. Entonces, el valor de z, para 0.975, es 1.96. Reempalzando en –c y c. La región de decisión, se determina como: -1.96 y 1.96. Si el estadístico z*, se encuentra entre –1.96 y 1.96 no se rechaza Ho. -1.96 1.96 α/2=0.025 (α/2)=0.025 Región de no rechazo de Ho.
  • 125. Ejemplo: Solución.Ejemplo: Solución. Paso 4. a. La información muestral es: media muestral “equis barra” es 53.75 y n=100. b. El cálculo del estadístico de prueba, al aplicar la fórmula es: a. La información muestral es: media muestral “equis barra” es 53.75 y n=100. b. El cálculo del estadístico de prueba, al aplicar la fórmula es: -1.96 1.96 α/2=0.025 (α/2)=0.025 Región de no rechazo de Ho. 20.1 100/4.5 4.5475.53 / * −= − = − = n x z σ µ
  • 126. Ejemplo: Solución.Ejemplo: Solución. Paso 5. a. Decisión: Como z*=-1.20, se encuentra en la región de no rechazo de Ho. b. En conclusión, No hay suficientes hechos al nivel de significancia 0.05 que demuestren que las estudiantes tienen un peso medio diferente de los 54.4 kg indicados. En otras palabras, no hay hechos estadísticos que sustenten los argumentos del profesor Hart. a. Decisión: Como z*=-1.20, se encuentra en la región de no rechazo de Ho. b. En conclusión, No hay suficientes hechos al nivel de significancia 0.05 que demuestren que las estudiantes tienen un peso medio diferente de los 54.4 kg indicados. En otras palabras, no hay hechos estadísticos que sustenten los argumentos del profesor Hart. -1.96 1.96 α/2=0.025 (α/2)=0.025 Región de no rechazo de Ho.
  • 127. Pruebas de Hipótesis de laPruebas de Hipótesis de la mediamedia µµ ((σσ desconocida):desconocida): El estadístico de prueba, a utilizar es: ns x t x n / 1 µ− =− Cuando la varianza poblacional no es conocida, se utiliza el estadístico t-student. Recordemos, que usualmente, la varianza poblacional es desconocida y que se utiliza la varianza estimada S. El estadístico t, sigue una distribución t-student con n-1 grados de libertad.
  • 128. 3. Pruebas de Hipótesis para3. Pruebas de Hipótesis para proporciones.proporciones. El estadístico de prueba, para el caso de proporciones en una sola muestra, es: n pp pp Z o )1( − − = p, es el número de éxitos en la muestra entre el tamaño de la muestra: x/n. po, es el valor específico de interés o de comparación.
  • 129. Análisis de Correlación y Regresión Lineal
  • 130. Suposiciones fundamentales de regresión lineal • Para cada valor de X, existe un grupo de valores de Y que tienen una distribución normal. • Las medias de estas distribuciones normales de valores de Y deben estar sobre la recta de regresión. • Las desviaciones estándar de estas distribuciones normales son iguales. • Los valores de Y son estadísticamente independientes. Es decir, que en la selección de una muestra, los valores elegidos de Y para un valor particular de X no depende de los valores de Y para otro valor de X.
  • 131. Método estadístico de regresión lineal simple • Se determina el valor de la recta y = a + bx, calculada mediante la fórmula de los mínimos cuadrados obteniendo la línea que mejor se ajuste al nube de puntos que representa dos variables: una dependiente y una independiente • Pasos: 1) Elaborar diagrama de dispersión. 2) Calcular coeficientes de correlación. 3) Realizar el Análisis de regresión. 4) Verificar la línea de tendencia. 0 1 2 3 4 5 6 7 8 9 0 2 4 6 8 10 12
  • 132. Generalidades del Análisis de correlación • Análisis de correlación: se usa un grupo de técnicas estadísticas para medir la fuerza de la relación (correlación) entre dos variables. • Diagrama de dispersión: gráfica que describe la relación entre las dos variables de interés. • Variable dependiente: la variable que se pronostica o estima. • Variable independiente: la variable que proporciona la base para la estimación. Es la variable predictora.
  • 133. Coeficiente de correlación, r • El coeficiente de correlación (r) es una medida de la intensidad de la relación entre dos variables o más • Requiere datos con escala de intervalo o de razón (variables). • Puede tomar valores entre -1.00 y 1.00. (-100% y 100%) • Valores de -1.00 o 1.00 indican correlación fuerte y perfecta. • Valores cercanos a 0 indican correlación débil. • Valores negativos indican una relación inversa y valores positivos indican una relación directa. Interpretación • Este coeficiente de correlación nos indica la medida en que están relacionados las variables. Si es muy cercano a 100% la relación es lineal, fuerte y directa. • Es decir que a medida que aumenta una también aumenta la otra • Si es cercana a 0, no significa ausencia de relación, sino que podría existir otro tipo de relación distinta a la lineal ( parabólica, exponencial, logarítmica)
  • 134. Correlación negativa perfecta 0 1 2 3 4 5 6 7 8 9 10 10 9 8 7 6 5 4 3 2 1 0 X Y
  • 135. Correlación positiva perfecta 0 1 2 3 4 5 6 7 8 9 10 10 9 8 7 6 5 4 3 2 1 0 X Y
  • 136. Correlación cero 0 1 2 3 4 5 6 7 8 9 10 10 9 8 7 6 5 4 3 2 1 0 X Y
  • 137. Correlación positiva fuerte 0 1 2 3 4 5 6 7 8 9 10 10 9 8 7 6 5 4 3 2 1 0 X Y
  • 138. Fórmula para r (Coeficiente de Correlación) [ ] ( ) ( )[ ]2222 )()( ))(()( = YYnXXn YXXYn r Σ−ΣΣ−Σ ΣΣ−Σ -1 -0.75 - 0.5 0 0.5 0.75 1 Perfecta Fuerte Moderada Nula Moderada Fuerte Perfecta inversa directa
  • 139. Coeficiente de determinación R = r2 • El coeficiente de determinación, r2 es la proporción de la variación total en la variable dependiente Y que está explicada por, o se debe a la variación en la variable independiente X. • El coeficiente de determinación es el cuadrado del coeficiente de correlación, y toma valores de 0 a 1. (0% a 100%) • Mientras más alto más explicativa es la variable independiente.
  • 140. Ejemplo. Realizar el análisis de correlación Puntos (X) Salario Actual Y 183 300.00 263 328.00 276 400.00 313 400.50 356 410.00 404 410.00 417 430.00 546 490.00 547 520.00 3,305 3,688.50 Dibujar el diagrama de dispersión Diagrama de Dispersión 0 100 200 300 400 500 600 0 100 200 300 400 500 600 Puntos SalarioActual El diagrama de dispersión nos indica que existe una relación lineal directa y fuerte entre los puntajes y los salarios.
  • 141. Ejemplo. Realizar el análisis de correlación Puntos (X) Salario Actual Y X2 Y2 XY 183 300.00 33,489.0 90,000.0 54,900.0 263 328.00 69,169.0 107,584.0 86,264.0 276 400.00 76,176.0 160,000.0 110,400.0 313 400.50 97,969.0 160,400.3 125,356.5 356 410.00 126,736.0 168,100.0 145,960.0 404 410.00 163,216.0 168,100.0 165,640.0 417 430.00 173,889.0 184,900.0 179,310.0 546 490.00 298,116.0 240,100.0 267,540.0 547 520.00 299,209.0 270,400.0 284,440.0 3305 3,688.50 1,337,969.00 1,549,584.25 1,419,810.5 [ ] ( ) ( )[ ]2222 )()( ))(()( = YYnXXn YXXYn r Σ−ΣΣ−Σ ΣΣ−Σ 9 (1,419,810.5) – (3,305)(3,688.5) 9 (1,337,969) - (3,305)2 9 (1,549,584.25) - (3,688.5)2 r = = 0.95 Tabla 2.
  • 142. El Análisis de regresión • Propósito: determinar la ecuación de regresión; se usa para predecir el valor de la variable dependiente (Y) basado en la variable independiente (X). • Procedimiento: seleccionar una muestra de la población y enumerar los datos por pares para cada observación; dibujar un diagrama de dispersión para visualizar la relación; determinar la ecuación de regresión.
  • 143. Análisis de regresión • La ecuación de regresión: Yi’= a + b Xi donde: • Yi’ es el valor promedio pronosticado de Y para cualquier valor de Xi. • a es la intercepción en Y, o el valor estimado de Y cuando X = 0 • b es la pendiente de la recta, o cambio promedio en Y’ por cada cambio de una unidad en X. (cambio promedio en salario por cada unidad de cambio en puntos) • Se usa el principio de mínimos cuadrados para obtener los parámetros a y b: b n XY X Y n X X a Y n b X n = − − = − ( ) ( )( ) ( ) ( ) Σ Σ Σ Σ Σ Σ Σ 2 2
  • 144. Continuación del EJEMPLO b n XY X Y n X X a Y n b X n = − − = − ( ) ( )( ) ( ) ( ) Σ Σ Σ Σ Σ Σ Σ 2 2 9 (1,419,810.5) – (3,305)(3,688.5) 587,802 9 (1,337,969) - (3,305)2 1,118,696 .b = = = 0.5254 (3,688.5) - 0.5254 (3,305) 9 9 a.= Utilizando las fórmulas para los parámetros y reemplazando los valores obtenidos en la tabla 2. Calculamos: = 216.89 La ecuación de regresión: Yi’= a + b Xi Salario = 216.89 + 0.52 Puntos Sirve de base referencial para estimar el salario en función del puntaje del puesto de trabajo para este grupo en específico.
  • 145. Error estándar de la estimación • El error estándar de la estimación mide la dispersión de los valores observados alrededor de la recta de regresión. • Fórmulas usadas para calcular el error estándar: S Y Y n Y a Y b XY n Y X⋅ = − − = − − − Σ Σ Σ Σ ( ') ( ) ( ) 2 2 2 2
  • 146. Taller Aplicación de herramientas para el análisis de Excel para el análisis de regresión y correlación lineal.