Publicité
Publicité

Contenu connexe

Publicité

ESTADISTICA PROBLEMAS

  1. Un intervalo de confianza para una proporción de población Dr. José Luis Pérez Ramírez DOCENTE: ESTADÍSTICA EMPRESARIAL UNIVERSIDAD NACIONAL JOSÉ FAUSTINO SÁNCHEZ CARRIÓN UNIVERSIDAD NACIONAL JOSÉ FAUSTINO SÁNCHEZ CARRIÓN FACULTAD DE INGENIERIA INDUSTRIAL,SISTEMAS E INFORMATICA FACULTAD DE INGENIERIA INDUSTRIAL,SISTEMAS E INFORMATICA ESCUELA PROFESIONAL DE INGENIERÍA INDUSTRIAL ESCUELA PROFESIONAL DE INGENIERÍA INDUSTRIAL
  2. Cuanto mayor sea la muestra, menor será el intervalo estimado, pero a medida que aumenta el nivel de confianza o el porcentaje, el intervalo estimado se vuelve más amplio. Si desea conocer exactamente la media poblacional de una variable, debe considerar toda la población, pero esto no siempre es posible porque es costoso obtener datos para toda la población cuando la población es muy grande. INTRODUCCIÓN INTRODUCCIÓN
  3. Los intervalos de confianza se pueden usar para estimar varios parámetros de la población a partir de una muestra aleatoria de la población y determinar la incertidumbre asociada con esa estimación. Por ejemplo, podríamos querer saber qué porcentaje de la población peruana apoya una determinada ley. Para este tipo de problema, necesitamos encontrar un intervalo de confianza. ESTIMACIÓN POR ESTIMACIÓN POR INTERVALO DE CONFIANZA INTERVALO DE CONFIANZA PARA LA PROPORCIÓN PARA LA PROPORCIÓN POBLACIONAL POBLACIONAL
  4. Para determinar la fórmula del margen de error, se debe considerar la distribución muestral de p ̂. Necesitamos saber la media, la desviación estándar y la distribución particular que estamos usando. La distribución de muestreo p ̂ es una distribución binomial con probabilidad de éxito p y n intentos. La media p y la desviación estándar ( p (1 - p )/n ) de este tipo de variable aleatoria es 0,5. LA PROPORCIÓN DE LA LA PROPORCIÓN DE LA POBLACIONAL POBLACIONAL
  5. El intervalo de confianza para la proporción poblacional se puede calcular mediante la siguiente fórmula: Intervalo de confianza = Estimación puntual ± Z* (Error estándar) El error estándar se calcula como la desviación estándar muestral dividida por la raíz cuadrada del tamaño muestral. Es decir, FÓRMULA DEL INTERVALO DE FÓRMULA DEL INTERVALO DE CONFIANZA DE LA PROPORCIÓN DE LA CONFIANZA DE LA PROPORCIÓN DE LA POBLACIONAL POBLACIONAL
  6. FÓRMULA DEL INTERVALO DE FÓRMULA DEL INTERVALO DE CONFIANZA DE LA PROPORCIÓN DE CONFIANZA DE LA PROPORCIÓN DE LA POBLACIONAL LA POBLACIONAL Por lo tanto, el intervalo de confianza para la proporción poblacional se puede expresar como:
  7. Tenemos una muestra aleatoria simple de tamaño n de una población grande Nuestras personas son seleccionadas independientemente unas de otras. Al menos 15 éxitos y 15 fracasos en nuestra muestra. Antes de realizar una prueba o un procedimiento estadístico, es importante asegurarse de que se cumplen todas las condiciones. Para determinar un intervalo de confianza para una proporción poblacional, debemos asegurarnos de que se cumplan las siguientes condiciones: CONDICIONES PARA USAR EL CONDICIONES PARA USAR EL INTERVALO DE CONFIANZA DE LA INTERVALO DE CONFIANZA DE LA PROPORCIÓN DE LA POBLACIONAL PROPORCIÓN DE LA POBLACIONAL
  8. TABLA DEL NIVEL DE CONFIANZA TABLA DEL NIVEL DE CONFIANZA
  9. Use la siguiente información para responder los dos próximos ejercicios: Compañías de mercadeo están interesadas en conocer el porcentaje de población femenina que toma la mayoría de las decisiones de compra en el hogar.
  10. 01. Al diseñar un estudio para determinar esta proporción de población, ¿cuál es el número mínimo que necesitaría encuestar para tener el 90 % de confianza en que la proporción de población se estima con un margen del 0,05? Para calcular el número mínimo de encuestas que se necesitan para un estudio con un 90 % de confianza y un margen de 0,05, se debe usar el cálculo de muestreo estadístico. Este cálculo requiere que se conozca el tamaño de la población objetivo, el porcentaje de respuesta esperado y la confianza deseada. Se estima que el número mínimo de encuestas necesarias sería de aproximadamente 492. Sin embargo, para obtener un resultado más preciso, se recomienda aumentar el número de encuestas para reducir el margen de error.
  11. 02. Si más adelante se determinara que es importante tener más de un 90 % de confianza y se encargara una nueva encuesta, ¿cómo afectaría al número mínimo que hay que encuestar? ¿Por qué?
  12. Use la siguiente información para responder los próximos cinco ejercicios:
  13. 03. Identifique lo siguiente: a. 𝑥̅=_______ b. n =_______ c. p´ =_______ a) El valor de 𝑥̅= 120 b) n es el tamaño de la muestra, que en este caso es 200. c) p es la proporción de la muestra en la que el resultado se observa, que en este caso es 0.6.
  14. 04. Defina las variables aleatorias X y P′ con palabras. X es el número de “aciertos” en los que la mujer toma la mayoría de las decisiones de compra del hogar. P′ es el porcentaje de hogares de la muestra en los que la mujer toma la mayoría de las decisiones de compra del hogar.
  15. 05. ¿Qué distribución debería utilizar para este problema? Para este problema, se debe utilizar una distribución binomial. Esta distribución se usa para calcular la probabilidad de un número específico de éxitos (en este caso, las mujeres toman la mayoría de las decisiones de compra) en un número específico de intentos (en este caso, los 200 hogares). La distribución binomial puede calcular la probabilidad de que una determinada cantidad de hogares tengan una mujer tomando la mayoría de las decisiones de compra.
  16. 06. Construya un intervalo de confianza del 95 % para la proporción de hogares en los que las mujeres toman la mayoría de las decisiones de compra. Indique el intervalo de confianza, dibuje el gráfico y calcule el límite de error. CI: (0,5321, 0,6679) EBM: 0,0679
  17. Primero, los destinatarios pueden optar por no responder la encuesta, lo que puede provocar un sesgo en los resultados. Segundo, el correo electrónico puede ser enviado a direcciones de correo electrónico incorrectas o no existentes, lo que también afectaría los resultados. La falta de control sobre el orden en el que los participantes responden a la encuesta. Debido a que los correos electrónicos se envían de forma asíncrona, no hay ninguna forma de controlar el orden en el que llegan las respuestas. Esto puede afectar la fiabilidad de los resultados. El tiempo de respuesta puede ser impredecible. Debido a que los correos electrónicos se envían de manera asíncrona, los participantes pueden tardar más o menos tiempo en responder a la encuesta. Esto significa que los resultados pueden ser sesgados si algunos participantes demoran más tiempo en responder. Al realizar una encuesta por correo electrónico, hay cuatro principales dificultades para obtener resultados aleatorios : 07. Enumere dos dificultades que podría tener la compañía para obtener resultados aleatorios, si esta encuesta se realizara por correo electrónico.
  18. Use la siguiente información para responder los próximos cinco ejercicios: De 1.050 adultos seleccionados al azar, 360 se identificaron como trabajadores manuales, 280 se identificaron como asalariados no manuales, 250 se identificaron como gerentes de nivel medio y 160 se identificaron como ejecutivos. En la encuesta, el 82 % de los trabajadores manuales prefieren camiones, así como el 62 % de los asalariados no manuales, el 54 % de los gerentes de nivel medio y el 26 % de los ejecutivos.
  19. 08. Nos interesa hallar el intervalo de confianza del 95 % para el porcentaje de ejecutivos que prefieren camiones. Defina las variables aleatorias X y P′ en palabras. La variable aleatoria X representa el número de ejecutivos que prefieren camiones en una muestra de tamaño n. La variable aleatoria P' representa el porcentaje de ejecutivos que prefieren camiones en la población total que es un valor desconocido. El intervalo de confianza del 95 % para el porcentaje de ejecutivos que prefieren camiones se puede encontrar usando la siguiente fórmula: P' ± z1/2 * √(P' * (1- P') / n), donde z1/2 es el punto crítico de la variable aleatoria Normal estandarizada y n es el tamaño de la muestra
  20. 09. ¿Qué distribución debería utilizar para este problema? Para este problema, se recomienda usar una distribución de frecuencias relativas, que muestra el porcentaje de personas que prefieren camiones para cada grupo de trabajadores. Esto ayudará a mostrar la distribución de preferencias entre los diferentes grupos de trabajadores. Esta distribución se muestra a continuación:
  21. 10. Construya un intervalo de confianza del 95 %. Indique el intervalo de confianza, dibuje el gráfico y calcule el límite de error EBM: 0,0679
  22. 11. Supongamos que queremos reducir el error de muestreo. ¿Cuál es una forma de lograrlo? Una forma de reducir el error de muestreo en esta encuesta es aumentar el tamaño de la muestra. Cuanto mayor sea la muestra, menor será el error de muestreo. También se pueden aplicar otros métodos para reducir el error de muestreo, como el muestreo estratificado. Esto implica dividir la población en grupos o estratos homogéneos, y luego seleccionar la misma cantidad de personas de cada estrato. De esta manera, se reduce la variación entre los grupos y se mejora la precisión de los resultados.
  23. 12. El error de muestreo indicado en la encuesta es de ±2 %. Explique qué significa el ±2 %.
  24. Use la siguiente información para responder los próximos cinco ejercicios:
  25. 13. Defina la variable aleatoria X con palabras..
  26. 14. Defina la variable aleatoria P′ en palabras.
  27. 15. ¿Qué distribución debería utilizar para este problema? Para este problema, se debería utilizar una distribución binomial, ya que se está preguntando acerca de la proporción de población de los votantes que consideran que la economía es lo más importante. La distribución binomial se utiliza para calcular la probabilidad de obtener un resultado específico al realizar una prueba con dos resultados posibles (en este caso, los votantes consideran que la economía es lo más importante o no). La distribución binomial se caracteriza por dos parámetros: el número de ensayos (en este caso, el número de votantes) y la probabilidad de éxito (en este caso, la proporción de votantes que consideran que la economía es lo más importante).
  28. 16. Construya un intervalo de confianza del 90 %, e indique el intervalo de confianza y el límite de error. CI: (0,62735, 0,67265) EBM: 0,02265
  29. 17. ¿Qué ocurriría con el intervalo de confianza si el nivel de confianza fuera del 95 %? Si el nivel de confianza es 95% significa que dentro del rango dado se encuentra el valor real de un parámetro con 95% de certeza.
  30. 18. Nos interesa hallar el intervalo de confianza del 95 % para el porcentaje de ejecutivos que prefieren camiones. Defina las variables aleatorias X y P′ en palabras. X es el número de “aciertos” en los que un ejecutivo prefiere una camioneta. P′ es el porcentaje de ejecutivos de la muestra que prefieren una camioneta.
  31. 19. ¿Qué distribución debería utilizar para este problema? Distribución uniforme: Se debería utilizar la distribución uniforme ya que es una familia de funciones de probabilidad donde cada elemento, dentro de cierto intervalo, tiene la misma probabilidad de aparecer.
  32. 20. Construya un intervalo de confianza del 95 %. Indique el intervalo de confianza, dibuje el gráfico y calcule el límite de error. intervalo de confianza con un nivel de 95%
  33. Encuentre el límite del error en la estimación con probabilidad de 95%
  34. 21. Supongamos que queremos reducir el error de muestreo. ¿Cuál es una forma de lograrlo? Una forma de reducir el error de muestreo es aumentar el tamaño de la muestra. Cuanto mayor sea el tamaño de la muestra, menor será el error de muestreo. También puede utilizar un muestreo especializado como el muestreo estratificado o el muestreo por conglomerados para reducir el error de muestreo. Otra forma de reducir el error de muestreo es aumentar la confianza. Esto se puede lograr aumentando el nivel de confianza al tomar la muestra. Por último, también puede aumentar la precisión al reducir la variabilidad de la muestra.
  35. 22. El error de muestreo indicado en la encuesta es de ±2 %. Explique qué significa el ±2 %. Esto significa que hay un 95 % de confianza de que los resultados de la encuesta estén dentro del rango del ±2 %. Esto se conoce como intervalo de confianza, y es una medida de la precisión de la encuesta. Esto significa que, si se realiza una segunda encuesta utilizando los mismos métodos, hay un 95 % de probabilidades de que los resultados estén dentro del rango del ±2 %.
  36. Use la siguiente información para responder los próximos 16 ejercicios: El Ice Park de Lima ofrece docenas de clases de patinaje sobre hielo para principiantes. Todos los nombres de las clases se ponen en una cubeta. Se eligió la clase de patinaje sobre hielo para principiantes de 8 a 12 años a las 5 p. m. del lunes. En esa clase había 64 niñas y 16 niños. Supongamos que estamos interesados en la proporción real de niñas, de 8 a 12 años, en todas las clases de patinaje sobre hielo para principiantes en el Ice Chalet. Supongamos que los niños de la clase seleccionada son una muestra aleatoria de la población.
  37. 26. Construya un intervalo de confianza del 90 %, e indique el intervalo de confianza y el límite de error. El intervalo de confianza del 90% para la proporción de población de los votantes que consideran que la economía es lo más importante es de 0.62 a 0.68, con un límite de error de ±0.05. Esto significa que, con un 90% de confianza, el porcentaje real de población de los votantes que consideran que la economía es lo más importante se encuentra entre el 62% y el 68%.
  38. 28. ¿Qué se cuenta? Se busca el número de niñas entre 8 y 12 años en la clase de iniciación al patinaje sobre hielo de los lunes a las 5 p. m. en el ice Park de Lima.
  39. 29. Defina la variable aleatoria X en palabras. Una variable aleatoria es un valor numérico que corresponde a un resultado de un experimento aleatorio. La variable aleatoria X en este caso sería la proporción de niñas de 8 a 12 años registradas en todas las clases de patinaje sobre hielo para principiantes en el Ice Chalet.
  40. 30. Calcule lo siguiente: a) x = 64 (es el tamaño de muestra de niñas de 8 - 12 años) b) n = 64+16 =80 (Es el total de la muestra de niños y niñas en la clase de patinaje a las 5pm) c) p′ = 64/80 = 0.8 (la muestra proporcional es X/n
  41. 31. Indique la distribución estimada de X. X~________ . La distribución estimada de X es una distribución binomial, ya que estamos tratando con una muestra aleatoria de una población con dos posibles resultados: niña o niño. La media de la distribución binomial se determina con la formula: μ = np, donde n es el tamaño de la muestra (80), y p es la proporción de niñas en la población (64/80 = 0.8). La media de X es entonces 64. La varianza de X se determina con la formula: σ2 = np(1-p), donde n es el tamaño de la muestra (80), y p es la proporción de niñas en la población (64/80 = 0.8). La varianza de X es entonces 25.6. Por lo tanto, la distribución estimada de X es una distribución binomial con media μ = 64 y varianza σ2 = 25.6.
  42. 32. Defina una nueva variable aleatoria P′. ¿Qué estima p′? . La variable aleatoria P' está definida como la proporción de niñas, de 8 a 12 años, en todas las clases de patinaje sobre hielo para principiantes en el Ice Chalet. Esto se puede estimar usando la muestra seleccionada para calcular el estimador de proporción para la variable aleatoria P', que se define como el cociente entre el número de niñas en la muestra y el número total de niños y niñas en la muestra. En este caso, el estimador de proporción para la variable aleatoria P' sería 64/80, lo que equivale a 0,8.
  43. 33. Defina la variable aleatoria P′ en palabras. . La variable aleatoria P' representa la proporción de niñas en todas las clases de patinaje sobre hielo para principiantes en el Ice Park de Lima. Se calcula como el número de niñas entre el total de niños y niñas que asisten a dichas clases.
  44. 34. Indique la distribución estimada de P′. Construya un intervalo de confianza del 92 % para la verdadera proporción de niñas de 8 a 12 años que comienzan las clases de patinaje sobre hielo en el Ice Chalet.
  45. TABLA DEL NIVEL DE CONFIANZA TABLA DEL NIVEL DE CONFIANZA P = 0.8 N= 80 Z= 1.751 0.72171 0.87829 Limite de error = Li - Ls = 0.72171 - 0.87829 = 0.157658 El intervalo de confianza seria: (0.72171,0.87829)
  46. 35. ¿Cuánta superficie hay en ambas colas (combinadas)? La superficie total en ambas colas combinadas es de 0.5. Esto se deriva del hecho de que la proporción de niñas presentes en la clase de patinaje seleccionada es de 80%, lo que significa que hay una proporción de 0.8 de niñas en la población de patinaje sobre hielo para principiantes en el Ice Chalet. El valor Z para esta proporción es 1.28, lo que significa que la superficie en ambas colas es de 0.5.
  47. 36. ¿Cuánta superficie hay en cada cola? En cada cola hay una superficie de 0,04
  48. 37. Calcule lo siguiente: a) límite inferior b) límite superior c) límite de error
  49. Para calcular la proporción real de niñas de 8 a 12 años en todas las clases de patinaje sobre hielo para principiantes en el Ice Chalet, primero necesitamos calcular el límite inferior, el límite superior y el límite de error. El límite inferior se calcula usando la siguiente fórmula: Límite inferior = (Cantidad de niñas / (Cantidad de niñas + Cantidad de niños)) - Límite de error Por lo tanto, en este caso, el límite inferior es: Límite inferior = (64 / (64 + 16)) - Límite de error = 0.8 - Límite de error
  50. El límite superior se calcula usando la siguiente fórmula: Límite superior = (Cantidad de niñas / (Cantidad de niñas + Cantidad de niños)) + Límite de error Por lo tanto, en este caso, el límite superior es: Límite superior = (64 / (64 + 16)) + Límite de error = 0.8 + Límite de error Finalmente, el límite de error se calcula usando la siguiente fórmula: Límite de error = (1.96 * √(P * (1 - P) / N)) Donde P es el porcentaje de éxito (en este caso, la proporción de niñas) y N es el tamaño de la muestra (en este caso, el número total de niños y niñas en la clase). Por lo tanto, en este caso, el límite de error es: Límite de error = (1.96 * √(0.8 * (1 - 0.8) / 80)) = 0.094
  51. Entonces: a) límite inferior es: 0.706 b) límite superior es: 0.894 c) límite de error es: 0.094
  52. 38.El intervalo de confianza del 92 % es ?. (0,72; 0,88)
  53. n= 1050 p= 0.384761905 q= 0.615238095 z= 1.96 p(1-p)/n= 0.000225448 I.C (+) = 0.414191146 I.C (-) = 0.355332664 Lím. De Error= 0.029429241 39. Rellene los espacios en blanco del gráfico con las áreas, los límites superior e inferior del intervalo de confianza y la proporción de la muestra.
  54. 39. Rellene los espacios en blanco del gráfico con las áreas, los límites superior e inferior del intervalo de confianza y la proporción de la muestra.
  55. 40 explique el significado del intervalo en una oración completa Con el 92 % de confianza estimamos que la proporción de niñas de 8 a 12 años que asisten a una clase de patinaje sobre hielo para principiantes en el Ice Chalet se sitúa entre el 72 % y el 88 %.
  56. 41. Utilizando la misma p′ y el mismo nivel de confianza, supongamos que n se aumenta a 100. ¿El límite de error sería mayor o menor? ¿Cómo lo sabe?
  57. 42. Utilizando la misma p′ y n = 80, ¿cómo cambiaría el límite de error si el nivel de confianza se incrementara al 98 %? ¿Por qué?
  58. 43. Si se disminuye el límite de error permitido, ¿por qué aumentaría el tamaño mínimo de la muestra (manteniendo el mismo nivel de confianza) Si se disminuye el límite de error permitido, el tamaño mínimo de la muestra aumentará para asegurar que se mantenga el mismo nivel de confianza. Esto se debe a que cuanto mayor sea el límite de error permitido, menor es la precisión de los resultados de la muestra. Por lo tanto, para asegurar que los resultados sean lo suficientemente precisos como para confiar en su exactitud, el tamaño mínimo de la muestra debe aumentar para reducir el límite de error permitido.
  59. Gracias
Publicité