SlideShare une entreprise Scribd logo
1  sur  37
UNIVERSIDAD POLITECNICA ESTATAL DEL CARCHI




FACULTAD DE COMERCIO INTERNACIONAL, INTEGRACIÓN, ADMINISTRACIÓN
                   Y ECONOMÍA EMPRESARIAL



    ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL
                       INTERNACIONAL


              TRABAJO DE ESTADISTICA INFERENCIAL



                   EJERCICIOS CHI CUADRADO




                         DEICY CUMBAL




                   SEXTO NIVEL PARALELO “A”




                             2012
TEMA: CHI-CUADRADO


PROBLEMA: Desconocimiento del Chi- Cuadrado imposibilita la realización y

desarrollo de ejercicios que a futuro utilizaremos.


OBJETIVOS


General


       Conocer y aplicar el CHI-CUADRADO en ejercicios planteados para

       tener un mejor desarrollo como profesionales en el futuro.


Específicos:


       Fundamentar el Chi-cuadrado.

       Analizar la información obtenida sobre el CHI-CUADRADO.

       Realizar ejercicios planteados sobre el CHI-CUADRADO para aplicarlos

       en la carrera.


JUSTIFICACIÓN


El presente trabajo lo hemos realizado con la finalidad de aprender acerca del

Chi-cuadrado, su concepto y los ejercicios que se pueden desarrollar, para

conocer lo fundamental que ayudara en la carrera de comercio exterior y como

profesionales en este campo.


Además se reforzará los conocimientos y así como resolver ejercicios sobre

CHI-CUADRO aplicando la fórmula en ejercicios de nuestra carrera.
5.- MARCO TEORICO

                                CHI-CUADRADO

En una prueba de ajuste la hipótesis nula establece que una variable X tiene
una cierta distribución de probabilidad con unos determinados valores de los
parámetros. (Arvelo, 1998)

El tipo de distribución se determina, según los casos, en función de: La propia
definición de la variable, consideraciones teóricas al margen de esta y/o
evidencia aportada por datos anteriores al experimento actual. (Arvelo, 1998)

A menudo, la propia definición del tipo de variable lleva implícitos los valores de
sus parámetros o de parte de ellos; si esto no fuera así dichos parámetros se
estimarán a partir de la muestra de valores de la variable que utilizaremos para
realizar la prueba de ajuste. (Arvelo, 1998)

Como en casos anteriores, empezaremos definiendo las hipótesis.

       Hipótesis nula: X tiene distribución de probabilidad f(x) con
       parámetros y1,..., yp


       Hipótesis alternativa: X tiene cualquier otra distribución de
       probabilidad.
Es importante destacar que el rechazo de la hipótesis nula no implica que sean
falsos todos sus aspectos sino únicamente el conjunto de ellos; por ejemplo,
podría ocurrir que el tipo de distribución fuera correcto pero que nos
hubiésemos equivocado en los valores de los parámetros. (Arvelo, 1998)

Obviamente, necesitaremos una muestra de valores de la variable X. Si la
variable es discreta y tiene pocos valores posible estimaremos las
probabilidades de dichos valores mediante sus frecuencias muéstrales; si la
variable es continua o si es una discreta con muchos o infinitos valores
estimaremos probabilidades de grupos de valores (intervalos). (Arvelo, 1998)

Metodológicamente, la prueba se basa en la comparación entre la serie de
frecuencias absolutas observadas empíricamente para los valores de la
variable (Oi) y las correspondientes frecuencias absolutas teóricas obtenidas
en base a la función de probabilidad supuesta en la hipótesis nula (Ei). (Arvelo,
1998)

Así pues, una vez calculadas las frecuencias absolutas de cada valor o
intervalo de valores, obtendremos el número total de observaciones de la
muestra (T) sumando las frecuencias observadas (Arvelo, 1998)




Para calcular las frecuencias esperadas repartiremos este número total de
observaciones (T) en partes proporcionales a la probabilidad de cada suceso o
grupo de sucesos. (Arvelo, 1998). Para ello calcularemos dichas probabilidades
utilizando la función de probabilidad definida en la hipótesis nula f(x), de modo
que, cada valor Ei tendrá la siguiente expresión:




Por tanto, tendremos los siguientes datos para la prueba:

           Valor de la variable         x1   x2     x3   ... xi ... xk
           Frecuencias observadas O1 O2 O3 ... Oi ... Ok
           Frecuencias esperadas        E1   E2     E3 ... Ei ... Ek



Si la hipótesis nula es cierta, las diferencias entre valores observados y
esperados (que siempre existirán por tratarse de una muestra aleatoria) son
atribuibles, exclusivamente, al efecto del azar. En estas condiciones, se puede
calcular un parámetro que depende de ambos, cuya distribución se ajusta a
una CHI-CUADRADO. (Arvelo, 1998)
Si, por el contrario, la hipótesis nula fuera falsa los Ei ya no serían, realmente,
los valores esperados de las frecuencias; por tanto, las diferencias entre los
valores "esperados" y los observados reflejarían no sólo el efecto del azar sino
también las diferencias entre los Ei y la auténtica serie de valores esperados
(desconocida) Como consecuencia, las diferencias de los numeradores de la
expresión anterior tienden a ser más grandes y, por estar elevadas al
cuadrado, la suma de cocientes ser positiva y mayor que lo que se esperaría
para los valores de una CHI-CUADRADO. (Arvelo, 1998)




Por tanto, el parámetro anterior será el estadístico de contraste de la prueba de
hipótesis y la región crítica se encontrar siempre en la cola derecha de la
distribución CHI-CUADRADO. Evidentemente, esta prueba será siempre de
una sola cola. (Arvelo, 1998)



Estadístico de contraste


Se acepta la hipótesis nula si              , el percentil 1 – α de la distribución
CHI-CUADRADO con grados de libertad.

Cabe señalar que en las pruebas CHI-CUADRADO lo corriente es que
pretendamos comprobar que una variable tiene una cierta distribución y, por
tanto, habitualmente, nos vemos obligados a colocar nuestra propia hipótesis
en la hipótesis nula. Únicamente podremos colocar nuestra hipótesis en la
alternativa en el caso excepcional de que pretendamos demostrar que cierto
tratamiento produce una distorsión de la distribución básica de la variable en
estudio. (Arvelo, 1998)

El número de grados de libertad de la variable CHI-CUADRADO se calcula de
la siguiente forma:

       A priori, tendrá tantos grados de libertad como parejas frecuencia
       observada - frecuencia esperada. (Arvelo, 1998)
A esta cantidad se debe restar el número de restricciones lineales
       impuestas a las frecuencias observadas, es decir, el número de
       parámetros que es necesario calcular directamente a partir de los
       valores observados para establecer los valores esperados. Este número
       es, como mínimo, uno ya que siempre tendremos que calcular el número
       total de observaciones de la muestra. (Arvelo, 1998)

Una condición básica para que podamos llevar a cabo una prueba CHI-
CUADRADO es que las frecuencias de las distintas clases deben ser
suficientemente altas como para garantizar que pequeñas desviaciones
aleatorias en la muestra no tengan importancia decisiva sobre el valor del
estadístico de contraste. (Arvelo, 1998). (Arvelo, 1998)

Las reglas que determinan cuando es posible o no realizar el contraste varían
mucho de unos autores a otros. En un extremo de máxima rigidez se
encuentran aquellos que opinan que no se puede realizar la prueba cuando
alguna de las frecuencias, observadas o esperadas, sea menor que 5. En el
otro extremo se encuentran quienes opinan que, para que la prueba sea viable
ninguna de las frecuencias esperadas debe ser menor que 1 y no más del 25%
pueden ser menores que 5; en lo que refiere a las frecuencias observadas no
existirían límites. La autora de este texto simpatiza más con la segunda
postura, no sólo por razones prácticas, sino porque lo razonable es que la
distribución esperada esté adecuadamente definida y, por tanto, no debe incluir
valores muy bajos; sin embargo, los valores extremos en la distribución
observada simplemente reflejan diferencias importantes entre la distribución
supuesta por la hipótesis nula y la real. (Arvelo, 1998)

Sea cual sea el criterio que elijamos, si resultara que la prueba no es viable
podríamos recurrir a englobar los valores o clases de valores con sus vecinos
más próximos y pasar así a engrosar sus frecuencias. Este procedimiento no
puede llevarse hasta el absurdo pero proporciona una salida digna a
situaciones complejas. En casos excepcionales se pueden englobar valores
que no sean vecinos porque exista algún nexo lógico de conexión entre ellos.
(Arvelo, 1998)
Cuando sea necesario agrupar valores, los grados de libertad no se deben
calcular hasta que tengamos establecidas definitivamente las parejas de
frecuencias observadas y esperadas con las que calcularemos el estadístico de
contraste. (Arvelo, 1998)

                                    EJERCICIOS

EJERCICIO 1.-

1.- Un jugador quiere probar que es legal el dado con el que juega. Tiro el dado
120 veces y obtuvo la siguiente distribución de frecuencias de las caras
resultantes.

RESULTADO            1         2         3         4         5          6

FRECUENCIA           15        25        33        17        16         14



      a) Enuncie las hipótesis de la prueba y determine las frecuencias
         esperadas.
      b) Describa la estadística de la prueba
      c) Determine la región crítica de la prueba al nivel de significación del 5%.
      d) ¿A qué conclusión llega usando el nivel de significación 0,05?
      e) Determine la probabilidad P.

1.-

         Ho: El dado es legal.
         Ha: El dado no es legal.

2.- Es de dos colas.

3.- Nivel de confianza



4.-

gl= k-1         gl=6-1       gl=5
5.-
Zona
       aceptación



                          11,07
6.-

Ei              20     20          20          20         20          20

Oi         15        25           33         17          16          14




7.- Se acepta la hipótesis alternativa y se rechaza la hipótesis nula, es decir el
dado del jugador no es legal ya que se encuentra dentro de la zona de rechazo.



EJERCICIO 2.-

2.- El gerente de ventas de una compañía P&C afirma que todos sus
vendedores realizan el mismo número de visitas durante el mismo período de
tiempo. Una muestra aleatoria de 5 registros de los vendedores en una semana
dada reveló el siguiente número de visitas.

Vendedor                    A           B           C           D           E


Número de visitas           23          29          25          23         30
Con el nivel de significación de 0.05, ¿es razonable aceptar la afirmación del
gerente?



1)     : hacen el mismo número de visitas

     : hacen menor número de visitas

2) Gráfica: unilateral y cola a la derecha




3) Nivel de significación 0.05

4) Variables cualitativas → chi cuadrado

5) gl = k-1

gl = 5-1 = 4

      = 9,49

6)                     26         26          26        26        26
                  23         29          25        23        30




7) Acepta la hipótesis nula por que realizan el mismo número de visitas



EJERCICIO 3.-
3.- El gerente de personal       de la compañía de “REXA” quiere probar la
hipótesis que hay diferencias significativas de tardanzas de los diferentes días
de la semana. De los registros de asistencia obtuvo la siguiente tabla de
tardanzas de su personal para cada uno de los días de la semana:

DIAS             LUNES      MARTES           MIERCOLES        JUEVES    VIERNES


TARDANZAS        58         39               75              48         80




¿Se puede aceptar la hipótesis del gerente con un nivel de significación de
0.05?

1.- HO = El número de tardanzas en el mismo cada día

2.- La prueba es unilateral de una cola

3.- Nivel de significancia del =0.05

4.-Utilizamos la prueba del CHI-CUADRADO

5.-




                                                           z. rechazo

                             z. aceptación


                                                   9.488


gl=K-1

gl= 5-1

gl=4
x2=9.488

6. - frecuencias esperadas

                                     Xi

                                     58

                                     39

                                     75

                                     48

                                     80

                                     300




 =60

                    60         60          60        60        60
              58          39        75          48        80



X2=            = 20.232




7.- Se rechaza la hipótesis nula y se acepta la hipótesis alternativa debido a
que    hay tardanzas del personal en cada día de la semana ya que llegan
puntuales a la compañía REXA.

EJERCICIO 4.-

4.- De una muestra de turistas que se hospedan en el hotel “ EL PALMER” se
recogió sus opiniones acerca de los servicios del hotel, resultando los
siguientes datos:
PESIMA        MALA REGULAR BUENA MUY BUENA EXCELENTE

TURISTAS 20            25            40        54                 56




Pruebe con un nivel de significación del 5%, la hipótesis nula de que no hay
diferencias significativas entre las opciones de los turistas.

1.- HO = no hay diferencias significativas en las opiniones

2.- La prueba es unilateral de una cola

3.- Nivel de significancia del =0.05

4.- Utilizamos la prueba del CHI-CUADRADO




5.-




                                                            z. rechazo

                              z. aceptación



                                                    9.488



gl=K-1

gl= 5-1

gl=4

x2=9.488
6. FRECUENCIA ESPERADAS

                                     Xi
                                     20
                                     25
                                     40
                                     54
                                     56
                                     195

               =39




      39             39             39             39             39

20            25             40            54             56



X2=            = 27.486



7.- La hipótesis nula se rechaza porque, no hay diferencias significativas en las
opiniones de los turistas.




Ejercicio 5

En un día se observó el número de conductores que escogieron cada una de
las diez casetas de pago de peaje ubicadas a la salida al sur. Los datos se
registraron en l siguiente tabla:

Caseta #        1      2      3      4      5      6      7      8      9      10

#        de 580        700    730    745    720    710    660    655    670    490
conductores




Presentan estos datos suficiente evidencia para concluir que hay casetas
preferidas?. Utilice el nivel de significancia del 5%
Pasos:

1)

Ho: No existen las casetas preferidas

Ha: Existen casetas preferidas

2) la prueba es unilateral con una cola hacia la derecha.

3) nivel de significancia del 0.5

4) utilizar el Chi cuadrado.

5) grafica

gl= k-1

gl= 10-1=9

Tabla obtenemos 16,919




6) calculo estadístico

Ei           666   666       666   666   666    666      666       666   666   666
Oi           580   700       730   745   720    710      660       655   670   490


     (9) =

     (9) =           +              +            +             +         +           +

              +          +          +          = 82,42
7) Se rechaza la hipótesis nula y se acepta la alternativa que propone que si
existen preferencias en las casetas del cobro de peaje.

Ejercicio 6

Un ejecutivo de hipermercado “TOD” afirma que las compras se pagan 30%
con cheques, 45% con efectivo y 25% con tarjeta de crédito. En una muestra
aleatoria de 400 compradores se encontró q 110 de ellos pagaron con
cheques, 210 con efectivo y 80 con tarjetas ¿puede usted concluir con la
significación de 0,05 que la afirmación del ejecutivo es razonable?

30% cheque

45% efectivo

25% tarjeta de crédito

N= 400

110 cheques

210 efectivos

80 tarjetas



1) Ho: los pagos guardan relación

  Ha: los pagos no guardan relación entre si

2) la prueba es unilateral con una cola hacia la derecha.

3) nivel de significancia del 0.05

4) utilizar el Chi cuadrado.

5) grafica

gl= k-1

gl= 3-1=2

Tabla obtenemos 5,991
6) calculo estadístico

Ei        120    180     100
Oi        110    210     80


  (2) =

  (2) =            +            +          = 9,83

7) se rechaza la hipótesis nula y se acoge la alternativa que manifiesta que los
pagos con tarjeta, cheque o efectivo no guardan ninguna relación entre si.




EJERCICIO 7.-

Una maquina llena latas con 300 caramelos de sabores: Piña, Fresa, Limón y
Naranja en la relación: 4:3:2:1. Si en una lata de estos caramelos se encontró;
115 de piña, 95 de fresa, 70 de limón, y 20 de naranja, pruebe la hipótesis de
que la maquina está mezclando en la relación: 4;3;2;1 al nivel de significación
de 0.05.

SABORES         PIÑA           FRESA       LIMON        NARANJA      TOTAL
RELACION        4              3           2            10           10
CANTIDAD        115            95          70           20           300
TOTAL           119            98          72           21           316


     1)     = la maquina esta mesclado en la relación 4:3:2:1
     2) La prueba es unilateral de una cola
     3) Nivel de significación 0.05
     4) Utilizamos CHI- CUADRADO
7.815




        gl= (f -1) (c- 1)
        gl= (2-1)(4-1)
        gl=3

        X= 7.815


  5)       = 300 X 40 =120
           = 300 X 30 =90
           = 300 X 20=60
           = 300 X 10=30



           120              90                60        30




115                95            70                20




       =            +

       = 5.496
6) TOMA DE DECICIONES
      Como se puede ver aceptamos la hipótesis nula y desechamos la
       hipótesis alternativa y que la maquina mezcladora tiene relación entre
       4:3:2:1.



EJERCICIO.- 8



Se cree que las personas que mueren por sobredosis de narcóticos son
generalmente jóvenes. Para comprobar esta hipótesis se ha obtenido la
siguiente distribución del número de muertes por sobredosis.

EDAD         15 - 19       20 - 24   25 - 29   30 - 34   35 - 39   40      O
                                                                   MAS
NUMERO 31                   44       27        39        41        28
DE
MUERTES


Con estos resultados y con un nivel de significación de 0.05. ¿Se puede
concluir, empleado, que muere un número igual de personas en cada
categoría?



   1)     = Muere igual el número de personas en cada categoría
   2) La prueba es unilateral de una cola
   3) Nivel de significación 0.05
   4) Utilizamos CHI- CUADRADO
   5)




                                     11.070




       gl= K -1 = 6-1= 5
= 11.070

       6)

            35               35                  35                  35        35        35




31               44                    27                  39             41        28




      =          +


      = 0.46+2.31+1.83+0.46+1.03+1.4

      = 7.486



     6) TOMA DECISIONES


Se acepta la hipótesis nula y se rechaza la hipótesis alternativa y que le
número de muertos es igual al número de personas por categoría.




EJERCICIO 9.-

9. Un investigador escogió una muestra aleatoria de 192 familias con 4 hijos y
encontró la siguiente distribución de frecuencias del número de hijos varones:
Número               de 0         1         2         3         4
varones
Número               de 18        42        64        40        28
familias
Él quiere probar la hipótesis de que los nacimientos de varones y mujeres son
igualmente probables. Esto es, quiere probar que la distribución de estos datos
se aproxima a una distribución binomial.
Enuncie la hipótesis de la prueba y obtenga las frecuencias esperadas.
Describa la estadística de la prueba
Determine la región critica de la prueba al nivel de significación del 5%
A que conclusión llega usando el nivel de significación 0.05
Determine el nivel de significación de la prueba (calcule probabilidad:P)
     1) H0: la distribución de nacimiento de varones y mujeres son igualmente
        probables.
        H1: la distribución de nacimientos de varones y mujeres no son
        igualmente probables.
     2) La prueba es unilateral y de cola derecha
     3) Nivel de significación 0.05
     4) Emplearemos la distribución maestral del CHI-CUADRADO
     5) Gl= k-1
        Gl=5-1=4




                                             9.48




6)
         Ei           38.4            38.4          38.4        38.4        38.4
Oi             18            42              64            40          28




        Cálculo de las frecuencias esperadas
1. Toma de decisiones
  Aceptamos la Ha y rechazamos la Ho.
  Esto significa que los nacimientos de varones y mujeres no son
  igualmente probables.
EJERCICIO 10.-


10. Se lanzaron 200 veces 5 monedas y en cada tirada se contaron el número
de caras. Los resultados de este experimento son los siguientes:
Número de caras        0    1    2       3    4    5
Número            de 3      15 55        60   40 27
tiradas


Pruebe la hipótesis de que la distribución del número de caras se ajusta a una
distribución binominal. Use el nivel de significación del 1%
     1) H0: la distribución del número de caras se ajusta a la distribución.
        H1: la distribución del número de caras no se ajusta a la distribución.
     2) La prueba es unilateral y de cola derecha
     3) Nivel de significación 1% = 0.01
     4) Emplearemos la distribución muestral del CHI-CUADRADO
     5) Gl= k-1
        Gl=6-1=5




                                                  15.086


6)
      Ei       33.33            .3333,        33.33         33.33        33.33 33.33
Oi         3               15            55            60           40         27
1. Cálculo del Estadístico de la Prueba




7.- Toma de decisiones
Aceptamos la Ha y rechazamos la Ho. La distribución del número de caras se
ajusta a una distribución binomial.




CONCLUSIONES:


    Mediante el presente trabajo hemos podido conocer y aplicar sobre la

      distribución de Chi-Cuadrado, además hemos aprendido sobre las

      relaciones que existen entre las variables dentro de un problema.

    Con el desarrollo de varios problemas con respecto al tema hemos

      podido practicar y aprender las relaciones existentes: relación infinita,

      positiva perfecta, negativa imperfecta, nula etc.

    La aplicación de Chi cuadrado puede ser compleja en cuanto a la

      determinación de las hipótesis, pero son de suma importancia para

      determinar la aceptación o rechazo de ellas.
RECOMENDACIONES:


   Es de vital ayuda poner en práctica los conocimientos aprendidos ya que

       nos servirán dentro de nuestra carrera y el desarrollo de la problemática

       que en ella se engloba.

   Es necesario identificar el Chi cuadrado dentro de las variables porque

       estas se aplican para el desarrollo de proyectos.

   Proponer ejercicios mediante la distribución del chi cuadrado en función

       a las actividades del comercio exterior y así lograr una mayor

       comprensión.




CRONOGRAMA

                                                    SEMANA
              ACTIVIDAD                    1        2         3          4         5
DISEÑO DEL PROYECTO                         x
ELABORACIÓN DEL PROYECTO                            x

DESARROLLO DEL PROYECTO                                        x

INFORME FINAL                                                             x

ENTREGA DEL                                                                        x
PROYECTO




BIBLIOGRAFÍA

Aldape, A., & Toral, C. (2005). Matemáticas 2. México: PROGRESO

S.A.


Altamirano, E. (2007).
Anderson, D. R. (2005). Estadística para Administración y

Economía. México: Cengage Learning.

Diaz, R. G. (2008). Unidades fundamentales .


Enríquez, H. (2002). Fundamentos de Electricidad. México: LIMUSA

S.A.


Física, E. d. (1997). Brian Mckittrick. Madrid: Reverté S.A.


García, M. A. (2000). Estadística Avanzada con el Paquete Systat.

Murcia: I.S.B.N.


J.R, W. D. (20007). Ciencias e Ingenieria de las Materias .

ANEXOS:

   1) Un camión lleva al país de destino 200 productos perecibles como:
      manzanas, Limón y Naranja y mangos en la relación: 4:3:2:1. Si en el
      camión en se encontró; 115 de piña, 95 de fresa, 70 de limón, y 20 de
      naranja, pruebe la hipótesis que el camión tiene relación: 4;3;2;1 al nivel
      de significación de 0.05.

PRODUCTOS       MANZANAS LIMON              NARANJA      MANGOS        TOTAL
PERECIBLES
RELACION        4               3           2            10            10
CANTIDAD        115             95          70           20            300
TOTAL           119             98          72           21            316


   1)     = el camión tiene relación: 4;3;2;1
   2) La prueba es unilateral de una cola
   3) Nivel de significación 0.05
   4) Utilizamos CHI- CUADRADO
7.815




       gl= (f -1) (c- 1)
       gl= (2-1)(4-1)
       gl=3

       X= 7.815


  5)     = 300 X 40 =120
         = 300 X 30 =90
         = 300 X 20=60
         = 300 X 10=30




         120               90                60        30




115               95            70                20
=           +

      = 5.496



     6) TOMA DE DECICIONES
        Como se puede ver aceptamos la hipótesis nula y desechamos la
        hipótesis alternativa y el camión tiene relación: 4;3;2;1


     2) En un día se observó el número de conductores que pasan por el
        puente de rumichaca . Los datos se registraron en l siguiente tabla:

            1           2      3      4      5      6      7        8     9     10
#        de 580         700    730    745    720    710    660      655   670   490
conductores


Presentan estos datos suficiente evidencia para concluir que hay casetas
preferidas?. Utilice el nivel de significancia del 5%.



Pasos:

1)

Ho: No existen las casetas preferidas

Ha: Existen casetas preferidas

2) la prueba es unilateral con una cola hacia la derecha.

3) nivel de significancia del 0.5

4) utilizar el Chi cuadrado.

5) grafica

gl= k-1

gl= 10-1=9

Tabla obtenemos 16,919
6) calculo estadístico

Ei        666   666        666   666     666     666      666       666    666    666
Oi        580   700        730   745     720     710      660       655    670    490


  (9) =

  (9) =            +              +               +             +           +           +

           +           +          +             = 82,42



7) Se rechaza la hipótesis nula y se acepta la alternativa que propone que si
existen preferencias en las casetas del cobro de peaje para conductores que
pasan en el puente de rumichaca pasando mercadería

     3) En un estudio realizado en el departamento comercio exterior se aplicó:

Una encuesta a los exportadores cuanto exportan en toneladas, obteniendo
los resultados que presenta la siguiente tabla



Exportación en toneladas
Exportación     1 mes                 2 meses          3 meses            total
Alto            32                    225              50                 307
Bajo            28                    290              79                 397
Total           60                    515              129                704


Al nivel de significación Q=0.05, determinar que las variables perjuicio étnico
hacia el negro y lugar de residencia son independientes

     1. Ho: el departamento de comercio exterior y los exportadores
H1: existe dependencia entre las variables.

   2. La prueba es unilateral y la cola derecha
   3. Asumimos el nivel de significación de Q= 0.05
   4. Utilizaremos la distribución muestral de chi-cuadrado porque las dos
      variables son cualitativas.
   5. Esquema de la prueba

Gl =(C-1) (F-1)      1.1.3.4

Gl=(3-1) (2-1)     = 2 11.3.4

Gl= 2

Q= 0.05

X2 = (2) = 5.991

C= # de columnas

F= # de filas


   6. Calculo del estadístico de la prueba                          x= 3.54
      5.991
      Formula
                               2




          X2= 3.54

Ya conocemos las frecuencias observadas para determinar las frecuencias
esperadas emplearemos la misma tabla, manteniendo invariables de
frecuencias marginales de dos variables




Exportación en toneladas
exportacion    1 mes               2 meses        3 meses   total
Alto           E11                 E12            E13       307
Bajo           E21                 E22            E23       397
Total          60                  515            129       704
Cuando las variables X y Y son independientes, las frecuencias de cada celda
son igual al productos de las frecuencias marginales correspondientes dividido
por el tamaño de la muestra.




                                                      26.16          224.58             56.25



                                               32              225             50


                                                       33.84          290.42            72.75



                                               28              290              79




Las frecuencias esperadas y las asociadas determinan las frecuencias
observadas anteriormente



   4) En la exportación de naranjas, la empresa exportadora envía
      mensualmente lotes de 50 cajas al exterior, cada caja tiene un peso
      aproximado de 20 kilos. Las cajas son previamente almacenadas. Para
      el               control                 de                calidad                 se
      examinan al azar, si en alguna caja encuentran por lo                menos        una
      naranja malograda, esta es calificada mala. Para que pase el control
      mediante la inspección de la muestra no debe haber caja malograda, si
      solo e x i s t e u n a c a j a e s t a s e r á c a m b i a d a , s i h a y m á s d e 1
e n las 5 inspeccionadas, inspeccionaran las cincuenta cajas. Según las
       estadísticas pasadas de un total de 40 envíos, registro lo siguiente: Se
       puede afirmar que la variable número de cajas en mal estado en la
       muestra de 5 sigue una distribución Binomial?.



manzanas      Rojas        verdes       ambos
Grandes       3            5            5               13
Medianas      5            4            8               17
pequeñas      7            9            6               22
total         15           18           19              52

  1)
       H0: La variable número de cajas sigue una distribución Binomial.
       Ha: No siguen una Binomial.


  2) La prueba es unilateral y de una cola derecha


  3) Nivel de significación 0.10


  4) Utilización del chi cuadrado


  5) Esquema de la prueba


       Gl = (c-1) (f-1)
         = (3-1) (3-1)
         =4
       α = 0.10


       En la tabla de CHI CUADRADA obtenemos
       X2 (4) = 7.779


  6) Calculo del estadístico de la prueba
Calculo de las pruebas esperadas.




manzanas      Rojas          verdes         ambos
Grandes               3.75            4.5        4.75
                                                        13
              3              5              5
Medianas            4.90          5.88           6.21
              5                                         17
                             4              8
pequeñas            6.35          7.62           8.04
              7              9              6           22
total
              15             18             19          52
= 0.15+ 0.06+ 0.01+ 0.002+0.60+0.52+ 0.07+ 0.25+ 0.52

          =2.182

   7)




                   ZA             ZR




                2.182         7.779




        ZA= aceptamos la hipótesis nula porque La variable número de cajas
        sigue una distribución Binomial.



   5) En Tulcán se realiza un estudio si es factible la creación de una Bodega
        , para la cual se aplicó una encuesta a las personas que se dedican al
        comercio exterior, obteniéndose los resultados que se presentan a
        continuación:


Actividad de Comercio Exterior
Factibilidad   Importadores Exportadores         Agentes de Total
                                                 Aduana
Si              18                20             38         76
No              12                8              14         34
Total           30                28             52         110
Al nivel de significación α= 0.05, determinar que las variables factibilidad de
creación de Zona Franca y actividad de comercio exterior son independientes.

   a)

Ho= factibilidad de creación de Zona Franca y la actividad de comercio exterior
son independientes;

H1=existe dependencia entre las dos variables.

   b) La prueba es unilateral y de cola derecha.
   c) Asumimos el nivel de significación de α= 0.05
   d) Utilizaremos la distribución muestral de Chi-cuadrado porque las dos
        variables son cualitativas
   e)

gl= (C-1)(F-1)

gl= (3-1)(2-1) = 2

α= 0.05

x2(2)=5.991

   f)


Actividad de Comercio Exterior
Factibilidad   Importadores Exportadores           Agentes de Total
                                                   Aduana
Si               E11                 E12           E13        76
No               E21                 E22           E23        34
Total            30                  28            52         110
Ei          20,73        19,35         35,93
                  Oi     18           20            38
                              9,27         8,65          16,07
                         12           8             14




   g) Vemos que el valor se encuentra en la zona de aceptación por lo tanto
      aceptamos la Ho.




   6) Los estudiantes de comercio exterior quiere determinar si la creación de
      una empresa de contenedores para el Transporte de exportaciones e
      importaciones entre Ecuador y Perú.


EMPRESA DE ALQUILER DE CONTENEDORES
Grado de    Transportistas Empresas de Exportadores Importadores TOTAL
perjuicio                  transporte
Están de    392            222         331          123          1068
acuerdo
No Están    122               324                 122            323             891
de
acuerdo
TOTAL       514               546                 453            446             1959
El nivel de significancia es de α=0.05 determinar las variables de la
aceptabilidad de la creación de la empresa.

1).      la aceptabilidad de la creación de la empresas.

      Existe aceptabilidad.

2). La prueba es unilateral y la cola es derecha.

3) Asumimos el nivel de significancia de α=0.05

4) Utilizaremos la distribución maestral de Ji-Cuadrado porque las dos variables
son cualitativas.

5) Esquema de la prueba




6) Calculo del estadístico de la prueb




EMPRESA DE DE ALQUILER DE CONTENEDORES
Grado de Transportistas Empresas                Exportadores Importadores      TOTAL
perjuicio      280.22   de                                           243,14
                        transporte
Están de 392                297,66              331   246.96   123             1068
acuerdo
               233,77                                                202,85
                        222 248,33
                                                      206,03
No Están 122                    324             122            323             891
de
acuerdo
TOTAL         514               546             453            446             1959
6,62   7,815

Contenu connexe

Tendances

Chi Cuadrado
Chi CuadradoChi Cuadrado
Chi Cuadradoaramirez
 
Capitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de HipótesisCapitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de Hipótesisug-dipa
 
Guia intervalos de confianza
Guia intervalos de confianzaGuia intervalos de confianza
Guia intervalos de confianzaAndres Oyarzun
 
Estadistica chi cuadrado
Estadistica chi cuadradoEstadistica chi cuadrado
Estadistica chi cuadradoPABLITO Pablo
 
7. Análisis de Varianza (ANOVA)
7. Análisis de Varianza (ANOVA) 7. Análisis de Varianza (ANOVA)
7. Análisis de Varianza (ANOVA) Consuelo Valle
 
control estadistico de procesos-prueba de hipotesis
control estadistico de procesos-prueba de hipotesiscontrol estadistico de procesos-prueba de hipotesis
control estadistico de procesos-prueba de hipotesisSonia Ynés Huaripaucar G
 
Estimación.intervalos de confianza para la media y para las proporciones
Estimación.intervalos de confianza para la media y para las proporcionesEstimación.intervalos de confianza para la media y para las proporciones
Estimación.intervalos de confianza para la media y para las proporcionesHugo Caceres
 
Estadistica aplicada
Estadistica aplicadaEstadistica aplicada
Estadistica aplicadaNancy Curasi
 
Muestreo aleatorio simple
Muestreo aleatorio simpleMuestreo aleatorio simple
Muestreo aleatorio simplemilit
 
50 ejercicios estadistica
50 ejercicios estadistica50 ejercicios estadistica
50 ejercicios estadisticaPAHOLA24
 
Distribucion muestral de proporciones
Distribucion muestral de proporcionesDistribucion muestral de proporciones
Distribucion muestral de proporcioneseraperez
 
Coeficiente de asimetría de pearson
Coeficiente de asimetría de pearsonCoeficiente de asimetría de pearson
Coeficiente de asimetría de pearsoncarlosrv0
 
14 prueba chi cuadrado
14 prueba chi cuadrado14 prueba chi cuadrado
14 prueba chi cuadradoYerko Bravo
 

Tendances (20)

Chi Cuadrado
Chi CuadradoChi Cuadrado
Chi Cuadrado
 
Capitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de HipótesisCapitulo 4 : Pruebas de Hipótesis
Capitulo 4 : Pruebas de Hipótesis
 
Guia intervalos de confianza
Guia intervalos de confianzaGuia intervalos de confianza
Guia intervalos de confianza
 
Calculo del tamaño de muestra
Calculo del tamaño de muestraCalculo del tamaño de muestra
Calculo del tamaño de muestra
 
Estadistica chi cuadrado
Estadistica chi cuadradoEstadistica chi cuadrado
Estadistica chi cuadrado
 
7. Análisis de Varianza (ANOVA)
7. Análisis de Varianza (ANOVA) 7. Análisis de Varianza (ANOVA)
7. Análisis de Varianza (ANOVA)
 
Análisis de Regresión Múltiple
Análisis de Regresión MúltipleAnálisis de Regresión Múltiple
Análisis de Regresión Múltiple
 
control estadistico de procesos-prueba de hipotesis
control estadistico de procesos-prueba de hipotesiscontrol estadistico de procesos-prueba de hipotesis
control estadistico de procesos-prueba de hipotesis
 
Estimación.intervalos de confianza para la media y para las proporciones
Estimación.intervalos de confianza para la media y para las proporcionesEstimación.intervalos de confianza para la media y para las proporciones
Estimación.intervalos de confianza para la media y para las proporciones
 
Análisis de Regresión Lineal
Análisis de Regresión LinealAnálisis de Regresión Lineal
Análisis de Regresión Lineal
 
Estadistica aplicada
Estadistica aplicadaEstadistica aplicada
Estadistica aplicada
 
Capítulo viii
Capítulo viiiCapítulo viii
Capítulo viii
 
Muestreo aleatorio simple
Muestreo aleatorio simpleMuestreo aleatorio simple
Muestreo aleatorio simple
 
50 ejercicios estadistica
50 ejercicios estadistica50 ejercicios estadistica
50 ejercicios estadistica
 
2012 3 distribucion-f_(fisher)
2012 3 distribucion-f_(fisher)2012 3 distribucion-f_(fisher)
2012 3 distribucion-f_(fisher)
 
Ejercicios estadistica
Ejercicios estadisticaEjercicios estadistica
Ejercicios estadistica
 
Distribucion muestral de proporciones
Distribucion muestral de proporcionesDistribucion muestral de proporciones
Distribucion muestral de proporciones
 
Teorema del limite central
Teorema del limite centralTeorema del limite central
Teorema del limite central
 
Coeficiente de asimetría de pearson
Coeficiente de asimetría de pearsonCoeficiente de asimetría de pearson
Coeficiente de asimetría de pearson
 
14 prueba chi cuadrado
14 prueba chi cuadrado14 prueba chi cuadrado
14 prueba chi cuadrado
 

Similaire à Chi cuadrado (20)

Juan ruales estadistica
Juan ruales estadisticaJuan ruales estadistica
Juan ruales estadistica
 
El chi cuadrado
El chi cuadradoEl chi cuadrado
El chi cuadrado
 
Deber chi cuadrado
Deber chi cuadradoDeber chi cuadrado
Deber chi cuadrado
 
Deber chi cuadrado
Deber chi cuadradoDeber chi cuadrado
Deber chi cuadrado
 
Tarea chi cuadrado
Tarea chi cuadradoTarea chi cuadrado
Tarea chi cuadrado
 
Deber chi cuadrado
Deber chi cuadradoDeber chi cuadrado
Deber chi cuadrado
 
Deber chi cuadrado (2)
Deber chi cuadrado (2)Deber chi cuadrado (2)
Deber chi cuadrado (2)
 
proytecto 044.docx
proytecto 044.docxproytecto 044.docx
proytecto 044.docx
 
Estadisticadocx
EstadisticadocxEstadisticadocx
Estadisticadocx
 
Pruebas de bondad de ajuste
Pruebas de bondad de ajustePruebas de bondad de ajuste
Pruebas de bondad de ajuste
 
Entregar pruebas de bondad de ajuste
Entregar pruebas de bondad de ajusteEntregar pruebas de bondad de ajuste
Entregar pruebas de bondad de ajuste
 
Metodos no parametricos ji cuadrado anexo
Metodos no parametricos ji cuadrado anexoMetodos no parametricos ji cuadrado anexo
Metodos no parametricos ji cuadrado anexo
 
Estadistica 8
Estadistica 8Estadistica 8
Estadistica 8
 
Estadística bivariada ejercicio 1
Estadística bivariada ejercicio 1Estadística bivariada ejercicio 1
Estadística bivariada ejercicio 1
 
Informe estadistica bivariada
Informe estadistica bivariadaInforme estadistica bivariada
Informe estadistica bivariada
 
Chi cuadrada
Chi cuadradaChi cuadrada
Chi cuadrada
 
Trabajo 11
Trabajo 11Trabajo 11
Trabajo 11
 
Prueba de hipotesis
Prueba de hipotesisPrueba de hipotesis
Prueba de hipotesis
 
Prueba de hipotesis 2018 final
Prueba de hipotesis 2018 finalPrueba de hipotesis 2018 final
Prueba de hipotesis 2018 final
 
Aplicaciones x2 u38
Aplicaciones x2 u38Aplicaciones x2 u38
Aplicaciones x2 u38
 

Plus de deicycumbal

Prueba de hipotesis subir
Prueba de hipotesis  subirPrueba de hipotesis  subir
Prueba de hipotesis subirdeicycumbal
 
Revista lideres segunda
Revista lideres segundaRevista lideres segunda
Revista lideres segundadeicycumbal
 
Metodos de valoracion
Metodos de valoracionMetodos de valoracion
Metodos de valoraciondeicycumbal
 
Estadistica tarea
Estadistica tareaEstadistica tarea
Estadistica tareadeicycumbal
 
Obligación tributaria aduanera
Obligación tributaria aduaneraObligación tributaria aduanera
Obligación tributaria aduaneradeicycumbal
 
Decomiso administrativo
Decomiso administrativoDecomiso administrativo
Decomiso administrativodeicycumbal
 
Importación de envíos de socorro
Importación de envíos de socorroImportación de envíos de socorro
Importación de envíos de socorrodeicycumbal
 
Portafolio imprimir estadistica (16 de mayo del 2012)
Portafolio imprimir estadistica  (16 de mayo del 2012)Portafolio imprimir estadistica  (16 de mayo del 2012)
Portafolio imprimir estadistica (16 de mayo del 2012)deicycumbal
 
Valoracion libro
Valoracion libroValoracion libro
Valoracion librodeicycumbal
 
Situación económica del pais frente al mundo
Situación económica del pais frente al mundoSituación económica del pais frente al mundo
Situación económica del pais frente al mundodeicycumbal
 
Cuestionario subir
Cuestionario subirCuestionario subir
Cuestionario subirdeicycumbal
 
Analisis del capitulo tres
Analisis del capitulo tresAnalisis del capitulo tres
Analisis del capitulo tresdeicycumbal
 
Mercados internacionales
Mercados internacionalesMercados internacionales
Mercados internacionalesdeicycumbal
 
Portafolio de finanzas
Portafolio de finanzasPortafolio de finanzas
Portafolio de finanzasdeicycumbal
 
Importancia de las finanzas internacionales
Importancia de las finanzas internacionalesImportancia de las finanzas internacionales
Importancia de las finanzas internacionalesdeicycumbal
 

Plus de deicycumbal (20)

Prueba de hipotesis subir
Prueba de hipotesis  subirPrueba de hipotesis  subir
Prueba de hipotesis subir
 
Manual spss
Manual spssManual spss
Manual spss
 
Necesidades
NecesidadesNecesidades
Necesidades
 
Chi cuadrado
Chi cuadradoChi cuadrado
Chi cuadrado
 
Revista lideres segunda
Revista lideres segundaRevista lideres segunda
Revista lideres segunda
 
Revista lideres
Revista lideresRevista lideres
Revista lideres
 
Metodos de valoracion
Metodos de valoracionMetodos de valoracion
Metodos de valoracion
 
Estadistica tarea
Estadistica tareaEstadistica tarea
Estadistica tarea
 
Obligación tributaria aduanera
Obligación tributaria aduaneraObligación tributaria aduanera
Obligación tributaria aduanera
 
Decomiso administrativo
Decomiso administrativoDecomiso administrativo
Decomiso administrativo
 
Importación de envíos de socorro
Importación de envíos de socorroImportación de envíos de socorro
Importación de envíos de socorro
 
Portafolio imprimir estadistica (16 de mayo del 2012)
Portafolio imprimir estadistica  (16 de mayo del 2012)Portafolio imprimir estadistica  (16 de mayo del 2012)
Portafolio imprimir estadistica (16 de mayo del 2012)
 
Finanzas grupo
Finanzas grupoFinanzas grupo
Finanzas grupo
 
Valoracion libro
Valoracion libroValoracion libro
Valoracion libro
 
Situación económica del pais frente al mundo
Situación económica del pais frente al mundoSituación económica del pais frente al mundo
Situación económica del pais frente al mundo
 
Cuestionario subir
Cuestionario subirCuestionario subir
Cuestionario subir
 
Analisis del capitulo tres
Analisis del capitulo tresAnalisis del capitulo tres
Analisis del capitulo tres
 
Mercados internacionales
Mercados internacionalesMercados internacionales
Mercados internacionales
 
Portafolio de finanzas
Portafolio de finanzasPortafolio de finanzas
Portafolio de finanzas
 
Importancia de las finanzas internacionales
Importancia de las finanzas internacionalesImportancia de las finanzas internacionales
Importancia de las finanzas internacionales
 

Chi cuadrado

  • 1. UNIVERSIDAD POLITECNICA ESTATAL DEL CARCHI FACULTAD DE COMERCIO INTERNACIONAL, INTEGRACIÓN, ADMINISTRACIÓN Y ECONOMÍA EMPRESARIAL ESCUELA DE COMERCIO EXTERIOR Y NEGOCIACIÓN COMERCIAL INTERNACIONAL TRABAJO DE ESTADISTICA INFERENCIAL EJERCICIOS CHI CUADRADO DEICY CUMBAL SEXTO NIVEL PARALELO “A” 2012
  • 2. TEMA: CHI-CUADRADO PROBLEMA: Desconocimiento del Chi- Cuadrado imposibilita la realización y desarrollo de ejercicios que a futuro utilizaremos. OBJETIVOS General Conocer y aplicar el CHI-CUADRADO en ejercicios planteados para tener un mejor desarrollo como profesionales en el futuro. Específicos: Fundamentar el Chi-cuadrado. Analizar la información obtenida sobre el CHI-CUADRADO. Realizar ejercicios planteados sobre el CHI-CUADRADO para aplicarlos en la carrera. JUSTIFICACIÓN El presente trabajo lo hemos realizado con la finalidad de aprender acerca del Chi-cuadrado, su concepto y los ejercicios que se pueden desarrollar, para conocer lo fundamental que ayudara en la carrera de comercio exterior y como profesionales en este campo. Además se reforzará los conocimientos y así como resolver ejercicios sobre CHI-CUADRO aplicando la fórmula en ejercicios de nuestra carrera.
  • 3. 5.- MARCO TEORICO CHI-CUADRADO En una prueba de ajuste la hipótesis nula establece que una variable X tiene una cierta distribución de probabilidad con unos determinados valores de los parámetros. (Arvelo, 1998) El tipo de distribución se determina, según los casos, en función de: La propia definición de la variable, consideraciones teóricas al margen de esta y/o evidencia aportada por datos anteriores al experimento actual. (Arvelo, 1998) A menudo, la propia definición del tipo de variable lleva implícitos los valores de sus parámetros o de parte de ellos; si esto no fuera así dichos parámetros se estimarán a partir de la muestra de valores de la variable que utilizaremos para realizar la prueba de ajuste. (Arvelo, 1998) Como en casos anteriores, empezaremos definiendo las hipótesis. Hipótesis nula: X tiene distribución de probabilidad f(x) con parámetros y1,..., yp Hipótesis alternativa: X tiene cualquier otra distribución de probabilidad. Es importante destacar que el rechazo de la hipótesis nula no implica que sean falsos todos sus aspectos sino únicamente el conjunto de ellos; por ejemplo, podría ocurrir que el tipo de distribución fuera correcto pero que nos hubiésemos equivocado en los valores de los parámetros. (Arvelo, 1998) Obviamente, necesitaremos una muestra de valores de la variable X. Si la variable es discreta y tiene pocos valores posible estimaremos las probabilidades de dichos valores mediante sus frecuencias muéstrales; si la variable es continua o si es una discreta con muchos o infinitos valores estimaremos probabilidades de grupos de valores (intervalos). (Arvelo, 1998) Metodológicamente, la prueba se basa en la comparación entre la serie de frecuencias absolutas observadas empíricamente para los valores de la variable (Oi) y las correspondientes frecuencias absolutas teóricas obtenidas
  • 4. en base a la función de probabilidad supuesta en la hipótesis nula (Ei). (Arvelo, 1998) Así pues, una vez calculadas las frecuencias absolutas de cada valor o intervalo de valores, obtendremos el número total de observaciones de la muestra (T) sumando las frecuencias observadas (Arvelo, 1998) Para calcular las frecuencias esperadas repartiremos este número total de observaciones (T) en partes proporcionales a la probabilidad de cada suceso o grupo de sucesos. (Arvelo, 1998). Para ello calcularemos dichas probabilidades utilizando la función de probabilidad definida en la hipótesis nula f(x), de modo que, cada valor Ei tendrá la siguiente expresión: Por tanto, tendremos los siguientes datos para la prueba: Valor de la variable x1 x2 x3 ... xi ... xk Frecuencias observadas O1 O2 O3 ... Oi ... Ok Frecuencias esperadas E1 E2 E3 ... Ei ... Ek Si la hipótesis nula es cierta, las diferencias entre valores observados y esperados (que siempre existirán por tratarse de una muestra aleatoria) son atribuibles, exclusivamente, al efecto del azar. En estas condiciones, se puede calcular un parámetro que depende de ambos, cuya distribución se ajusta a una CHI-CUADRADO. (Arvelo, 1998)
  • 5. Si, por el contrario, la hipótesis nula fuera falsa los Ei ya no serían, realmente, los valores esperados de las frecuencias; por tanto, las diferencias entre los valores "esperados" y los observados reflejarían no sólo el efecto del azar sino también las diferencias entre los Ei y la auténtica serie de valores esperados (desconocida) Como consecuencia, las diferencias de los numeradores de la expresión anterior tienden a ser más grandes y, por estar elevadas al cuadrado, la suma de cocientes ser positiva y mayor que lo que se esperaría para los valores de una CHI-CUADRADO. (Arvelo, 1998) Por tanto, el parámetro anterior será el estadístico de contraste de la prueba de hipótesis y la región crítica se encontrar siempre en la cola derecha de la distribución CHI-CUADRADO. Evidentemente, esta prueba será siempre de una sola cola. (Arvelo, 1998) Estadístico de contraste Se acepta la hipótesis nula si , el percentil 1 – α de la distribución CHI-CUADRADO con grados de libertad. Cabe señalar que en las pruebas CHI-CUADRADO lo corriente es que pretendamos comprobar que una variable tiene una cierta distribución y, por tanto, habitualmente, nos vemos obligados a colocar nuestra propia hipótesis en la hipótesis nula. Únicamente podremos colocar nuestra hipótesis en la alternativa en el caso excepcional de que pretendamos demostrar que cierto tratamiento produce una distorsión de la distribución básica de la variable en estudio. (Arvelo, 1998) El número de grados de libertad de la variable CHI-CUADRADO se calcula de la siguiente forma: A priori, tendrá tantos grados de libertad como parejas frecuencia observada - frecuencia esperada. (Arvelo, 1998)
  • 6. A esta cantidad se debe restar el número de restricciones lineales impuestas a las frecuencias observadas, es decir, el número de parámetros que es necesario calcular directamente a partir de los valores observados para establecer los valores esperados. Este número es, como mínimo, uno ya que siempre tendremos que calcular el número total de observaciones de la muestra. (Arvelo, 1998) Una condición básica para que podamos llevar a cabo una prueba CHI- CUADRADO es que las frecuencias de las distintas clases deben ser suficientemente altas como para garantizar que pequeñas desviaciones aleatorias en la muestra no tengan importancia decisiva sobre el valor del estadístico de contraste. (Arvelo, 1998). (Arvelo, 1998) Las reglas que determinan cuando es posible o no realizar el contraste varían mucho de unos autores a otros. En un extremo de máxima rigidez se encuentran aquellos que opinan que no se puede realizar la prueba cuando alguna de las frecuencias, observadas o esperadas, sea menor que 5. En el otro extremo se encuentran quienes opinan que, para que la prueba sea viable ninguna de las frecuencias esperadas debe ser menor que 1 y no más del 25% pueden ser menores que 5; en lo que refiere a las frecuencias observadas no existirían límites. La autora de este texto simpatiza más con la segunda postura, no sólo por razones prácticas, sino porque lo razonable es que la distribución esperada esté adecuadamente definida y, por tanto, no debe incluir valores muy bajos; sin embargo, los valores extremos en la distribución observada simplemente reflejan diferencias importantes entre la distribución supuesta por la hipótesis nula y la real. (Arvelo, 1998) Sea cual sea el criterio que elijamos, si resultara que la prueba no es viable podríamos recurrir a englobar los valores o clases de valores con sus vecinos más próximos y pasar así a engrosar sus frecuencias. Este procedimiento no puede llevarse hasta el absurdo pero proporciona una salida digna a situaciones complejas. En casos excepcionales se pueden englobar valores que no sean vecinos porque exista algún nexo lógico de conexión entre ellos. (Arvelo, 1998)
  • 7. Cuando sea necesario agrupar valores, los grados de libertad no se deben calcular hasta que tengamos establecidas definitivamente las parejas de frecuencias observadas y esperadas con las que calcularemos el estadístico de contraste. (Arvelo, 1998) EJERCICIOS EJERCICIO 1.- 1.- Un jugador quiere probar que es legal el dado con el que juega. Tiro el dado 120 veces y obtuvo la siguiente distribución de frecuencias de las caras resultantes. RESULTADO 1 2 3 4 5 6 FRECUENCIA 15 25 33 17 16 14 a) Enuncie las hipótesis de la prueba y determine las frecuencias esperadas. b) Describa la estadística de la prueba c) Determine la región crítica de la prueba al nivel de significación del 5%. d) ¿A qué conclusión llega usando el nivel de significación 0,05? e) Determine la probabilidad P. 1.- Ho: El dado es legal. Ha: El dado no es legal. 2.- Es de dos colas. 3.- Nivel de confianza 4.- gl= k-1 gl=6-1 gl=5 5.-
  • 8. Zona aceptación 11,07 6.- Ei 20 20 20 20 20 20 Oi 15 25 33 17 16 14 7.- Se acepta la hipótesis alternativa y se rechaza la hipótesis nula, es decir el dado del jugador no es legal ya que se encuentra dentro de la zona de rechazo. EJERCICIO 2.- 2.- El gerente de ventas de una compañía P&C afirma que todos sus vendedores realizan el mismo número de visitas durante el mismo período de tiempo. Una muestra aleatoria de 5 registros de los vendedores en una semana dada reveló el siguiente número de visitas. Vendedor A B C D E Número de visitas 23 29 25 23 30
  • 9. Con el nivel de significación de 0.05, ¿es razonable aceptar la afirmación del gerente? 1) : hacen el mismo número de visitas : hacen menor número de visitas 2) Gráfica: unilateral y cola a la derecha 3) Nivel de significación 0.05 4) Variables cualitativas → chi cuadrado 5) gl = k-1 gl = 5-1 = 4 = 9,49 6) 26 26 26 26 26 23 29 25 23 30 7) Acepta la hipótesis nula por que realizan el mismo número de visitas EJERCICIO 3.-
  • 10. 3.- El gerente de personal de la compañía de “REXA” quiere probar la hipótesis que hay diferencias significativas de tardanzas de los diferentes días de la semana. De los registros de asistencia obtuvo la siguiente tabla de tardanzas de su personal para cada uno de los días de la semana: DIAS LUNES MARTES MIERCOLES JUEVES VIERNES TARDANZAS 58 39 75 48 80 ¿Se puede aceptar la hipótesis del gerente con un nivel de significación de 0.05? 1.- HO = El número de tardanzas en el mismo cada día 2.- La prueba es unilateral de una cola 3.- Nivel de significancia del =0.05 4.-Utilizamos la prueba del CHI-CUADRADO 5.- z. rechazo z. aceptación 9.488 gl=K-1 gl= 5-1 gl=4
  • 11. x2=9.488 6. - frecuencias esperadas Xi 58 39 75 48 80 300 =60 60 60 60 60 60 58 39 75 48 80 X2= = 20.232 7.- Se rechaza la hipótesis nula y se acepta la hipótesis alternativa debido a que hay tardanzas del personal en cada día de la semana ya que llegan puntuales a la compañía REXA. EJERCICIO 4.- 4.- De una muestra de turistas que se hospedan en el hotel “ EL PALMER” se recogió sus opiniones acerca de los servicios del hotel, resultando los siguientes datos:
  • 12. PESIMA MALA REGULAR BUENA MUY BUENA EXCELENTE TURISTAS 20 25 40 54 56 Pruebe con un nivel de significación del 5%, la hipótesis nula de que no hay diferencias significativas entre las opciones de los turistas. 1.- HO = no hay diferencias significativas en las opiniones 2.- La prueba es unilateral de una cola 3.- Nivel de significancia del =0.05 4.- Utilizamos la prueba del CHI-CUADRADO 5.- z. rechazo z. aceptación 9.488 gl=K-1 gl= 5-1 gl=4 x2=9.488
  • 13. 6. FRECUENCIA ESPERADAS Xi 20 25 40 54 56 195 =39 39 39 39 39 39 20 25 40 54 56 X2= = 27.486 7.- La hipótesis nula se rechaza porque, no hay diferencias significativas en las opiniones de los turistas. Ejercicio 5 En un día se observó el número de conductores que escogieron cada una de las diez casetas de pago de peaje ubicadas a la salida al sur. Los datos se registraron en l siguiente tabla: Caseta # 1 2 3 4 5 6 7 8 9 10 # de 580 700 730 745 720 710 660 655 670 490 conductores Presentan estos datos suficiente evidencia para concluir que hay casetas preferidas?. Utilice el nivel de significancia del 5%
  • 14. Pasos: 1) Ho: No existen las casetas preferidas Ha: Existen casetas preferidas 2) la prueba es unilateral con una cola hacia la derecha. 3) nivel de significancia del 0.5 4) utilizar el Chi cuadrado. 5) grafica gl= k-1 gl= 10-1=9 Tabla obtenemos 16,919 6) calculo estadístico Ei 666 666 666 666 666 666 666 666 666 666 Oi 580 700 730 745 720 710 660 655 670 490 (9) = (9) = + + + + + + + + + = 82,42
  • 15. 7) Se rechaza la hipótesis nula y se acepta la alternativa que propone que si existen preferencias en las casetas del cobro de peaje. Ejercicio 6 Un ejecutivo de hipermercado “TOD” afirma que las compras se pagan 30% con cheques, 45% con efectivo y 25% con tarjeta de crédito. En una muestra aleatoria de 400 compradores se encontró q 110 de ellos pagaron con cheques, 210 con efectivo y 80 con tarjetas ¿puede usted concluir con la significación de 0,05 que la afirmación del ejecutivo es razonable? 30% cheque 45% efectivo 25% tarjeta de crédito N= 400 110 cheques 210 efectivos 80 tarjetas 1) Ho: los pagos guardan relación Ha: los pagos no guardan relación entre si 2) la prueba es unilateral con una cola hacia la derecha. 3) nivel de significancia del 0.05 4) utilizar el Chi cuadrado. 5) grafica gl= k-1 gl= 3-1=2 Tabla obtenemos 5,991
  • 16. 6) calculo estadístico Ei 120 180 100 Oi 110 210 80 (2) = (2) = + + = 9,83 7) se rechaza la hipótesis nula y se acoge la alternativa que manifiesta que los pagos con tarjeta, cheque o efectivo no guardan ninguna relación entre si. EJERCICIO 7.- Una maquina llena latas con 300 caramelos de sabores: Piña, Fresa, Limón y Naranja en la relación: 4:3:2:1. Si en una lata de estos caramelos se encontró; 115 de piña, 95 de fresa, 70 de limón, y 20 de naranja, pruebe la hipótesis de que la maquina está mezclando en la relación: 4;3;2;1 al nivel de significación de 0.05. SABORES PIÑA FRESA LIMON NARANJA TOTAL RELACION 4 3 2 10 10 CANTIDAD 115 95 70 20 300 TOTAL 119 98 72 21 316 1) = la maquina esta mesclado en la relación 4:3:2:1 2) La prueba es unilateral de una cola 3) Nivel de significación 0.05 4) Utilizamos CHI- CUADRADO
  • 17. 7.815 gl= (f -1) (c- 1) gl= (2-1)(4-1) gl=3 X= 7.815 5) = 300 X 40 =120 = 300 X 30 =90 = 300 X 20=60 = 300 X 10=30 120 90 60 30 115 95 70 20 = + = 5.496
  • 18. 6) TOMA DE DECICIONES Como se puede ver aceptamos la hipótesis nula y desechamos la hipótesis alternativa y que la maquina mezcladora tiene relación entre 4:3:2:1. EJERCICIO.- 8 Se cree que las personas que mueren por sobredosis de narcóticos son generalmente jóvenes. Para comprobar esta hipótesis se ha obtenido la siguiente distribución del número de muertes por sobredosis. EDAD 15 - 19 20 - 24 25 - 29 30 - 34 35 - 39 40 O MAS NUMERO 31 44 27 39 41 28 DE MUERTES Con estos resultados y con un nivel de significación de 0.05. ¿Se puede concluir, empleado, que muere un número igual de personas en cada categoría? 1) = Muere igual el número de personas en cada categoría 2) La prueba es unilateral de una cola 3) Nivel de significación 0.05 4) Utilizamos CHI- CUADRADO 5) 11.070 gl= K -1 = 6-1= 5
  • 19. = 11.070 6) 35 35 35 35 35 35 31 44 27 39 41 28 = + = 0.46+2.31+1.83+0.46+1.03+1.4 = 7.486 6) TOMA DECISIONES Se acepta la hipótesis nula y se rechaza la hipótesis alternativa y que le número de muertos es igual al número de personas por categoría. EJERCICIO 9.- 9. Un investigador escogió una muestra aleatoria de 192 familias con 4 hijos y encontró la siguiente distribución de frecuencias del número de hijos varones: Número de 0 1 2 3 4 varones Número de 18 42 64 40 28 familias
  • 20. Él quiere probar la hipótesis de que los nacimientos de varones y mujeres son igualmente probables. Esto es, quiere probar que la distribución de estos datos se aproxima a una distribución binomial. Enuncie la hipótesis de la prueba y obtenga las frecuencias esperadas. Describa la estadística de la prueba Determine la región critica de la prueba al nivel de significación del 5% A que conclusión llega usando el nivel de significación 0.05 Determine el nivel de significación de la prueba (calcule probabilidad:P) 1) H0: la distribución de nacimiento de varones y mujeres son igualmente probables. H1: la distribución de nacimientos de varones y mujeres no son igualmente probables. 2) La prueba es unilateral y de cola derecha 3) Nivel de significación 0.05 4) Emplearemos la distribución maestral del CHI-CUADRADO 5) Gl= k-1 Gl=5-1=4 9.48 6) Ei 38.4 38.4 38.4 38.4 38.4 Oi 18 42 64 40 28 Cálculo de las frecuencias esperadas
  • 21. 1. Toma de decisiones Aceptamos la Ha y rechazamos la Ho. Esto significa que los nacimientos de varones y mujeres no son igualmente probables.
  • 22. EJERCICIO 10.- 10. Se lanzaron 200 veces 5 monedas y en cada tirada se contaron el número de caras. Los resultados de este experimento son los siguientes: Número de caras 0 1 2 3 4 5 Número de 3 15 55 60 40 27 tiradas Pruebe la hipótesis de que la distribución del número de caras se ajusta a una distribución binominal. Use el nivel de significación del 1% 1) H0: la distribución del número de caras se ajusta a la distribución. H1: la distribución del número de caras no se ajusta a la distribución. 2) La prueba es unilateral y de cola derecha 3) Nivel de significación 1% = 0.01 4) Emplearemos la distribución muestral del CHI-CUADRADO 5) Gl= k-1 Gl=6-1=5 15.086 6) Ei 33.33 .3333, 33.33 33.33 33.33 33.33 Oi 3 15 55 60 40 27
  • 23. 1. Cálculo del Estadístico de la Prueba 7.- Toma de decisiones Aceptamos la Ha y rechazamos la Ho. La distribución del número de caras se ajusta a una distribución binomial. CONCLUSIONES:  Mediante el presente trabajo hemos podido conocer y aplicar sobre la distribución de Chi-Cuadrado, además hemos aprendido sobre las relaciones que existen entre las variables dentro de un problema.  Con el desarrollo de varios problemas con respecto al tema hemos podido practicar y aprender las relaciones existentes: relación infinita, positiva perfecta, negativa imperfecta, nula etc.  La aplicación de Chi cuadrado puede ser compleja en cuanto a la determinación de las hipótesis, pero son de suma importancia para determinar la aceptación o rechazo de ellas.
  • 24. RECOMENDACIONES:  Es de vital ayuda poner en práctica los conocimientos aprendidos ya que nos servirán dentro de nuestra carrera y el desarrollo de la problemática que en ella se engloba.  Es necesario identificar el Chi cuadrado dentro de las variables porque estas se aplican para el desarrollo de proyectos.  Proponer ejercicios mediante la distribución del chi cuadrado en función a las actividades del comercio exterior y así lograr una mayor comprensión. CRONOGRAMA SEMANA ACTIVIDAD 1 2 3 4 5 DISEÑO DEL PROYECTO x ELABORACIÓN DEL PROYECTO x DESARROLLO DEL PROYECTO x INFORME FINAL x ENTREGA DEL x PROYECTO BIBLIOGRAFÍA Aldape, A., & Toral, C. (2005). Matemáticas 2. México: PROGRESO S.A. Altamirano, E. (2007).
  • 25. Anderson, D. R. (2005). Estadística para Administración y Economía. México: Cengage Learning. Diaz, R. G. (2008). Unidades fundamentales . Enríquez, H. (2002). Fundamentos de Electricidad. México: LIMUSA S.A. Física, E. d. (1997). Brian Mckittrick. Madrid: Reverté S.A. García, M. A. (2000). Estadística Avanzada con el Paquete Systat. Murcia: I.S.B.N. J.R, W. D. (20007). Ciencias e Ingenieria de las Materias . ANEXOS: 1) Un camión lleva al país de destino 200 productos perecibles como: manzanas, Limón y Naranja y mangos en la relación: 4:3:2:1. Si en el camión en se encontró; 115 de piña, 95 de fresa, 70 de limón, y 20 de naranja, pruebe la hipótesis que el camión tiene relación: 4;3;2;1 al nivel de significación de 0.05. PRODUCTOS MANZANAS LIMON NARANJA MANGOS TOTAL PERECIBLES RELACION 4 3 2 10 10 CANTIDAD 115 95 70 20 300 TOTAL 119 98 72 21 316 1) = el camión tiene relación: 4;3;2;1 2) La prueba es unilateral de una cola 3) Nivel de significación 0.05 4) Utilizamos CHI- CUADRADO
  • 26. 7.815 gl= (f -1) (c- 1) gl= (2-1)(4-1) gl=3 X= 7.815 5) = 300 X 40 =120 = 300 X 30 =90 = 300 X 20=60 = 300 X 10=30 120 90 60 30 115 95 70 20
  • 27. = + = 5.496 6) TOMA DE DECICIONES Como se puede ver aceptamos la hipótesis nula y desechamos la hipótesis alternativa y el camión tiene relación: 4;3;2;1 2) En un día se observó el número de conductores que pasan por el puente de rumichaca . Los datos se registraron en l siguiente tabla: 1 2 3 4 5 6 7 8 9 10 # de 580 700 730 745 720 710 660 655 670 490 conductores Presentan estos datos suficiente evidencia para concluir que hay casetas preferidas?. Utilice el nivel de significancia del 5%. Pasos: 1) Ho: No existen las casetas preferidas Ha: Existen casetas preferidas 2) la prueba es unilateral con una cola hacia la derecha. 3) nivel de significancia del 0.5 4) utilizar el Chi cuadrado. 5) grafica gl= k-1 gl= 10-1=9 Tabla obtenemos 16,919
  • 28. 6) calculo estadístico Ei 666 666 666 666 666 666 666 666 666 666 Oi 580 700 730 745 720 710 660 655 670 490 (9) = (9) = + + + + + + + + + = 82,42 7) Se rechaza la hipótesis nula y se acepta la alternativa que propone que si existen preferencias en las casetas del cobro de peaje para conductores que pasan en el puente de rumichaca pasando mercadería 3) En un estudio realizado en el departamento comercio exterior se aplicó: Una encuesta a los exportadores cuanto exportan en toneladas, obteniendo los resultados que presenta la siguiente tabla Exportación en toneladas Exportación 1 mes 2 meses 3 meses total Alto 32 225 50 307 Bajo 28 290 79 397 Total 60 515 129 704 Al nivel de significación Q=0.05, determinar que las variables perjuicio étnico hacia el negro y lugar de residencia son independientes 1. Ho: el departamento de comercio exterior y los exportadores
  • 29. H1: existe dependencia entre las variables. 2. La prueba es unilateral y la cola derecha 3. Asumimos el nivel de significación de Q= 0.05 4. Utilizaremos la distribución muestral de chi-cuadrado porque las dos variables son cualitativas. 5. Esquema de la prueba Gl =(C-1) (F-1) 1.1.3.4 Gl=(3-1) (2-1) = 2 11.3.4 Gl= 2 Q= 0.05 X2 = (2) = 5.991 C= # de columnas F= # de filas 6. Calculo del estadístico de la prueba x= 3.54 5.991 Formula 2 X2= 3.54 Ya conocemos las frecuencias observadas para determinar las frecuencias esperadas emplearemos la misma tabla, manteniendo invariables de frecuencias marginales de dos variables Exportación en toneladas exportacion 1 mes 2 meses 3 meses total Alto E11 E12 E13 307 Bajo E21 E22 E23 397 Total 60 515 129 704
  • 30. Cuando las variables X y Y son independientes, las frecuencias de cada celda son igual al productos de las frecuencias marginales correspondientes dividido por el tamaño de la muestra. 26.16 224.58 56.25 32 225 50 33.84 290.42 72.75 28 290 79 Las frecuencias esperadas y las asociadas determinan las frecuencias observadas anteriormente 4) En la exportación de naranjas, la empresa exportadora envía mensualmente lotes de 50 cajas al exterior, cada caja tiene un peso aproximado de 20 kilos. Las cajas son previamente almacenadas. Para el control de calidad se examinan al azar, si en alguna caja encuentran por lo menos una naranja malograda, esta es calificada mala. Para que pase el control mediante la inspección de la muestra no debe haber caja malograda, si solo e x i s t e u n a c a j a e s t a s e r á c a m b i a d a , s i h a y m á s d e 1
  • 31. e n las 5 inspeccionadas, inspeccionaran las cincuenta cajas. Según las estadísticas pasadas de un total de 40 envíos, registro lo siguiente: Se puede afirmar que la variable número de cajas en mal estado en la muestra de 5 sigue una distribución Binomial?. manzanas Rojas verdes ambos Grandes 3 5 5 13 Medianas 5 4 8 17 pequeñas 7 9 6 22 total 15 18 19 52 1) H0: La variable número de cajas sigue una distribución Binomial. Ha: No siguen una Binomial. 2) La prueba es unilateral y de una cola derecha 3) Nivel de significación 0.10 4) Utilización del chi cuadrado 5) Esquema de la prueba Gl = (c-1) (f-1) = (3-1) (3-1) =4 α = 0.10 En la tabla de CHI CUADRADA obtenemos X2 (4) = 7.779 6) Calculo del estadístico de la prueba
  • 32. Calculo de las pruebas esperadas. manzanas Rojas verdes ambos Grandes 3.75 4.5 4.75 13 3 5 5 Medianas 4.90 5.88 6.21 5 17 4 8 pequeñas 6.35 7.62 8.04 7 9 6 22 total 15 18 19 52
  • 33. = 0.15+ 0.06+ 0.01+ 0.002+0.60+0.52+ 0.07+ 0.25+ 0.52 =2.182 7) ZA ZR 2.182 7.779 ZA= aceptamos la hipótesis nula porque La variable número de cajas sigue una distribución Binomial. 5) En Tulcán se realiza un estudio si es factible la creación de una Bodega , para la cual se aplicó una encuesta a las personas que se dedican al comercio exterior, obteniéndose los resultados que se presentan a continuación: Actividad de Comercio Exterior Factibilidad Importadores Exportadores Agentes de Total Aduana Si 18 20 38 76 No 12 8 14 34 Total 30 28 52 110
  • 34. Al nivel de significación α= 0.05, determinar que las variables factibilidad de creación de Zona Franca y actividad de comercio exterior son independientes. a) Ho= factibilidad de creación de Zona Franca y la actividad de comercio exterior son independientes; H1=existe dependencia entre las dos variables. b) La prueba es unilateral y de cola derecha. c) Asumimos el nivel de significación de α= 0.05 d) Utilizaremos la distribución muestral de Chi-cuadrado porque las dos variables son cualitativas e) gl= (C-1)(F-1) gl= (3-1)(2-1) = 2 α= 0.05 x2(2)=5.991 f) Actividad de Comercio Exterior Factibilidad Importadores Exportadores Agentes de Total Aduana Si E11 E12 E13 76 No E21 E22 E23 34 Total 30 28 52 110
  • 35. Ei 20,73 19,35 35,93 Oi 18 20 38 9,27 8,65 16,07 12 8 14 g) Vemos que el valor se encuentra en la zona de aceptación por lo tanto aceptamos la Ho. 6) Los estudiantes de comercio exterior quiere determinar si la creación de una empresa de contenedores para el Transporte de exportaciones e importaciones entre Ecuador y Perú. EMPRESA DE ALQUILER DE CONTENEDORES Grado de Transportistas Empresas de Exportadores Importadores TOTAL perjuicio transporte Están de 392 222 331 123 1068 acuerdo No Están 122 324 122 323 891 de acuerdo TOTAL 514 546 453 446 1959
  • 36. El nivel de significancia es de α=0.05 determinar las variables de la aceptabilidad de la creación de la empresa. 1). la aceptabilidad de la creación de la empresas. Existe aceptabilidad. 2). La prueba es unilateral y la cola es derecha. 3) Asumimos el nivel de significancia de α=0.05 4) Utilizaremos la distribución maestral de Ji-Cuadrado porque las dos variables son cualitativas. 5) Esquema de la prueba 6) Calculo del estadístico de la prueb EMPRESA DE DE ALQUILER DE CONTENEDORES Grado de Transportistas Empresas Exportadores Importadores TOTAL perjuicio 280.22 de 243,14 transporte Están de 392 297,66 331 246.96 123 1068 acuerdo 233,77 202,85 222 248,33 206,03 No Están 122 324 122 323 891 de acuerdo TOTAL 514 546 453 446 1959
  • 37. 6,62 7,815