SlideShare una empresa de Scribd logo
1 de 10
Descargar para leer sin conexión
Prueba de Bondad de Ajuste de
Kolmogorov-Smirnov (KS)
Hipótesis a contrastar:
H0: Los datos analizados siguen una distribución M.
H1: Los datos analizados no siguen una distribución M.
Estadístico de contraste:
0
1
ˆsup ( ) ( )n i i
i n
D F x F x
≤ ≤
= −
donde:
• xi es el i-ésimo valor observado en la muestra (cuyos
valores se han ordenado previamente de menor a mayor).
• ˆ ( )n iF x es un estimador de la probabilidad de observar
valores menores o iguales que xi.
• 0 ( )F x es la probabilidad de observar valores menores o
iguales que xi cuando H0 es cierta.
Así pues, D es la mayor diferencia absoluta observada entre la
frecuencia acumulada observada ˆ ( )nF x y la frecuencia
acumulada teórica 0 ( )F x , obtenida a partir de la distribución de
probabilidad que se especifica como hipótesis nula.
Si los valores observados ˆ ( )nF x son similares a los esperados
0 ( )F x , el valor de D será pequeño. Cuanto mayor sea la
discrepancia entre la distribución empírica ˆ ( )nF x y la distribución
teórica , mayor será el valor de D.
Por tanto, el criterio para la toma de la decisión entre las dos
hipótesis será de la forma:
Si D≤Dα ⇒ Aceptar H0
Si D>Dα ⇒ Rechazar H0
donde el valor Dα se elige de tal manera que:
( )
( )
0 0P H H
P D Dα α
=
= > =
Rechazar es cierta
Los datos siguen la distribucion M
siendo α el nivel de significación del contraste.
Para el cálculo práctico del estadístico D deben obtenerse:
0 0
1 1
1
max ( ) , max ( )i i
i n i n
i i
D F x D F x
n n
+ −
≤ ≤ ≤ ≤
−   
= − = −   
   
y a partir de estos valores:
{ }max ,D D D+ −
=
A su vez, el valor de Dα depende del tipo de distribución a probar
y se encuentra tabulado. En general es de la forma:
( )
c
D
k n
α
α =
donde cα y k(n) se encuentran en las tablas siguientes:
cαααα αααα
Modelo 0.1 0.05 0.01
General 1.224 1.358 1.628
Normal 0.819 0.895 1.035
Exponencial 0.990 1.094 1.308
Weibull n=10 0.760 0.819 0.944
Weibull n=20 0.779 0.843 0.973
Weibull n=50 0.790 0.856 0.988
Weibull n=∞ 0.803 0.874 1.007
DISTRIBUCIÓN QUE SE
CONTRASTA
k(n)
General. Parámetros conocidos. 0.11
( ) 0.12k n n
n
= + +
Normal
0.85
( ) 0.01k n n
n
= − +
Exponencial
0.11
( ) 0.12k n n
n
= + +
Weibull ( )k n n=
Ejemplo 1:
Determinar si los valores de la primera columna se conforman a una
distribución normal:
Y Y-ordenados Orden F Z Fo D+ D-
6.0 1.9 1 0.1 -1.628 0.051 0.049 0.051
2.3 2.3 2 0.2 -1.332 0.091 0.109 -0.009
4.8 3.3 3 0.3 -0.592 0.276 0.024 0.076
5.6 3.4 4 0.4 -0.518 0.302 0.098 0.002
4.5 4.5 5 0.5 0.296 0.616 -0.116* 0.216*
3.4 4.5 6 0.6 0.296 0.616 -0.016 0.116
3.3 4.8 7 0.7 0.518 0.698 0.002 0.098
1.9 4.8 8 0.8 0.518 0.698 0.102 -0.002
4.8 5.6 9 0.9 1.11 0.867 0.033 0.067
4.5 6.0 10 1.0 1.406 0.920 0.080 0.020
(media: 4.1 varianza: 1.82)
0.895 0.895
0.262
0.85 3.42
10 0.01
10
Dα = = =
− +
Como el valor D = 0.216 < 0.262, no se rechaza H0 y se acepta
que los datos se distribuyen normalmente.
Modo alternativo de realizar la prueba de Kolmogorov
Smirnov.
La toma de la decisión en el contraste anterior puede llevarse a
cabo también mediante el empleo del p-valor asociado al
estadístico D observado. El p-valor se define como:
( )0obsP D D H>p-valor = es cierta
Si el p-valor es grande significa que, siendo cierta la hipótesis
nula, el valor observado del estadístico D era esperable. Por
tanto no hay razón para rechazar dicha hipótesis. Asimismo, si el
p-valor fuera pequeño, ello indicaría que, siendo cierta la
hipótesis nula, era muy difícil que se produjera el valor de D que
efectivamente se ha observado. Ello obliga a poner muy en duda,
y por tanto a rechazar, la hipótesis nula. De esta forma, para un
nivel de significación α, la regla de decisión para este contraste
es:
Si p-valor ≥ α ⇒ Aceptar H0
Si p-valor < α ⇒ Rechazar H0
Obviamente, la obtención del p-valor requiere conocer la
distribución de D bajo la hipótesis nula y hacer el cálculo
correspondiente. En el caso particular de la prueba de
Kolmogorov Smirnov, la mayoría de los paquetes de software
estadístico realizan este cálculo y proporcionan el p-valor
directamente.
Ejemplo 2:
En los siguientes ejemplos se han simulado datos con distribución
exponencial o normal, contrastándose en todos los casos si puede
aceptarse que los datos siguen distribución exponencial. Se ha
acompañado al contraste con el histograma de los datos y el gráfico Q-Q
Plot (gráfico cuantil-cuantil: se representan los cuantiles de la distribución
teórica supuesta frente a los cuantiles de la distribución empírica. En un
buen ajuste, la gran mayoría de estos puntos deberían situarse sobre la
recta y=x)
Simulación de datos con distribución exponencial
n=1000
Histogram of x
x
Density
0.0 0.5 1.0 1.5 2.0 2.5
0.00.51.01.5
0.0 0.5 1.0 1.5 2.0 2.5
0123
x
qu
Kolmogorov Smirnov D = 0.030760 p-valor = 0.3004146
Q-Q Plot
Simulación de datos con distribución exponencial:
n=1000
Histogram of x
x
Density
0 1 2 3
0.00.51.01.5
0 1 2 3
0123
x
qu
Kolmogorov Smirnov D = 0.018285 p-valor = 0.8917437
Q-Q Plot
Simulación de datos con distribución exponencial
n=1000
Nótese que, en este caso, aunque los datos se han generado realmente
con distibución exponencial, el p-valor conduce a rechazar que ésta sea la
distribución de los datos.
Histogram of x
x
Density
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0.00.51.01.52.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0123
x
qu
Kolmogorov Smirnov D = 0.047714 p-valor = 0.02106549
Q-Q Plot
Simulación de datos con distribución normal
n=1000
En este caso, obviamente se rechaza que la distribución sea exponencial,
cosa que además se ve claramente en los gráficos.
Histogram of x
x
Density
-1 0 1 2
0.00.20.40.6
-1 0 1 2
0123
x
qu
Kolmogorov Smirnov D = 0.237 p-valor = 0
Q-Q Plot
Simulación de datos con distribución normal
n=10
En este caso, aunque los datos se han generado con distribución normal,
el contraste conduce a aceptar que siguen distribución normal. Ello se
debe a que en general cuando hay poca información (en este caso sólo
diez datos), la hipótesis nula tiende a no ser rechazada, salvo que haya
una evidencia abrumadora en su contra.
Histogram of x
x
Density
-1.0 -0.5 0.0 0.5 1.0
0.00.40.8
-0.5 0.0 0.5 1.0
0.00.40.81.2
x
qu
Kolmogorov Smirnov D = 0.33481 p-valor = 0.2122409
Q-Q Plot
Simulación de datos con distribución exponencial
n=10
Aquí ha ocurrido lo contrario al caso anterior; a pesar de que los datos son
originalmente exponenciales, el contraste rechaza que lo sean
Histogram of x
x
Density
0.0 0.5 1.0 1.5
0.00.40.8
0.2 0.4 0.6 0.8 1.0 1.2 1.4
0.00.40.81.2
x
qu
Kolmogorov Smirnov D = 0.54233 p-valor = 0.005575512
Q-Q Plot

Más contenido relacionado

La actualidad más candente

Derivadas parciales
Derivadas parcialesDerivadas parciales
Derivadas parcialesvlado1884
 
Distribuciones de probabilidad
Distribuciones de probabilidadDistribuciones de probabilidad
Distribuciones de probabilidadKassandra Gomez
 
Taller N°6 InterpolacióN Feb Jun2009
Taller N°6 InterpolacióN Feb Jun2009Taller N°6 InterpolacióN Feb Jun2009
Taller N°6 InterpolacióN Feb Jun2009EFRAIN VASQUEZ MILLAN
 
Taller N°5 Metodos Iterativos Algebra L Feb Jun2009
Taller N°5 Metodos Iterativos Algebra L Feb Jun2009Taller N°5 Metodos Iterativos Algebra L Feb Jun2009
Taller N°5 Metodos Iterativos Algebra L Feb Jun2009EFRAIN VASQUEZ MILLAN
 
Trabajo4 unidad2
Trabajo4 unidad2Trabajo4 unidad2
Trabajo4 unidad2alimacni
 
Taller N°7 TeríA De AproximacióN F J2009
Taller N°7 TeríA De AproximacióN F J2009Taller N°7 TeríA De AproximacióN F J2009
Taller N°7 TeríA De AproximacióN F J2009EFRAIN VASQUEZ MILLAN
 
Integrales impropias ucv (2021)
Integrales impropias   ucv (2021)Integrales impropias   ucv (2021)
Integrales impropias ucv (2021)Elsa Guédez
 
2 ecuaciones e inecuaciones con valor absoluto
2 ecuaciones e inecuaciones con valor absoluto2 ecuaciones e inecuaciones con valor absoluto
2 ecuaciones e inecuaciones con valor absolutoGino León
 
Segunda present.
Segunda present.Segunda present.
Segunda present.Nancy Leal
 
Trabajo4 unidad2
Trabajo4 unidad2Trabajo4 unidad2
Trabajo4 unidad2alimacni
 
Distribuciones de Probabilidad (Variable Aleatoria Continua)
Distribuciones de Probabilidad (Variable Aleatoria Continua)Distribuciones de Probabilidad (Variable Aleatoria Continua)
Distribuciones de Probabilidad (Variable Aleatoria Continua)Daniel Gómez
 
Ejercicio - Función cuadrática - Excel
Ejercicio - Función cuadrática - ExcelEjercicio - Función cuadrática - Excel
Ejercicio - Función cuadrática - ExcelHoracio181
 
Notacion cientifica
Notacion cientificaNotacion cientifica
Notacion cientificaDMITRIX
 
Ejemplos de distribucion de probabilidad
Ejemplos de distribucion de probabilidadEjemplos de distribucion de probabilidad
Ejemplos de distribucion de probabilidadadrikiana
 

La actualidad más candente (19)

T2preliminaresbinariosfeb Jun2009uc
T2preliminaresbinariosfeb Jun2009ucT2preliminaresbinariosfeb Jun2009uc
T2preliminaresbinariosfeb Jun2009uc
 
Derivadas parciales
Derivadas parcialesDerivadas parciales
Derivadas parciales
 
Ejemplos lm
Ejemplos lmEjemplos lm
Ejemplos lm
 
Distribuciones de probabilidad
Distribuciones de probabilidadDistribuciones de probabilidad
Distribuciones de probabilidad
 
Taller N°6 InterpolacióN Feb Jun2009
Taller N°6 InterpolacióN Feb Jun2009Taller N°6 InterpolacióN Feb Jun2009
Taller N°6 InterpolacióN Feb Jun2009
 
Taller N°5 Metodos Iterativos Algebra L Feb Jun2009
Taller N°5 Metodos Iterativos Algebra L Feb Jun2009Taller N°5 Metodos Iterativos Algebra L Feb Jun2009
Taller N°5 Metodos Iterativos Algebra L Feb Jun2009
 
Trabajo4 unidad2
Trabajo4 unidad2Trabajo4 unidad2
Trabajo4 unidad2
 
Taller N°7 TeríA De AproximacióN F J2009
Taller N°7 TeríA De AproximacióN F J2009Taller N°7 TeríA De AproximacióN F J2009
Taller N°7 TeríA De AproximacióN F J2009
 
Integrales impropias ucv (2021)
Integrales impropias   ucv (2021)Integrales impropias   ucv (2021)
Integrales impropias ucv (2021)
 
2 ecuaciones e inecuaciones con valor absoluto
2 ecuaciones e inecuaciones con valor absoluto2 ecuaciones e inecuaciones con valor absoluto
2 ecuaciones e inecuaciones con valor absoluto
 
Segunda present.
Segunda present.Segunda present.
Segunda present.
 
Trabajo4 unidad2
Trabajo4 unidad2Trabajo4 unidad2
Trabajo4 unidad2
 
T1preliminaresrcalculofeb Jun2009uc
T1preliminaresrcalculofeb Jun2009ucT1preliminaresrcalculofeb Jun2009uc
T1preliminaresrcalculofeb Jun2009uc
 
Int superficie
Int superficieInt superficie
Int superficie
 
Distribuciones de Probabilidad (Variable Aleatoria Continua)
Distribuciones de Probabilidad (Variable Aleatoria Continua)Distribuciones de Probabilidad (Variable Aleatoria Continua)
Distribuciones de Probabilidad (Variable Aleatoria Continua)
 
Ejercicio - Función cuadrática - Excel
Ejercicio - Función cuadrática - ExcelEjercicio - Función cuadrática - Excel
Ejercicio - Función cuadrática - Excel
 
Notacion cientifica
Notacion cientificaNotacion cientifica
Notacion cientifica
 
Ejemplos de distribucion de probabilidad
Ejemplos de distribucion de probabilidadEjemplos de distribucion de probabilidad
Ejemplos de distribucion de probabilidad
 
Distribuciones de probabilidad en minitab
Distribuciones de probabilidad en minitabDistribuciones de probabilidad en minitab
Distribuciones de probabilidad en minitab
 

Similar a prueba_de_bondad_de_ajuste_de_kolmogorov_smirnov

Chi cuadrado propiedades
Chi cuadrado propiedadesChi cuadrado propiedades
Chi cuadrado propiedadesPABLITO Pablo
 
Clase9
Clase9Clase9
Clase9mayejh
 
Ejercicios resueltos 1.pdf
Ejercicios resueltos 1.pdfEjercicios resueltos 1.pdf
Ejercicios resueltos 1.pdfhousegrj
 
Distribuciones de probabilidad continua
Distribuciones de probabilidad continuaDistribuciones de probabilidad continua
Distribuciones de probabilidad continuaLIZBETH IZA
 
Tarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirre
Tarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirreTarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirre
Tarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirreONG Institute
 
SEMANA12- CON. ANALISIS DE LA VARIANZA.pdf
SEMANA12- CON. ANALISIS DE LA VARIANZA.pdfSEMANA12- CON. ANALISIS DE LA VARIANZA.pdf
SEMANA12- CON. ANALISIS DE LA VARIANZA.pdfPabloTorres474113
 
Probabilidad y estadistica
Probabilidad y estadisticaProbabilidad y estadistica
Probabilidad y estadisticaKärIim Stark
 
Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1WilsonAdemirJinezInc
 

Similar a prueba_de_bondad_de_ajuste_de_kolmogorov_smirnov (20)

Ji cuadrada1
Ji cuadrada1Ji cuadrada1
Ji cuadrada1
 
Chi cuadrado propiedades
Chi cuadrado propiedadesChi cuadrado propiedades
Chi cuadrado propiedades
 
Clase9
Clase9Clase9
Clase9
 
Sol. 3ra PC 19-1.pdf
Sol. 3ra PC 19-1.pdfSol. 3ra PC 19-1.pdf
Sol. 3ra PC 19-1.pdf
 
Distribucion Binomial
Distribucion BinomialDistribucion Binomial
Distribucion Binomial
 
X cuadrada
X cuadradaX cuadrada
X cuadrada
 
Ejercicios resueltos 1.pdf
Ejercicios resueltos 1.pdfEjercicios resueltos 1.pdf
Ejercicios resueltos 1.pdf
 
Distribuciones de probabilidad continua
Distribuciones de probabilidad continuaDistribuciones de probabilidad continua
Distribuciones de probabilidad continua
 
Distribuciónes
DistribuciónesDistribuciónes
Distribuciónes
 
Clase02 distribuciones de probabilidad
Clase02   distribuciones de probabilidadClase02   distribuciones de probabilidad
Clase02 distribuciones de probabilidad
 
Tarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirre
Tarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirreTarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirre
Tarea ejemplos distribución chi cuadrado, ingrid alcayaga y rocío eyzaguirre
 
SEMANA12- CON. ANALISIS DE LA VARIANZA.pdf
SEMANA12- CON. ANALISIS DE LA VARIANZA.pdfSEMANA12- CON. ANALISIS DE LA VARIANZA.pdf
SEMANA12- CON. ANALISIS DE LA VARIANZA.pdf
 
Hipotesis
HipotesisHipotesis
Hipotesis
 
Estadistica soluciones
Estadistica solucionesEstadistica soluciones
Estadistica soluciones
 
Método Quasi-Newton
Método Quasi-NewtonMétodo Quasi-Newton
Método Quasi-Newton
 
Probabilidad y estadistica
Probabilidad y estadisticaProbabilidad y estadistica
Probabilidad y estadistica
 
Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1
 
Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1
 
Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1Problemas resueltos-de-dist-normal1
Problemas resueltos-de-dist-normal1
 
Distribucion normal completo
Distribucion normal completoDistribucion normal completo
Distribucion normal completo
 

Más de Universidad Tecnológica

Cómo resolver los desacuerdos en la música adventista
Cómo resolver los desacuerdos en la música adventistaCómo resolver los desacuerdos en la música adventista
Cómo resolver los desacuerdos en la música adventistaUniversidad Tecnológica
 
Meditaciones para la recepcion del sabado 2014
Meditaciones para la recepcion del sabado 2014Meditaciones para la recepcion del sabado 2014
Meditaciones para la recepcion del sabado 2014Universidad Tecnológica
 

Más de Universidad Tecnológica (20)

Debe un cristiano asistir al cine
Debe un cristiano asistir al cineDebe un cristiano asistir al cine
Debe un cristiano asistir al cine
 
Nace juan el bautista
Nace juan el bautistaNace juan el bautista
Nace juan el bautista
 
Los pozos de isaac
Los pozos de isaacLos pozos de isaac
Los pozos de isaac
 
La creacion
La creacionLa creacion
La creacion
 
Elias y la viuda
Elias y la viudaElias y la viuda
Elias y la viuda
 
El sermon del monte
El sermon del monteEl sermon del monte
El sermon del monte
 
David y goliat
David y goliatDavid y goliat
David y goliat
 
Daniel y el sueño del rey
Daniel y el sueño del reyDaniel y el sueño del rey
Daniel y el sueño del rey
 
Jesus llama a sus discipulos
Jesus llama a sus discipulosJesus llama a sus discipulos
Jesus llama a sus discipulos
 
Cómo resolver los desacuerdos en la música adventista
Cómo resolver los desacuerdos en la música adventistaCómo resolver los desacuerdos en la música adventista
Cómo resolver los desacuerdos en la música adventista
 
El arte de ser la mujer encantadora
El arte de ser la mujer encantadoraEl arte de ser la mujer encantadora
El arte de ser la mujer encantadora
 
El culto divino inspirador
El culto divino inspiradorEl culto divino inspirador
El culto divino inspirador
 
Libro el lenguaje de la musica
Libro el lenguaje de la musicaLibro el lenguaje de la musica
Libro el lenguaje de la musica
 
Meditaciones para la recepcion del sabado 2014
Meditaciones para la recepcion del sabado 2014Meditaciones para la recepcion del sabado 2014
Meditaciones para la recepcion del sabado 2014
 
Resurreccion especial
Resurreccion especialResurreccion especial
Resurreccion especial
 
Juicio previo a la venida de cristo
Juicio previo a la venida de cristoJuicio previo a la venida de cristo
Juicio previo a la venida de cristo
 
Campo minado por satanas
Campo minado por satanasCampo minado por satanas
Campo minado por satanas
 
Características de los 144000
Características de los 144000Características de los 144000
Características de los 144000
 
El caracter de los 144000
El caracter de los 144000El caracter de los 144000
El caracter de los 144000
 
Jose
JoseJose
Jose
 

Último

RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxAna Fernandez
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxzulyvero07
 
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxTECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxKarlaMassielMartinez
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónLourdes Feria
 
celula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamicacelula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamicaFlor Idalia Espinoza Ortega
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFAROJosé Luis Palma
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arteRaquel Martín Contreras
 
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxEXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxPryhaSalam
 
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024AndreRiva2
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.José Luis Palma
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMarjorie Burga
 
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdfDemetrio Ccesa Rayme
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...JonathanCovena1
 
programa dia de las madres 10 de mayo para evento
programa dia de las madres 10 de mayo  para eventoprograma dia de las madres 10 de mayo  para evento
programa dia de las madres 10 de mayo para eventoDiegoMtsS
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxMaritzaRetamozoVera
 
la unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscala unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscaeliseo91
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdfgimenanahuel
 

Último (20)

RETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docxRETO MES DE ABRIL .............................docx
RETO MES DE ABRIL .............................docx
 
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptxACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
ACUERDO MINISTERIAL 078-ORGANISMOS ESCOLARES..pptx
 
Repaso Pruebas CRECE PR 2024. Ciencia General
Repaso Pruebas CRECE PR 2024. Ciencia GeneralRepaso Pruebas CRECE PR 2024. Ciencia General
Repaso Pruebas CRECE PR 2024. Ciencia General
 
Presentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza MultigradoPresentacion Metodología de Enseñanza Multigrado
Presentacion Metodología de Enseñanza Multigrado
 
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptxTECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
TECNOLOGÍA FARMACEUTICA OPERACIONES UNITARIAS.pptx
 
Estrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcciónEstrategia de prompts, primeras ideas para su construcción
Estrategia de prompts, primeras ideas para su construcción
 
celula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamicacelula, tipos, teoria celular, energia y dinamica
celula, tipos, teoria celular, energia y dinamica
 
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARONARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
NARRACIONES SOBRE LA VIDA DEL GENERAL ELOY ALFARO
 
Historia y técnica del collage en el arte
Historia y técnica del collage en el arteHistoria y técnica del collage en el arte
Historia y técnica del collage en el arte
 
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptxEXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
EXPANSIÓN ECONÓMICA DE OCCIDENTE LEÓN.pptx
 
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024UNIDAD DPCC. 2DO. DE  SECUNDARIA DEL 2024
UNIDAD DPCC. 2DO. DE SECUNDARIA DEL 2024
 
Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.Clasificaciones, modalidades y tendencias de investigación educativa.
Clasificaciones, modalidades y tendencias de investigación educativa.
 
MAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grandeMAYO 1 PROYECTO día de la madre el amor más grande
MAYO 1 PROYECTO día de la madre el amor más grande
 
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdfPlanificacion Anual 4to Grado Educacion Primaria   2024   Ccesa007.pdf
Planificacion Anual 4to Grado Educacion Primaria 2024 Ccesa007.pdf
 
La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...La empresa sostenible: Principales Características, Barreras para su Avance y...
La empresa sostenible: Principales Características, Barreras para su Avance y...
 
programa dia de las madres 10 de mayo para evento
programa dia de las madres 10 de mayo  para eventoprograma dia de las madres 10 de mayo  para evento
programa dia de las madres 10 de mayo para evento
 
Medición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptxMedición del Movimiento Online 2024.pptx
Medición del Movimiento Online 2024.pptx
 
Sesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docxSesión de aprendizaje Planifica Textos argumentativo.docx
Sesión de aprendizaje Planifica Textos argumentativo.docx
 
la unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fiscala unidad de s sesion edussssssssssssssscacio fisca
la unidad de s sesion edussssssssssssssscacio fisca
 
30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf30-de-abril-plebiscito-1902_240420_104511.pdf
30-de-abril-plebiscito-1902_240420_104511.pdf
 

prueba_de_bondad_de_ajuste_de_kolmogorov_smirnov

  • 1. Prueba de Bondad de Ajuste de Kolmogorov-Smirnov (KS) Hipótesis a contrastar: H0: Los datos analizados siguen una distribución M. H1: Los datos analizados no siguen una distribución M. Estadístico de contraste: 0 1 ˆsup ( ) ( )n i i i n D F x F x ≤ ≤ = − donde: • xi es el i-ésimo valor observado en la muestra (cuyos valores se han ordenado previamente de menor a mayor). • ˆ ( )n iF x es un estimador de la probabilidad de observar valores menores o iguales que xi. • 0 ( )F x es la probabilidad de observar valores menores o iguales que xi cuando H0 es cierta. Así pues, D es la mayor diferencia absoluta observada entre la frecuencia acumulada observada ˆ ( )nF x y la frecuencia acumulada teórica 0 ( )F x , obtenida a partir de la distribución de probabilidad que se especifica como hipótesis nula. Si los valores observados ˆ ( )nF x son similares a los esperados 0 ( )F x , el valor de D será pequeño. Cuanto mayor sea la discrepancia entre la distribución empírica ˆ ( )nF x y la distribución teórica , mayor será el valor de D.
  • 2. Por tanto, el criterio para la toma de la decisión entre las dos hipótesis será de la forma: Si D≤Dα ⇒ Aceptar H0 Si D>Dα ⇒ Rechazar H0 donde el valor Dα se elige de tal manera que: ( ) ( ) 0 0P H H P D Dα α = = > = Rechazar es cierta Los datos siguen la distribucion M siendo α el nivel de significación del contraste. Para el cálculo práctico del estadístico D deben obtenerse: 0 0 1 1 1 max ( ) , max ( )i i i n i n i i D F x D F x n n + − ≤ ≤ ≤ ≤ −    = − = −        y a partir de estos valores: { }max ,D D D+ − = A su vez, el valor de Dα depende del tipo de distribución a probar y se encuentra tabulado. En general es de la forma: ( ) c D k n α α = donde cα y k(n) se encuentran en las tablas siguientes: cαααα αααα Modelo 0.1 0.05 0.01 General 1.224 1.358 1.628 Normal 0.819 0.895 1.035 Exponencial 0.990 1.094 1.308 Weibull n=10 0.760 0.819 0.944 Weibull n=20 0.779 0.843 0.973 Weibull n=50 0.790 0.856 0.988 Weibull n=∞ 0.803 0.874 1.007
  • 3. DISTRIBUCIÓN QUE SE CONTRASTA k(n) General. Parámetros conocidos. 0.11 ( ) 0.12k n n n = + + Normal 0.85 ( ) 0.01k n n n = − + Exponencial 0.11 ( ) 0.12k n n n = + + Weibull ( )k n n= Ejemplo 1: Determinar si los valores de la primera columna se conforman a una distribución normal: Y Y-ordenados Orden F Z Fo D+ D- 6.0 1.9 1 0.1 -1.628 0.051 0.049 0.051 2.3 2.3 2 0.2 -1.332 0.091 0.109 -0.009 4.8 3.3 3 0.3 -0.592 0.276 0.024 0.076 5.6 3.4 4 0.4 -0.518 0.302 0.098 0.002 4.5 4.5 5 0.5 0.296 0.616 -0.116* 0.216* 3.4 4.5 6 0.6 0.296 0.616 -0.016 0.116 3.3 4.8 7 0.7 0.518 0.698 0.002 0.098 1.9 4.8 8 0.8 0.518 0.698 0.102 -0.002 4.8 5.6 9 0.9 1.11 0.867 0.033 0.067 4.5 6.0 10 1.0 1.406 0.920 0.080 0.020 (media: 4.1 varianza: 1.82) 0.895 0.895 0.262 0.85 3.42 10 0.01 10 Dα = = = − + Como el valor D = 0.216 < 0.262, no se rechaza H0 y se acepta que los datos se distribuyen normalmente.
  • 4. Modo alternativo de realizar la prueba de Kolmogorov Smirnov. La toma de la decisión en el contraste anterior puede llevarse a cabo también mediante el empleo del p-valor asociado al estadístico D observado. El p-valor se define como: ( )0obsP D D H>p-valor = es cierta Si el p-valor es grande significa que, siendo cierta la hipótesis nula, el valor observado del estadístico D era esperable. Por tanto no hay razón para rechazar dicha hipótesis. Asimismo, si el p-valor fuera pequeño, ello indicaría que, siendo cierta la hipótesis nula, era muy difícil que se produjera el valor de D que efectivamente se ha observado. Ello obliga a poner muy en duda, y por tanto a rechazar, la hipótesis nula. De esta forma, para un nivel de significación α, la regla de decisión para este contraste es: Si p-valor ≥ α ⇒ Aceptar H0 Si p-valor < α ⇒ Rechazar H0 Obviamente, la obtención del p-valor requiere conocer la distribución de D bajo la hipótesis nula y hacer el cálculo correspondiente. En el caso particular de la prueba de Kolmogorov Smirnov, la mayoría de los paquetes de software estadístico realizan este cálculo y proporcionan el p-valor directamente.
  • 5. Ejemplo 2: En los siguientes ejemplos se han simulado datos con distribución exponencial o normal, contrastándose en todos los casos si puede aceptarse que los datos siguen distribución exponencial. Se ha acompañado al contraste con el histograma de los datos y el gráfico Q-Q Plot (gráfico cuantil-cuantil: se representan los cuantiles de la distribución teórica supuesta frente a los cuantiles de la distribución empírica. En un buen ajuste, la gran mayoría de estos puntos deberían situarse sobre la recta y=x) Simulación de datos con distribución exponencial n=1000 Histogram of x x Density 0.0 0.5 1.0 1.5 2.0 2.5 0.00.51.01.5 0.0 0.5 1.0 1.5 2.0 2.5 0123 x qu Kolmogorov Smirnov D = 0.030760 p-valor = 0.3004146 Q-Q Plot
  • 6. Simulación de datos con distribución exponencial: n=1000 Histogram of x x Density 0 1 2 3 0.00.51.01.5 0 1 2 3 0123 x qu Kolmogorov Smirnov D = 0.018285 p-valor = 0.8917437 Q-Q Plot
  • 7. Simulación de datos con distribución exponencial n=1000 Nótese que, en este caso, aunque los datos se han generado realmente con distibución exponencial, el p-valor conduce a rechazar que ésta sea la distribución de los datos. Histogram of x x Density 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.00.51.01.52.0 0.0 0.5 1.0 1.5 2.0 2.5 3.0 0123 x qu Kolmogorov Smirnov D = 0.047714 p-valor = 0.02106549 Q-Q Plot
  • 8. Simulación de datos con distribución normal n=1000 En este caso, obviamente se rechaza que la distribución sea exponencial, cosa que además se ve claramente en los gráficos. Histogram of x x Density -1 0 1 2 0.00.20.40.6 -1 0 1 2 0123 x qu Kolmogorov Smirnov D = 0.237 p-valor = 0 Q-Q Plot
  • 9. Simulación de datos con distribución normal n=10 En este caso, aunque los datos se han generado con distribución normal, el contraste conduce a aceptar que siguen distribución normal. Ello se debe a que en general cuando hay poca información (en este caso sólo diez datos), la hipótesis nula tiende a no ser rechazada, salvo que haya una evidencia abrumadora en su contra. Histogram of x x Density -1.0 -0.5 0.0 0.5 1.0 0.00.40.8 -0.5 0.0 0.5 1.0 0.00.40.81.2 x qu Kolmogorov Smirnov D = 0.33481 p-valor = 0.2122409 Q-Q Plot
  • 10. Simulación de datos con distribución exponencial n=10 Aquí ha ocurrido lo contrario al caso anterior; a pesar de que los datos son originalmente exponenciales, el contraste rechaza que lo sean Histogram of x x Density 0.0 0.5 1.0 1.5 0.00.40.8 0.2 0.4 0.6 0.8 1.0 1.2 1.4 0.00.40.81.2 x qu Kolmogorov Smirnov D = 0.54233 p-valor = 0.005575512 Q-Q Plot