Prueba de Kolmogorov-Smirnov en R (con ejemplos)

Actualizado por ultima vez el 7 de mayo de 2021, por .

La prueba de Kolmogorov-Smirnov se utiliza para comprobar si una muestra procede o no de una determinada distribución.

Para realizar una prueba de Kolmogorov-Smirnov de una o dos muestras en R, podemos usar la función ks.test () .

Este tutorial muestra un ejemplo de cómo utilizar esta función en la práctica.

Ejemplo 1: Prueba de Kolmogorov-Smirnov de una muestra

Supongamos que tenemos los siguientes datos de muestra:

#Haga que este ejemplo sea reproducible
semilla (0)

#generar un conjunto de datos de 100 valores que siguen una distribución de Poisson con media = 5
 datos <- rpois (n = 20 , lambda = 5 )

Relacionado: Una guía para dpois, ppois, qpois y rpois en R

El siguiente código muestra cómo realizar una prueba de Kolmogorov-Smirnov en esta muestra de 100 valores de datos para determinar si provienen de una distribución normal:

# realizar la prueba ks.test de Kolmogorov-Smirnov 
(datos, " pnorm ")

	Prueba de Kolmogorov-Smirnov de una muestra

datos: datos
D = 0,97725, valor de p <2,2e-16
hipótesis alternativa: bilateral

De la salida podemos ver que el estadístico de prueba es 0.97725 y el valor p correspondiente es 2.2e-16 . Dado que el valor p es menor que .05, rechazamos la hipótesis nula. Tenemos evidencia suficiente para decir que los datos de la muestra no provienen de una distribución normal.

Este resultado no debería sorprender, ya que generamos los datos de muestra utilizando la función rpois () , que genera valores aleatorios que siguen una distribución de Poisson .

Ejemplo 2: Prueba de Kolmogorov-Smirnov de dos muestras

Supongamos que tenemos los siguientes dos conjuntos de datos de muestra:

#Haga que este ejemplo sea reproducible
semilla (0)

#generar dos conjuntos de datos
 data1 <- rpois (n = 20 , lambda = 5 )
datos2 <- rnorm ( 100 )

El siguiente código muestra cómo realizar una prueba de Kolmogorov-Smirnov en estas dos muestras para determinar si provienen de la misma distribución:

# realizar la prueba de Kolmogorov-Smirnov
ks.test (datos1, datos2)

	Prueba de Kolmogorov-Smirnov de dos muestras

datos: datos1 y datos2
D = 0,99, valor p = 1,299e-14
hipótesis alternativa: bilateral

A partir de la salida, podemos ver que el estadístico de prueba es 0,99 y el valor p correspondiente es 1,299e-14 . Dado que el valor p es menor que .05, rechazamos la hipótesis nula. Tenemos suficiente evidencia para decir que los dos conjuntos de datos de muestra no provienen de la misma distribución.

Este resultado tampoco debería sorprender, ya que generamos valores para la primera muestra usando la distribución de Poisson y valores para la segunda muestra usando la distribución normal .

Recursos adicionales

Cómo realizar una prueba de Shapiro-Wilk en R
Cómo realizar una prueba de Anderson-Darling en R
Cómo realizar pruebas de normalidad multivariante en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Puede usar la siguiente sintaxis para calcular la correlación entre dos columnas en un DataFrame de pandas: df [' columna1…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!