Cómo realizar una prueba de correlación en R (con ejemplos)

Una forma de cuantificar la relación entre dos variables es utilizar el coeficiente de correlación de Pearson , que es una medida de la asociación lineal entre dos variables .Siempre toma un valor entre -1 y 1 donde:

  • -1 indica una correlación lineal perfectamente negativa entre dos variables
  • 0 indica que no hay correlación lineal entre dos variables
  • 1 indica una correlación lineal perfectamente positiva entre dos variables

Para determinar si un coeficiente de correlación es estadísticamente significativo, puede calcular la puntuación t y el valor p correspondientes.

La fórmula para calcular la puntuación t de un coeficiente de correlación (r) es:

t = r√ (n-2) / √ (1-r 2 )

El valor p se calcula como el valor p de dos lados correspondiente para la distribución t con n-2 grados de libertad.

Prueba de correlación en R

Para determinar si el coeficiente de correlación entre dos variables es estadísticamente significativo, puede realizar una prueba de correlación en R utilizando la siguiente sintaxis:

cor.test (x, y, método = c («pearson», «kendall», «spearman»))

dónde:

  • x, y: vectores numéricos de datos
  • método: método utilizado para calcular la correlación entre dos vectores

El siguiente ejemplo muestra cómo utilizar esta función para realizar una prueba de correlación en R.

Ejemplo: prueba de correlación en R

Supongamos que tenemos los siguientes dos vectores en R:

x <- c (2, 3, 3, 5, 6, 9, 14, 15, 19, 21, 22, 23)
y <- c (23, 24, 24, 23, 17, 28, 38, 34, 35, 39, 41, 43)

Antes de realizar una prueba de correlación entre las dos variables, podemos crear una gráfica de dispersión rápida para ver su relación:

#create scatterplot 
plot (x, y, pch = 16 )

Prueba de correlación en R

Parece haber una correlación positiva entre las dos variables. Es decir, a medida que uno aumenta, el otro tiende a aumentar también.

Para ver si esta correlación es estadísticamente significativa, podemos realizar una prueba de correlación:

# realizar una prueba de correlación entre los dos vectores
cor.test (x, y)

	Correlación producto-momento de Pearson

datos: xey
t = 7.8756, gl = 10, valor p = 1.35e-05
hipótesis alternativa: la correlación verdadera no es igual a 0
Intervalo de confianza del 95 por ciento:
 0,7575203 0,9799783
estimaciones de muestra:
      cor 
0,9279869 

El coeficiente de correlación entre los dos vectores resulta ser 0.9279869 .

El estadístico de prueba resulta ser 7.8756 y el valor p correspondiente es 1.35e-05 . Dado que este valor es menor que .05, tenemos evidencia suficiente para decir que la correlación entre las dos variables es estadísticamente significativa.

Recursos adicionales

Introducción al coeficiente de correlación de Pearson
Cómo calcular la correlación parcial en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Siempre que realice una prueba de hipótesis, obtendrá una estadística de prueba como resultado. Para determinar si los resultados de…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!