Cómo calcular un coeficiente de correlación de Pearson a mano

Actualizado por ultima vez el 7 de mayo de 2021, por .

Un coeficiente de correlación de Pearson mide la asociación lineal entre dos variables.

Siempre toma un valor entre -1 y 1 donde:

  • -1 indica una correlación lineal perfectamente negativa entre dos variables
  • 0 indica que no hay correlación lineal entre dos variables
  • 1 indica una correlación lineal perfectamente positiva entre dos variables

La fórmula para calcular un coeficiente de correlación de Pearson, denotado r , es:

Fuente: Wikipedia

Este tutorial proporciona un ejemplo paso a paso de cómo calcular manualmente un coeficiente de correlación de Pearson para el siguiente conjunto de datos:

Paso 1: Calcule la media de X e Y

Primero, calcularemos la media de los valores X e Y:

Paso 2: Calcule la diferencia entre medias

A continuación, calcularemos la diferencia entre cada uno de los valores X e Y individuales y sus respectivas medias:

Paso 3: Calcule los valores restantes

A continuación, calcularemos los valores restantes necesarios para completar la fórmula del coeficiente de correlación de Pearson:

Paso 4: Calcule las sumas

A continuación, calcularemos las sumas de las últimas tres columnas:

Paso 5: Calcule el coeficiente de correlación de Pearson

Ahora simplemente ingresaremos las sumas del paso anterior en la fórmula para el coeficiente de correlación de Pearson:

Coeficiente de correlación de Pearson a mano

El coeficiente de correlación de Pearson resulta ser 0,947 .

Dado que este valor es cercano a 1, esto es una indicación de que X e Y están fuertemente correlacionados positivamente.

En otras palabras, a medida que aumenta el valor de X, el valor de Y también aumenta de una manera muy predecible.

Recursos adicionales

Introducción al coeficiente de correlación de Pearson
Cómo encontrar un intervalo de confianza para un coeficiente de correlación

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La distribución normal es la distribución de probabilidad más utilizada en todas las estadísticas. Tiene las siguientes propiedades: En forma…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!