Correlación vs. Asociación: ¿Cuál es la diferencia?

Dos términos que a veces se usan indistintamente son correlación y asociación . Sin embargo, en el campo de la estadística, estos dos términos tienen significados ligeramente diferentes.

En particular, cuando usamos la palabra correlación , normalmente hablamos del coeficiente de correlación de Pearson . Esta es una medida de la asociación lineal entre dos variables aleatorias X e Y. Tiene un valor entre -1 y 1 donde:

  • -1 indica una correlación lineal perfectamente negativa entre dos variables
  • 0 indica que no hay correlación lineal entre dos variables
  • 1 indica una correlación lineal perfectamente positiva entre dos variables

Por el contrario, cuando los estadísticos usan la palabra asociación , pueden estar hablando de cualquier relación entre dos variables, ya sea lineal o no lineal.

Para ilustrar esta idea, considere los siguientes ejemplos.

Visualización de correlación frente a asociación con diagramas de dispersión

Usamos dos palabras para describir la correlación entre dos variables aleatorias:

1 dirección

  • Positivo: Dos variables aleatorias tienen una correlación positiva si Y tiende a aumentar a medida que X aumenta.
  • Negativo: Dos variables aleatorias tienen una correlación negativa si Y tiende a disminuir a medida que X aumenta.

2. Fuerza

  • Débil: dos variables aleatorias tienen una correlación débil si los puntos en un diagrama de dispersión están poco dispersos.
  • Fuerte: dos variables aleatorias tienen una fuerte correlación si los puntos en un diagrama de dispersión están muy juntos.

Los siguientes diagramas de dispersión ilustran ejemplos de cada tipo de correlación:

En comparación con la correlación, la asociación de palabras nos puede decir si existe o no alguna relación entre dos variables aleatorias: lineal o no lineal.

Los siguientes diagramas de dispersión ilustran algunos ejemplos:

Correlación versus asociación

El diagrama de dispersión en la esquina superior izquierda ilustra una relación cuadrática entre dos variables aleatorias, lo que significa que es una asociación entre las dos variables, pero no es lineal.

Si calculamos la correlación entre las dos variables, probablemente sería cercana a cero porque no existe una relación lineal entre ellas.

Sin embargo, el simple hecho de saber que la correlación entre las dos variables es cero puede ser engañoso porque oculta el hecho de que existe una relación no lineal.

Correlación versus asociación: un resumen

Los términos correlación y asociación tienen las siguientes similitudes y diferencias:

Similitudes:

  • Ambos términos se utilizan para describir si existe o no una relación entre dos variables aleatorias.
  • Ambos términos pueden usar diagramas de dispersión para analizar la relación entre dos variables aleatorias.

Diferencias:

  • La correlación solo puede decirnos si dos variables aleatorias tienen una relación lineal, mientras que la asociación puede decirnos si dos variables aleatorias tienen una relación lineal o no lineal.
  • La correlación cuantifica la relación entre dos variables aleatorias usando un número entre -1 y 1, pero la asociación no usa un número específico para cuantificar una relación.

Recursos adicionales

Introducción al coeficiente de correlación de Pearson
Introducción a los diagramas de dispersión
Correlación y regresión: ¿Cuál es la diferencia?

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Se usa una prueba t de una muestra para probar si la media de una población es igual a algún…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!