Cómo crear una matriz de correlación en Google Sheets

Una forma de cuantificar la relación entre dos variables es utilizar el coeficiente de correlación de Pearson , que es una medida de la asociación lineal entre dos variables .Tiene un valor entre -1 y 1 donde:

  • -1 indica una correlación lineal perfectamente negativa entre dos variables
  • 0 indica que no hay correlación lineal entre dos variables
  • 1 indica una correlación lineal perfectamente positiva entre dos variables

Cuanto más lejos esté el coeficiente de correlación de cero, más fuerte será la relación entre las dos variables.

Pero en algunos casos queremos comprender la correlación entre más de un par de variables. En estos casos, podemos crear una matriz de correlación , que es una tabla cuadrada que muestra los coeficientes de correlación entre varias combinaciones de variables por pares.

Este tutorial explica cómo crear e interpretar una matriz de correlación en Google Sheets.

Cómo crear una matriz de correlación en Google Sheets

Supongamos que tenemos el siguiente conjunto de datos que muestra el promedio de puntos, rebotes y asistencias de 10 jugadores de baloncesto:

Para crear una matriz de correlación para este conjunto de datos, podemos usar la función CORREL () con la siguiente sintaxis:

COVAR (datos_y, datos_x)

La matriz de covarianza para este conjunto de datos se muestra en las celdas B15: D17, mientras que las fórmulas utilizadas para crear la matriz de covarianza se muestran en las celdas B21: D23 a continuación:

Matriz de correlación en Google Sheets

Cómo interpretar una matriz de correlación

Los valores de las celdas individuales de la matriz de correlación nos indican el coeficiente de correlación de Pearson entre cada combinación de variables por pares. Por ejemplo:

Correlación entre puntos y rebotes: -0,0464. Los puntos y los rebotes tienen una correlación levemente negativa, pero este valor es tan cercano a cero que no hay pruebas sólidas de una asociación significativa entre estas dos variables.

Correlación entre puntos y asistencias: 0,1219. Los puntos y las asistencias tienen una correlación levemente positiva, pero este valor también es bastante cercano a cero, por lo que no hay pruebas sólidas de una asociación significativa entre estas dos variables.

Correlación entre rebotes y asistencias: 0,7137. Los rebotes y las asistencias están fuertemente correlacionados positivamente. Es decir, los jugadores que tienen más rebotes también suelen tener más asistencias.

Observe que los valores diagonales en la matriz de correlación son todos iguales a 1 porque la correlación entre una variable y ella misma es siempre 1. En la práctica, este número no es útil para interpretar.

Recursos adicionales

Cómo leer una matriz de correlación
Cómo crear una matriz de correlación en Excel

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

El rango intercuartil , a menudo denominado "IQR", es una forma de medir la dispersión del 50% medio de un…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!