Cómo crear un diagrama de pares en Python

Actualizado por ultima vez el 7 de mayo de 2021, por .

Un diagrama de pares es una matriz de diagramas de dispersión que le permite comprender la relación por pares entre diferentes variables en un conjunto de datos.

La forma más fácil de crear un diagrama de pares en Python es usar la función seaborn.pairplot (df) .

Los siguientes ejemplos muestran cómo utilizar esta función en la práctica.

Ejemplo 1: Gráfico de pares para todas las variables

El siguiente código muestra cómo crear un diagrama de pares para cada variable numérica en el conjunto de datos de seaborn llamado iris :

importar pandas como pd
 import matplotlib. pyplot  como plt
 importar seaborn como sns

#define dataset
 iris = sns. load_dataset (" iris ")

#create pairs plot para todas las variables numéricas
 sns. parcela (iris)

Parcela de pares en Python

La forma de interpretar la matriz es la siguiente:

  • La distribución de cada variable se muestra como un histograma a lo largo de los cuadros diagonales.
  • Todos los demás cuadros muestran un diagrama de dispersión de la relación entre cada combinación de variables por pares. Por ejemplo, la caja en la parte inferior izquierda esquina de las pantallas de matriz un diagrama de dispersión de valores para petal_width vs. sepal_length .

Esta única gráfica nos da una idea de la relación entre cada par de variables en nuestro conjunto de datos.

Ejemplo 2: Gráfico de pares para variables específicas

También podemos especificar solo ciertas variables para incluir en la gráfica de pares:

sns. parplot (iris [[' sepal_length ', ' sepal_width ']])

Ejemplo 3: parcela con color por categoría

También podemos crear una gráfica de pares que colorea cada punto en cada gráfica en función de alguna variable categórica usando el argumento de tono :

sns. parcela (iris, hue = ' especie ')

Parcela en Python con color por categoría

Al utilizar el argumento de tono , podemos obtener una mejor comprensión de los datos.

Recursos adicionales

Cómo hacer gráficos de barras con Seaborn
Cómo hacer mapas de calor con Seaborn
Cómo agregar un título a los gráficos de Seaborn

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

R cuadrado , a menudo escrito R 2 , es la proporción de la varianza en la variable de respuesta…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!