Cómo crear una parcela residual en R

Los gráficos de residuos se utilizan a menudo para evaluar si los residuos en un análisis de regresión están distribuidos normalmente y si presentan o no heterocedasticidad .

Este tutorial explica cómo crear gráficos de residuos para un modelo de regresión en R.

Ejemplo: parcelas residuales en R

En este ejemplo, ajustaremos un modelo de regresión utilizando el conjunto de datos R integrado mtcars y luego produciremos tres gráficos de residuos diferentes para analizar los residuos.

Paso 1: ajuste el modelo de regresión.

Primero, ajustaremos un modelo de regresión usando mpg como variable de respuesta y disp y hp como variables explicativas:

#cargar el conjunto de datos
datos (mtcars)

#ajustar un modelo de regresión
modelo <- lm (mpg ~ disp + hp, data = mtcars)

#obtener lista de residuos 
res <- resid (modelo)

Paso 2: Producir parcela residual vs. ajustada.

A continuación, produciremos una gráfica residual vs. ajustada, que es útil para detectar visualmente la heterocedasticidad, por ejemplo, un cambio sistemático en la dispersión de los residuos en un rango de valores.

#producir parcela residual vs. ajustada
plot (ajustado (modelo), res)

#add una línea horizontal en 0 
abline (0,0)

Gráfica residual vs. ajustada en R

El eje x muestra los valores ajustados y el eje y muestra los residuos. En el gráfico podemos ver que la dispersión de los residuales tiende a ser mayor para valores ajustados más altos, pero no parece lo suficientemente serio como para necesitar realizar cambios en el modelo.

Paso 3: Produzca un diagrama QQ.

También podemos producir una gráfica QQ, que es útil para determinar si los residuos siguen una distribución normal. Si los valores de los datos en el gráfico caen a lo largo de una línea aproximadamente recta en un ángulo de 45 grados, entonces los datos se distribuyen normalmente.

#crear gráfico QQ para residuos
 qqnorm (res)

#agregue una línea diagonal recta a la trama
qqline (res) 

Gráfico residual QQ en R

Podemos ver que los residuos tienden a desviarse bastante de la línea cerca de las colas, lo que podría indicar que no están distribuidos normalmente.

Paso 4: Produzca una gráfica de densidad.

También podemos producir una gráfica de densidad, que también es útil para verificar visualmente si los residuos están distribuidos normalmente o no. Si el gráfico tiene aproximadamente una forma de campana, es probable que los residuos sigan una distribución normal.

#Crear gráfico de densidad de residuos
parcela (densidad (res))

Gráfico de densidad residual en R

Podemos ver que la gráfica de densidad sigue aproximadamente una forma de campana, aunque está ligeramente sesgada hacia la derecha. Dependiendo del tipo de estudio, un investigador puede decidir o no realizar una transformación en los datos para asegurarse de que los residuos se distribuyan de manera más normal.

Recursos adicionales

Cómo calcular residuos estandarizados en R
Cómo calcular residuos estudentizados en R
Cómo crear un histograma de residuos en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Un resumen de cinco números es una forma de resumir un conjunto de datos utilizando los siguientes cinco valores: El…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!