Cómo calcular el error estándar residual en R

Siempre que ajustamos un modelo de regresión lineal en R, el modelo toma la siguiente forma:

Y = β 0 + β 1 X +… + β i X + ϵ

donde ϵ es un término de error que es independiente de X.

No importa qué tan bien se pueda usar X para predecir los valores de Y, siempre habrá algún error aleatorio en el modelo. Una forma de medir la dispersión de este error aleatorio es utilizar el error estándar residual , que es una forma de medir la desviación estándar de los residuos ϵ.

El error estándar residual de un modelo de regresión se calcula como:

Error estándar residual = √ SS residuales / gl residuales

dónde:

  • Residuos SS : La suma de cuadrados de los residuos.
  • df residuales : Los grados de libertad residuales, calculados como n – k – 1 donde n = observaciones totales yk = parámetros totales del modelo.

Hay tres métodos que podemos usar para calcular el error estándar residual de un modelo de regresión en R.

Método 1: analizar el resumen del modelo

La primera forma de obtener el error estándar residual es simplemente ajustar un modelo de regresión lineal y luego usar el comando summary () para obtener los resultados del modelo. Luego, busque el «error estándar residual» cerca de la parte inferior de la salida:

#cargar el conjunto de datos integrado de mtcars
datos (mtcars)

#fit modelo de regresión modelo
 <- lm (mpg ~ disp + hp, data = mtcars)

#ver resumen de
 resumen del modelo (modelo)

Llamada:
lm (fórmula = mpg ~ disp + hp, datos = mtcars)

Derechos residuales de autor:
    Mín. 1T Mediana 3T Máx. 
-4,7945 -2,3036 -0,8246 1,8582 6,9363 

Coeficientes:
             Estimar Std. Valor t de error Pr (> | t |)    
(Intercepción) 30.735904 1.331566 23.083 <2e-16 ***
disp -0.030346 0.007405 -4.098 0.000306 ***
CV -0,024840 0,013385 -1,856 0,073679.  
---
Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0,1 pulg. 1

Error estándar residual: 3,127 en 29 grados de libertad
R cuadrado múltiple: 0,7482, R cuadrado ajustado: 0,7309 
Estadístico F: 43,09 en 2 y 29 DF, valor de p: 2,062e-09

Podemos ver que el error estándar residual es 3.127 .

Método 2: use una fórmula simple

Otra forma de obtener el error estándar residual (RSE) es ajustar un modelo de regresión lineal y luego usar la siguiente fórmula para calcular RSE:

sqrt ( desviación (modelo) / gl residual (modelo))

A continuación, se muestra cómo implementar esta fórmula en R:

#cargar el conjunto de datos integrado de mtcars
datos (mtcars)

#fit modelo de regresión modelo
 <- lm (mpg ~ disp + hp, data = mtcars)

#calcular el error estándar residual
 sqrt ( desviación (modelo) / df. residual (modelo))

[1] 3.126601

Podemos ver que el error estándar residual es 3.126601 .

Método 3: use una fórmula paso a paso

Otra forma de obtener el error estándar residual es ajustar un modelo de regresión lineal y luego usar un enfoque paso a paso para calcular cada componente individual de la fórmula para RSE:

#cargar el conjunto de datos integrado de mtcars
datos (mtcars)

#fit modelo de regresión modelo
 <- lm (mpg ~ disp + hp, data = mtcars)

# calcular el número de parámetros del modelo - 1
 k = longitud ( coeficientes de $ del modelo ) -1

# calcular la suma de los residuos al cuadrado 
SSE = suma (modelo $ residuos ** 2)

# calcular el total de observaciones en el conjunto de datos 
n = longitud (modelo $ residuales )

#calcular el error estándar residual
raíz cuadrada (SSE / (n- (1 + k)))

[1] 3.126601

Podemos ver que el error estándar residual es 3.126601 .

Cómo interpretar el error estándar residual

Como se mencionó anteriormente, el error estándar residual (RSE) es una forma de medir la desviación estándar de los residuos en un modelo de regresión.

Cuanto menor sea el valor de RSE, más fielmente podrá un modelo ajustarse a los datos (pero tenga cuidado con el sobreajuste ). Esta puede ser una métrica útil para usar al comparar dos o más modelos para determinar qué modelo se ajusta mejor a los datos.

Recursos adicionales

Cómo realizar una regresión lineal múltiple en R
Cómo realizar una validación cruzada para el rendimiento del modelo en R
Cómo calcular la desviación estándar en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La regresión logística es un método estadístico que utilizamos para ajustar un modelo de regresión cuando la variable de respuesta…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!