Cómo calcular el error estándar de regresión en Excel

Actualizado por ultima vez el 7 de mayo de 2021, por .

Siempre que ajustamos un modelo de regresión lineal , el modelo toma la siguiente forma:

Y = β 0 + β 1 X +… + β i X + ϵ

donde ϵ es un término de error que es independiente de X.

No importa qué tan bien se pueda usar X para predecir los valores de Y, siempre habrá algún error aleatorio en el modelo.

Una forma de medir la dispersión de este error aleatorio es utilizando el error estándar del modelo de regresión , que es una forma de medir la desviación estándar de los residuos ϵ.

Este tutorial proporciona un ejemplo paso a paso de cómo calcular el error estándar de un modelo de regresión en Excel.

Paso 1: crear los datos

Para este ejemplo, crearemos un conjunto de datos que contiene las siguientes variables para 12 estudiantes diferentes:

  • Puntaje del examen
  • Horas de estudio
  • Grado actual

Paso 2: ajustar el modelo de regresión

A continuación, ajustaremos un modelo de regresión lineal múltiple utilizando la puntuación del examen como variable de respuesta y las horas de estudio y la calificación actual como variables predictoras.

Para hacerlo, haga clic en la pestaña Datos a lo largo de la cinta superior y luego haga clic en Análisis de datos :

Si no ve esta opción disponible, primero debe cargar el Paquete de herramientas de análisis de datos .

En la ventana que aparece, seleccione Regresión . En la nueva ventana que aparece, complete la siguiente información:

Una vez que haga clic en Aceptar , aparecerá la salida del modelo de regresión:

Paso 3: interpretar el error estándar de regresión

El error estándar del modelo de regresión es el número junto al Error estándar :

Error estándar de regresión en Excel

El error estándar de este modelo de regresión en particular resulta ser 2.790029 .

Este número representa la distancia promedio entre los puntajes reales del examen y los puntajes del examen predichos por el modelo.

Tenga en cuenta que algunas de las puntuaciones del examen estarán a más de 2,79 unidades de la puntuación prevista, mientras que otras estarán más cerca. Pero, en promedio, la distancia entre los puntajes reales del examen y los puntajes previstos es 2.790029 .

También tenga en cuenta que un error estándar de regresión más pequeño indica que un modelo de regresión se ajusta más a un conjunto de datos.

Por lo tanto, si ajustamos un nuevo modelo de regresión al conjunto de datos y terminamos con un error estándar de, digamos, 4.53 , este nuevo modelo sería peor para predecir los puntajes de los exámenes que el modelo anterior.

Recursos adicionales

Otra forma común de medir la precisión de un modelo de regresión es usar R cuadrado. Consulte este artículo para obtener una buena explicación de los beneficios de usar el error estándar de la regresión para medir la precisión en comparación con R-cuadrado.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Este tutorial proporciona una guía completa de los mejores temas de ggplot2, que incluyen: Cómo modificar la apariencia de los…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!