Regresión logarítmica en R (paso a paso)

Actualizado por ultima vez el 9 de noviembre de 2021, por Luis Benites.

La regresión logarítmica es un tipo de regresión que se utiliza para modelar situaciones en las que el crecimiento o el deterioro se acelera rápidamente al principio y luego se ralentiza con el tiempo.

El Modelo de regresión logarítmico en R o Rstudio

Por ejemplo, la siguiente gráfica demuestra un ejemplo de decaimiento logarítmico:

Para este tipo de situación, la relación entre una variable predictora y una variable de respuesta podría modelarse bien mediante regresión logarítmica.

La ecuación de un modelo de regresión logarítmica tiene la siguiente forma:

y = a + b * ln (x)

dónde:

  • y: la variable de respuesta
  • x: la variable predictora
  • a, b: Los coeficientes de regresión que describen la relación entre x y y

El siguiente ejemplo paso a paso muestra cómo realizar una regresión logarítmica en R.

Paso 1: crear los datos

En primer lugar, vamos a crear algunos datos falsos para dos variables: X e Y :

x = 1:15

y = c (59, 50, 44, 38, 33, 28, 23, 20, 17, 15, 13, 12, 11, 10, 9,5)

Paso 2: Visualice los datos

A continuación, vamos a crear una rápida dispersión de visualizar la relación entre X e Y :

plot (x, y)

En el gráfico podemos ver que existe un patrón de decaimiento logarítmico claro entre las dos variables. El valor de la variable de respuesta, y , disminuye rápidamente al principio y luego se ralentiza con el tiempo.

Por tanto, parece una buena idea ajustar una ecuación de regresión logarítmica para describir la relación entre las variables.

Paso 3: ajustar el modelo de regresión logarítmica

A continuación, usaremos la función lm () para ajustar un modelo de regresión logarítmica, usando el logaritmo natural de x como variable predictora e y como variable de respuesta.

#ajustar el modelo 
modelo <- lm (y ~ log (x)) 
#ver la salida del modelo

summary (modelo)

Llamada:
lm (fórmula = y ~ log (x))

Derechos residuales de autor:
   Mín. 1T Mediana 3T Máx. 
-4,069 -1,313 -0,260 1,127 3,122 

Coeficientes:
            Estimar Std. Valor t de error Pr (> | t |)    
(Intercepción) 63.0686 1.4090 44.76 1.25e-15 ***
log (x) -20.1987 0.7019 -28.78 3.70e-13 ***
---
Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0,1 pulg. 1

Error estándar residual: 2.054 en 13 grados de libertad
R cuadrado múltiple: 0,9845, R cuadrado ajustado: 0,9834 
Estadístico F: 828.2 en 1 y 13 DF, valor p: 3.702e-13

El valor F general del modelo es 828.2 y el valor p correspondiente es extremadamente pequeño (3.702e-13), lo que indica que el modelo en su conjunto es útil.

Usando los coeficientes de la tabla de salida, podemos ver que la ecuación de regresión logarítmica ajustada es:

y = 63.0686 – 20.1987 * ln (x)

Podemos usar esta ecuación para predecir la variable de respuesta, y , con base en el valor de la variable predictora, x . Por ejemplo, si x = 12, predeciríamos que y sería 12,87 :

y = 63.0686 – 20.1987 * ln (12) = 12.87

Bonificación: no dude en utilizar esta calculadora de regresión logarítmica en línea para calcular automáticamente la ecuación de regresión logarítmica para un predictor y una variable de respuesta determinados.

Paso 4: Visualice el modelo de regresión logarítmica

Por último, podemos crear un gráfico rápido para visualizar qué tan bien se ajusta el modelo de regresión logarítmica a los datos:

#plot x vs. y
trama (x, y)

#define los valores de x que se usarán para la línea de regresión
 x = seq (desde = 1 , hasta = 15 , longitud. out = 1000 )

#utilice el modelo para predecir los valores de y basados ​​en los valores de x
 y = predecir (modelo, nuevos datos = lista (x = seq (desde = 1 , hasta = 15 , longitud. fuera = 1000 )),
          intervalo = " confianza ")

# agregue la línea de regresión ajustada al gráfico (lwd especifica el ancho de la línea)
 matlines (x, y, lwd = 2 )

Regresión logarítmica en R

Podemos ver que el modelo de regresión logarítmica hace un buen trabajo al ajustar este conjunto de datos en particular.

Recursos adicionales

Cómo realizar una regresión lineal simple en R
Cómo realizar una regresión lineal múltiple en R
Cómo realizar una regresión cuadrática en R
Cómo realizar una regresión exponencial en R
Cómo realizar una regresión polinomial en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Tengo una Maestría en Ciencias en Estadística Aplicada y he trabajado en algoritmos de aprendizaje automático para empresas profesionales tanto en el sector de la salud como en el comercio minorista.

Deja un comentario

La desviación absoluta mediana mide la dispersión de las observaciones en un conjunto de datos. Es una métrica particularmente útil…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!