Cómo crear e interpretar una curva ROC en Stata

La regresión logística es un método estadístico que utilizamos para ajustar un modelo de regresión cuando la variable de respuesta es binaria.Para evaluar qué tan bien se ajusta un modelo de regresión logística a un conjunto de datos, podemos observar las siguientes dos métricas:

  • Sensibilidad: la probabilidad de que el modelo prediga un resultado positivo para una observación cuando de hecho el resultado es positivo.
  • Especificidad: la probabilidad de que el modelo prediga un resultado negativo para una observación cuando en realidad el resultado es negativo.

Una forma fácil de visualizar estas dos métricas es creando una curva ROC , que es un gráfico que muestra la sensibilidad y especificidad de un modelo de regresión logística.

Este tutorial explica cómo crear e interpretar una curva ROC en Stata.

Ejemplo: curva ROC en Stata

Para este ejemplo usaremos un conjunto de datos llamado lbw , que contiene las siguientes variables para 189 madres:

  • bajo : si el bebé tuvo bajo peso al nacer o no. 1 = sí, 0 = no.
  • edad – edad de la madre.
  • humo – si la madre fumó o no durante el embarazo. 1 = sí, 0 = no.

Ajustaremos un modelo de regresión logística a los datos utilizando la edad y el tabaquismo como variables explicativas y el bajo peso al nacer como variable de respuesta. Luego, crearemos una curva ROC para analizar qué tan bien se ajusta el modelo a los datos.

Paso 1: cargue y vea los datos.

Cargue los datos usando el siguiente comando:

use http://www.stata-press.com/data/r13/lbw

Obtenga una comprensión rápida del conjunto de datos con el siguiente comando:

resumir

Conjunto de datos de bajo peso al nacer en Stata

Hay 11 variables diferentes en el conjunto de datos, pero las únicas tres que nos importan son la baja, la edad y el humo.

Paso 2: Ajuste el modelo de regresión logística.

Utilice el siguiente comando para ajustar el modelo de regresión logística:

logit humo de baja edad

Salida de regresión logística en Stata

Paso 3: Cree la curva ROC.

Podemos crear la curva ROC para el modelo usando el siguiente comando:

lroc

Curva ROC en Stata

Paso 4: Interprete la curva ROC.

Cuando ajustamos un modelo de regresión logística, se puede usar para calcular la probabilidad de que una observación dada tenga un resultado positivo, basándose en los valores de las variables predictoras.

Para determinar si una observación debe clasificarse como positiva, podemos elegir un punto de corte tal que las observaciones con una probabilidad ajustada por encima del punto de corte se clasifiquen como positivas y cualquier observación con una probabilidad ajustada por debajo del punto de corte se clasifiquen como negativas. .

Por ejemplo, suponga que elegimos el punto de corte 0.5. Esto significa que se pronosticará que cualquier observación con una probabilidad ajustada mayor que 0,5 tendrá un resultado positivo, mientras que cualquier observación con una probabilidad ajustada menor o igual a 0,5 tendrá un resultado negativo.

La curva ROC nos muestra los valores de sensibilidad frente a 1-especificidad a medida que el valor del punto de corte se mueve de 0 a 1. Un modelo con alta sensibilidad y alta especificidad tendrá una curva ROC que abraza la esquina superior izquierda de la gráfico. Un modelo con baja sensibilidad y baja especificidad tendrá una curva cercana a la línea diagonal de 45 grados.

El AUC (área bajo la curva) nos da una idea de qué tan bien el modelo es capaz de distinguir entre resultados positivos y negativos. El AUC puede variar de 0 a 1. Cuanto mayor sea el AUC, mejor será el modelo para clasificar correctamente los resultados.En nuestro ejemplo, podemos ver que el AUC es 0,6111 .

Podemos usar AUC para comparar el rendimiento de dos o más modelos. El modelo con el AUC más alto es el que tiene un mejor rendimiento.

Recursos adicionales

Cómo realizar una regresión logística en Stata
Cómo interpretar la curva ROC y el AUC de un modelo de regresión logística

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Muchas pruebas de hipótesis en estadística dan como resultado una estadística de prueba z. Una vez que encontramos este estadístico…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!