Variables instrumentales: definición y ejemplos

A menudo, en estadística, nos interesa estimar el efecto que una variable tiene sobre otra. Por ejemplo, quizás queramos saber:

  • ¿Cómo afecta la cantidad de tiempo dedicado al estudio a las calificaciones de los exámenes?
  • ¿Cómo afecta un determinado medicamento a la presión arterial?
  • ¿Cómo afecta el estrés a la frecuencia cardíaca?

En cada escenario, queremos entender si alguna variable predictora afecta o no a una variable de respuesta . Sin embargo, a menudo habrá otras variables que afecten la relación entre las dos variables.

Por ejemplo, supongamos que usamos un determinado fármaco como nuestra variable predictora y la presión arterial como nuestra variable de respuesta. Solo nos interesa el efecto que tiene el medicamento sobre la presión arterial:

Sin embargo, otras variables como el tiempo dedicado al ejercicio, la dieta general y los niveles de estrés también afectan la presión arterial:

Por lo tanto, si ejecutamos una regresión lineal simple usando el fármaco como nuestra variable predictora y la presión arterial como nuestra variable de respuesta, no podemos estar seguros de que los coeficientes de regresión capten con precisión el efecto que el fármaco tiene sobre la presión arterial debido a factores externos ( ejercicio, dieta, estrés, etc.) también podrían influir.

Una forma potencial de solucionar este problema es utilizar una variable instrumental .

¿Qué es una variable instrumental?

Una variable instrumental es una tercera variable introducida en el análisis de regresión que está correlacionada con la variable predictora, pero no correlacionada con la variable de respuesta. Al usar esta variable, es posible estimar el verdadero efecto causal que alguna variable predictora tiene sobre una variable de respuesta.

Por ejemplo, supongamos que queremos estimar el efecto que tiene un determinado medicamento sobre la presión arterial:

Un ejemplo de una variable instrumental que podemos usar en este análisis de regresión es la proximidad de un individuo a una farmacia.

Esta variable «proximidad» probablemente estaría altamente correlacionada con si el individuo toma o no determinado medicamento porque, en primer lugar, un individuo no podría obtenerlo si no vive cerca de una farmacia.

Sin embargo, no se espera que la variable «proximidad» tenga ninguna correlación con la presión arterial. La única asociación que tendría con la presión arterial es a través de la variable predictora.

Variable instrumental

La forma en que realmente usamos una variable instrumental es a través de la regresión de variables instrumentales, a veces llamada regresión de mínimos cuadrados en dos etapas .

Regresión de variables instrumentales

La regresión de variables instrumentales (o regresión de mínimos cuadrados en dos etapas) utiliza el siguiente enfoque para estimar el efecto que tiene una variable predictora sobre una variable de respuesta:

Etapa 1: Ajustar un modelo de regresión utilizando la variable instrumental como variable predictora.

En nuestro ejemplo específico, primero ajustaríamos el siguiente modelo de regresión:

Cierto fármaco = B 0 + B 1 (proximidad)

Entonces nos quedaríamos con valores predichos para cierta droga (cd), que llamaremos cd hat .

Etapa 2: ajuste un segundo modelo de regresión utilizando los valores predichos para cd hat .

A continuación, ajustaremos el siguiente modelo de regresión:

Presión arterial = B 0 + B 1 (cd hat )

Si el coeficiente de regresión para cd hat resulta ser estadísticamente significativo, entonces podemos decir que existe un efecto causal del fármaco sobre la presión arterial.

La razón por la que podemos decir esto es porque solo usamos «proximidad» para crear cd hat y dado que sabemos que la proximidad no debe correlacionarse con la presión arterial, cualquier correlación significativa en la regresión de la segunda etapa puede atribuirse a la droga determinada.

Precauciones sobre el uso de variables instrumentales

Una variable instrumental solo debe usarse si cumple los siguientes criterios:

  • Está altamente correlacionado con la variable predictora.
  • No se correlaciona con la variable de respuesta.
  • No se correlaciona con las otras variables que quedan fuera del modelo (por ejemplo, la proximidad no se correlaciona con el ejercicio, la dieta o el estrés).

Si una variable instrumental no cumple con este criterio, entonces no debe usarse en el modelo de regresión porque probablemente producirá resultados poco confiables y sesgados.

Bono: una explicación en video de las variables instrumentales

El siguiente video de Ashley Hodgson proporciona una excelente explicación visual de las variables instrumentales:

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La prueba de Friedman es una alternativa no paramétrica al ANOVA de medidas repetidas . Se utiliza para determinar si…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!