Cómo realizar una prueba de independencia de chi-cuadrado en Python

Se utiliza una prueba de independencia de chi-cuadrado para determinar si existe o no una asociación significativa entre dos variables categóricas.

Este tutorial explica cómo realizar una prueba de independencia de chi-cuadrado en Python.

Ejemplo: prueba chi-cuadrado de independencia en Python

Supongamos que queremos saber si el género está asociado o no con la preferencia de un partido político. Tomamos una muestra aleatoria simple de 500 votantes y los encuestamos sobre su preferencia de partido político. La siguiente tabla muestra los resultados de la encuesta:

Republicano Demócrata Independiente Total
Masculino 120 90 40 250
Mujer 110 95 45 250
Total 230 185 85 500

Utilice los siguientes pasos para realizar una prueba de independencia de chi-cuadrado en Python para determinar si el género está asociado con la preferencia de un partido político.

Paso 1: crea los datos.

Primero, crearemos una tabla para contener nuestros datos:

datos = [[120, 90, 40],
        [110, 95, 45]]

Paso 2: Realice la prueba de independencia de chi-cuadrado.

A continuación, podemos realizar la Prueba de Independencia de Chi-Cuadrado usando la función chi2_contingency de la biblioteca SciPy, que usa la siguiente sintaxis:

chi2_contingency (observado)

dónde:

  • observado: una tabla de contingencia de valores observados.

El siguiente código muestra cómo usar esta función en nuestro ejemplo específico:

importar scipy.stats como estadísticas

#realice la prueba chi-cuadrado de independencia
stats.chi2_contingency (datos)

(0,864,
 0,649,
 2,
 matriz ([[115., 92.5, 42.5],
        [115. , 92,5, 42,5]]))

La forma de interpretar la salida es la siguiente:

  • Estadística de prueba de chi-cuadrado: 0.864
  • valor p: 0,649
  • Grados de libertad: 2 (calculado como # filas-1 * # columnas-1)
  • Matriz: la última matriz muestra los valores esperados para cada celda en la tabla de contingencia.

Recuerde que la prueba de independencia de chi-cuadrado utiliza las siguientes hipótesis nulas y alternativas:

  • H 0 : (hipótesis nula) Las dos variables son independientes.
  • H 1 : (hipótesis alternativa) Las dos variables no son independientes.

Dado que el valor p (.649) de la prueba no es menor que 0.05, no rechazamos la hipótesis nula. Esto significa que no tenemos evidencia suficiente para decir que existe una asociación entre género y preferencia de partido político.

En otras palabras, las preferencias de género y de partido político son independientes.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

En estadística, ajustamos modelos de regresión por dos razones: (1) Para explicar la relación entre una o más variables explicativas…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!