Cómo calcular la V de Cramer en Python

El V de Cramer es una medida de la fuerza de asociación entre dos variables nominales .

Va de 0 a 1 donde:

  • 0 indica que no hay asociación entre las dos variables.
  • 1 indica una fuerte asociación entre las dos variables.

Se calcula como:

V de Cramer = √ (X 2 / n) / min (c-1, r-1)

dónde:

  • X 2 : el estadístico Chi-cuadrado
  • n: tamaño total de la muestra
  • r: número de filas
  • c: número de columnas

Este tutorial proporciona un par de ejemplos de cómo calcular la V de Cramer para una tabla de contingencia en Python.

Ejemplo 1: V de Cramer para una tabla de 2 × 2

El siguiente código muestra cómo calcular el V de Cramer para una tabla de 2 × 2:

#cargar los paquetes y funciones necesarios
 import scipy. stats  as stats 
importan numpy as np

#create 2x2 table
datos = np. matriz ([[7,12], [9,8]])

# Estadística de prueba de chi-cuadrado, tamaño de muestra y mínimo de filas y columnas
 X2 = estadísticas. chi2_contingency (datos, corrección = Falso ) [0]
n = np. suma (datos)
minDim = min (datos. forma ) -1

#calcule el V 
V de Cramer = np. sqrt ((X2 / n) / minDim)

#display Cramer's V
 print (V)

0.1617

El V de Cramer resulta ser 0,1617 , lo que indica una asociación bastante débil entre las dos variables de la tabla.

Ejemplo 2: V de Cramer para tablas más grandes

Tenga en cuenta que podemos usar la función CramerV para calcular la V de Cramer para una tabla de cualquier tamaño.

El siguiente código muestra cómo calcular la V de Cramer para una tabla con 2 filas y 3 columnas:

#cargar los paquetes y funciones necesarios
 import scipy. stats  as stats 
importan numpy as np

#create 2x2 table
datos = np. matriz ([[6,9], [8, 5], [12, 9]])

# Estadística de prueba de chi-cuadrado, tamaño de muestra y mínimo de filas y columnas
 X2 = estadísticas. chi2_contingency (datos, corrección = Falso ) [0]
n = np. suma (datos)
minDim = min (datos. forma ) -1

#calcule el V 
V de Cramer = np. sqrt ((X2 / n) / minDim)

#display Cramer's V
 print (V)

0,1775

La V de Cramer resulta ser 0,1775 .

Tenga en cuenta que este ejemplo usó una tabla con 2 filas y 3 columnas, pero este mismo código funciona exactamente para una tabla de cualquier dimensión.

Recursos adicionales

Prueba de chi-cuadrado de independencia en Python Prueba de
bondad de ajuste de chi-cuadrado en Python
Prueba exacta de Fisher en Python

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La distribución de Poisson es una de las distribuciones más populares en estadística. Para comprender la distribución de Poisson, es…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!