Cómo realizar una prueba de bondad de ajuste de chi-cuadrado en Stata

Se utiliza una prueba de bondad de ajuste de chi-cuadrado para determinar si una variable categórica sigue o no una distribución hipotética.

Este tutorial explica cómo realizar una prueba de bondad de ajuste de chi-cuadrado en Stata.

Ejemplo: prueba de bondad de ajuste de chi-cuadrado en Stata

Para ilustrar cómo realizar esta prueba, usaremos un conjunto de datos llamado nlsw88 , que contiene información sobre estadísticas laborales para mujeres en los EE. UU. En 1988.

Utilice los siguientes pasos para realizar una prueba de bondad de ajuste de chi-cuadrado para determinar si la verdadera distribución de la raza en este conjunto de datos es la siguiente: 70% blancos, 20% negros, 10% otros.

Paso 1: cargue y vea los datos sin procesar.

Primero, cargaremos los datos escribiendo el siguiente comando:

sysuse nlsw88

Podemos ver los datos sin procesar escribiendo el siguiente comando:

br

Ver datos sin procesar en Stata

Cada línea muestra información de un individuo, incluida su edad, raza, estado civil, nivel de educación y una variedad de otros factores.

Paso 2: Cargue el paquete de bondad de ajuste.

Para realizar una prueba de bondad de ajuste, necesitaremos instalar el paquete csgof . Podemos hacerlo escribiendo el siguiente comando:

findit csgof

Aparecerá una nueva ventana. Haga clic en el enlace que dice csgof de https://stats.idre.ucla.edu/stat/stata/ado/analysis .

Aparecerá otra ventana. Haga clic en el enlace que dice haga clic aquí para instalar .

El paquete solo debería tardar unos segundos en instalarse.

Paso 3: Realice la prueba de bondad de ajuste.

Una vez que el paquete está instalado, podemos realizar la prueba de bondad de ajuste en los datos para determinar si la verdadera distribución de la raza es la siguiente: 70% blancos, 20% negros, 10% otros.

Usaremos la siguiente sintaxis para realizar la prueba:

csgof variable_of_interest, expperc (lista_de_porcentajes_esperados)

Aquí está la sintaxis exacta que usaremos en nuestro caso:

raza csgof, expperc (70, 20, 10)

Bondad de chi-cuadrado de salida de ajuste en Stata

A continuación se explica cómo interpretar la salida:

Cuadro de resumen: este cuadro nos muestra el porcentaje esperado, la frecuencia esperada y la frecuencia observada para cada carrera. Por ejemplo:

  • El porcentaje esperado de individuos blancos fue del 70%. Este es el porcentaje que especificamos.
  • La frecuencia esperada de individuos blancos fue de 1.572,2. Esto se calcula utilizando el hecho de que había 2246 personas en el conjunto de datos, por lo que el 70% de ese número es 1572,2.
  • La frecuencia observada de individuos blancos fue de 1.637. Este es el número real de individuos blancos en el conjunto de datos.

Chisq (2): este es el estadístico de la prueba Chi-cuadrado para la prueba de bondad de ajuste. Resulta ser 218.13.

p: Este es el valor p asociado con el estadístico de prueba de Chi-Cuadrado. Resulta ser 0. Dado que esto es menor que 0.05, no rechazamos la hipótesis nula de que la verdadera distribución de la raza es 70% Blanca, 20% Negra, 10% Otra. Tenemos suficiente evidencia para concluir que la verdadera distribución de la raza es diferente de esta distribución hipotética.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

A menudo, es posible que desee ordenar por varias columnas en Excel. Afortunadamente, esto es fácil de hacer con la…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!