Cómo realizar una prueba de Kruskal-Wallis en Stata

Se utiliza una prueba de Kruskal-Wallis para determinar si existe o no una diferencia estadísticamente significativa entre las medianas de tres o más grupos independientes. Se considera el equivalente no paramétrico del ANOVA de una vía .

Este tutorial explica cómo realizar una prueba de Kruskal-Wallis en Stata.

Cómo realizar una prueba de Kruskal-Wallis en Stata

Para este ejemplo usaremos el conjunto de datos del censo , que contiene datos del censo de 1980 para los cincuenta estados de los EE. UU. Dentro del conjunto de datos, los estados se clasifican en cuatro regiones diferentes:

  • Noreste
  • norte central
  • Sur
  • Oeste

Realizaremos una prueba de Kruskal-Wallis para determinar si la edad media es igual en estas cuatro regiones.

Paso 1: cargue y vea los datos.

Primero, cargue el conjunto de datos escribiendo el siguiente comando en el cuadro Comando:

use http://www.stata-press.com/data/r13/census

Obtenga un resumen rápido del conjunto de datos mediante el siguiente comando:

resumir

Resumiendo un conjunto de datos en Stata

Podemos ver que hay 13 variables diferentes en este conjunto de datos, pero las únicas dos con las que trabajaremos son la mediana (edad media) y la región .

Paso 2: Visualiza los datos.

Antes de realizar la prueba de Kruskal-Wallis, primero creemos algunos diagramas de caja para visualizar la distribución de la edad media para cada una de las cuatro regiones:

Medida de cuadro de gráfico, sobre (región)

Varias gráficas de caja en una parcela en Stata

Con solo mirar los diagramas de caja, podemos ver que las distribuciones parecen variar entre las regiones. A continuación, realizaremos una prueba de Kruskal-Wallis para ver si estas diferencias son estadísticamente significativas.

Paso 3: Realice una prueba de Kruskal-Wallis.

Utilice la siguiente sintaxis para realizar una prueba de Kruskal-Wallis:

kwallis variable_medida, por (variable_grupo)

En nuestro caso, usaremos la siguiente sintaxis:

kwallis medage, por (región)

Salida de Kruskal-Wallis en Stata

A continuación se explica cómo interpretar la salida:

Tabla de resumen: esta tabla muestra el número de observaciones por región y las sumas de rango para cada región.

Chi-cuadrado con empates: este es el valor del estadístico de prueba, que resulta ser 17.062.

probabilidad: Este es el valor p que corresponde al estadístico de prueba, que resulta ser 0,0007. Dado que este valor es menor que .05, podemos rechazar la hipótesis nula y concluir que la edad mediana no es igual en las cuatro regiones.

Paso 4: Informe los resultados.

Por último, queremos informar los resultados de la prueba de Kruskal-Wallis. A continuación, se muestra un ejemplo de cómo hacerlo:

Se realizó una prueba de Kruskal-Wallist para determinar si la edad media de los individuos era la misma en las siguientes cuatro regiones de los Estados Unidos:

  • Noreste (n = 9)
  • Centro-norte (n = 12)
  • Sur (n = 16)
  • Oeste (n = 13)

La prueba reveló que la edad media de los individuos no era la misma (X 2 = 17.062, p = 0.0007) en las cuatro regiones. Es decir, hubo una diferencia estadísticamente significativa en la edad media entre dos o más de las regiones.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Se utiliza un ANOVA de una vía para determinar si existe o no una diferencia estadísticamente significativa entre las medias…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!