¿Cuál es la diferencia entre una prueba T y un ANOVA?

Diferencia entre una prueba t y un ANOVA

Este tutorial explica la diferencia entre una prueba t y un ANOVA , junto con cuándo usar cada prueba.

Comprensión de los conceptos básicos de cada prueba

Antes de explicar la diferencia entre una prueba t y un ANOVA, es útil explicar primero los conceptos básicos de cada prueba.

Prueba t

Se utiliza una prueba t para determinar si existe una diferencia estadísticamente significativa entre las medias de dos grupos . Hay dos tipos de pruebas t:

1. Prueba t de muestras independientes. Se utiliza cuando deseamos comparar la diferencia entre las medias de dos grupos y los grupos son completamente independientes entre sí.

Por ejemplo, los investigadores pueden querer saber si la dieta A o la dieta B ayudan a las personas a perder más peso. Se asignan 100 personas asignadas al azar a la dieta A. Otras 100 personas asignadas al azar se asignan a la dieta B. Después de tres meses, los investigadores registran la pérdida de peso total de cada persona. Para determinar si la pérdida de peso media entre los dos grupos es significativamente diferente, los investigadores pueden realizar una prueba t de muestras independientes.

2. Prueba t de muestras pareadas . Esto se usa cuando deseamos comparar la diferencia entre las medias de dos grupos y donde cada observación en un grupo se puede emparejar con una observación en el otro grupo.

Por ejemplo, suponga que 20 estudiantes en una clase toman una prueba, luego estudian una guía determinada y luego vuelven a tomar la prueba. Para comparar la diferencia entre las puntuaciones en la primera y la segunda prueba, utilizamos una prueba t pareada porque para cada estudiante, la puntuación de la primera prueba se puede emparejar con la puntuación de la segunda prueba.

Para que una prueba t produzca resultados válidos, se deben cumplir las siguientes suposiciones:

  • Aleatorio: se debe utilizar una muestra aleatoria o un experimento aleatorio para recopilar datos para ambas muestras.
  • Normal: la distribución de la muestra es normal o aproximadamente normal.

Si se cumplen estas suposiciones, entonces es seguro usar una prueba t para probar la diferencia entre las medias de dos grupos.

ANOVA

Se utiliza un ANOVA (análisis de varianza) para determinar si existe o no una diferencia estadísticamente significativa entre las medias de tres o más grupos .Las pruebas ANOVA más utilizadas en la práctica son el ANOVA unidireccional y el ANOVA bidireccional:

ANOVA unidireccional: se utiliza para probar si existe una diferencia estadísticamente significativa entre las medias de tres o más grupos cuando los grupos se pueden dividir en un factor .

Ejemplo: divide al azar una clase de 90 estudiantes en tres grupos de 30. Cada grupo usa una técnica de estudio diferente durante un mes para prepararse para un examen. Al final del mes, todos los estudiantes toman el mismo examen. Desea saber si la técnica de estudio tiene un impacto o no en los puntajes de los exámenes, por lo que realiza un ANOVA de una vía para determinar si existe una diferencia estadísticamente significativa entre los puntajes medios de los tres grupos.

Ejemplo de ANOVA unidireccional

ANOVA bidireccional: se utiliza para probar si existe una diferencia estadísticamente significativa entre las medias de tres o más grupos cuando los grupos se pueden dividir en dos factores .

Ejemplo: desea determinar si el nivel de ejercicio (sin ejercicio, ejercicio ligero, ejercicio intenso) y el sexo (hombre, mujer) afectan la pérdida de peso. En este caso, los dos factores que está estudiando son el ejercicio y el género, y su variable de respuesta es la pérdida de peso (medida en libras). Puede realizar un ANOVA bidireccional para determinar si el ejercicio y el género afectan la pérdida de peso y para determinar si existe una interacción entre el ejercicio y el género en la pérdida de peso.

Ejemplo de ANOVA bidireccional

Para que un ANOVA produzca resultados válidos, se deben cumplir los siguientes supuestos:

  • Normalidad : todas las poblaciones que estamos estudiando siguen una distribución normal. Entonces, por ejemplo, si queremos comparar los puntajes del examen de tres grupos diferentes de estudiantes, los puntajes del examen para el primer grupo, segundo grupo y tercer grupo deben distribuirse normalmente.
  • Igualdad de varianza : las varianzas de población en cada grupo son iguales o aproximadamente iguales.
  • Independencia : las observaciones de cada grupo deben ser independientes entre sí. Por lo general, un diseño aleatorio se encargará de esto.

Si se cumplen estas suposiciones, entonces es seguro usar un ANOVA para probar la diferencia entre las medias de tres o más grupos.

Comprensión de las diferencias entre cada prueba

La principal diferencia entre una prueba t y un ANOVA está en cómo las dos pruebas calculan su estadística de prueba para determinar si hay una diferencia estadísticamente significativa entre los grupos.

Una prueba t de muestras independientes utiliza la siguiente estadística de prueba:

estadístico de prueba t = [( x 1x 2 ) – d] / (√ s 2 1 / n 1 + s 2 2 / n 2 )

donde x 1 y x 2 son las medias muestrales para los grupos 1 y 2, d es la diferencia hipotética entre las dos medias (a menudo es cero), s 1 2 y s 2 2 son las varianzas muestrales para los grupos 1 y 2, y n 1 y n 2 son los tamaños de muestra para los grupos 1 y 2, respectivamente.

Una prueba t de muestras pareadas utiliza la siguiente estadística de prueba:

estadístico de prueba t = d / (s d / √n)

donde d es la diferencia media entre los dos grupos, s d es la desviación estándar de las diferencias y n es el tamaño de la muestra para cada grupo (tenga en cuenta que ambos grupos tendrán el mismo tamaño de muestra).

Un ANOVA utiliza la siguiente estadística de prueba:

estadístico de prueba F = s 2 b / s 2 w

donde s 2 b es la varianza entre muestras y s 2 w es la varianza dentro de la muestra.

Una prueba t mide la razón de la diferencia media entre dos grupos en relación con la desviación estándar general de las diferencias. Si esta relación es lo suficientemente alta, proporciona suficiente evidencia de que existe una diferencia significativa entre los dos grupos.

Un ANOVA, por otro lado, mide la relación de varianza entre los grupos en relación con la varianza dentro de los grupos. Similar a la prueba t, si esta relación es lo suficientemente alta, proporciona evidencia suficiente de que no los tres grupos tienen la misma media.

Otra diferencia clave entre una prueba t y un ANOVA es que la prueba t puede decirnos si dos grupos tienen la misma media o no. Un ANOVA, por otro lado, nos dice si tres grupos tienen la misma media o no, pero no nos dice explícitamente qué grupos tienen medias que son diferentes entre sí. Para saber qué grupos difieren entre sí, tendríamos que realizar pruebas post-hoc .

Entender cuándo usar cada prueba

En la práctica, cuando queremos comparar las medias de dos grupos , utilizamos una prueba t. Cuando queremos comparar las medias de tres o más grupos , usamos un ANOVA.

La razón subyacente por la que no usamos simplemente varias pruebas t para comparar las medias de tres o más grupos se remonta a la comprensión de la tasa de error de tipo I.Suponga que tenemos tres grupos entre los que queremos comparar las medias: grupo A, grupo B y grupo C. Puede tener la tentación de realizar las siguientes tres pruebas t:

  • Una prueba t para comparar la diferencia de medias entre el grupo A y el grupo B
  • Una prueba t para comparar la diferencia de medias entre el grupo A y el grupo C
  • Una prueba t para comparar la diferencia de medias entre el grupo B y el grupo C

Para cada prueba t existe la posibilidad de que cometamos un error de tipo I , que es la probabilidad de que rechacemos la hipótesis nula cuando en realidad es cierta. Esta probabilidad suele ser del 5%. Esto significa que cuando realizamos múltiples pruebas t, esta tasa de error aumenta. Por ejemplo:

  • La probabilidad de que cometamos un error de tipo I con una prueba t es 1 – 0,95 = 0,05 .
  • La probabilidad de que cometamos un error de tipo I con dos pruebas t es 1 – (0,95 2 ) = 0,0975 .
  • La probabilidad de que cometamos un error de tipo I con dos pruebas t es 1 – (0,95 3 ) = 0,1427 .

Esta tasa de error es inaceptablemente alta. Afortunadamente, un ANOVA controla estos errores de modo que el error de Tipo I permanece en solo el 5%. Esto nos permite tener más confianza en que un resultado de prueba estadísticamente significativo es realmente significativo y no solo un resultado que obtuvimos al realizar muchas pruebas. Así, cuando queremos entender si existe una diferencia entre las medias de tres o más grupos, debemos utilizar un ANOVA para que nuestros resultados sean estadísticamente válidos y fiables.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

El índice de similitud de Jaccard mide la similitud entre dos conjuntos de datos. Puede variar de 0 a 1.…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!