Una explicación de los valores p y la importancia estadística

En estadística, los valores p se utilizan comúnmente en las pruebas de hipótesis para pruebas t, pruebas de chi-cuadrado, análisis de regresión, ANOVA y una variedad de otros métodos estadísticos.

A pesar de ser tan común, las personas a menudo interpretan los valores p de manera incorrecta, lo que puede llevar a errores al interpretar los hallazgos de un análisis o estudio.

Esta publicación explica cómo comprender e interpretar los valores p de una manera clara y práctica.

Evaluación de la hipótesis

Para comprender los valores p, primero debemos comprender el concepto de prueba de hipótesis .

Una prueba de hipótesis es una prueba estadística formal que usamos para rechazar o no rechazar alguna hipótesis. Por ejemplo, podemos plantear la hipótesis de que un nuevo fármaco, método o procedimiento proporciona algún beneficio sobre un fármaco, método o procedimiento actual.

Para probar esto, podemos realizar una prueba de hipótesis donde usamos una hipótesis nula y alternativa:

Hipótesis nula : no hay efecto ni diferencia entre el método nuevo y el método antiguo.

Hipótesis alternativa : existe algún efecto o diferencia entre el método nuevo y el método antiguo.

Un valor p indica qué tan creíble es la hipótesis nula, dados los datos de la muestra. Específicamente, asumiendo que la hipótesis nula es verdadera, el valor p nos dice la probabilidad de obtener un efecto al menos tan grande como el que realmente observamos en los datos de la muestra.

Si el valor p de una prueba de hipótesis es suficientemente bajo, podemos rechazar la hipótesis nula. Específicamente, cuando realizamos una prueba de hipótesis, debemos elegir un nivel de significancia desde el principio. Las opciones comunes para los niveles de significancia son 0.01, 0.05 y 0.10.

Si los valores p son menores que nuestro nivel de significancia, entonces podemos rechazar la hipótesis nula.

De lo contrario, si el valor p es igual o mayor que nuestro nivel de significancia, no rechazamos la hipótesis nula.

Cómo interpretar un valor p

La definición de libro de texto de un valor p es:

Un valor p es la probabilidad de observar un estadístico muestral que es al menos tan extremo como el estadístico muestral, dado que la hipótesis nula es verdadera.

Por ejemplo, suponga que una fábrica afirma que produce neumáticos con un peso medio de 200 libras. Un auditor plantea la hipótesis de que el peso medio real de los neumáticos producidos en esta fábrica es diferente de 200 libras, por lo que realiza una prueba de hipótesis y encuentra que el valor p de la prueba es 0.04. A continuación se explica cómo interpretar este valor p:

Si la fábrica realmente produce llantas que tienen un peso medio de 200 libras, entonces el 4% de todas las auditorías obtendrán el efecto observado en la muestra, o más, debido a un error de muestra aleatorio. Esto nos dice que obtener los datos de muestra que obtuvo el auditor sería bastante raro si de hecho la fábrica produjera neumáticos con un peso medio de 200 libras.

Dependiendo del nivel de significancia usado en esta prueba de hipótesis, el auditor probablemente rechazaría la hipótesis nula de que el verdadero peso medio de los neumáticos producidos en esta fábrica es de hecho de 200 libras. Los datos de muestra que obtuvo de la auditoría no son muy consistentes con la hipótesis nula.

Cómo no interpretar un valor p

El mayor error sobre los valores p es que son equivalentes a la probabilidad de cometer un error al rechazar una hipótesis nula verdadera (conocida como error de Tipo I).

Hay dos razones principales por las que los valores p no pueden ser la tasa de error:

1. Los valores p se calculan basándose en el supuesto de que la hipótesis nula es verdadera y que la diferencia entre los datos de la muestra y la hipótesis nula es simple causada por el azar. Por lo tanto, los valores p no pueden decirle la probabilidad de que el nulo sea verdadero o falso, ya que es 100% verdadero según la perspectiva de los cálculos.

2. Aunque un valor p bajo indica que es poco probable que los datos de su muestra supongan que el nulo sea verdadero, un valor p aún no puede decirle cuál de los siguientes casos es más probable:

  • El nulo es falso
  • El nulo es cierto pero obtuviste una muestra extraña

Con respecto al ejemplo anterior, aquí hay una forma correcta e incorrecta de interpretar el valor p:

  • La interpretación correcta: Suponiendo que la fábrica de neumáticos no producen con un peso promedio de 200 libras, que obtendría la diferencia observada que hizo obtener en su muestra o una diferencia más extrema en el 4% de las auditorías debido a un error de muestreo al azar.
  • Interpretación incorrecta: si rechaza la hipótesis nula, existe un 4% de probabilidad de que esté cometiendo un error.

Ejemplos de interpretación de valores p

Los siguientes ejemplos ilustran formas correctas de interpretar los valores p en el contexto de la prueba de hipótesis.

Ejemplo 1

Una compañía telefónica afirma que el 90% de sus clientes están satisfechos con su servicio. Para probar esta afirmación, un investigador independiente reunió una muestra aleatoria simple de 200 clientes y les preguntó si estaban satisfechos con su servicio, a lo que el 85% respondió que sí. El valor p asociado con estos datos de muestra resultó ser 0.018.

Interpretación correcta del valor p: Suponiendo que el 90% de los clientes están realmente satisfechos con su servicio, el investigador obtendría la diferencia observada que obtuvo en su muestra o una diferencia más extrema en el 1.8% de las auditorías debido a un error de muestreo aleatorio. .

Ejemplo 2

Una empresa inventa una nueva batería para teléfonos. La compañía afirma que esta nueva batería funcionará durante al menos 10 minutos más que la batería vieja. Para probar esta afirmación, un investigador toma una muestra aleatoria simple de 80 baterías nuevas y 80 baterías viejas. Las baterías nuevas funcionan durante un promedio de 120 minutos con una desviación estándar de 12 minutos y las baterías viejas funcionan durante un promedio de 115 minutos con una desviación estándar de 15 minutos. El valor p que resulta de la prueba para una diferencia en las medias poblacionales es 0.011.

Interpretación correcta del valor p: Suponiendo que la batería nueva funciona durante la misma cantidad de tiempo o menos que la batería vieja, el investigador obtendría la diferencia observada o una diferencia más extrema en el 1,1% de los estudios debido a un error de muestreo aleatorio.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Un polígono de frecuencia es un tipo de gráfico que nos ayuda a visualizar una distribución de valores. Este tutorial…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!