La condición del 10% en estadística: definición y ejemplo

Actualizado por ultima vez el 7 de mayo de 2021, por .

Un ensayo de Bernoulli es un experimento con solo dos resultados posibles: «éxito» o «fracaso», y la probabilidad de éxito es la misma cada vez que se realiza el experimento.

Un ejemplo de prueba de Bernoulli es el lanzamiento de una moneda. La moneda solo puede caer en dos lados (podríamos llamar a la cara un «éxito» y a la cruz un «fracaso») y la probabilidad de éxito en cada lanzamiento es 0.5, asumiendo que la moneda es justa.

A menudo, en estadística, cuando queremos calcular probabilidades que involucran más de unos pocos ensayos de Bernoulli, usamos la distribución normal como una aproximación. Sin embargo, para hacerlo debemos asumir que los ensayos son independientes.

En los casos en los que los ensayos no son realmente independientes, podemos suponer que lo son si el tamaño de muestra con el que estamos trabajando no supera el 10% del tamaño de la población. Esto se conoce como la condición del 10% .

La condición del 10%: siempre que el tamaño de la muestra sea menor o igual al 10% del tamaño de la población, podemos suponer que los ensayos de Bernoulli son independientes.

Intuición detrás de la condición del 10%

Para desarrollar una intuición detrás de la Condición del 10%, considere el siguiente ejemplo.

S upongamos la verdadera proporción de estudiantes en una clase determinada que prefieren el fútbol sobre el baloncesto es 50%. Sea la variable aleatoria X el número de estudiantes seleccionados al azar en 4 ensayos que prefieren el fútbol americano al baloncesto. Digamos que estamos interesados ​​en comprender la probabilidad de que los 4 estudiantes seleccionados al azar prefieran el fútbol americano al baloncesto.

Si el tamaño de nuestra clase es 20 y nuestras pruebas fueran independientes (por ejemplo, podríamos tomar muestras repetidas de los 20 estudiantes), entonces la probabilidad de que cada estudiante prefiera el fútbol americano al baloncesto podría calcularse como:

P (Los 4 estudiantes prefieren el fútbol) = 10/20 * 10/20 * 10/20 * 10/20 = .0625 .

Sin embargo, si nuestras pruebas no son independientes (por ejemplo, una vez que muestreamos a un estudiante, no se puede volver a colocar en el aula), entonces la probabilidad de que los 4 estudiantes prefieran el fútbol se calcularía como:

P (Los 4 estudiantes prefieren el fútbol) = 10/20 * 9/19 * 8/18 * 7/17 = .0433 .

Estas dos probabilidades son bastante diferentes. Considere que en este ejemplo nuestro tamaño de muestra (4 estudiantes) no es menor o igual al 10% de la población (20 estudiantes), por lo que no podríamos usar la Condición del 10%.

Sin embargo, considere la siguiente tabla que muestra la probabilidad de que los 4 estudiantes seleccionados al azar prefieran el fútbol, ​​según el tamaño del aula:

Condición del 10 por ciento en estadísticas

A medida que disminuye el tamaño de la muestra en relación con el tamaño de la población (por ejemplo, el “tamaño del aula” en este ejemplo), la probabilidad calculada entre ensayos independientes y ensayos no independientes se acerca cada vez más.

Tenga en cuenta que cuando el tamaño de la muestra es exactamente el 10% del tamaño de la población, la diferencia entre las probabilidades de los ensayos independientes y los ensayos no independientes es relativamente similar.

Y cuando el tamaño de la muestra es mucho menor al 10% del tamaño de la población (por ejemplo, solo el 0,4% del tamaño de la población en la última fila de la tabla), las probabilidades entre ensayos independientes y no independientes son extremadamente cercanas.

Conclusión

La Condición del 10% dice que el tamaño de nuestra muestra debe ser menor o igual al 10% del tamaño de la población para poder asumir con seguridad que un conjunto de ensayos de Bernoulli es independiente.

Por supuesto, es mejor si el tamaño de nuestra muestra es mucho menor al 10% del tamaño de la población para que nuestras inferencias sobre la población sean lo más precisas posible. Por ejemplo, preferiríamos que nuestro tamaño de muestra sea solo el 5% de la población en comparación con el 10%.

Recursos adicionales

Introducción a la distribución normal
Introducción a la distribución binomial
Introducción al teorema del límite central

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Dos de las distribuciones más utilizadas en estadística son la distribución binomial y la distribución geométrica . Este tutorial proporciona…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!