Prueba Q de Dixon: definición + ejemplo

Actualizado por ultima vez el 26 de agosto de 2022, por Dereck Amesquita.

La prueba Q de Dixon , a menudo denominada simplemente prueba Q , es una prueba estadística que se utiliza para detectar valores atípicos en un conjunto de datos.

La estadística de prueba para la prueba Q es la siguiente:

Q = | x a – x b | / R

donde x a es el valor atípico sospechado, x b es el punto de datos más cercano ax a , y R es el rango del conjunto de datos.En la mayoría de los casos, x a es el valor máximo en el conjunto de datos, pero también puede ser el valor mínimo.

Es importante tener en cuenta que la prueba Q se realiza normalmente en pequeños conjuntos de datos y la prueba asume que los datos se distribuyen normalmente.También es importante tener en cuenta que la prueba Q solo debe realizarse una vez para un conjunto de datos determinado.

¿Cómo realizar la prueba Q de Dixon a mano?

Supongamos que tenemos el siguiente conjunto de datos:

1, 3, 5, 7, 8, 9, 13, 25

Podemos seguir el procedimiento estándar de cinco pasos para la prueba de hipótesis para realizar la prueba Q de Dixon a mano para determinar si el valor máximo en este conjunto de datos es un valor atípico:

Paso 1. Exprese las hipótesis.

La hipótesis nula (H0): el máximo no es un valor atípico.

La hipótesis alternativa: (Ha): el máximo es un valor atípico.

Paso 2. Determine un nivel de significancia a utilizar.

Las opciones comunes son 0,1, 0,05 y 0,01. Usaremos un nivel de significancia de 0.05 para este ejemplo.

Paso 3. Encuentre la estadística de prueba.

Q = | x a – x b | / R

En este caso, nuestro valor máximo es x a = 25, nuestro siguiente valor más cercano es x b = 13 y nuestro rango es R = 25 – 1 = 24.

Por tanto, Q = | 25 – 13 | / 24 = 0,5 .

A continuación, podemos comparar esta estadística de prueba con los valores críticos de la prueba Q, que se muestran a continuación para varios tamaños de muestra (n) y niveles de confianza:

n 90% 95% 99%
3 0,941 0,970 0,994
4 0,765 0,829 0,926
5 0,642 0,710 0,821
6 0,560 0,625 0,740
7 0,507 0,568 0,680
8 0,468 0,526 0,634
9 0,437 0,493 0,598
10 0,412 0,466 0,568
11 0,392 0,444 0,542
12 0,376 0,426 0,522
13 0,361 0,410 0,503
14 0,349 0,396 0,488
15 0,338 0,384 0,475
16 0,329 0,374 0,463
17 0,320 0,365 0,452
180,313 0,356 0,442
19 0,306 0,349 0,433
20 0,300 0,342 0,425
21 0,295 0,337 0,418
22 0,290 0,331 0,411
23 0,285 0,326 0,404
24 0,281 0,321 0,399
25 0,277 0,317 0,393
26 0,273 0,312 0,388
27 0,269 0,308 0,384
28 0,266 0,305 0,380
29 0,263 0,301 0,376
30 0,260 0,290 0.372

El valor crítico para un tamaño de muestra de 8 y un nivel de confianza del 95% es 0,526 .

Paso 4. Rechace o no rechace la hipótesis nula.

Dado que nuestro estadístico de prueba Q (0.5) es menor que el valor crítico (0.526), ​​no rechazamos la hipótesis nula.

Paso 5. Interprete los resultados.

Dado que no pudimos rechazar la hipótesis nula, concluimos que el valor máximo 25 no es un valor atípico en este conjunto de datos.

¿Cómo realizar la prueba Q de Dixon en R?

Para realizar la prueba Q de Dixon en el mismo conjunto de datos en R, podemos usar la función dixon.test () de la biblioteca de valores atípicos , que usa la siguiente sintaxis:

dixon.test (datos, tipo = 10, opuesto = FALSO)

  • datos: un vector numérico de valores de datos
  • tipo: el tipo de fórmula que se utilizará para realizar el estadístico de prueba Q. Establezca el valor en 10 para utilizar la fórmula descrita anteriormente.
  • opuesto: si es FALSO, la prueba determina si el valor máximo es un valor atípico. Si es VERDADERO, la prueba determina si el valor mínimo es un valor atípico. Esto es FALSO por defecto.

Nota : Encuentre la documentación completa para dixon.test () aquí .

El siguiente código ilustra cómo realizar la prueba Q de Dixon para determinar si el valor máximo en el conjunto de datos es un valor atípico.

#cargar la biblioteca de valores atípicos
library(outliers)

#create data
 data <- c (1, 3, 5, 7, 8, 9, 13, 25)

# realizar la prueba Q de Dixon
 dixon.test (data, type = 10)

# Prueba de Dixon para valores atípicos
#
#data: data
#Q = 0.5, valor p = 0.06913
# hipótesis alternativa: el valor más alto 25 es un valor atípico

De la salida podemos ver que el estadístico de prueba es Q = 0.5 y el valor p correspondiente es 0.06913 . Por lo tanto, no rechazamos la hipótesis nula a un nivel de significancia de 0.05 y concluimos que 25 no es un valor atípico. Esto coincide con el resultado que obtuvimos a mano.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

I’m a Bachelor of Economics gratuaded from the National University of San Agustin. I have experience in Python, R and other languages with aplications in Finance or Econometrics, I also have knowledge of statistics and econometrics. If you need help on some issues you can write to me.

Deja un comentario

https://r-project.org https://www.python.org/ https://www.stata.com/
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!