Cómo calcular deciles en Python (con ejemplos)

En estadística, los deciles son números que dividen un conjunto de datos en diez grupos de igual frecuencia.

El primer decil es el punto donde el 10% de todos los valores de datos se encuentran por debajo de él. El segundo decil es el punto donde el 20% de todos los valores de datos se encuentran por debajo de él, y así sucesivamente.

Podemos usar la siguiente sintaxis para calcular los deciles de un conjunto de datos en Python:

importar numpy como np

notario público. percentil (var, np. rango (0, 100, 10))

El siguiente ejemplo muestra cómo utilizar esta función en la práctica.

Ejemplo: calcular deciles en Python

El siguiente código muestra cómo crear un conjunto de datos falso con 20 valores y luego calcular los valores para los deciles del conjunto de datos:

importar numpy como np

#create data
 data = np. matriz ([56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
                 89, 90, 91, 92, 93, 93, 94, 95, 97, 99])

#calcular deciles de datos
 np. percentil (datos, np. rango (0, 100, 10))

matriz ([56., 63,4, 67,8, 76,5, 83,6, 88,5, 90,4, 92,3, 93,2, 95,2])

La forma de interpretar los deciles es la siguiente:

  • El 10% de todos los valores de datos se encuentran por debajo de 63,4
  • El 20% de todos los valores de datos se encuentran por debajo de 67,8 .
  • El 30% de todos los valores de datos se encuentran por debajo de 76,5 .
  • El 40% de todos los valores de datos se encuentran por debajo de 83,6 .
  • El 50% de todos los valores de datos se encuentran por debajo de 88,5 .
  • El 60% de todos los valores de los datos se encuentran por debajo de 90,4 .
  • El 70% de todos los valores de los datos se encuentran por debajo de 92,3 .
  • El 80% de todos los valores de datos se encuentran por debajo de 93,2 .
  • El 90% de todos los valores de los datos se encuentran por debajo de 95,2 .

Tenga en cuenta que el primer valor en la salida (56) simplemente denota el valor mínimo en el conjunto de datos.

Ejemplo: colocar valores en deciles en Python

Para colocar cada valor de datos en un decil, podemos usar la función qcut pandas.

A continuación, se explica cómo utilizar esta función para el conjunto de datos que creamos en el ejemplo anterior:

importar pandas como pd

#create data frame
 df = pd. DataFrame ({' valores ': [56, 58, 64, 67, 68, 73, 78, 83, 84, 88,
                              89, 90, 91, 92, 93, 93, 94, 95, 97, 99]})

# calcular el decil de cada valor en el marco de datos
 df [' Decil '] = pd. qcut (df ​​[' valores '], 10, etiquetas = Falso )

#display marco de datos
 df

	valores Decil
0 56 0
1 58 0
2 64 1
3 67 1
4 68 2
5 73 2
6 78 3
7 83 3
8 84 4
9 88 4
10 89 5
11 90 5
12 91 6
13 92 6
14 93 7
15 93 7
16 94 8
17 95 8
18 97 9
19 99 9

La forma de interpretar la salida es la siguiente:

  • El valor de los datos 56 cae entre el percentil 0% y el 10%, por lo que cae en el decil 0 .
  • El valor de los datos 58 cae entre el percentil 0% y el 10%, por lo que cae en el decil 0 .
  • El valor de los datos 64 cae entre el percentil 10% y el 20%, por lo que cae en el decil 1 .
  • El valor de los datos 67 cae entre el percentil 10% y el 20%, por lo que cae del decil 1 .
  • El valor de los datos 68 se encuentra entre el percentil 20% y el 30%, por lo que cae del decil 2 .

Y así.

Recursos adicionales

Cómo calcular percentiles en Python
Cómo calcular el rango intercuartil en Python

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

El error estándar de la media es una forma de medir qué tan dispersos están los valores en un conjunto…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!