Cómo buscar y visualizar cuartiles en R

Los cuartiles son valores que dividen un conjunto de datos en cuatro partes iguales.

  • El primer cuartil representa el percentil 25 de un conjunto de datos.
  • El segundo cuartil representa el percentil 50 de un conjunto de datos. Este valor es equivalente al valor mediano del conjunto de datos.
  • El tercer cuartil representa el percentil 75 de un conjunto de datos.

Podemos calcular fácilmente los cuartiles de un conjunto de datos dado en R usando la función de cuantiles () . Este tutorial proporciona ejemplos de cómo utilizar esta función en la práctica.

Calcular cuartiles en R

El siguiente código muestra cómo calcular los cuartiles de un conjunto de datos dado en R:

#define dataset
datos = c (4, 7, 12, 13, 14, 15, 15, 16, 19, 23, 24, 25, 27, 28, 33)

#calcular cuartiles del conjunto de datos
cuantil (datos)

  0% 25% 50% 75% 100% 
 4,0 13,5 16,0 24,5 33,0 

A continuación, se explica cómo interpretar la salida:

  • El primer valor muestra el valor mínimo en el conjunto de datos: 4.0
  • El segundo valor muestra el primer cuartil del conjunto de datos: 13,5
  • El tercer valor muestra el segundo cuartil del conjunto de datos: 16.0
  • El cuarto valor muestra el tercer cuartil del conjunto de datos: 24,5
  • El quinto valor muestra el valor máximo en el conjunto de datos: 33.0

Relacionado: Cómo calcular fácilmente percentiles en R

Visualización de cuartiles en R

Podemos usar la función boxplot () para crear un diagrama de caja para visualizar los cuartiles de este conjunto de datos en R:

#create boxplot 
diagrama de caja (datos)

Visualización de cuartiles en R

A continuación, se explica cómo interpretar la gráfica de caja:

  • El «bigote» inferior muestra el valor mínimo de 4 .
  • La línea inferior del cuadro muestra el valor del primer cuartil de 13,5 .
  • La barra negra en el medio del cuadro muestra el valor del segundo cuartil de 16.0 .
  • La línea superior del cuadro muestra el valor del tercer cuartil de 24,5 .
  • El «bigote» superior muestra el valor máximo de 33,0 .

Este gráfico único nos ayuda a visualizar rápidamente la distribución de valores en el conjunto de datos.

Relacionado: Cómo trazar múltiples diagramas de caja en un gráfico en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Un bucle for anidado le permite recorrer elementos en múltiples vectores (o múltiples dimensiones de una matriz) y realizar algunas…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!