Cómo contar observaciones por grupo en R

Actualizado por ultima vez el 7 de mayo de 2021, por .

A menudo, puede estar interesado en contar el número de observaciones (o filas) por grupo en R. Afortunadamente, esto es fácil de hacer usando la función count () de la biblioteca dplyr .

biblioteca (dplyr)

Este tutorial explica varios ejemplos de cómo utilizar esta función en la práctica utilizando el siguiente marco de datos:

#create marco de datos
df <- data.frame (equipo = c ('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'C', 'C' , 'C', 'C'),
                 posición = c ('G', 'G', 'F', 'G', 'F', 'F', 'F', 'G', 'G', 'F', 'F', 'F '),
                 puntos = c (4, 13, 7, 8, 15, 15, 17, 9, 21, 22, 25, 31))

#ver marco de datos
 df

   puntos de posición del equipo
1 AG 4
2 AG 13
3 AF 7
4 BG 8
5 BF 15
6 BF 15
7 BF 17
8 BG 9
9 CG 21
10 CF 22
11 CF 25
12 CF 31

Ejemplo 1: contar por una variable

El siguiente código muestra cómo contar el número total de jugadores por equipo:

#contar observaciones totales por variable 'equipo'
df%>% count (equipo)

# A tibble: 3 x 2
  equipo n
   
1 A 3
2 B 5
3 C 4

De la salida podemos ver que:

  • El equipo A tiene 3 jugadores
  • El equipo B tiene 5 jugadores
  • El equipo C tiene 4 jugadores

Esta función única count () nos da una buena idea de la distribución de jugadores por equipo.

Tenga en cuenta que también podemos ordenar los recuentos si nos gustaría:

#contar observaciones totales por variable 'equipo' 
df%>% count (equipo, sort = TRUE )

# A tibble: 3 x 2
  equipo n
   
1 B 5
2 C 4
3 A 3

Ejemplo 2: contar por múltiples variables

También podemos ordenar por más de una variable:

#contar observaciones totales por 'equipo' y 'posición'
 df%>% count (equipo, posición)

# A tibble: 6 x 3
  posición del equipo m
       
1 AF 1
2 AG 2
3 BF 3
4 BG 2
5 CF 3
6 CG 1

De la salida podemos ver que:

  • El equipo A tiene 1 jugador en la posición ‘F’ (delantero) y 2 jugadores en la posición ‘G’ (guardia).
  • El equipo B tiene 3 jugadores en la posición ‘F’ (adelante) y 2 jugadores en la posición ‘G’ (guardia).
  • El equipo C tiene 3 jugadores en la posición ‘F’ (adelante) y 1 jugador en la posición ‘G’ (guardia).

Ejemplo 3: recuento ponderado

También podemos «ponderar» los recuentos de una variable por otra variable. Por ejemplo, el siguiente código muestra cómo contar el total de observaciones por equipo, usando la variable ‘puntos’ como ponderación:

df%>% count (equipo, peso = puntos )

# A tibble: 3 x 2
  equipo n
   
1 A 24
2 B 64
3 C 99

Puede encontrar la documentación completa para el recuento () la función aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Se utiliza una prueba U de Mann-Whitney (a veces llamada prueba de suma de rangos de Wilcoxon) para comparar las…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!