Actualizado por ultima vez el 7 de mayo de 2021, por .
A menudo, puede estar interesado en contar el número de observaciones (o filas) por grupo en R. Afortunadamente, esto es fácil de hacer usando la función count () de la biblioteca dplyr .
biblioteca (dplyr)
Este tutorial explica varios ejemplos de cómo utilizar esta función en la práctica utilizando el siguiente marco de datos:
#create marco de datos df <- data.frame (equipo = c ('A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'C', 'C' , 'C', 'C'), posición = c ('G', 'G', 'F', 'G', 'F', 'F', 'F', 'G', 'G', 'F', 'F', 'F '), puntos = c (4, 13, 7, 8, 15, 15, 17, 9, 21, 22, 25, 31)) #ver marco de datos df puntos de posición del equipo 1 AG 4 2 AG 13 3 AF 7 4 BG 8 5 BF 15 6 BF 15 7 BF 17 8 BG 9 9 CG 21 10 CF 22 11 CF 25 12 CF 31
Ejemplo 1: contar por una variable
El siguiente código muestra cómo contar el número total de jugadores por equipo:
#contar observaciones totales por variable 'equipo' df%>% count (equipo) # A tibble: 3 x 2 equipo n 1 A 3 2 B 5 3 C 4
De la salida podemos ver que:
- El equipo A tiene 3 jugadores
- El equipo B tiene 5 jugadores
- El equipo C tiene 4 jugadores
Esta función única count () nos da una buena idea de la distribución de jugadores por equipo.
Tenga en cuenta que también podemos ordenar los recuentos si nos gustaría:
#contar observaciones totales por variable 'equipo' df%>% count (equipo, sort = TRUE ) # A tibble: 3 x 2 equipo n 1 B 5 2 C 4 3 A 3
Ejemplo 2: contar por múltiples variables
También podemos ordenar por más de una variable:
#contar observaciones totales por 'equipo' y 'posición' df%>% count (equipo, posición) # A tibble: 6 x 3 posición del equipo m 1 AF 1 2 AG 2 3 BF 3 4 BG 2 5 CF 3 6 CG 1
De la salida podemos ver que:
- El equipo A tiene 1 jugador en la posición ‘F’ (delantero) y 2 jugadores en la posición ‘G’ (guardia).
- El equipo B tiene 3 jugadores en la posición ‘F’ (adelante) y 2 jugadores en la posición ‘G’ (guardia).
- El equipo C tiene 3 jugadores en la posición ‘F’ (adelante) y 1 jugador en la posición ‘G’ (guardia).
Ejemplo 3: recuento ponderado
También podemos «ponderar» los recuentos de una variable por otra variable. Por ejemplo, el siguiente código muestra cómo contar el total de observaciones por equipo, usando la variable ‘puntos’ como ponderación:
df%>% count (equipo, peso = puntos ) # A tibble: 3 x 2 equipo n 1 A 24 2 B 64 3 C 99
Puede encontrar la documentación completa para el recuento () la función aquí .
- https://r-project.org
- https://www.python.org/
- https://www.stata.com/