Cómo agregar varias columnas en R (con ejemplos)

Actualizado por ultima vez el 7 de mayo de 2021, por .

Podemos usar la función aggregate () en R para producir estadísticos de resumen para una o más variables en un marco de datos.

Esta función utiliza la siguiente sintaxis básica:

agregado (suma_var ~ grupo_var, datos = gl, DIVERSIÓN = media)

dónde:

  • sum_var: la variable a resumir
  • group_var: la variable para agrupar
  • datos: el nombre del marco de datos
  • DIVERSIÓN: la estadística de resumen para calcular

Este tutorial proporciona varios ejemplos de cómo usar esta función para agregar una o más columnas a la vez en R, usando el siguiente marco de datos como ejemplo:

#create data frame 
df <- data. frame (equipo = c ('A', 'A', 'A', 'B', 'B', 'B', 'C', 'C'),
                 conf = c ('E', 'E', 'W', 'W', 'W', 'W', 'W', 'W'),
                 puntos = c (1, 3, 3, 4, 5, 7, 7, 9),
                 rebotes = c (7, 7, 8, 3, 2, 7, 14, 13))

#ver marco de datos
 df

  rebotes de puntos de conf del equipo
1 AE 1 7
2 AE 3 7
3 AW 3 8
4 BW 4 3
5 BW 5 2
6 BW 7 7
7 CW 7 14
8 CW 9 13

Ejemplo 1: resumir una variable y agrupar por una variable

El siguiente código muestra cómo encontrar la media de puntos anotados, agrupados por equipo:

# encontrar la media de puntos anotados, agrupados por equipo 
agregado (puntos ~ equipo, datos = gl, DIVERSIÓN = media, na. rm = VERDADERO )

  puntos de equipo
1 A 2.333333
2 B 5.333333
3 C 8.000000

Ejemplo 2: resumir una variable y agrupar por varias variables

El siguiente código muestra cómo encontrar los puntos medios anotados, agrupados por equipo y conferencia:

# encontrar la media de puntos anotados, agrupados por equipo y 
agregado de conferencia (puntos ~ equipo + conf, datos = df, DIVERSIÓN = media, na. rm = VERDADERO )

  puntos de conf del equipo
1 AE 2.000000
2 AW 3.000000
3 BW 5.333333
4 CW 8.000000

Ejemplo 3: resumir múltiples variables y agrupar por una variable

El siguiente código muestra cómo encontrar los puntos medios y los rebotes medios, agrupados por equipo:

# encontrar la media de puntos anotados, agrupados por equipo y 
agregado de conferencia ( cbind (puntos, rebotes) ~ equipo, datos = gl, DIVERSIÓN = media, na. rm = VERDADERO )

  rebotes de puntos de equipo
1 A 2,333333 7,333333
2 B 5.333333 4.000000
3 C 8.000000 13.500000

Ejemplo 4: Resumir múltiples variables y agrupar por múltiples variables

El siguiente código muestra cómo encontrar los puntos medios y los rebotes medios, agrupados por equipo y conferencia:

# encontrar la media de puntos anotados, agrupados por equipo y 
agregado de conferencia ( cbind (puntos, rebotes) ~ equipo + conf, datos = gl, DIVERSIÓN = media, na. rm = VERDADERO )

  rebotes de puntos de conf del equipo
1 AE 2.000000 7.0
2 AW 3.000000 8.0
3 BW 5.333333 4.0
4 CW 8.000000 13.5

Recursos adicionales

Cómo calcular la media de varias columnas en R
Cómo sumar columnas específicas en R
Cómo sumar filas específicas en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Uno de los supuestos clave en la regresión lineal es que no existe correlación entre los residuos, por ejemplo, los…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!