Cómo promediar entre columnas en R (con ejemplos)

Actualizado por ultima vez el 7 de mayo de 2021, por .

A menudo, es posible que desee calcular el promedio de valores en varias columnas en R. Afortunadamente, esto es fácil de hacer usando la función rowMeans () .

Este tutorial muestra varios ejemplos de cómo utilizar esta función en la práctica.

Ejemplo 1: encontrar el promedio en todas las columnas

El siguiente código muestra cómo calcular el valor promedio de cada fila en todas las columnas de un marco de datos:

#create marco de datos
data <- data.frame (var1 = c (0, NA, 2, 2, 5),
                   var2 = c (5, 5, 7, 8, 9),
                   var3 = c (2, 7, 9, 9, 7))

#ver datos del marco de
 datos

  var1 var2 var3
1 0 5 2
2 NA 5 7
3 2 7 9
4 2 8 9
5 5 9 7

# encontrar el valor promedio en cada fila
 rowMeans (data, na.rm = TRUE )

[1] 2.333333 6.000000 6.000000 6.333333 7.000000

La forma de interpretar la salida es la siguiente:

  • El valor medio de la primera fila es 2,333 .
  • El valor promedio en la segunda fila es 6 .
  • El valor promedio en la tercera fila es 6 .
  • El valor promedio en la cuarta fila es 6.333 .
  • El valor promedio en la quinta fila es 7 .

También puede asignar estos promedios de fila a una nueva variable en el marco de datos:

#asignar promedios de fila a la nueva variable denominada row_mean 
data $ row_mean <- rowMeans (data, na.rm = TRUE )

#ver datos del marco de
 datos

  var1 var2 var3 row_mean
1 0 5 2 2.333333
2 NA 5 7 6.000000
3 2 7 9 6.000000
4 2 8 9 6.333333
5 5 9 7 7.000000

Ejemplo 2: encontrar el promedio en columnas específicas

También es posible encontrar el promedio solo en columnas específicas en un marco de datos. Por ejemplo, el siguiente código muestra cómo calcular los promedios de las filas solo en las dos primeras columnas:

# encontrar promedios de filas en las dos primeras columnas 
data $ new <- rowMeans (data [, c (1,2)], na.rm = TRUE )

#ver marco de datos
datos

  var1 var2 var3 nuevo
1 0 5 2 2,5
2 NA 5 7 5,0
3 2 7 9 4.5
4 2 8 9 5,0
5 5 9 7 7.0

Podemos ver eso:

  • El valor medio de la primera fila en las dos primeras columnas es 2,5 .
  • El valor promedio de la segunda fila en las dos primeras columnas es 5 .

Y así.

Puede usar una sintaxis similar para encontrar los promedios de fila para cualquier conjunto de columnas. Por ejemplo, el siguiente código muestra cómo calcular los promedios de las filas solo en la primera y tercera columnas:

# encontrar promedios de filas en la primera y la tercera columna 
data $ new <- rowMeans (data [, c (1,3)], na.rm = TRUE )

#ver marco de datos
datos

  var1 var2 var3 nuevo
1 0 5 2 1,0
2 NA 5 7 7,0
3 2 7 9 5,5
4 2 8 9 5,5
5 5 9 7 6,0

Podemos ver eso:

  • El valor promedio de la primera fila en la primera y tercera columnas es 1 .
  • El valor promedio en la segunda fila en la primera y tercera columnas es 7 .

Y así.

Puede encontrar más tutoriales de R aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Se utiliza una prueba t de muestras pareadas para comparar las medias de dos muestras cuando cada observación en una…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!