Cómo encontrar la suma de filas en un marco de datos de Pandas

A menudo, puede estar interesado en calcular la suma de una o más filas en un DataFrame de pandas. Afortunadamente, puede hacer esto fácilmente en pandas usando la función suma (eje = 1) .

Este tutorial muestra varios ejemplos de cómo utilizar esta función en el siguiente DataFrame:

importar pandas como pd
 importar numpy como np

#create DataFrame
df = pd.DataFrame ({'calificación': [90, 85, 82, 88, 94, 90, 76, 75, 87, 86],
                   'puntos': [25, 20, 14, 16, 27, 20, 12, 15, 14, 19],
                   'asiste': [5, 7, 7, 8, 5, 7, 6, 9, 9, 5],
                   'rebotes': [8, np.nan, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame 
df


        puntos de calificación ayuda a rebotes
0 90 25 5 8,0
1 85 20 7 NaN
2 82 14 7 10,0
3 88 16 8 6,0
4 94 27 5 6,0
5 90 20 7 9,0
6 76 12 6 6,0
7 75 15 9 10,0
8 87 14 9 10,0
9 86 19 5 7,07

Ejemplo 1: Encuentre la suma de cada fila

Podemos encontrar la suma de cada fila en el DataFrame usando la siguiente sintaxis:

df. suma (eje = 1)

0 128,0
1 112,0
2 113,0
3 118,0
4 132,0
5 126,0
6 100,0
7 109,0
8 120,0
9 117,0
dtype: float64

La salida nos dice:

  • La suma de los valores de la primera fila es 128 .
  • La suma de los valores de la segunda fila es 112 .
  • La suma de valores en la tercera fila es 113 .

Y así.

Ejemplo 2: colocar las sumas de las filas en una nueva columna

Podemos usar el siguiente código para agregar una columna a nuestro DataFrame para contener las sumas de las filas:

#define la nueva columna DataFrame 'row_sum' como la suma de cada fila 
df ['row_sum'] = df. suma (eje = 1)

#view DataFrame
df

puntos de calificación asiste rebotes row_sum
0 90 25 5 8,0 128,0
1 85 20 7 NaN 112,0
2 82 14 7 10,0 113,0
3 88 16 8 6,0 118,0
4 94 27 5 6,0 132,0
5 90 20 7 9,0 126,0
6 76 12 6 6,0 100,0
7 75 15 9 10,0 109,0
8 87 14 9 10,0 120,0
9 86 19 5 7,0 117,0

Ejemplo 3: Encuentre las sumas de fila para una lista corta de columnas específicas

Podemos usar el siguiente código para encontrar la suma de filas para una lista corta de columnas específicas:

#define la nueva columna DataFrame como suma de puntos y columnas de asistencia
df ['sum_pa'] = df ['puntos'] + df ['asistencias']

#view DataFrame
df

	puntos de rating asiste rebotes sum_pa
0 90 25 5 8,0 30
1 85 20 7 NaN 27
2 82 14 7 10,0 21
3 88 16 8 6,0 24
4 94 27 5 6,0 32
5 90 20 7 9,0 27
6 76 12 6 6,0 18
7 75 15 9 10,0 24
8 87 14 9 10,0 23
9 86 19 5 7,0 24

Ejemplo 4: Encuentre las sumas de fila para una lista larga de columnas específicas

Podemos usar el siguiente código para encontrar la suma de filas para una lista más larga de columnas específicas:

#define col_list como una lista de todos los nombres de columna de DataFrame
col_list = lista (df)

# eliminar la columna 'calificación' de la lista
col_list.remove ('calificación')

#define la nueva columna DataFrame como la suma de filas en col_list  
df ['new_sum'] = df [col_list]. suma (eje = 1)

#view DataFrame
df

        puntos de rating asiste rebotes new_sum
0 90 25 5 8,0 38,0
1 85 20 7 NaN 27,0
2 82 14 7 10,0 31,0
3 88 16 8 6,0 30,0
4 94 27 5 6,0 38,0
5 90 20 7 9,0 36,0
6 76 12 6 6,0 24,0
7 75 15 9 10,0 34,0
8 87 14 9 10,0 33,0
9 86 19 5 7,0 31,0

Puede encontrar la documentación completa para la función pandas sum () aquí .

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

El rango es la diferencia entre el valor más grande y el más pequeño de un conjunto de datos. Podemos…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!