Cómo seleccionar filas por índice en un marco de datos de Pandas

A menudo, es posible que desee seleccionar las filas de un DataFrame de pandas en función de su valor de índice.

Si desea seleccionar filas según la indexación de enteros, puede usar la función .iloc .

Si desea seleccionar filas según la indexación de etiquetas, puede usar la función .loc .

Este tutorial proporciona un ejemplo de cómo utilizar cada una de estas funciones en la práctica.

Ejemplo 1: seleccionar filas según la indexación de enteros

El siguiente código muestra cómo crear un DataFrame de pandas y usar .iloc para seleccionar la fila con un valor entero de índice de 3 :

importar pandas como pd
 importar numpy como np

#Haga que este ejemplo sea reproducible
 np. al azar . semilla (0)

#create DataFrame
 df = pd. Trama de datos (np. Aleatorio . Rand (6,2), índice = rango (0,18,3), columnas = [ ' A ', ' B ']) 
#view trama de datos

df

	       A B
0 0,548814 0,715189
3 0,602763 0,544883
6 0,423655 0,645894
9 0,437587 0,891773
12 0,963663 0,383442
15 0,791725 0,528895

#seleccione la quinta fila del DataFrame
 df. iloc [[4]]

	       A B
12 0,963663 0,383442

Podemos usar una sintaxis similar para seleccionar varias filas:

#seleccione las filas 3, 4 y 5 del DataFrame
 df. iloc [[2, 3, 4]]

	       A B
6 0,423655 0,645894
9 0,437587 0,891773
12 0,963663 0,383442

O podríamos seleccionar todas las filas en un rango:

#seleccione las filas 3, 4 y 5 del DataFrame
 df. iloc [2: 5]

	       A B
6 0,423655 0,645894
9 0,437587 0,891773
12 0,963663 0,383442

Ejemplo 2: Seleccionar filas según la indexación de etiquetas

El siguiente código muestra cómo crear un DataFrame de pandas y usar .loc para seleccionar la fila con una etiqueta de índice de 3 :

importar pandas como pd
 importar numpy como np

#Haga que este ejemplo sea reproducible
 np. al azar . semilla (0)

#create DataFrame 
df = pd. Trama de datos (np. Aleatorio . Rand (6,2), índice = rango (0,18,3), columnas = [ ' A ', ' B '])

#view DataFrame
df

	       A B
0 0,548814 0,715189
3 0,602763 0,544883
6 0,423655 0,645894
9 0,437587 0,891773
12 0,963663 0,383442
15 0,791725 0,528895

#seleccione la fila con la etiqueta de índice '3'
 df. loc [[3]]

               A B
3 0,602763 0,544883

Podemos usar una sintaxis similar para seleccionar varias filas con diferentes etiquetas de índice:

#seleccione las filas con etiquetas de índice '3', '6' y '9'
 df. loc [[3, 6, 9]]

	       A B
3 0,602763 0,544883
6 0,423655 0,645894
9 0,437587 0,891773

La diferencia entre .iloc y .loc

Los ejemplos anteriores ilustran la sutil diferencia entre .iloc y .loc :

  • .iloc selecciona filas basándose en un índice entero . Entonces, si desea seleccionar la quinta fila en un DataFrame, usaría df.iloc [[4]] ya que la primera fila está en el índice 0, la segunda fila está en el índice 1, y así sucesivamente.
  • .loc selecciona filas basándose en un índice etiquetado . Entonces, si desea seleccionar la fila con una etiqueta de índice de 5, debe usar directamente df.loc [[5]].

Recursos adicionales

Cómo obtener números de fila en un DataFrame de Pandas
Cómo soltar filas con valores NaN en Pandas
Cómo soltar la columna de índice en Pandas

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

A menudo, es posible que desee seleccionar las filas de un DataFrame de pandas en el que aparece un cierto…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!