Cómo crear un DataFrame de Pandas a partir de una matriz NumPy

Ocasionalmente, es posible que desee crear un DataFrame de pandas a partir de una matriz NumPy. Afortunadamente, esto es fácil de hacer con la siguiente sintaxis:

#create NumPy array
 data = np. matriz ([[1, 7, 6, 5, 6], [4, 4, 4, 3, 1]])

#convertir la matriz NumPy a pandas DataFrame
 df = pd. DataFrame (datos = datos)

Este tutorial proporciona un ejemplo de cómo crear un DataFrame de pandas a partir de una matriz NumPy en la práctica.

Cree Pandas DataFrame a partir de una matriz NumPy

Supongamos que tenemos la siguiente matriz NumPy:

importar numpy como np

#create matriz NumPy
datos = np. matriz ([[1, 7, 6, 5, 6], [4, 4, 4, 3, 1]])

#print clase de impresión de matriz NumPy
 (tipo (datos))

<clase 'numpy.ndarray'>

Podemos usar la siguiente sintaxis para crear un DataFrame de pandas a partir de la matriz:

importar pandas como pd

#convertir matriz NumPy a pandas DataFrame
gl = pd. DataFrame (datos = datos)

#print DataFrame
imprimir (df)

   0 1 2 3 4
0 1 7 6 5 6
1 4 4 4 3 1

#print clase de 
impresión DataFrame (tipo (df))

<clase 'pandas.core.frame.DataFrame'>

Especificar manualmente los nombres de filas y columnas

Podemos especificar nombres de fila para el DataFrame de pandas usando el argumento de índice y los nombres de columna usando el argumento de columnas :

#convierta la matriz NumPy a pandas DataFrame y especifique filas y columnas
 df = pd. DataFrame (datos = datos, índice = ["r1", "r2"], columnas = ["A", "B", "C", "D", "E"])

#imprima el DataFrame
imprimir (df)

    A B C D E
r1 1 7 6 5 6
r2 4 4 4 3 1

Especificar automáticamente nombres de filas y columnas

Si la matriz NumPy es bastante grande, puede que no sea razonable especificar manualmente cada nombre de fila y columna. En este caso, podríamos usar un bucle for simple para especificar nombres de filas y columnas.

El siguiente código muestra cómo hacerlo:

#create la matriz NumPy con 100 valores
 data = np. arange (0,100,1). remodelar (20,5)

#print NumPy array 
print (datos)

[[0 1 2 3 4]
 [5 6 7 8 9]
 [10 11 12 13 14]
 [15 16 17 18 19]
 [20 21 22 23 24]
 [25 26 27 28 29]
 [30 31 32 33 34]
 [35 36 37 38 39]
 [40 41 42 43 44]
 [45 46 47 48 49]
 [50 51 52 53 54]
 [55 56 57 58 59]
 [60 61 62 63 64]
 [65 66 67 68 69]
 [70 71 72 73 74]
 [75 76 77 78 79]
 [80 81 82 83 84]
 [85 86 87 88 89]
 [90 91 92 93 94]
 [95 96 97 98 99]]

#convierta a pandas DataFrame y especifique automáticamente los nombres de filas y columnas
 df = pd. DataFrame (datos = datos [0:, 0:],
                índice = [i para i en el rango (datos. forma [0])],
                columnas = ['col' + str (i) para i en el rango (datos. forma [1])])

#print DataFrame 
imprimir (df)

    col0 col1 col2 col3 col4
0 0 1 2 3 4
1 5 6 7 8 9
2 10 11 12 13 14
3 15 16 17 18 19
4 20 21 22 23 24
5 25 26 27 28 29
6 30 31 32 33 34
7 35 36 37 38 39
8 40 41 42 43 44
9 45 46 47 48 49
10 50 51 52 53 54
11 55 56 57 58 59
12 60 61 62 63 64
13 65 66 67 68 69
14 70 71 72 73 74
15 75 76 77 78 79
16 80 81 82 83 84
17 85 86 87 88 89
18 90 91 92 93 94
19 95 96 97 98 99

Podemos confirmar rápidamente la clase del DataFrame junto con la forma:

#print clase de impresión DataFrame
 (tipo (df))

<clase 'pandas.core.frame.DataFrame'>

#imprima el número de filas y columnas de DataFrame 
df. forma

(20, 5)

Recursos adicionales

Cómo agregar una matriz Numpy a un DataFrame de Pandas
Cómo soltar la columna de índice en Pandas
Pandas: seleccione las filas donde aparece el valor en cualquier columna

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

En estadística, a menudo usamos el coeficiente de correlación de Pearson para medir la relación lineal entre dos variables. Sin…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!