¿Cómo leer un archivo de texto con Pandas? (incluidos ejemplos)

Actualizado por ultima vez el 3 de noviembre de 2022, por Dereck Amesquita.

Para leer un archivo .txt con pandas en Python, puede usar la siguiente sintaxis básica:

df = pd. read_csv (" data.txt ", sep = "")

Este tutorial proporciona varios ejemplos de cómo utilizar esta función en la práctica.

Leer un archivo .txt  con encabezado en Pandas

Supongamos que tenemos el siguiente archivo de texto llamado data.txt con un encabezado:

Leer archivo de texto en Pandas

Para leer este archivo en un DataFrame de pandas, podemos usar la siguiente sintaxis:

import pandas as pd

# Código para leer un archivo txt con pandas
df = pd.read_csv("data.txt", sep=" ")

# Ver el DataFrame
print(df)

   column1  column2
0        1        4
1        3        4
2        2        5
3        7        9
4        9        1
5        6        3
6        4        4
7        5        2
8        4        8
9        6        8

Podemos imprimir la clase del DataFrame y encontrar el número de filas y columnas usando la siguiente sintaxis:

# Mostrar la clase del DataFrame
print(type(df))

<class 'pandas.core.frame.DataFrame'>

# Mostrar el número de filas y columnas 
df.shape

(10, 2)

Podemos ver que df es un DataFrame de pandas con 10 filas y 2 columnas.

Leer un archivo de texto sin encabezado

Supongamos que tenemos el siguiente archivo de texto llamado data.txt sin encabezados:

Pandas lee el archivo de texto sin encabezados

Para leer este archivo en un DataFrame de pandas, podemos usar la siguiente sintaxis:

# Cargar el archivo de texto en Python
df = pd.read_csv("data.txt", sep=" ", header=None)

# Mostrar Dataframe
print(df)

   0  1
0  1  4
1  3  4
2  2  5
3  7  9
4  9  1
5  6  3
6  4  4
7  5  2
8  4  8
9  6  8

Dado que el archivo de texto no tenía encabezados, los pandas simplemente nombraron las columnas 0 y 1 .

Leer un archivo de texto sin encabezado y especificar nombres de columna

Si lo deseamos, podemos asignar nombres de columna mientras importamos el archivo de texto usando el argumento de nombres :

df = pd.read_csv("data.txt", sep=" ", header=None, names=["A", "B"])

#display DataFrame
print(df)

   A  B
0  1  4
1  3  4
2  2  5
3  7  9
4  9  1
5  6  3
6  4  4
7  5  2
8  4  8
9  6  8

Recursos adicionales

Cómo leer archivos CSV con Pandas
Cómo leer archivos Excel con Pandas
Cómo leer un archivo JSON con Pandas

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

I’m a Bachelor of Economics gratuaded from the National University of San Agustin. I have experience in Python, R and other languages with aplications in Finance or Econometrics, I also have knowledge of statistics and econometrics. If you need help on some issues you can write to me.

Deja un comentario

En estadística, la curtosis se utiliza para describir la forma de una distribución de probabilidad. Específicamente, nos dice el grado…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!