Cómo contar valores perdidos en un marco de datos de Pandas

A menudo, puede estar interesado en contar la cantidad de valores faltantes en un DataFrame de pandas.

Este tutorial muestra varios ejemplos de cómo contar los valores perdidos usando el siguiente DataFrame:

importar pandas como pd
 importar numpy como np

#create DataFrame con algunos valores faltantes
df = pd.DataFrame ({'a': [4, np.nan, np.nan, 7, 8, 12],
                   'b': [np.nan, 6, 8, 14, 29, np.nan],
                   'c': [11, 8, 10, 6, 6, np.nan]})

#view 
Impresión de DataFrame (df)

      a B C
0 4,0 NaN 11,0
1 NaN 6,0 8,0
2 NaN 8,0 10,0
3 7.0 14.0 6.0
4 8.0 29.0 6.0
5 12,0 NaN NaN

Cuente los valores perdidos totales en todo el marco de datos

El siguiente código muestra cómo calcular el número total de valores faltantes en todo el DataFrame:

df. isnull (). suma (). suma ()

5

Esto nos dice que hay 5 valores perdidos totales.

Cuente los valores perdidos totales por columna

El siguiente código muestra cómo calcular el número total de valores faltantes en cada columna del DataFrame:

df. isnull (). suma ()

un 2
b 2
c 1

Esto nos dice:

  • La columna ‘a’ tiene 2 valores perdidos.
  • La columna ‘b’ tiene 2 valores perdidos.
  • La columna ‘c’ tiene 1 valor faltante.

También puede mostrar el número de valores perdidos como un porcentaje de toda la columna:

df. isnull (). suma () / len (gl) * 100

a 33.333333
b 33.333333
c 16.666667

Esto nos dice:

  • Falta el 33,33% de los valores de la columna ‘a’.
  • Falta el 33,33% de los valores de la columna ‘b’.
  • Falta el 16,67% de los valores de la columna ‘c’.

Cuente los valores perdidos totales por fila

El siguiente código muestra cómo calcular el número total de valores faltantes en cada fila del DataFrame:

df. isnull (). suma (eje = 1 )

0 1
1 1
2 1
3 0
4 0
5 2

Esto nos dice:

  • La fila 1 tiene 1 valor faltante.
  • La fila 2 tiene 1 valor faltante.
  • La fila 3 tiene 1 valor faltante.
  • La fila 4 tiene 0 valores perdidos.
  • La fila 5 tiene 0 valores perdidos.
  • La fila 6 tiene 2 valores perdidos.

Recursos adicionales

Cómo encontrar valores únicos en varias columnas en Pandas
Cómo crear una nueva columna basada en una condición en Pandas

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

En estadística, los deciles son números que dividen un conjunto de datos en diez grupos de igual frecuencia. El primer…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!