Cómo crear una tabla de frecuencia de múltiples variables en R

Para calcular una tabla de frecuencia para múltiples variables en un marco de datos en R, puede usar la función apply () , que usa la siguiente sintaxis:

aplicar (X, MARGIN FUN)

dónde:

  • X: una matriz, matriz o marco de datos
  • MARGEN: aplica una función en filas (1) o columnas (2)
  • FUN: La función que se aplicará

Los siguientes ejemplos muestran cómo utilizar esta sintaxis en la práctica.

Ejemplo 1: Tabla de frecuencia para todas las variables en R

El siguiente código muestra cómo calcular una tabla de frecuencia para cada variable en un marco de datos:

#create data frame 
df <- data. marco (var1 = c (1, 1, 2, 2, 2, 2, 3),
                 var2 = c ('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3 = c (6, 7, 7, 7, 8, 8, 9))

#ver las primeras filas del marco de datos
cabeza (df)

  var1 var2 var3
1 1 A 6
2 1 A 7
3 2 A 7
4 2 A 7
5 2 B 8
6 2 B 8

#calcular tabla de frecuencia para cada variable en el marco de datos
 aplicar ((df), 2, tabla)

$ var1

1 2 3 
2 4 1 

$ var2

AB 
4 3 

$ var3

6 7 8 9 
1 3 2 1

El resultado son tres tablas de frecuencia, una para cada variable en el marco de datos.

A continuación, se explica cómo interpretar la primera tabla de frecuencias:

  • El valor 1 aparece 2 veces en la columna «var1»
  • El valor 2 aparece 4 veces en la columna «var2».
  • El valor 3 aparece 1 vez en la columna «var3»

Las otras tablas de frecuencias se pueden interpretar de manera similar.

Ejemplo 2: Tabla de frecuencia para variables específicas en R

El siguiente código muestra cómo calcular una tabla de frecuencia para variables específicas en un marco de datos

#create data frame 
df <- data. marco (var1 = c (1, 1, 2, 2, 2, 2, 3),
                 var2 = c ('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3 = c (6, 7, 7, 7, 8, 8, 9))

#calcular la tabla de frecuencias para las columnas var1 y var3 se
 aplican ((df [c (' var1 ', ' var3 ')]), 2, table)

$ var1

1 2 3 
2 4 1

$ var3

6 7 8 9 
1 3 2 1

Ejemplo 3: Tabla de frecuencia para todas las variables menos una en R

Supongamos que tenemos una columna de índice en un marco de datos y nos gustaría calcular una tabla de frecuencia para cada variable en el marco de datos, excepto la columna de índice.

El siguiente código muestra cómo hacerlo:

#create data frame 
df <- data. marco (índice = c (1, 2, 3, 4, 5, 6, 7),
                 var2 = c ('A', 'A', 'A', 'A', 'B', 'B', 'B'),
                 var3 = c (6, 7, 7, 7, 8, 8, 9))

#calcular la tabla de frecuencia para todas las columnas, excepto la columna de índice,
 aplicar ((df [-1]), 2, tabla)

$ var2

AB 
4 3 

$ var3

6 7 8 9 
1 3 2 1

Recursos adicionales

Cómo crear una tabla bidireccional en R
Cómo crear un histograma de frecuencia relativa en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La distribución de Poisson es una distribución de probabilidad que se utiliza para modelar la probabilidad de que ocurra un…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!