Muestreo estratificado en R (con ejemplos)

Actualizado por ultima vez el 7 de mayo de 2021, por .

Los investigadores a menudo toman muestras de una población y usan los datos de la muestra para sacar conclusiones sobre la población en su conjunto.

Un método de muestreo comúnmente utilizado es el muestreo aleatorio estratificado , en el que una población se divide en grupos y un cierto número de miembros de cada grupo se seleccionan al azar para ser incluidos en la muestra.

Este tutorial explica cómo realizar un muestreo aleatorio estratificado en R.

Ejemplo: muestreo estratificado en R

Una escuela secundaria está compuesta por 400 estudiantes que son Freshman, Sophomores, Juniors o Seniors. Suponga que nos gustaría tomar una muestra estratificada de 40 estudiantes de manera que se incluyan en la muestra 10 estudiantes de cada grado.

El siguiente código muestra cómo generar un marco de datos de muestra de 400 estudiantes:

#Haga que este ejemplo sea reproducible
set.seed (1)

#create data frame 
df <- data.frame (grade = rep (c ('Freshman', 'Sophomore', 'Junior', 'Senior'), cada uno = 100),
                 gpa = rnorm (400, media = 85, sd = 3))

#ver las primeras seis filas del encabezado del marco de datos
 (df)

     Grado / GPA
1 estudiante de primer año 83.12064
2 Estudiante de primer año 85.55093
3 Estudiante de primer año 82.49311
4 Estudiante de primer año 89.78584
5 Estudiante de primer año 85.98852
6 Estudiante de primer año 82.53859

Muestreo estratificado mediante el número de filas

El siguiente código muestra cómo usar las funciones group_by () y sample_n () del paquete dplyr para obtener una muestra aleatoria estratificada de 40 estudiantes en total con 10 estudiantes de cada grado:

biblioteca (dplyr)

#obtener muestra estratificada
muestra_estrat <- df%>%
                  group_by (grado)%>%
                   sample_n (tamaño = 10)

# encontrar la frecuencia de los estudiantes de cada tabla de calificaciones
 (strat_sample $ grade)

 Freshman Junior Senior Sophomore 
       10 10 10 10 

Muestreo estratificado utilizando una fracción de filas

El siguiente código muestra cómo usar las funciones group_by () y sample_frac () del paquete dplyr para obtener una muestra aleatoria estratificada en la que seleccionamos al azar al 15% de los estudiantes de cada grado:

biblioteca (dplyr)

#obtener muestra estratificada
muestra_estrat <- df%>%
                  group_by (grado)%>%
                   sample_frac (tamaño = .15)

# encontrar la frecuencia de los estudiantes de cada tabla de calificaciones
 (strat_sample $ grade)

 Freshman Junior Senior Sophomore 
       15 15 15 15 

Recursos adicionales

Tipos de métodos
de muestreo Muestreo por conglomerados en R
Muestreo sistemático en R

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

El índice de similitud de Jaccard mide la similitud entre dos conjuntos de datos. Puede variar de 0 a 1.…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!