Cómo calcular el error estándar de la media en R

El error estándar de la media es una forma de medir qué tan dispersos están los valores en un conjunto de datos. Se calcula como:

Error estándar = s / √n

dónde:

  • s : desviación estándar de la muestra
  • n : tamaño de la muestra

Este tutorial explica dos métodos que puede utilizar para calcular el error estándar de un conjunto de datos en R. Tenga en cuenta que ambos métodos producen exactamente los mismos resultados.

Método 1: usar la biblioteca Plotrix

La primera forma de calcular el error estándar de la media es usar la función incorporada std.error () de la biblioteca Plotrix.

El siguiente código muestra cómo utilizar esta función:

#cargar biblioteca plotrix
biblioteca (plotrix)

#define dataset
datos <- c (3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calcular el error estándar de la media 
std.error (datos)

2.001447

El error estándar de la media resulta ser 2,001447 .

Método 2: defina su propia función

Otra forma de calcular el error estándar de la media de un conjunto de datos es simplemente definir su propia función.

El siguiente código muestra cómo hacerlo:

#definir el error estándar de la función media 
std.error <- function (x) sd (x) / sqrt ( length (x))

#define dataset
datos <- c (3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 29)

#calcular el error estándar de la media 
std.error (datos)

2.001447

Una vez más, el error estándar de la media resulta ser 2.0014 .

Cómo interpretar el error estándar de la media

El error estándar de la media es simplemente una medida de cuán dispersos están los valores alrededor de la media. Hay dos cosas a tener en cuenta al interpretar el error estándar de la media:

1. Cuanto mayor sea el error estándar de la media, más dispersos estarán los valores alrededor de la media en un conjunto de datos.

Para ilustrar esto, considere si cambiamos el último valor en el conjunto de datos anterior a un número mucho mayor:

#definir 
datos del conjunto de datos <- c (3, 4, 4, 5, 7, 8, 12, 14, 14, 15, 17, 19, 22, 24, 24, 24, 25, 28, 28, 150 )

#calcular el error estándar de la media 
std.error (datos)

6.978265

Observe cómo el error estándar salta de 2,001447 a 6,978265 . Esta es una indicación de que los valores en este conjunto de datos están más dispersos alrededor de la media en comparación con el conjunto de datos anterior.

2. A medida que aumenta el tamaño de la muestra, el error estándar de la media tiende a disminuir.

Para ilustrar esto, considere el error estándar de la media para los siguientes dos conjuntos de datos:

# definir el primer conjunto de datos y encontrar SEM
datos1 <- c (1, 2, 3, 4, 5)
error estándar (datos1)

0,7071068

#define el segundo conjunto de datos y encuentre SEM
datos2 <- c (1, 2, 3, 4, 5, 1, 2, 3, 4, 5)
error estándar (datos2)

0,4714045

El segundo conjunto de datos es simplemente el primer conjunto de datos que se repite dos veces. Por lo tanto, los dos conjuntos de datos tienen la misma media, pero el segundo conjunto de datos tiene un tamaño de muestra más grande, por lo que tiene un error estándar menor.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

La estadística Kappa de Cohen se utiliza para medir el nivel de acuerdo entre dos evaluadores o jueces que clasifican…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!