Cómo calcular el valor P de una estadística F en R

Una prueba F produce un F-estadística . Para encontrar el valor p asociado con una estadística F en R, puede usar el siguiente comando:

pf (fstat, df1, df2, lower.tail = FALSE)

  • fstat – el valor de la estadística f
  • df1 – grados de libertad 1
  • df2 – grados de libertad 2
  • lower.tail : si se devuelve o no la probabilidad asociada con la cola inferior de la distribución F. Esto es VERDADERO por defecto.

Por ejemplo, aquí se explica cómo encontrar el valor p asociado con una estadística F de 5, con grados de libertad 1 = 3 y grados de libertad 2 = 14:

pf (5, 3, 14, cola inferior = FALSO)

# [1] 0.01457807

Uno de los usos más comunes de una prueba F es para probar la significancia general de un modelo de regresión . En el siguiente ejemplo, mostramos cómo calcular el valor p del estadístico F para un modelo de regresión.

Ejemplo: calcular el valor p a partir del estadístico F

Supongamos que tenemos un conjunto de datos que muestra la cantidad total de horas estudiadas, el total de exámenes de preparación tomados y la puntuación del examen final recibida para 12 estudiantes diferentes:

#create dataset 
data <- data.frame (study_hours = c (3, 7, 16, 14, 12, 7, 4, 19, 4, 8, 8, 3), 
                   prep_exams = c (2, 6, 5, 2 , 7, 4, 4, 2, 8, 4, 1, 3), 
                   final_score = c (76, 88, 96, 90, 98, 80, 86, 89, 68, 75, 72, 76)) 
#ver primero seis filas de conjunto de datos

cabeza (datos)

# study_hours prep_exams final_score
# 1 3 2 76
# 2 7 6 88
# 3 16 5 96
# 4 14 2 90
# 5 12 7 98
# 6 7 4 80

A continuación, podemos ajustar un modelo de regresión lineal a estos datos utilizando las horas de estudio y los exámenes de preparación como variables predictoras y la puntuación final como variable de respuesta. Luego, podemos ver la salida del modelo:

#fit modelo de regresión
modelo <- lm (puntuación_final ~ horas_estudio + exámenes_preparación, datos = datos)

#ver salida del modelo
resumen (modelo)

#Llamada:
#lm (fórmula = puntuación_final ~ horas_estudio + exámenes_preparación, datos = datos)
#
#Derechos residuales de autor:
# Mín. 1T Mediana 3T Máx. 
# -13.128 -5.319 2.168 3.458 9.341 
#
#Coeficientes:
# Estimar Std. Valor t de error Pr (> | t |)    
# (Intercepción) 66.990 6.211 10.785 1.9e-06 ***
#study_hours 1.300 0.417 3.117 0.0124 *  
#prep_exams 1.117 1.025 1.090 0.3041    
# ---
#Signif. códigos: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0,1 pulg. 1
#
# Error estándar residual: 7.327 en 9 grados de libertad
# R-cuadrado múltiple: 0.5308, R-cuadrado ajustado: 0.4265 
# Estadístico F: 5.091 en 2 y 9 DF, valor p: 0.0332

En la última línea del resultado podemos ver que el estadístico F para el modelo de regresión general es 5.091 . Este estadístico F tiene 2 grados de libertad para el numerador y 9 grados de libertad para el denominador. R calcula automáticamente que el valor p para este estadístico F es 0.0332 .

Para calcular este valor p equivalente nosotros mismos, podríamos usar el siguiente código:

pf (5.091, 2, 9, cola inferior = FALSO)

# [1] 0.0331947

Observe que obtenemos la misma respuesta (pero con más decimales mostrados) que la salida de regresión lineal anterior.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Un conjunto es una colección de elementos. Denotamos un conjunto usando una letra mayúscula y definimos los elementos dentro del…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!