Cómo encontrar fácilmente valores atípicos en Excel

Un valor atípico es una observación que se encuentra anormalmente alejada de otros valores en un conjunto de datos. Los valores atípicos pueden ser problemáticos porque pueden afectar los resultados de un análisis.

Usaremos el siguiente conjunto de datos en Excel para ilustrar dos métodos para encontrar valores atípicos:

Método 1: utilice el rango intercuartílico

El rango intercuartil (IQR) es la diferencia entre el percentil 75 (Q3) y el percentil 25 (Q1) en un conjunto de datos. Mide la propagación del 50% medio de los valores.

Podemos definir una observación como un valor atípico si es 1,5 veces el rango intercuartil mayor que el tercer cuartil (Q3) o 1,5 veces el rango intercuartil menor que el primer cuartil (Q1).

La siguiente imagen muestra cómo calcular el rango intercuartílico en Excel:

A continuación, podemos usar la fórmula mencionada anteriormente para asignar un «1» a cualquier valor que sea un valor atípico en el conjunto de datos:

Encontrar valores atípicos en Excel

Vemos que solo un valor, 164 , resulta ser un valor atípico en este conjunto de datos.

Método 2: utilizar puntuaciones z

Un puntaje z le dice cuántas desviaciones estándar tiene un valor dado de la media. Usamos la siguiente fórmula para calcular una puntuación z:

z = (X – μ) / σ

dónde:

  • X es un único valor de datos sin procesar
  • μ es la media de la población
  • σ es la desviación estándar de la población

Podemos definir una observación como un valor atípico si tiene una puntuación z menor que -3 o mayor que 3.

La siguiente imagen muestra cómo calcular la desviación estándar y media de un conjunto de datos en Excel:

Luego, podemos usar la media y la desviación estándar para encontrar el puntaje z para cada valor individual en el conjunto de datos:

Luego, podemos asignar un «1» a cualquier valor que tenga una puntuación z menor que -3 o mayor que 3:

Encontrar valores atípicos en Excel usando puntuaciones z

Con este método, vemos que no hay valores atípicos en el conjunto de datos.

Nota: A veces se usa una puntuación z de 2.5 en lugar de 3. En este caso, el valor individual de 164 se consideraría un valor atípico ya que tiene una puntuación z mayor que 2.5. Cuando utilice el método de puntuación z, utilice su mejor criterio para determinar qué valor de puntuación z considera que es un valor atípico.

Cómo manejar valores atípicos

Si hay un valor atípico en sus datos, tiene algunas opciones:

1. Asegúrese de que el valor atípico no sea el resultado de un error de entrada de datos.

A veces, una persona simplemente ingresa el valor de datos incorrecto al registrar datos. Si hay un valor atípico, primero verifique que el valor se ingresó correctamente y que no fue un error.

2. Elimine el valor atípico.

Si el valor es un valor atípico verdadero, puede optar por eliminarlo si tendrá un impacto significativo en su análisis general. Solo asegúrese de mencionar en su informe o análisis final que eliminó un valor atípico.

3. Asigne un nuevo valor al valor atípico .

Si el valor atípico es el resultado de un error de entrada de datos, puede decidir asignarle un nuevo valor, como la media o la mediana del conjunto de datos.

  • https://r-project.org
  • https://www.python.org/
  • https://www.stata.com/

Deja un comentario

Se utiliza una prueba de falta de ajuste para determinar si un modelo de regresión completo ofrece un ajuste significativamente…
statologos comunidad-2

Compartimos información EXCLUSIVA y GRATUITA solo para suscriptores (cursos privados, programas, consejos y mucho más)

You have Successfully Subscribed!