19 abril 2021 13:31

Análisis de varianza (ANOVA)

¿Qué es el análisis de varianza (ANOVA)?

El análisis de varianza (ANOVA) es una herramienta de análisis utilizada en estadísticas que divide una variabilidad agregada observada que se encuentra dentro de un conjunto de datos en dos partes: factores sistemáticos y factores aleatorios. Los factores sistemáticos tienen una influencia estadística en el conjunto de datos dado, mientras que los factores aleatorios no. Los analistas utilizan la prueba ANOVA para determinar la influencia que tienen las variables independientes sobre la variable dependiente en un estudio de regresión.

Los métodos de prueba t y z desarrollados en el siglo XX se utilizaron para el análisis estadístico hasta 1918, cuando Ronald Fisher creó el método de análisis de varianza.1 ANOVA también se denomina análisis de varianza de Fisher y es la extensión de las pruebas t y z. El término se hizo muy conocido en 1925, después de aparecer en el libro de Fisher, «Métodos estadísticos para investigadores». Se empleó en psicología experimental y luego se expandió a temas que eran más complejos.

La fórmula para ANOVA es:

¿Qué revela el análisis de varianza?

La prueba ANOVA es el paso inicial para analizar los factores que afectan un conjunto de datos dado. Una vez finalizada la prueba, un analista realiza pruebas adicionales sobre los factores metódicos que contribuyen de manera medible a la inconsistencia del conjunto de datos. El analista utiliza los resultados de la prueba ANOVA en una prueba f para generar datos adicionales que se alinean con los modelos de regresión propuestos.

La prueba ANOVA permite una comparación de más de dos grupos al mismo tiempo para determinar si existe una relación entre ellos. El resultado de la fórmula ANOVA, el estadístico F (también llamado índice F), permite el análisis de múltiples grupos de datos para determinar la variabilidad entre muestras y dentro de las mismas.

Si no existe una diferencia real entre los grupos probados, lo que se denomina hipótesis nula, el resultado del estadístico de razón F del ANOVA será cercano a 1. La distribución de todos los valores posibles del estadístico F es la distribución F. En realidad, se trata de un grupo de funciones de distribución, con dos números característicos, llamados grados de libertad del numerador y grados de libertad del denominador.

Conclusiones clave

  • El análisis de varianza, o ANOVA, es un método estadístico que separa los datos de varianza observada en diferentes componentes para utilizarlos en pruebas adicionales.
  • Se utiliza un ANOVA de una vía para tres o más grupos de datos, para obtener información sobre la relación entre las variables dependientes e independientes.
  • Si no existe una verdadera varianza entre los grupos, la relación F del ANOVA debe ser cercana a 1.

Ejemplo de cómo utilizar ANOVA

Un investigador podría, por ejemplo, evaluar a estudiantes de varias universidades para ver si los estudiantes de una de las universidades superan sistemáticamente a los estudiantes de las otras universidades. En una aplicación empresarial, un investigador de I + D puede probar dos procesos diferentes de creación de un producto para ver si un proceso es mejor que el otro en términos de rentabilidad.

El tipo de prueba ANOVA utilizada depende de varios factores. Se aplica cuando los datos deben ser experimentales. El análisis de varianza se emplea si no hay acceso a software estadístico que resulte en calcular ANOVA a mano. Es fácil de usar y se adapta mejor a muestras pequeñas. Con muchos diseños experimentales, los tamaños de muestra deben ser los mismos para las diversas combinaciones de niveles de factores.

ANOVA es útil para probar tres o más variables. Es similar a múltiples pruebas t de dos muestras. Sin embargo, da como resultado menos errores de tipo I y es apropiado para una variedad de problemas. ANOVA agrupa las diferencias comparando las medias de cada grupo e incluye la distribución de la varianza en diversas fuentes. Se emplea con sujetos, grupos de prueba, entre grupos y dentro de grupos.

ANOVA unidireccional versus ANOVA bidireccional

Hay dos tipos principales de ANOVA: unidireccional (o unidireccional) y bidireccional. También existen variaciones de ANOVA. Por ejemplo, MANOVA (ANOVA multivariante) difiere de ANOVA ya que el primero prueba para múltiples variables dependientes simultáneamente mientras que el segundo evalúa solo una variable dependiente a la vez. Unidireccional o bidireccional se refiere al número de variables independientes en su análisis de prueba de varianza. Un ANOVA de una vía evalúa el impacto de un único factor en una única variable de respuesta. Determina si todas las muestras son iguales. El ANOVA de una vía se utiliza para determinar si existen diferencias estadísticamente significativas entre las medias de tres o más grupos independientes (no relacionados).

Un ANOVA bidireccional es una extensión del ANOVA unidireccional. Con un solo factor, tiene una variable independiente que afecta a una variable dependiente. Con un ANOVA de dos vías, hay dos independientes. Por ejemplo, un ANOVA bidireccional permite a una empresa comparar la productividad de los trabajadores en función de dos variables independientes, como el salario y el conjunto de habilidades. Se utiliza para observar la interacción entre los dos factores y prueba el efecto de dos factores al mismo tiempo.