Análisis de Variación
Introducción
En estadística, el análisis de la varianza (ANOVA por sus sigloides en inglés, ANalysis Of VAriance) es una colección de modelos estadísticos y sus procedimientos asociados, en el cual la varianza está particionada en ciertos componentes debidos a diferentes variables explicativas. Se utiliza de forma intensiva en el análisis y diseño de experimentos para evaluar el efecto de tratamientos en la variabilidad de la variable respuesta.
Desarrollada por el genetista R. A. Fisher en los años 1920 y 1930, se conoce también como "Anova de Fisher" o "análisis de varianza de Fisher" debido al uso de la distribución F de Fisher como parte del contraste de hipótesis.
Contenido
El análisis de la varianza parte del concepto de regresión lineal, cuya funcionalidad amplía. Así, un análisis de la varianza permite determinar, por ejemplo, si diferentes tratamientos médicos (es decir, un grupo de más de dos tratamientos) muestran diferencias significativas en sus resultados o si por el contrario puede suponerse que sus medias poblacionales no difieren. De este modo el análisis de la varianza permite superar las limitaciones de hacer contrastes bilaterales por parejas entre todos los tratamientos posibles, lo que sería un mal método para determinar si un conjunto de variables con n > 2 difieren entre sí. El primer concepto fundamental es suponer que todo valor observado puede expresarse mediante la siguiente función:.
Donde:.
Por tanto, a la función de pronóstico la podemos llamar "media del tratamiento i":.
Podemos resumir que las puntuaciones observadas equivalen a las puntuaciones esperadas, más el error aleatorio (). A partir de esa idea, se puede operar:.
Esta ecuación se reescribe frecuentemente como:.
de un factor, que es el caso más sencillo, la idea básica del análisis de la varianza es comparar la variación total de un conjunto de muestras y descomponerla como:.
Donde:.
En el caso de que la diferencia debida al factor o tratamiento no sea estadísticamente significativa puede probarse que las varianzas muestrales son iguales:.
Donde:.
Así lo que un simple test a partir de la F de Snedecor puede decidir si el factor o tratamiento es estadísticamente significativo.