Variation Analysis
Introduction
In statistics, analysis of variance (ANOVA, ANalysis Of VAriance) is a collection of statistical models and their associated procedures, in which the variance is partitioned into certain components due to different explanatory variables. It is used intensively in the analysis and design of experiments to evaluate the effect of treatments on the variability of the response variable.
Developed by geneticist R. A. Fisher in the 1920s and 1930s, it is also known as "Fisher's Anova" or "Fisher's analysis of variance" due to the use of Fisher's F distribution as part of the hypothesis test.
Contenido
El análisis de la varianza parte del concepto de regresión lineal, cuya funcionalidad amplía. Así, un análisis de la varianza permite determinar, por ejemplo, si diferentes tratamientos médicos (es decir, un grupo de más de dos tratamientos) muestran diferencias significativas en sus resultados o si por el contrario puede suponerse que sus medias poblacionales no difieren. De este modo el análisis de la varianza permite superar las limitaciones de hacer contrastes bilaterales por parejas entre todos los tratamientos posibles, lo que sería un mal método para determinar si un conjunto de variables con n > 2 difieren entre sí. El primer concepto fundamental es suponer que todo valor observado puede expresarse mediante la siguiente función:.
Donde:.
Por tanto, a la función de pronóstico la podemos llamar "media del tratamiento i":.
Podemos resumir que las puntuaciones observadas equivalen a las puntuaciones esperadas, más el error aleatorio (). A partir de esa idea, se puede operar:.
Esta ecuación se reescribe frecuentemente como:.
de un factor, que es el caso más sencillo, la idea básica del análisis de la varianza es comparar la variación total de un conjunto de muestras y descomponerla como:.
Donde:.
En el caso de que la diferencia debida al factor o tratamiento no sea estadísticamente significativa puede probarse que las varianzas muestrales son iguales:.
Donde:.
Así lo que un simple test a partir de la F de Snedecor puede decidir si el factor o tratamiento es estadísticamente significativo.