Home
Aide mémoire R
Quelques librairies R
Liens & contact
Recherche :
Aide-memoire-R > Statistiques > ANOVA

ANOVA.

L'objectif est de savoir si une variable numérique a des valeurs significativement différentes selon plusieurs catégories (i.e., selon les valeurs d'un facteur). Plus précisémment, on teste l'hypothèse nulle : il y a au moins deux catégories pour lesquelles les moyennes de la variable sont différentes. C'est une généralisation du t-test dans le cas où il y a plus de deux catégories.
ANOVA à un facteur (one-way):
Test de Bartlett : permet de tester l'hypothèse nulle de variances égales entre les groupes :
autre façon de faire une ANOVA à un facteur :
Si l'hypothèse de normalité n'est pas vérifiée, on peut faire un test non paramétrique de Krukal-Wallis :
Une fois que l'ANOVA a montré une différence significative, on peut faire un test de Tukey Honestly Significant Difference pour savoir entre quels facteurs il y a une différence (à condition qu'il y ait à peu près le même nombre d'observations dans chaque catégorie) :
ANOVA à deux facteurs :
fr <- data.frame(var = c(10, 4, 5, 3, 3, 7, 2, 6, 2, 8, 5),
                 categ = factor(c("c", "a", "b", "a", "b", "b", "a", "b", "a", "c", "c")),
                 categ2 = factor(c("A", "B", "B", "B", "B", "A", "B", "A", "B", "A", "A")))
fit <- aov(var ~ categ * categ2, fr)
summary(fit)
donne :
            Df Sum Sq Mean Sq F value  Pr(>F)
categ        2 41.833  20.917  8.1721 0.01476 *
categ2       1  6.250   6.250  2.4419 0.16211
Residuals    7 17.917   2.560
On peut aussi faire : anova(lm(var ~ categ * categ2, fr)).

Dernière date de modification : 2013-12-07