ANOVA ou analyse des variances. Quand vous posez la question: « Les moyennes des groupes, sont-elles différentes ?» Vous posez implicitement la question sur la variabilité des moyennes. Vous devez donc regardez la moyenne et les écart-types de chaque groupe. Voila le principe, pour la pratique, on va le voir sur Jamovi.
Principe général de ANOVA (ANalyse des VAriances)
ANOVA correspond à l’analyse des variances. Elle sert à déterminer si les moyennes de trois groupes ou plus sont différentes par la statistique F (Fisher). Mais comment sommes nous passer de la comparaison de moyennes à l’analyse de la variance ?
Au fait, quand vous posez la question: « Les moyennes des groupes, sont-elles différentes ?» Vous posez implicitement la question sur la variabilité des moyennes.
Je m’explique, si les moyennes des groupes ne “se varient” pas, vous ne pouvez pas dire que les moyennes des groupes soient différentes. Et c’est pourquoi vous utilisez l’analyse de la variance pour tester les moyennes.
Rappelez vous que la variance correspond aux carré des écart-types.
Vous devez donc regardez la moyenne et les écart-types de chaque groupe.
Vous pouvez vous arrêter là et allez directement à la fin du post pour une démonstration de l’ANOVA sur Jamovi (vidéo à venir prochainement sur la chaine Youtube Epirheum).
Ou
Si vous êtes encore curieux, voici quelques explications supplémentaires.
Le principe de ANOVA
ANOVA correspond à l’analyse des variances. Elle sert à déterminer si les moyennes de trois groupes ou plus sont différentes par la statistique F (Fisher).
Comprendre le principe de ANOVA revient donc à expliquer simplement et sans formule, car vous êtes sur Epirheum :-), le principe de la statistique F (Fisher).
La statistique F
L’analyse de la variance à un facteur contrôlé (ANOVA one-way) utilise la statistique de F (Fisher) .
La Statistique F correspond au rapport de la Variation entre les moyennes d’échantillon / Variation à l’intérieur des échantillons.
Voyons cela à travers cet exemple.
Je cherche à comparer la moyenne de la ration calcique (variable quantitative de disrtibution normale) entre 4 groupes de patients répartis selon leur niveau d’instruction (analphabète, primaire, secondaire et universitaire)
Numérateur : Variation entre les moyennes des groupes
L’ANOVA à un facteur contrôlé (ANOVA one-way) calcule une moyenne pour chacun des quatre groupes selon le niveau d’instruction (tableau 1).
Si les moyennes des groupes sont regroupées près de la moyenne globale, leur variance est faible.
Ici, les moyennes de groupe sont réparties autour de la moyenne globale pour les 373 observations qui est de 687 (tableau 2).
Si les moyennes des groupes (633, 631, 708, 740) sont regroupées près de la moyenne globale 687, leur variance est faible.
Plus les moyennes des groupes sont écartées les unes des autres, plus la valeur dans le nominateur de la statistique F est élevée.
Rappelez-vous :
La Statistique F = la Variation entre les moyennes d’échantillon / Variation à l’intérieur des échantillons.
Dénominateur : Variation à l’intérieur des échantillons
Pour comparer ces moyennes, nous avons également besoin d’une estimation de la variabilité au sein de chaque groupe.
La variance à l’intérieur du groupe peut s’apparenter au bruit de fond qui peut masquer une différence entre les moyennes.
Si les observations pour chaque groupe sont proches de la moyenne du groupe, la variance à l’intérieur des goupes est faible.
Si les observations pour chaque groupe sont plus éloignées de la moyenne du groupe, la variance à l’intérieur des groupes est élevée.
Plus les observations sont éloignées de leur moyenne de groupe, plus la valeur dans le dénominateur de la statistique F est élevée.
La Statistique F : Variation entre les moyennes d’échantillon / Variation à l’intérieur des groupes
L’ANOVA utilise le test F pour déterminer si la variabilité entre les moyennes de groupe est plus grande que la variabilité des observations à l’intérieur des groupes.
Plus la variation entre les moyennes est grandes et la variation à l’intérieur des groupes est faible.
Si ce rapport est suffisamment élevé, vous pouvez conclure que toutes les moyennes ne sont pas égales.
Plus F sera grand est la probabilité que le p soit significatif aussi.
C’est aussi simple que cela 🙂
Maintenant, vous êtes vraiment Prêt(e) pour une démonstration de l’ANOVA sur Jamovi.
Sur Jamovi, ANOVA en pratique
Je cherche à comparer la moyenne de la ration calcique (variable quantitative de disrtibution normale) entre 4 groupes de patients répartis selon leur niveau d’instruction (analphabète, primaire, secondaire et universitaire)
La ration calcique est une variable quantitative de distribution normale. Il s’agit donc de comparer des moyennes dans 4 groupes indépendants. Le test le plus adéquat est le test d’ANOVA pour groupes indépendants.
Sur Jamovi on va sur analyses->ANOVA->one way anova.
A. Comparer les moyennes des 3 groupes ou plus (test de Fisher)
La variable dépendante est celle dont on compare les moyennes soit la ration calcique.
La variable de regroupement est le niveau d’instruction.
On vérifie l’homogénéité des variances.
On coche donc dans variances, assume equals (ficher’s) et également sur descriptive tables pour obtenir le tableau qui décrit les moyennes dans les différents groupes.
L’hypothèse nulle H0 est que les moyennes de ration calcique ne diffèrent pas entre les groupes de niveau d’instruction. L’hypothèse alternative H1 est qu’au moins une moyenne est significativement différente des autres.
Le p est de 0.005 donc significatif. Au moins une moyenne est significativement différente des autres. Mais laquelle?
Pour avoir plus de détails, on effectue un test post hoc.
B. Si les moyennes sont différentes, quel groupe est différent? test Post-hoc
On va donc dans la section post hoc tests, et on coche tukey .
L’option flag significant comparisons permet de mettre en évidence les p significatifs.
On peut donc conclure que dans notre étude, la moyenne de la ration calcique du groupe analphabète (633) et du groupe primaire (631) est significativement inférieure à celle du groupe supérieur (740).
Mais il faut corriger la valeur du p par le nombre de comparaison faite (à la main :-).
Du coup, seul la moyenne de la ration calcique du groupe analphabète est significativement inférieure à celle du groupe niveau supérieur.
C. Tableau récapitulatif des résultats de ANOVA : Comapraison de la ration calcique entre 4 groupes de patients selon leur niveau d’instruction
Voilà, j’espère que ce tuto vous sera utile.
Bonne journée !
Bonjour, quand vous dites “Mais il faut corriger la valeur du p par le nombre de comparaison faite (à la main :-).”, je suppose qu’on doit faire qqchose avec la valeur de p du tableau post hoc et la valeur de N de chaque groupe du tableau précédent “Group Descriptive”, mais je n’ai aucune idée de la correction qu’on est censé faire. Vous sauriez l’expliquer (ou mettre un exemple avec les 2 valeurs qui sont “flaggées” comme significatives sur le tableau de départ, montrant pourquoi l’un est conservée et pas l’autre).
Re bonjour. Si j’ai bien compris ce qui est dit ici https://jmeunierp8.github.io/ManuelJamovi/s13.html#s13_5 sur la correction de Bonferroni, il suffirait de multiplier p par le nombre de GROUPES qu’on a comparés. (donc dans votre exemple ça ferait .015*4 = .060 et .049*4 = .198 et les 2 résultats seraient exclus car >.05 => donc je pense que ce n’est pas comme ça que vous avez fait).
Bonjour Loic,
Merci pour ton retour.
Pour utiliser la correction de Bonferroni, on ajuste sur le nombre de comparaison.
Ici , il s’agit de 4 groupes (Analphabete, Primaire, Secondaire, Supérieur ) / la variable de référence est Analphabète /
-> nous pouvons donc effectuer 3 paires de comparaisons: Analphabète – Primaire / Analphabète – Secondaire / Analphabète – Supérieur.
On multiple donc le p par 3 (et non pas par 4)
Ici la paire sig différente est Analphabète- Supérieur (0.015 * 3 = 0.045).
J’espère que cela éclaire votre lanterne 🙂 N’hésitez pas à revenir vers moi pour tout complément .
Bon courage!
Bonjour Loic,
Merci pour ton retour.
Pour utiliser la correction de Bonferroni, on ajuste sur le nombre de comparaison.
Ici , il s’agit de 4 groupes (Analphabete, Primaire, Secondaire, Supérieur ) / la variable de référence est Analphabète /
-> nous pouvons donc effectuer 3 paires de comparaisons: Analphabète – Primaire / Analphabète – Secondaire / Analphabète – Supérieur.
On multiple donc le p par 3 (et non pas par 4)
Ici la paire sig différente est Analphabète- Supérieur (0.015 * 3 = 0.045).
J’espère que cela éclaire votre lanterne 🙂 N’hésitez pas à revenir vers moi pour tout complément .
Bon courage!
Bonjour Ihsane, effectivement, avec cette dernière précision je comprends meiux.