Test HSD de Tukey
1. Test de Tukey pour une ANOVA à 1 facteur
1.1 Principe
On dispose de données recueillies selon un plan S. On a réalisé une ANOVA qui conclut à une différence entre les groupes. On souhaite répondre à la question suivante : "quelles sont les paires de groupes pour lesquelles les différences sont significatives ?" Notations :
* r : nombre de groupes
* n : effectif de chaque groupe (N.B. la méthode fonctionne aussi pour des groupes non équilibrés). Tableau d'ANOVA :
| SC
| ddl
| CM
| F
| Entre groupes
| SCG
| r-1
| CMG
| F
| Résidu
| SCS(G)
| r(n-1)
| CMS(G)
|
| Total
| SCT
| rn-1
|
|
|
Pour chaque groupe, l'erreur standard estimée est :

On ordonne les moyennes par ordre décroissant. Soient et la plus grande et la plus petite valeur de cet ensemble de moyennes. Lorsque r > 2, la quantité :

(ou plutôt la quantité ) ne suit pas une loi de Student, car les deux moyennes prises en compte ne sont pas choisies au hasard. On montre que cette quantité suit la loi des écarts studentisés qui prend comme paramètres le nombre de groupes r et le nombre de ddl (celui figurant dans la ligne "résidu" du tableau d'ANOVA). Dans le test de Newman-Keuls, on calcule la quantité Q pour deux moyennes quelconques, et on considère la loi des écarts studentisés avec comme paramètre r, le nombre "d'échelons" : deux moyennes adjacentes sont distantes de deux échelons, deux moyennes séparées par une 3è sont distantes de 3 échelons, etc. En fait, dès que le nombre de paires augmente, le risque de commettre une erreur de type I dépasse ainsi largement le seuil fixé par l'expérimentateur. Le test de Tukey, ou test de la différence franchement significative (HSD : honestly significative difference) consiste à calculer l'expression Q pour toutes les différences de moyennes, en conservant comme loi de distribution, celle de paramètres r et ddl. Autrement dit, on calcule les quantités :

et on conserve pour Q la distribution des étendues studentisées de paramètres r et ddl.
Si QObs > QCrit, on conclut à une différence significative entre les deux moyennes constituant la paire.
1.2 Le test de Tukey avec Minitab
Données : Gr1
| Gr2
| Gr3
| Gr4
| 1
| 2
| 3
| 4
| 1,3
| 2,3
| 3,3
| 4,3
| 1,6
| 2,6
| 3,6
| 4,6
| 1,9
| 2,9
| 3,9
| 4,9
|
En considérant Gr1 et Gr2 :
| SC
| ddl
| CM
| F
| Entre groupes
| 2
| 1
| 2
| 13,33
| Résidu
| 0,9
| 6
| 0,15
|
| Total
| 2,9
| 7
|
|
|
Avec le menu "ANOVA à un facteur", Minitab donne les résultats suivants : Intervalles de confiance à 95% pour la moyenne, basés sur l'écart type groupé Niveau
| N
| Moyenne
| Ecart type
| 1
| 4
| 1,45
| 0,3873
| 2
| 4
| 2,45
| 0,3873
|
Ce tableau est accompagné d'un graphique en mode caractère.
N.B. et cette valeur correspond effectivement à l'écart type corrigé dans l'un ou l'autre des groupes. Ecart type groupé : 0,3873 Comparaisons deux à deux de Tukey : Valeur critique : 3,46 N.B. Cette valeur correspond au calcul R suivant :
qtukey(1-.05, 2, df=6)= 3,360456 Intervalles pour (moyenne des niveaux par colonne) - (moyenne des niveaux par ligne)
N.B. Il s'agit ici de l'intervalle de confiance pour la différence des deux moyennes (valeur observée = -1). Les valeurs sont obtenues en calculant -1 ± 0,6703, et la valeur 0,6703 est obtenue par :

Cela correspond à la formule indiquée pour calculer la "Tukey Honestly Significant Difference" :
.
Ici, on conclut à une différence significative des moyennes, car 0 ne fait pas partie de l'intervalle. Avec le menu "Modèle linéaire généralisé", Minitab donne les résultats suivants : Tukey 95% Intervalles de confiance simultanés
Groupe =1 soustraites de : Groupe
| Infér
| Centre
| Supér
| 2
| 0,3297
| 1,000
| 1,670
|
Tests de simultanéité de Tukey Groupe =1 soustraites de : Niveau Groupe
| Différence des moyennes
| Erreur type de la différence
| T
| Valeur ajustée de P
| 2
| 1
| 0,2739
| 3,651
| 0,0107
|
N.B. Ici, l'erreur standard estimée (cf. le paragraphe "principe") est et . Or, on trouve à l'aide de R : qtukey(1-0.0107,2,df=6)=5.16.
Noter que l'erreur type indiquée par Minitab est égale à , pendant que la valeur T de Minitab est égale à . Au final, le niveau de significativité indiqué correspond bien.
On peut cependant remarquer que dans le cas r=2, on a aussi : 3.65=qt(1-0.0107/2, df=6). Autrement dit, la valeur T indiquée correspond à ce qui serait obtenu à l'aide d'un test de Student.
En considérant 3 groupes, puis 4 groupes :
On obtient des résultats analogues. Pour les intervalles de confiance, avec le menu "modèle linéaire généralisé" et les 4 groupes, on obtient : Groupe =1 soustraites de : Groupe
| Infér
| Centre
| Supér
| 2
| 0,1867
| 1,000
| 1,813
| 3
| 1,1867
| 2,000
| 2,813
| 4
| 2,1867
| 3,000
| 3,813
|
Ici, la demi-amplitude de l'intervalle de confiance pour "moyenne gr2 - moyenne gr1" en calculant
qtukey(1-0.05,4,df=12) = 4,19866 puis  Avec Minitab, pour les tests de simultanéité de Tukey, les valeurs ajustées de P pour la différence "moyenne gr 2 - moyenne gr 1" sont respectivement p=0,0133 et p=0,0154 pour r=3 et r=4.
Or, on constate à l'aide de R que :
qtukey(1-0.0133, 3, df=9) = 5.16
qtukey(1-0.0152, 4, df=12)=5.16.
1.3 Le même exemple traité avec R :
exemple <- structure(list(vd = c(1, 1.3, 1.6, 1.9, 2, 2.3, 2.6, 2.9, 3, 3.3, 3.6, 3.9, 4, 4.3, 4.6, 4.9), groupe = structure(factor(c(1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4),levels=1:4), .Label=c("Gr1","Gr2","Gr3","Gr4"))), row.names=c("1","2","3","4","5","6","7","8","9","10","11","12","13","14","15","16"), ) summary(fm1 <- aov(vd ~ groupe , data = exemple))
# Df Sum Sq Mean Sq F value Pr(>F)
# groupe 3 20.0000 6.6667 44.444 8.958e-07 ***
# Residuals 12 1.8000 0.1500
# ---
# Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 TukeyHSD(fm1, "groupe", ordered = TRUE)
# Tukey multiple comparisons of means
# 95% family-wise confidence level
# factor levels have been ordered
#
# Fit: aov(formula = vd ~ groupe, data = exemple)
#
# $groupe
# diff lwr upr
# Gr2-Gr1 1 0.1869329 1.813067
# Gr3-Gr1 2 1.1869329 2.813067
# Gr4-Gr1 3 2.1869329 3.813067
# Gr3-Gr2 1 0.1869329 1.813067
# Gr4-Gr2 2 1.1869329 2.813067
# Gr4-Gr3 1 0.1869329 1.813067
1.4 Le test de Tukey avec Statistica On dispose les données comme suit :
| Gr
| VD
| 1
| 1
| 1
| 2
| 1
| 1,3
| 3
| 1
| 1,6
| 4
| 1
| 1,9
| 5
| 2
| 2
| 6
| 2
| 2,3
| 7
| 2
| 2,6
| 8
| 2
| 2,9
| 9
| 3
| 3
| 10
| 3
| 3,3
| 11
| 3
| 3,6
| 12
| 3
| 3,9
| 13
| 4
| 4
| 14
| 4
| 4,3
| 15
| 4
| 4,6
| 16
| 4
| 4,9
|
On utilise le menu "Modèle linéaire général", puis les traitements : "Synthèse - Tous les effets" et "Autres résultats - Post Hoc - HSD de Tukey". On obtient alors les résultats suivants : Tests Univariés de Significativité de VD (Feuille de données1)
Décomposition efficace de l'hypothèse
| SC
| Degré de
| MC
| F
| p
|
|
| Liberté
|
|
|
| Ord.Orig.
| 139,2400
| 1
| 139,2400
| 928,2667
| 0,000000
| Gr
| 20,0000
| 3
| 6,6667
| 44,4444
| 0,000001
| Erreur
| 1,8000
| 12
| 0,1500
|
|
|
Test HSD de Tukey ; variable VD (Feuille de données1)
Erreur : MC Inter = ,15000, dl = 12,000
| Gr
| {1}
| {2}
| {3}
| {4}
|
|
| 1,4500
| 2,4500
| 3,4500
| 4,4500
| 1
| 1
|
| 0,015285
| 0,000238
| 0,000199
| 2
| 2
| 0,015285
|
| 0,015285
| 0,000238
| 3
| 3
| 0,000238
| 0,015285
|
| 0,015285
| 4
| 4
| 0,000199
| 0,000238
| 0,015285
|
|
Autrement dit, Statistica nous indique les niveaux de significativité des différences entre les moyennes des quatre groupes, en utilisant la distribution des écarts studentisés.
|