Courses/anova 001/document/glossaire/glos test htm >tests statistiques





télécharger 119.21 Kb.
titreCourses/anova 001/document/glossaire/glos test htm >tests statistiques
date de publication22.10.2019
taille119.21 Kb.
typeCours
d.20-bal.com > loi > Cours
III.Analyse de variance

L’analyse de la variance est une méthode qui, par un ensemble de tests statistiques, permet d’étudier l’influence de facteurs sur la variable quantitative étudiée. Chaque statistique de test suit une loi de Fisher si les postulats sur les résidus sont vérifiés et l'hypothèse H0 vraie. Pour chaque test, l’hypothèse nulle H0 et l’hypothèse alternative H1 portent sur des paramètres du modèle.

L’analyse de variance pour un dispositif à deux facteurs croisés confronte la variabilité de chaque type de paramètres à la variabilité résiduelle.


Test pratiqué pour l'écriture (1) du modèle yijk = ij + ijk 


Le test statistique porte sur les paramètres ij


                            H0                                                 H1

Il n'y a pas d'effet des combinaisons            Les deux facteurs agissent sur la

des deux facteurs sur la variableY ;              variable Y car au moins une combi-

les deux facteurs n'ont pas d'influence          naison diffère des autres.  

 i, j  ij =                                               (i, i', j, j') / ij i'j'                                   


            La deuxième écriture du modèle permet d'étudier quels effets influencent Y. 

Les tests portent sur les paramètres contenus dans le modèle interactif complet :

yijk = + i + j + ij + ijk

avec

 : moyenne générale

i = i. - effet moyen de la modalité Ai du facteur A

j = .j -                    effet moyen de la modalité Bj du facteur B                  

j = iji..j +     interaction entre la modalité Ai et la modalité Bj                

Le premier test statistique porte sur l’effet moyen du facteur A

H0

Il n’y a pas d’effet moyen du facteur A, ou, les effets moyens du facteur A ne diffèrent pas entre eux

 i    i. =  

        (. = 2. = ….= i.  = a.)

ou

 i   i = 0

 

H1

Il y a au moins un effet moyen du facteur A qui diffère des autres

 (i, i’) / i.  i’.

ou

 i / i  0

 

 

 

Le deuxième test porte sur l’effet moyen du facteur B

H0

Il n’y a pas d’effet moyen du facteur B, ou, les effets moyens du facteur B ne diffèrent pas entre eux

 j    j =  

        (.1 = .2 = ….= .j  = .b)

Ou    j   j = 0

 

H1

Il y a au moins un effet moyen du facteur B qui diffère des autres

 (j, j’) / .j  .j’

ou   j / j  0

 

 

 

Le troisième test porte sur les effets d’interaction

H0

Les deux facteurs n’interagissent pas, ou, les interactions sont nulles

 (i, j) ij = 0

 

 

 

H1

Les deux facteurs interagissent, ou, au moins une interaction est non nulle

 (i, j) / ij  0

 


Chaque test statistique confronte le carré moyen dû à l'effet considéré au carré moyen résiduel.


Calcul des carrés moyens



Un carré moyen est le rapport d'une somme de carrés divisée par des degrés de liberté.

Carré moyen dû au facteur A : CMA

- numérateur : la somme des carrés des écarts due au facteur A,  SCEA

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f01.jpg

Les expressions de gauche permettent le calcul de la somme des carrés d’écarts. Les deux expressions de droite traduisent bien que c’est la variation des effets moyens du facteur A qui est considérée. 

- dénominateur de la variance : les degrés de liberté du facteur A : a – 1. Il s’agit du nombre de paramètres i indépendants.

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f02.jpg


Carré moyen dû au facteur B
: CMB


- numérateur : la somme des carrés d’écarts due au facteur B, SCEB

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f03.jpg

Ces formules de calcul montrent bien que cette somme de carrés prend en compte la variabilité des effets moyens du facteur B.


-dénominateur : les degrés de liberté pour le facteur B : b - 1, le nombre de paramètres j indépendants. 

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f04.jpg


Carré moyen des termes d’interaction
: CMAB

 

- numérateur : la somme des carrés d’interaction, SCEAB

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f05.jpg


-dénominateur : les degrés de liberté de l’interaction : (a-1)(b-1), C’est le nombre de paramètres ij indépendants (ab –(a+b-1)).


http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f01_09-10.jpg

Carré moyen résiduel : CM
R 


- numérateur : la somme des carrés d'écarts résiduelle, SCER

 

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f02_09-10.jpg

Dans chacune des populations correspondant à une combinaison AiBj, il existe une variabilité autour de l'espérance. La somme des carrés d'écarts résiduelle mesure donc la variabilité intra-groupe, en tenant compte des ab groupes.

 

- dénominateur : les degrés de liberté résiduels : n -ab.

 Ceux-ci correspondent à la différence entre n, l'effectif total d'individus statistiques et ab = P, le nombre total de paramètres du modèle interactif complet (P est clairement visible avec l'écriture (1) du modèle).

     
http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f03_09-10.jpg
                                 

Tests statistiques


 

Test des effets moyens du facteur A :

                             http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f09.jpg  

Si les postulats sont vérifiés et si H0 est vraie, alors CMA est une estimation de ², la variance résiduelle. Le rapport Fobs suit une loi F(a-1, n-ab) sous H0. 


Test des effets moyens du facteur B :

                               http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f10.jpg  

Si les postulats sont vérifiés et si H0 est vraie, alors CMB est une estimation de ², la variance résiduelle. Le rapport Fobs suit une loi F(b-1, n-ab) sous H0. 

Test des effets d’interaction :

                              http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f11.jpg 

Si les postulats sont vérifiés et si H0 est vraie, alors CMB est une estimation de ², la variance résiduelle. Le rapport Fobs suit une loi de F((a-1)(b-1), n-ab) sous H0. 

Comme pour tout test statistique, l’hypothèse H0 est rejetée si Fobs ≥ Fc, Fc valeur critique pour le risque de 1ère espèce  choisi, ou si la probabilité associée à la valeur observée (« p.value ») est inférieure à . Un test de F significatif (acceptation de l’hypothèse H1) indique que la variabilité due aux effets testés est élevée comparativement à la variabilité résiduelle.

L’ensemble des calculs est résumé dans la table d’analyse de la variance


Source de variation


Degrés de liberté

dl


Somme de carrés d’écarts

SCE


Carré moyen

CM

 


F observé

 

 

totale

n - 1

SCET

 

 

Facteur A

a - 1

SCEA

SCEA/(a-1)

CMA/CMR

Facteur B

b - 1

SCEB

SCEB/(b-1)

CMB/CMR

Interaction AxB

(a-1)(b-1)

SCEAB

SCEAB/(a-1)(b-1)

CMAB/CMR

résiduelle

n - ab

SCER

SCER/(n -ab)

 


A ce tableau peut être ajoutée soit la colonne des valeurs critiques pour le test de F pratiqué, soit la colonne des probabilités associées.

Attention : les calculs présentés ne s’appliquent qu’aux dispositifs équirépétés.


Remarque : il est toujours vrai que dltotale = dlA + dlB + dlAB + dlR

Cette équation permet de calculer facilement les degrés de liberté résiduels de dispositifs complexes. Ces degrés de liberté résiduels valent n - P, P nombre de paramètres du modèle. Les degrés de liberté du modèle valent dlA + dlB + dlAB = P - 1. 

Pour les dispositifs équirépétés, SCEtotale = SCEA + SCEB + SCEAB + SCER.


Interprétation de la table d’analyse de la variance


Il faut commencer par le test de l’INTERACTION. Si celle-ci est non significative (on se place sous H0), les effets moyens des facteurs A et B informent alors correctement sur l’influence des deux facteurs. La connaissance des effets moyens i et j suffit pour décrire et prédire l’effet de la combinaison AiBj sur la variable Y. Ceci s’illustre graphiquement

Si l’interaction est significative, les tests des effets moyens n’informent pas correctement sur l’influence des deux facteurs. En effet, l’effet d’un facteur dépend de la modalité de l’autre facteur avec laquelle il est combiné. La connaissance des effets moyens i et j ne suffit pas pour décrire et prédire l’influence de la combinaison AiBj.


*****

Application à l’exemple des trois sondes utilisées dans deux sols

Tableau des moyennes

Moyenne générale

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f12.jpg

Moyennes des combinaisons sol x sonde

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f13.jpg        http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f14.jpg        http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f15.jpg                                   

  http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f16.jpg         http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f17.jpg               http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f18.jpg                                                 

Moyennes des sols

 http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f19.jpg        http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f20.jpg                                                                          

Moyennes des sondes

 http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f21.jpg       http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f22.jpg       http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f23.jpg                                                            

Tableau des valeurs

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_t01.jpg

Questions :

-      calculez les termes d’interaction

-         complétez les cases vides

-         vérifiez que les conditions http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f24.jpg            http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f25.jpg             i     http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f27.jpg                  

 

 j    http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f26.jpg                    sont vraies avec les valeurs estimées

Tableau des carrés d’écarts

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_t02.jpg

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f28.jpg
http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f29.jpg

 

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f30.jpg

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f31.jpg

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_f32.jpg

Remarquez que chaque somme de carrés d’écarts fait intervenir 24 écarts, autant que d’individus statistiques.

Tableau d’analyse de la variance

Le risque de première espèce  est choisi égal à 5%

n = 24    a = 2    b = 3   r = 4


variation


dl

SCE

CM

F

p value

Fc

totale

23 = n - 1

346

 

 

 

 

sol

1 = a-1

181,5

181,5

29,04

4 10-5

4,41

sonde

2 = b - 1

49

24,5

3,92

0,0386

3,55

sol x sonde

2 = (a-1)(b-1)

3

1,5

0,24

0,789

3,55

résiduelle

18 = n - 6

112,5

 

 

 

 

- La probabilité associée à la valeur observée pour le test de l’interaction est supérieure à 0,05 ; on reste sous H0 ; on n’a pas mis en évidence d’interaction sol x sonde significative.

- La probabilité associée à la valeur de F observée pour le test de l’effet moyen du facteur sol étant inférieure à 0,05, l’effet moyen du sol est significatif. Toutes sondes confondues, les teneurs en P205 diffèrent entre les deux sols,.

- La probabilité associée à la valeur F observée pour le test de l’effet moyen du facteur sonde est inférieure à 0,05, l’effet moyen du aux sondes est significatif. Les trois sondes fournissent, en moyenne, des teneurs en P205 différentes.

- Les différences entre les sondes ne dépendent pas des deux types de sols sur lesquels les prélèvements ont été effectués.

Une comparaison multiple des moyennes va permettre d’identifier si toutes les sondes fournissent des teneurs différentes ou seulement une parmi les trois.


Deuxième exemple


Il s’agit d’un essai de comparaisons de 3 méthodes de pré-germination de semences. Ces méthodes sont appliquées à 5 variétés de ray-grass anglais. Il y a 6 pots par combinaison méthode x variété. Ces pots sont placés en chambre climatisée et le rendement (poids de la matière sèche aérienne (g)) est mesuré 4 semaines après le semis.

Questions :

-         quels sont les individus statistiques ?

-         combien y en a-t-il ?

-         quels sont les deux facteurs et le nombre de modalités observées pour chacun ?

Les données sont présentées dans les trois graphiques suivants

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_g01.jpg

Question :

Quelles informations tirez-vous de ce graphique représentant les valeurs individuelles ?

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_g02.jpg

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_g03.jpg

Questions :

Comment analysez-vous à l’aide des trois graphiques l’influence des facteurs méthode et variété sur le rendement ?

L’analyse de variance va permettre de confirmer si les différences observées graphiquement sont significatives ou pas.

Le modèle d’analyse utilisé est le modèle interactif

yijk = + i + j + ij + ijk

Questions :

-         que représentent les paramètres i ; de combien varie l’indice i ?

-         que représentent les paramètres j ; de combien varie l’indice j ?

-         que représentent les paramètres ij ?

-         quel est le nombre de paramètres de ce modèle ?

-        

L’analyse de variance a été réalisée.

Questions :

- quels sont les degrés de liberté pour chaque effet introduit dans le modèle et pour la résiduelle ? 

La vérification des postulats a été faite à l’aide des graphiques suivants

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_g04.jpg

La variabilité dans ces groupes de 6 résidus estimés est homogène d’un point de vue statistique et le nuage de points ne présente pas de structure. On peut considérer les postulats d’indépendance, d’espérance nulle et d’homogénéité des variances respectés.

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_g05.jpg

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_g06.jpg

La distribution des résidus estimés est normale ; le postulat de normalité est vérifié.

Les quatre postulats du modèle linéaire étant vérifiés, les résultats de l’analyse de variance sont fiables et peuvent être interprétés. Le risque  est choisi égal à 5%.

Tableau d’analyse de la variance

variation

dl

SCE

CM

F

p value

totale

89 = n-1

2812,792

 

 

 

méthode

2 = a - 1

953,156

476,578

24,253

7,52 10-9

variété

4 = b - 1

11,380

2,845

0,145

0,965

méthode x variété

8 = (a-1)(b-1)

374,488

46,811

2,382

0,024

résiduelle

75 = n - 15

1473,767

19,650

 

 

Au risque  de 5%, l'interaction est significative. La réponse aux méthodes dépend de la variété. On ne met pas en évidence d’effet moyen des variétés : toutes méthodes de pré-germination confondues, les variétés ne se distinguent pas pour le rendement. En revanche, l’effet moyen des méthodes est significatif : pour l’ensemble des variétés, en moyenne les méthodes induisent des rendements différents.

Ces résultats s’illustrent parfaitement à l’aide des graphiques suivants :

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_g07.jpg

L’effet moyen « variété » non significatif résulte de la faible variabilité observée entre les 5 moyennes.

http://cours.lasalle-beauvais.fr/courses/anova_001/document/images/mod2_aov_g08.jpg

L’effet moyen « méthode » significatif apparaît au travers des écarts importants entre les 3 moyennes.

L’interaction significative se traduit par des classements très différents entre les variétés pour chacune des méthodes et par des écarts entre les méthodes différents selon les variétés.

Des  comparaisons multiples de moyennes vont être réalisées. Elles tiendront compte de la présence de l’INTERACTION, afin d’identifier les méthodes et les variétés qui diffèrent entre elles. Ces comparaisons de moyennes permettront d’analyser l’interaction entre les deux facteurs étudiés et ainsi d'interpréter correctement l'influence des deux facteurs sur la variable réponse (le poids par pot).

 

                                                                                                                 *****

Passez au chapitre 4

similaire:

Courses/anova 001/document/glossaire/glos test htm >tests statistiques iconCourses/anova 001/document/glossaire/glos modele htm >paramètres

Courses/anova 001/document/glossaire/glos test htm >tests statistiques iconCourses/anova 001/document/glossaire/glos modele htm >modèle

Courses/anova 001/document/glossaire/glos test htm >tests statistiques iconLicence de Psychologie td n° 4 Tests statistiques avec Excel 1 Test du khi-2

Courses/anova 001/document/glossaire/glos test htm >tests statistiques iconTest hsd de Tukey Test de Tukey pour une anova à 1 facteur

Courses/anova 001/document/glossaire/glos test htm >tests statistiques iconSynthèse : anova de Kruskal-Wallis & test de la Médiane

Courses/anova 001/document/glossaire/glos test htm >tests statistiques iconTests d'hypothèses. Tests de Bayes. Rapport de Vraisemblance. Statistique...

Courses/anova 001/document/glossaire/glos test htm >tests statistiques iconLicence de Psychologie Semestre N° 5 td n° 2 Test du khi-2, lois...

Courses/anova 001/document/glossaire/glos test htm >tests statistiques iconArrêté N°D1/B2/PC/17-001 portant fixation des tarifs des courses de taxi pour l’année 2017
«taximètre», conforme aux prescriptions du décret n° 2006-447 du 12 avril 2006 relatif à la mise sur le marché et à la mise en service...

Courses/anova 001/document/glossaire/glos test htm >tests statistiques iconTests : Rappel / bilan / Tests non paramétriques

Courses/anova 001/document/glossaire/glos test htm >tests statistiques iconPackages r proposés pour l’analyse différentielle de données de séquençage...
«Le pendant du test limma adapté aux données de séquençage (cf moderated t-test du même auteur)»






Tous droits réservés. Copyright © 2016
contacts
d.20-bal.com