Résumé La méthode dite «de Papadakis»





télécharger 477.26 Kb.
titreRésumé La méthode dite «de Papadakis»
page2/10
date de publication12.10.2019
taille477.26 Kb.
typeRésumé
1   2   3   4   5   6   7   8   9   10

Deuxième dimension

Première dimension


Fig. 1. Determination des structures de voisinage (ou mailles) entourant chaque individu.
Un groupe de voisins est situé à l’intersection de l’angle avec la zone grisée représentant la couronne d’ellipse. Le centre de l’ellipse représente l’individu-pivot

- est le coefficient d’aplatissement de l’ellipse

- R1 est son rayon minimum, selon la première dimension (lignes de plantation)

- R2 est son rayon maximum) selon cette première dimension

- est l’orientation de la bissectrice du secteur de couronne par rapport à la direction de référence (base des lignes de plantation)

- est l’angle d’ouverture du secteur de couronne d’ellipse.


Fig. 2. Exemple de configuration de voisinage (maille) correspondant à une ellipse « pleine » à grand axe orienté perpendiculairement aux lignes de plantation.
Espacement entre lignes : 7.5 m. (soit 1.5 unité d’abscisse).

Espacement entre individus sur la ligne : 5 m.

Rayon minimum (R1) : 0

Rayon maximum (R2) : 8.64 m (1.73 unité d’abscisse).

Les individus autres que le pivot sont représentés par ce symbole.

Le centre de l’ellipse représente l’individu-pivot, identifié par ce symbole.

est le coefficient d’aplatissement de l’ellipse, rayon perpendiculaire / rayon sur la ligne : 1.94

est l’orientation de la bissectrice du secteur de couronne : quelconque (0 degré, par exemple).

est l’angle d’ouverture du secteur de couronne d’ellipse : 360 degrés.

Une deuxième étape dans la généralisation du modèle de Papadakis consiste à ne pas privilégier une configuration de voisinage (ou maille) donnée, mais à tester, parmi c mailles, celles qui permettent le meilleur ajustement de la variable observée sur l’individu-pivot, en utilisant toujours les p variables du modèle (4). Ceci revient, en fait, à construire un modèle de régression multiple avec c x p « variables explicatives » :



(5)

On peut, enfin, combiner les modèles (3) et (5), en ajustant simultanément les observations du pivot par un effet bloc et par régression multiple sur des variables environnementales. Ce modèle composite s’écrit :



(6)
Dans les modèles (4), (5) et (6), une régression multiple descendante avec p ou c x p « variables explicatives » au premier palier et une seule au dernier palier (Snedecor et Cochran 1980) permettra d’identifier les variables ou les combinaisons configuration x variable les plus efficaces pour l’ajustement et de tester leur signification.
Une fois ce choix réalisé, les calculs peuvent être réitérés, de façon à ajuster les variables retenues chez les voisins (qui deviennent à leur tour des arbres-pivots), selon la méthode « Papadakis réitérée » (Pichot 1993). Il en résulte logiquement une réduction du terme d’erreur, mesurable par la diminution de la variance résiduelle. Il faut noter que la symétrie de traitement entre individus-pivots et voisins (en principe, un même individu passe tour à tour d’une catégorie dans l’autre) suggère que l’on traite les mêmes observations sur l’ensemble des arbres de l’essai, même si l’on ne cherche à ajuster qu’une partie d’entre eux (cf. 2.2). Toutefois, l’implémentation actuelle du modèle permet de définir dans la population deux groupes d’individus :
- Ceux qui ne serviront que de pivots ;

- Ceux qui serviront à la fois de pivots et de membres de groupes de voisinage.
Sur le premier groupe, on peut ne disposer que de « caractères d’intérêt » relativement difficiles à mesurer (par exemple, des rapports isotopiques C13/C12 ou des analyses biochimiques), alors que le deuxième sera caractérisé, par exemple, par des caractères « dendrométriques » (hauteur, diamètre, caractéristiques de l’architecture…).
Les deux aspects nouveaux de ce modèle : covariables multiples et « mailles » multiples (d’où l’appellation « Papadakis++ »), doivent en principe le rendre plus puissant et mieux adapté sur le plan biologique que le modèle de Papadakis traditionnel. En effet, les voisins proches de l’individu-pivot pourront avoir avec lui des relations de compétition, plus importants que les effets d’environnement commun, se traduisant par une corrélation négative pour le même caractère. En revanche, ceux qui sont plus éloignés et échappent à ce type de relation traduiront alors uniquement des effets d’environnement commun (corrélation positive avec l’individu-pivot). Par ailleurs, la sensibilité à la compétition étant variable selon les caractères, la régression multiple descendante classera automatiquement les caractères dans les « mailles critiques » correspondant à ces deux types de relations (compétition et environnement commun). Enfin, les mailles pourront être soit disjointes (par exemple, couronnes de cercles emboîtées) ou présenter des individus communs (par exemple, cercles de rayon variable) : le modèle de régression multiple autorise, en effet, des auto-corrélations entre mailles pour les diverses variables. Le premier type de maille est plus adapté à l’analyse biologique, puisqu’on peut ainsi comparer les propriétés de groupes disjoints pour leurs relations avec l’individu-pivot. En revanche, les mailles « chevauchantes » correspondent mieux aux préoccupations pratiques du sélectionneur (ajustement optimal des données avec le minimum de « trous » dans certaines mailles).
-1.2- Amélioration de l’ajustement en tenant compte du génotype des voisins

Les modèles présentés ci-dessus excluent a priori l’individu-pivot de la configuration de voisinage ; ceci pour éviter une covariance génétique entre le résidu moyen et sa valeur phénotypique, qui conduirait, lors de l’ajustement, à éliminer une partie de sa composante génétique. Poussant plus loin ce raisonnement, on peut penser qu’il est, pour les mêmes raisons, souhaitable d’éliminer du calcul des résidus moyen tous les individus apparentés au pivot (a fortiori s’il s’agit de génotypes identiques, lorsque le modèle est appliqué à un essai clonal ou à des lignées). Par ailleurs, on peut souhaiter faire jouer un rôle privilégié dans l’ajustement à certains groupes d’individus. Ces individus peuvent constituer des catégories génotypiques particulièrement sensibles aux variations environnementales, pour les caractères observés (par exemple, des clones très sensibles à la rouille, introduits dans test de descendance de peupliers dont l’un des objectifs est la sélection de génotypes résistants) ; il peut également s’agir de « témoins » introduits dans l’essai selon une répartition plus ou moins régulière, et dont le rôle pourrait être en partie de constituer des « ponts » entre plusieurs essais comparant des unités génétiques au moins en partie différentes d’un essai à l’autre. Enfin, le même principe permet de distinguer les deux groupes d’individus définis plus haut (observés pour des « caractères d’intérêt » ou pour des variables dendrométriques).
Papadakis++ propose à cet effet l’option TRIGENE (cinquième paramètre du programme COMPEX), qui peut prendre quatre modalités différentes.
- 0 : Le génotype des individus inclus dans la maille n’est pas contrôlé (seul l’individu-pivot est exclu quels que soient les paramètres de la maille) ;
- 1 : Les individus ayant le même code génotypique que le pivot sont exclus ;
- 2 : Les individus dont les codes sont sur une « liste d’inclusion » peuvent faire partie de la maille, ceux qui ont le même code génotypique que le pivot étant exclus ;
- 3 : Les individus dont les codes ne figurent pas sur une « liste d’exclusion » peuvent faire partie de la maille, ceux qui ont le même code génotypique que le pivot étant exclus.
Si l’on choisit les modalités 2 ou 3, on indique le nom du fichier de norme ANTAR, avec le format : 1 indicatif, 1 individu et 0 caractère (cf. le manuel général de DIOGENE), qui donne la liste des codes génotypiques concernés. Ce fichier peut être soit directement créé dans la directory de travail avec l’utilitaire de saisie de DIOGENE (STOCK) soit être généré avec EXCEL et transcodé par l’utilitaire ASCBIN après son importation par FTP.

Par souci de concision, les exemples développés ci-dessous ne concernent que la modalité 0 de l’option TRIGENE ainsi que les modalités « n » et 0 de l’option REGPOND décrite dans le paragraphe suivant. Toutefois, les conclusions générales qui en sont tirées sont valables pour les modalités 1, 2 et 3 du paramètre.
-1.3- Amélioration de l’ajustement en y intégrant l’effectif « utile » par maille
Que l’on ait choisi une seule géométrie de maille ou plusieurs, on peut ajuster le phénotype par une régression multiple selon le critère des « moindres carrés pondérés », c’est-à-dire minimisant la somme des carrés des écarts des valeurs observés de l’individu-pivot en affectant à l’individu i une masse . Le critère devient : minimum.

Les q coefficients de régression partiels : , , …, sont alors estimés sous forme matricielle par :

(7)
est la matrice (n, q) des q variables explicatives mesurées sur les n individus, le vecteur colonne (n, 1) de la variable expliquée et une matrice carrée (n, n) qui comporte les éléments sur sa diagonale et des « 0 » ailleurs.
Les quatre valeurs possibles du paramètre REGPOND sont alors les suivantes :
- 0 : régression multiple non pondérée ;

- 1 : (moyenne arithmétique de l’effectif du pivot et de la maille associée) ;

- 2 : (moyenne géométrique) ;

- 3 : (moyenne harmonique).
Les effectifs utilisés pour cette pondération seront ceux correspondant au premier « jeu » de paramètres ; il convient alors que celui-ci corresponde à la maille la plus « interne » (celle pour laquelle les voisins sont les plus proches du pivot). En effet, c’est pour cette maille que l’effectif jouera le rôle le plus « limitant » pour la précision de l’estimation des variables explicatives.
La pondération permet de tenir compte des inégalités locales d’effectifs dues aux différences de mortalité ainsi que des effets de bordure qui tronquent la structure géométrique théorique de la maille. La moyenne arithmétique donne aux mailles un poids pratiquement proportionnel à leur effectif. La moyenne harmonique aboutit à limiter l’influence de mailles de très faible effectif et à égaliser celle des mailles d’effectifs moyens et forts, car elle vaut au minimum pour et tend asymptotiquement vers une valeur limite lorsque . La moyenne géométrique réalise un compromis entre ces deux systèmes de pondération. Un autre avantage de la pondération est de réduire l’hétéroscédasticité des résidus de la régression, si elle existe (Antoniadis et al. 1992, Ryan 1997).
Sur le plan pratique, l’option « régression multiple pondérée » est paramétrée au niveau des modules élémentaires :
- COMPEX (deux modalités, « o » ou « n »). C’est le sixième paramètre (il suit TRIGENE qui a été explicité en 1.2). Si TRIGENE vaut 2 ou 3, il sera décalé en septième position, puisque le nom du fichier donnant la liste d’inclusion/exclusion des génotypes sera donné après la modalité de TRIGENE ;
- MATCOR (les quatre modalités 0-3 indiquées ci-dessus). Il suit alors la modalité concernant le choix de chaînage de la régression multiple (REGMUL = « o »), le paramètre ne figurant pas si REGMUL = « n » (le choix étant forcément « o » dans le cadre des modules PAPA1 et PAPA2). Il est alors le neuvième paramètre.
Si REGPOND = « o », le module COMPEX crée un fichier spécialisé, weights, avec son fichier paramètre weights.p (donc, facilement éditable par l’utilisateur avec les utilitaires LIRE et LECTUR). Ce fichiers a autant d’enregistrements que d’individus-pivots, chacun comportant 0 indicatif, un « individu » , les effectifs du pivot pour chaque caractère (1 chaque fois), puis les effectifs par caractère pour chaque maille : caractère 1, maille 1, caractère 1, maille 2, caractère 1, maille 3,…caractère (nbcar), maille (nbmaille).
Si REGPOND = 1, 2, ou 3, le programme MATCOR lit le fichier weights, calcule le nombre de caractères et de mailles, et utilise les effectifs de la première maille définie dans le paramétrage de COMPEX pour utiliser les pondérations décrites ci-dessus dans le calcul des matrices se variances-covariances et le calcul du vecteur de moyennes (moyennes « simples » remplacées par des moyennes pondérées). Le programme REGMUL opère alors sur cette matrice et ce vecteur redéfinis sans qu’il soit besoin de modifier son paramétrage. Le paramétrage du programme RIVES, qui calcule les valeurs ajustées, est également inchangé.
Remarque : L’option REGPOND exige que le fichier de données de départ comporte un seul individu/enregistrement. Si ce n’est pas le cas, en changer le format avec l’utilitaire COMPAC.


-2- Mise en œuvre pratique

1   2   3   4   5   6   7   8   9   10

similaire:

Résumé La méthode dite «de Papadakis» icon1-addition vectorielle 2-La méthode graphique A+B = B+A (A+B)+C =...

Résumé La méthode dite «de Papadakis» iconRésumé : En France, depuis la loi de 2009 dite Grenelle 1, les projets...

Résumé La méthode dite «de Papadakis» iconRésumé : Ce texte s’intéresse aux conséquences de la multiplication...
«verdissement» de leur image ont contribué à créer un terrain favorable à la mise en place d'actions de politique publique en faveur...

Résumé La méthode dite «de Papadakis» iconLa méthode de l’imputation rationnelle (IR)

Résumé La méthode dite «de Papadakis» iconRplm Méthode de Guérison Multidimensionnelle

Résumé La méthode dite «de Papadakis» iconRappel de la commande, méthode adoptée

Résumé La méthode dite «de Papadakis» icon«La gestion de production par la méthode Six Sigma»

Résumé La méthode dite «de Papadakis» iconFiche méthode rédaction en problème d’électricité

Résumé La méthode dite «de Papadakis» icon§1/ Présentation des critères. La mission dite d’IG

Résumé La méthode dite «de Papadakis» iconFiche méthode : equilibrer une equation de reaction chimique






Tous droits réservés. Copyright © 2016
contacts
d.20-bal.com