télécharger 103.85 Kb.
|
Théorie de la Décision Tests d'hypothèses. Tests de Bayes. Rapport de Vraisemblance. Statistique suffisante. Tests de Neyman-Pearson. ROC. Tests simples et composés. Tests UMP. Rapport de Vraisemblance Généralisé. Détection d'un signal dans un bruit: le filtre adapté. 3.1 Tests d'hypothèses. On étudie dans ce chapitre la conception de mécanismes de décision. La figure suivante illustre les problèmes de teste d'hypothèses, pour le cas de décision entre deux alternatives possibles, désignées par ![]() ![]() ![]() Figure 3.1: Décision entre deux hypothèses alternatives. Exemples: 3-1 communications numériques. Dans les systèmes de communication numérique, un signal analogique ![]() ![]() ensuite chaque échantillon est quantifié, ![]() et finalement codé comme une séquence de symboles choisis dans un alphabet fini (binaire, par exemple) : ![]() Le signal original est ainsi transformé dans une série de symboles (binaires dans le cas de l'exemple). Ce sont ces symboles qui modulent une porteuse (en phase, en amplitude ou en fréquence) pour générer le signal transmis dans le canal de communication. Ainsi, dans le cas où le système de modulation n'a pas de mémoire (absence d'interférence inter-symbolique), le signal ![]() ![]() Le signal reçu à la sortie du canal de communication est, en général, une version bruité et déformée de m(t): ![]() où ![]() Le système de réception doit, en chaque intervalle ![]() ![]() ![]() En référence à la Figure 3.1, on doit, pour cet exemple, effectuer les correspondances suivantes: Þ source: système de codage, qui génère des symboles 0 ou 1; Þ mécanisme de transition: le canal, qui déforme le signal ![]() Þ mécanisme de décision: Application qui fait correspondre à chaque signal observé un des deux symboles: ![]() 3-2 détection de cibles en radar Les systèmes de radar utilisent une antenne pour détecter des cibles dans l'espace (en général 3D) autour de l'antenne. Pour chaque cible, on désire savoir sa position, sa direction et sa vitesse. On considère ici le cas simple où on ne détermine pas la vitesse de la cible. L'antenne du radar peut être dirigée de façon à émettre, à chaque instant, une impulsion ![]() ![]() ![]() où ![]() ![]() où la première hypothèse correspond à l'absence de cible dans la direction ![]() ![]() Nota: l'hypothèse ![]() ![]() ![]() 3-3 reconnaissance de mots La reconnaissance de mots parmi un dictionnaire est encore un problème de décision: étant donné un segment d'un signal de parole, qu'on admet correspondre à un mot unique, on doit décider de quel mot il s'agit. Ce problème très complexe peut être formalisé comme un problème de décision, avec autant d'hypothèses que de mots. Dans ce cas encore, chaque hypothèse (mot) est composée, puisque le signal de parole qui correspond à un mot donné varie avec la personne qui le prononce (homme/femme, région, âge, ...). Dans tous les exemples présentés, le système de décision est défini par une application de l'espace des observations dans l'ensemble des hypothèses possibles. On désigne cette application par règle de décision. Elle détermine, dans l'espace des observations, une partition en sous-ensembles disjoints, chaque sous-ensemble correspondant aux observations qui sont associées à une même hypothèse. Règle de décision ![]() ![]() ![]() Comme on doit associer une hypothèse à chaque observation possible , ![]() Et, comme les hypothèses sont alternatives, c'est-à-dire, l'occurrence simultanée de deux hypothèses différentes est impossible, les sous-ensembles ![]() ![]() La règle de décision est facilement décrite en fonction des régions ![]() ![]() où ![]() 3.2 Tests de Bayes. Dans cette section, on étudie l'approche Bayesienne aux problèmes de décision, qui est basée sur la connaissance, pour chaque hypothèse ![]() ![]() et qui associe, à chaque comportement possible du système de décision, un coût (équivalent à une pénalisation ou une récompense): ![]() La figure suivante illustre la définition de ces quantités pour un test binaire (où on considère que seulement deux hypothèses sont possibles) ![]() Figure 3.2 Dans la figure précédente, les lignes interrompues représentent les situations d'erreur. Les tests de Bayes consistent à déterminer les régions de décision ![]() ![]() ![]() Chaque probabilité conjointe qui figure dans cette expression peut être écrite comme: ![]() où l'on a exprimé la probabilité de décider ![]() ![]() ![]() ![]() ![]() Dans le cas de tests binaires, les deux régions de décision sont complémentaires, ![]() ![]() Avec ce résultat, on peut exprimer le coût de Bayes ![]() ![]() Les deux premiers termes dans cette expression de dépendent pas des régions de décision, et constituent une pénalisation fixe. Pour minimiser C, il faut donc minimiser l'intégrale. Pour cela, on doit attribuer à ![]() ![]() où on a défini le seuil ![]() ![]() On voit donc que le test de Bayes conduit à comparer le rapport entre les densités de probabilités conditionnelles à un seuil ( ![]() Notons que les tests de probabilité d'erreur moyenne minimale sont un cas particulier des tests de Bayes. Pour les obtenir, il suffit de prendre les valeurs de coût suivantes: ![]() pour lesquels le test optimal est ![]() Rapport de Vraisemblance. Le rapport de vraisemblance (entre les densités de probabilité conditionnelles correspondant à chaque hypothèse), qui détermine les tests de Bayes, joue un rôle très important dans tous les problèmes de décision statistique et sera représenté par ![]() ![]() En fait, si on considère que les densités conditionnelles résument notre connaissance sur chacune des hypothèses, ce rapport compare directement la vraisemblance des observations sous chacune des hypothèses. Puisque l'application d'une fonction monotone n'affecte pas la validité d'une inégalité, le test de Bayes est équivalent au test suivant: ![]() où on a défini le nouveau seuil ![]() ![]() Le logarithme du rapport de vraisemblance est, comme on le verra par la suite, particulièrement simple si les densités conditionnelles appartiennent à une famille exponentielle (dont les densités gaussiennes sont un cas particulier). On appelle ![]() Exemple 3-4. Soit k une variable aléatoire de Poisson de paramètre ![]() ![]() On observe N échantillons indépendants de k, et on veut décider entre les hypothèses ![]() La densité de probabilité des N observations pour une valeur de ![]() ![]() Le rapport de vraisemblance pour ce test est donc ![]() 3.3 Statistique suffisante. On appelle statistique une application de l'espace des observations dans un autre espace, en général de dimension plus petite que celle de l'espace des observations. Pour des problèmes où les observations prennent valeurs dans un espace de dimension élevée (ou même infinie, comme c'est le cas du problème de communications binaires), il est souvent pratique de formuler le problème de décision en considérant une statistique qui est obtenue à partir des observations, au lieu de les traiter directement. La notion de statistique suffisante établit les conditions dans lesquelles ont peut faire cette compression de données sans perte d'information. Par définition, ![]() ![]() où la fonction ![]() ![]() |
![]() | ![]() | «La Commission européenne va enquêter sur toute allégation de tricheries sur des tests», a annoncé vendredi une porte-parole | |
![]() | ![]() | ||
![]() | ![]() | ||
![]() | ![]() | ||
![]() | ![]() | «au risque» n’est pas clair pour un non initié aux tests d’hypothèse : peut être parler de probabilité ? |