Tests d'hypothèses. Tests de Bayes. Rapport de Vraisemblance. Statistique suffisante. Tests de Neyman-Pearson. Roc. Tests simples et composés. Tests ump. Rapport de Vraisemblance Généralisé. Détection d'un signal dans un bruit: le filtre adapté





télécharger 103.85 Kb.
titreTests d'hypothèses. Tests de Bayes. Rapport de Vraisemblance. Statistique suffisante. Tests de Neyman-Pearson. Roc. Tests simples et composés. Tests ump. Rapport de Vraisemblance Généralisé. Détection d'un signal dans un bruit: le filtre adapté
page1/4
date de publication08.07.2017
taille103.85 Kb.
typeThèse
d.20-bal.com > comptabilité > Thèse
  1   2   3   4




Théorie de la Décision

Tests d'hypothèses. Tests de Bayes. Rapport de Vraisemblance. Statistique suffisante. Tests de Neyman-Pearson. ROC. Tests simples et composés. Tests UMP. Rapport de Vraisemblance Généralisé. Détection d'un signal dans un bruit: le filtre adapté.
3.1 Tests d'hypothèses.
On étudie dans ce chapitre la conception de mécanismes de décision. La figure suivante illustre les problèmes de teste d'hypothèses, pour le cas de décision entre deux alternatives possibles, désignées par et .


Figure 3.1: Décision entre deux hypothèses alternatives.
Exemples:

3-1 communications numériques.

Dans les systèmes de communication numérique, un signal analogique souffre plusieurs transformations avant d'être effectivement envoyé dans le canal de communication. Il est d'abord échantillonné (à une vitesse au moins égale à la fréquence de Nyquist),

,

ensuite chaque échantillon est quantifié,

,

et finalement codé comme une séquence de symboles choisis dans un alphabet fini (binaire, par exemple) :

.

Le signal original est ainsi transformé dans une série de symboles (binaires dans le cas de l'exemple).
Ce sont ces symboles qui modulent une porteuse (en phase, en amplitude ou en fréquence) pour générer le signal transmis dans le canal de communication. Ainsi, dans le cas où le système de modulation n'a pas de mémoire (absence d'interférence inter-symbolique), le signal émis pendant l'intervalle de temps correspondant à un symbole est complètement déterminé par le symbole transmis. Par exemple, pour les systèmes de modulation d'amplitude et avec des symboles binaires


Le signal reçu à la sortie du canal de communication est, en général, une version bruité et déformée de m(t):



est l’opérateur de transmission du canal, en général, connu.
Le système de réception doit, en chaque intervalle , faire correspondre au signal reçu, soit un symbole 1, soit un symbole 0. Il doit donc résoudre le problème de décision suivant. Etant donné , décider laquelle des deux hypothèses suivantes est vraie:



En référence à la Figure 3.1, on doit, pour cet exemple, effectuer les correspondances suivantes:

Þ source: système de codage, qui génère des symboles 0 ou 1;

Þ mécanisme de transition: le canal, qui déforme le signal et ajoute du bruit au message;

Þ mécanisme de décision: Application qui fait correspondre à chaque signal observé un des deux symboles:


3-2 détection de cibles en radar

Les systèmes de radar utilisent une antenne pour détecter des cibles dans l'espace (en général 3D) autour de l'antenne. Pour chaque cible, on désire savoir sa position, sa direction et sa vitesse. On considère ici le cas simple où on ne détermine pas la vitesse de la cible. L'antenne du radar peut être dirigée de façon à émettre, à chaque instant, une impulsion seulement dans un cône angulaire étroit autour de la direction . S'il existe une cible dans cette direction, le signal émis est réfléchi et reçu avec un temps de retard qui est proportionnel à la distance d entre l'antenne et la cible:



dépend de l'attitude de la cible, des ses propriétés de réflexion, de la distance, etc., et c est la vitesse de propagation des ondes électromagnétiques. Pour détecter la cible, le système doit donc résoudre un problème de décision entre les deux hypothèses suivantes:



où la première hypothèse correspond à l'absence de cible dans la direction , et la deuxième à la présence d'une cible à une distance qui est déterminée par .

Nota: l'hypothèse de ce test binaire dépend des deux paramètres et qui ne sont pas connus. Ce type de problèmes de décision, bien plus difficile à résoudre, en général, que les problèmes de décision simple (comme le cas de l'exemple précédant), est connu sous le nom de tests d'hypothèses composées.

3-3 reconnaissance de mots

La reconnaissance de mots parmi un dictionnaire est encore un problème de décision: étant donné un segment d'un signal de parole, qu'on admet correspondre à un mot unique, on doit décider de quel mot il s'agit. Ce problème très complexe peut être formalisé comme un problème de décision, avec autant d'hypothèses que de mots. Dans ce cas encore, chaque hypothèse (mot) est composée, puisque le signal de parole qui correspond à un mot donné varie avec la personne qui le prononce (homme/femme, région, âge, ...).
Dans tous les exemples présentés, le système de décision est défini par une application de l'espace des observations dans l'ensemble des hypothèses possibles. On désigne cette application par règle de décision. Elle détermine, dans l'espace des observations, une partition en sous-ensembles disjoints, chaque sous-ensemble correspondant aux observations qui sont associées à une même hypothèse.
Règle de décision partition de l'espace d'observations en régions associées aux différentes hypothèses :
Comme on doit associer une hypothèse à chaque observation possible ,

.

Et, comme les hypothèses sont alternatives, c'est-à-dire, l'occurrence simultanée de deux hypothèses différentes est impossible, les sous-ensembles sont disjoints:

.
La règle de décision est facilement décrite en fonction des régions :

représente les observations (qui peuvent être scalaires, vectorielles, où les échantillons d'un signal pris dans un intervalle de temps).

3.2 Tests de Bayes.

Dans cette section, on étudie l'approche Bayesienne aux problèmes de décision, qui est basée sur la connaissance, pour chaque hypothèse , de la probabilité a priori pour que cette hypothèse se réalise,

,

et qui associe, à chaque comportement possible du système de décision, un coût (équivalent à une pénalisation ou une récompense):

.

La figure suivante illustre la définition de ces quantités pour un test binaire (où on considère que seulement deux hypothèses sont possibles)


Figure 3.2
Dans la figure précédente, les lignes interrompues représentent les situations d'erreur.
Les tests de Bayes consistent à déterminer les régions de décision et de façon à minimiser la valeur moyenne du coût:


Chaque probabilité conjointe qui figure dans cette expression peut être écrite comme:



où l'on a exprimé la probabilité de décider quand est vraie comme la probabilité pour que les observations appartiennent à la région où on décide , étant donné que est vraie.
Dans le cas de tests binaires, les deux régions de décision sont complémentaires, , et on peut donc écrire

,

Avec ce résultat, on peut exprimer le coût de Bayes en fonction d'une seule région:

.

Les deux premiers termes dans cette expression de dépendent pas des régions de décision, et constituent une pénalisation fixe. Pour minimiser C, il faut donc minimiser l'intégrale. Pour cela, on doit attribuer à tous les points de l'espace des observations pour lesquels l'intégrant est négatif, ce qui est équivalent à la règle de décision suivante:

,

où on a défini le seuil :

.
On voit donc que le test de Bayes conduit à comparer le rapport entre les densités de probabilités conditionnelles à un seuil (). On appelle le rapport des densités conditionnelles dans l'équation précédente le rapport de vraisemblance
Notons que les tests de probabilité d'erreur moyenne minimale sont un cas particulier des tests de Bayes. Pour les obtenir, il suffit de prendre les valeurs de coût suivantes:



pour lesquels le test optimal est



Rapport de Vraisemblance.

Le rapport de vraisemblance (entre les densités de probabilité conditionnelles correspondant à chaque hypothèse), qui détermine les tests de Bayes, joue un rôle très important dans tous les problèmes de décision statistique et sera représenté par :

.
En fait, si on considère que les densités conditionnelles résument notre connaissance sur chacune des hypothèses, ce rapport compare directement la vraisemblance des observations sous chacune des hypothèses.
Puisque l'application d'une fonction monotone n'affecte pas la validité d'une inégalité, le test de Bayes est équivalent au test suivant:

,

où on a défini le nouveau seuil :

.

Le logarithme du rapport de vraisemblance est, comme on le verra par la suite, particulièrement simple si les densités conditionnelles appartiennent à une famille exponentielle (dont les densités gaussiennes sont un cas particulier). On appelle le rapport de vraisemblance logarithmique.
Exemple 3-4.

Soit k une variable aléatoire de Poisson de paramètre :

.

On observe N échantillons indépendants de k, et on veut décider entre les hypothèses



La densité de probabilité des N observations pour une valeur de générique est:



Le rapport de vraisemblance pour ce test est donc



3.3 Statistique suffisante.

On appelle statistique une application de l'espace des observations dans un autre espace, en général de dimension plus petite que celle de l'espace des observations. Pour des problèmes où les observations prennent valeurs dans un espace de dimension élevée (ou même infinie, comme c'est le cas du problème de communications binaires), il est souvent pratique de formuler le problème de décision en considérant une statistique qui est obtenue à partir des observations, au lieu de les traiter directement.
La notion de statistique suffisante établit les conditions dans lesquelles ont peut faire cette compression de données sans perte d'information. Par définition, est une statistique suffisante si on peut factoriser les densités conditionnelles pour chaque hypothèse de la façon suivante:



où la fonction dépend des observations mais pas de l'hypothèse i. Dans ce cas, le rapport de vraisemblance dépend des observations r uniquement à travers la statistique suffisante:

.
  1   2   3   4

similaire:

Tests d\Tests : Rappel / bilan / Tests non paramétriques

Tests d\Petit aide-mémoire des tests à utiliser en statistique

Tests d\Les Tests pour évaluer le Q. I d’un chien

Tests d\Immigration : Besson enterre les tests adn

Tests d\Licence de Psychologie td n° 4 Tests statistiques avec Excel 1 Test du khi-2

Tests d\Ce cours portera principalement sur les tests d'évaluation de l'intelligence

Tests d\Licence de Psychologie Semestre N° 5 td n° 2 Test du khi-2, lois...

Tests d\04. 10. 2015 : 399. Tests de cosmétiques
«Peut-on se laver, se raser, se maquiller sans risques ?» Le magazine 60 millions de consommateurs de l'Institut national français...

Tests d\La médecine indique que le sida, ayant officiellement causé 28 millions...
Nécessité d’organiser des "fléaux" contre la population noire. En 1931, des tests sont faits secrètement sur les Afro-Américains...

Tests d\Des choix scientifiques et technologiques
«La place des biotechnologies en France et en Europe» et par m bruno Sido, sénateur, et M. Jean-Yves Le Déaut sur «Les tests d’intoxication...






Tous droits réservés. Copyright © 2016
contacts
d.20-bal.com