Licence de Psychologie Semestre N° 5 td n° 2 Test du khi-2, lois de distribution classiques et tests paramétriques avec Statistica





télécharger 71.6 Kb.
titreLicence de Psychologie Semestre N° 5 td n° 2 Test du khi-2, lois de distribution classiques et tests paramétriques avec Statistica
date de publication19.05.2017
taille71.6 Kb.
typeDocumentos
d.20-bal.com > loi > Documentos

Licence de Psychologie - Semestre N° 5 - TD n° 2

Test du khi-2, lois de distribution classiques et tests paramétriques avec Statistica




    1. Travail sur un tableau de contingence - Test du khi-2

1.1Enoncé


Une étude a été menée en 1990-91 sur les facteurs pouvant influer sur le port de la ceinture de sécurité par les conducteurs et les passagers de voitures de tourisme et de véhicules utilitaires. De nombreuses observations ont été effectuées (9434 au total), et ont donné lieu au relevé des éléments suivants :

- Nature du véhicule (voiture de tourisme / véhicule utilitaire)

- Age du conducteur (trois classes d'âge)

- Sexe (M / F)

- Port de la ceinture (port / non port)

- Présence d'un passager avant (oui / non)

- Le cas échéant, âge, sexe et port de la ceinture pour le passager

- Présence de passagers arrière (oui / non)

On s'intéresse tout d'abord à l'effet du type d'occupation du véhicule (conducteur seul, conducteur + passagers avant, conducteur + passagers arrière, conducteur + passagers avant et arrière) sur le port de la ceinture par le conducteur. On dispose de 8374 observations concernant cette partie de l'étude. Les données sont les suivantes :





Port ceinture

non port de ceinture

Seul

2825

3468

Cond. + pass. avant

729

815

Cond. + pass. arrière

80

113

Cond. + pass. av. et arr.

168

176


On souhaite en particulier tester l'existence d'un lien entre les deux variables "Type d'occupation" et "Port de la ceinture" à l'aide d'un test du khi-2.

1.2Mise en oeuvre du test du khi-2

1.2.1Le test du khi-2 à partir d'un tableau protocole


En général, une ligne d'une feuille de données Statistica correspond à une observation. Autrement dit, nous devions ici avoir 8374 lignes du type suivant :


N° obs

Type d'occupation

Port ceinture

1

Seul

Oui

2

Seul

Oui

...

...

...

8374

Cond. + pass. av. et arr.

Non


Ouvrez la feuille de données Ceinture-protocole.sta et observez la façon dont elle a été constituée.
1.2.1.1Vérifier la saisie des données

La feuille de données Ceinture-protocole.sta correspond-elle à l'énoncé ci-dessus ? On peut le vérifier en utilisant le menu : Statistiques - Statistiques élémentaires - Tableaux et tris croisés, et en sélectionnant l'onglet Tableaux croisés. Le bouton "Spécifier les tables (sélection des variables)" permet d'avoir accès au dialogue suivant :



On sélectionne alors des deux variables "Occupation" et "Port ceinture". Après avoir validé ce dialogue, on peut cliquer sur le bouton "Synthèse" pour obtenir un tableau de contingence du type suivant :

1.2.1.2Test du khi-2 sur un tableau protocole - Première méthode

Le test du khi-deux sur ce tableau de contingence peut être obtenu comme résultat supplémentaire de l'étude en cours. Pour cela, reprenez l'analyse en cours, activez l'onglet "Options" et cochez les cases "Chi² max de vraisemblance et Pearson" et "Effectifs théoriques" (par exemple).


Outre les effectifs théoriques, on obtient comme résultat la valeur de la statistique du khi-2 (² = 5,56) et son niveau de significativité (p=0,13) :

1.2.1.3Test du khi-2 sur un tableau protocole - deuxième méthode

Une deuxième méthode pour obtenir le khi-2, avec une meilleure présentation, est de procéder comme suit :

- Utiliser le menu Statistiques - Statistiques élémentaires - Tableaux et tris croisés

- Sélectionner l'onglet "Tris croisés".

- Cliquer sur le bouton "Spécifier les tables (sélection des variables)" et spécifier "Occupation" comme première variable et "Port ceinture" comme deuxième variable.

- Après avoir validé, afficher l'onglet "Options" et cocher la case "Chi² max de vraisemblance et Pearson"

- Enfin, afficher l'onglet "Avancé" et cliquer sur le bouton "Tableaux détaillés à double entrée".

On obtient alors comme résultat la feuille de données suivante :

Rassemblez au besoin les différentes feuilles de résultats dans un même classeur et enregistrez-le sous le nom Ceinture-protocole.stw. Fermez ensuite la feuille de données et le classeur.

1.2.2Le test du khi-2 à partir d'un tableau d'effectifs


Si les données que nous devons traiter sont des données que nous avons nous-mêmes recueillies, nous disposons sans doute d'un tableau protocole, et le traitement précédent convient. Cependant, si nous disposons au départ d'un tableau d'effectifs ou d'un tableau de contingence, il est évidemment très fastidieux de composer une feuille de données du type précédent.
Cependant, Statistica permet de travailler sur des données pondérées. Nous allons donc saisir nos données de la façon suivante :





Type occupation

Ceinture

Effectif

1

seul

oui

2825

2

avant

oui

729

3

arrière

oui

80

4

avant et arrière

oui

168

5

seul

non

3468

6

avant

non

815

7

arrière

non

113

8

avant et arrière

non

176


Saisissez ces données dans une nouvelle feuille, et enregistrez-la sous le nom : Ceinture-effectifs.sta.
Vérifiez bien que vous définissez exactement 4 modalités pour la variable "Type d'occupation" et 2 modalités pour la variable "ceinture". Pour cela, faites un double-clic sur la colonne correspondante, puis cliquez sur le bouton : Valeurs/Stats...
Utilisez ensuite le menu Statistiques Elémentaires. Cliquez sur le bouton (pondérations de l'analyse/graphique) et indiquez que la variable 3 (Effectif) est la variable de pondération :

Le reste du traitement peut alors être réalisé de la même façon que pour un tableau-protocole.

Pour réaliser un test du khi-2, utilisez l'item Tableaux et tris croisés. Indiquez Type occupation comme variable dans la première liste, Ceinture dans la deuxième, puis cliquez sur le bouton OK. La fenêtre de dialogue "Résultats des tableaux croisés" s'affiche pour nous permettre de sélectionner les résultats dont nous souhaitons le calcul.
Affichez l'onglet Options et sélectionnez "Effectifs théoriques" et "Chi2 ...".


Statistica affiche alors un tableau de contingence classique, le tableau des effectifs théoriques et le résultat du test du khi-2 :



Ici, le khi-2 observé vaut 5,56, et son niveau de significativité est de 13,5%. On retient donc l'hypothèse H0 d'absence de lien entre les variables.
Rassemblez au besoin les différentes feuilles de résultats dans un même classeur et enregistrez-le sous le nom Ceinture-effectifs.stw. Fermez ensuite la feuille de données et le classeur.

1.2.3Le test du khi-2 à partir d'un tableau de contingence


On peut aussi fournir à Statistica un tableau de contingence, sous la forme suivante :

Parmi les méthodes d'analyse qui sont présentes dans le menu Statistiques, l'une d'elles accepte des données structurées sous cette forme, et calcule un khi-deux de contingence comme résultat annexe. C'est la méthode "Techniques exploratoires multivariées - Analyse de correspondances".
On pourra procéder de la manière suivante :

- Saisir les données dans une nouvelle feuille de données, et l'enregistrer sous le nom Ceinture-contingence.sta.

- Utiliser le menu Statistiques - Techniques exploratoires multivariées - Analyse de correspondances

- Activer l'onglet "Analyse des correspondances" et compléter la fenêtre de dialogue comme suit :



- Cliquer sur le bouton OK

- La valeur du khi-2 et son niveau de significativité apparaissent alors dans l'en-tête de la fenêtre de dialogue suivante :
Nombre de variables (colonnes de la table) : 2

Nombre d'observations actives (lignes de la table) : 4
Valeurs propres : ,0007

Chi² Total = 5,56307 dl = 3 p = ,1349
- Pour obtenir des détails sur la manière dont ce khi-2 a été obtenu (effectifs théoriques, ou contributions au khi-2), on pourra activer l'onglet "Etude".
Rassemblez au besoin les différentes feuilles de résultats dans un même classeur et enregistrez-le sous le nom Ceinture-contingence.stw. Fermez ensuite la feuille de données et le classeur.
Remarque : Cette méthode permet également d'obtenir le calcul du khi-2 à partir du tableau protocole ou du tableau d'effectifs utilisé au paragraphe précédent, et en évitant de définir des pondérations.

Pour travailler à partir du tableau des effectifs, par exemple :

- Chargez la feuille de données Ceinture-effectifs.sta saisie au paragraphe précédent

- Utilisez le menu Statistiques - Techniques exploratoires multivariées - Analyse de correspondances

- Cochez "Effectifs avec variables de classement" comme type de données d'entrée.

1.2.4Exercice :


1) On s'intéresse, pour les conducteurs non accompagnés, au lien entre le sexe et le port de la ceinture. Les données sont les suivantes :




Port ceinture

non port de ceinture

Homme

1981

2647

Femme

844

821


Saisissez ces données dans une feuille de données Statistica.

Représentez graphiquement le taux de port de la ceinture selon le sexe à l'aide d'un graphique à barres.

Réalisez, de même, un test du khi-2 pour déterminer si le port de la ceinture par le conducteur dépend ou non du sexe du conducteur.
2) On se limite ici aux véhicules dans lesquels se trouvaient des passagers. On s'intéresse d'une part au port de la ceinture par la paire conducteur/passager avant et d'autre part au type de véhicule. Les données sont les suivantes :




Véh. de tourisme

Véh. utilitaire

Cond. sans ceint., pass avec ceint.

199

11

Cond. et pass. sans ceinture

596

111

Cond. et pass. avec ceinture

549

24

Cond. avec ceinture, pass. sans ceinture

161

10


Ouvrez un nouveau document Statistica et saisissez les données ci-dessus.

Représenter par un diagramme circulaire la répartition des paires d'occupants de véhicules de tourisme selon les 4 modalités de la variable "port de la ceinture".

Réalisez un test du khi-2 pour déterminer si les variables "comportement des occupants vis-à-vis du port de la ceinture" et "nature du véhicule" sont indépendantes ou non.

2Lois statistiques classiques


Le menu Statistiques - Calculateur de Probabilités - Distributions permet d'une part de trouver une valeur critique ou un niveau de significativité pour les lois statistiques continues usuelles, soit de réaliser des représentations graphiques de la densité ou de la fonction de répartition de ces lois.

2.1La loi normale centrée réduite


Quelle est la valeur de Zcritique pour un test unilatéral à 5% ?

Compléter le dialogue comme suit :



La réponse doit être lue dans la zone d'édition "X: ________". C'est ici : Zc=1,644854.

2.2Représenter graphiquement la densité d'une loi normale quelconque


On veut représenter la densité de la loi normale de paramètres m = 100 et s=15 pour X compris entre 70 et 130

Complétez la fenêtre de dialogue comme suit, en veillant à ce que la boite "Echelle Fixe" ne soit pas cochée :


Remarquez que Statistica exige que l'un des deux champs "X:" ou "p:" soit complété, et repère la valeur correspondante sur le graphique. On obtient ainsi un graphique ayant l'allure suivante :


2.3Loi de Student


Calculez la valeur critique de la loi de Student pour un test bilatéral avec ddl=24 et =0,01 :



Remarquez que les paramètres peuvent être entrés de deux façons différentes :

- p = 0,95 si l'on ne coche pas la boîte "(1-p cumulé)

- p = 0,05 si l'on coche cette boîte.

Lecture du résultat : dans les deux cas, on obtient tcrit=2,063899.
On a réalisé un test de Student, avec un nombre de degrés de liberté égal à 58. La valeur observée de la statistique est tobs=2,54. Quel est le niveau de significativité du résultat obtenu pour un test unilatéral ? pour un test bilatéral ?

Réponses : p=1,38% pour un test bilatéral et p=0,69% pour un test unilatéral.

2.4Loi du khi-2


Selon les habitudes américaines, cette loi est désignée par Chi2.

Déterminez la valeur critique du khi-2 pour un seuil de 5% et 6 ddl.

Vous devriez trouver : Khi-2 = 12,59.

Réaliser un graphique de la densité de la loi du khi-2 à 1 degré de liberté, en ajustant les échelles de manière à faire apparaître clairement la valeur critique correspondant à un seuil de 5% : 3,94.

Là, le choix d'échelle fait par Statistica est plus que discutable (que l'on ait, ou non, coché la case "Echelle Fixe"). Pour imposer notre choix d'échelle :

- Cliquez sur le graphique avec le bouton droit de la souris

- Sélectionnez l'item de menu Propriétés du Graphique (toutes options)

- Affichez l'onglet Axe -Echelle

- Indiquez pour l'axe X une plage de variation de 0,00015 à 5

- Indiquez pour l'axe Y une plage de variation de 0 à 1,5 (par exemple).

3Tests paramétriques classiques

3.1Test de comparaison d'une moyenne à une norme


On considère les données ADD. La population étudiée diffère-t-elle significativement de la population générale du point de vue du QI ?
Ouvrez le fichier de données ADD.sta.

Utilisez le menu Statistiques - Statistiques Elémentaires, puis l'item Comparer une moyenne à un standard.

Sélectionnez la variable IQ et indiquez 100 comme valeur de référence. Vous devriez obtenir le résultat suivant :


Lecture du résultat :

La moyenne observée sur l'échantillon de 88 sujets est de 100,16. Statistica compare cette valeur à la valeur de référence (100), à l'aide d'un test de Student, avec 87 degrés de liberté. La statistique de test vaut t=0,189, ce qui correspond à un niveau de significativité de 85%. Autrement dit, rien n'indique une différence entre la population étudiée et la population générale du point de vue du QI.
Remarque : Dans le test ci-dessus, Statistica utilise l'estimation de l'écart type des QI faite à partir de l'échantillon, et non l'écart type de la distribution des QI dans la population (15). Il est possible d'introduire l'écart type de la population, à condition d'utiliser le menu Statistiques - Statistiques Elémentaires - Tests d'homogénéité et de remplir la fenêtre de dialogue comme suit :


3.2Test de comparaison de deux moyennes sur des groupes indépendants

3.2.1Données saisies "par sujet"


Lorsque la saisie a été faite correctement, la feuille de données Statistica rassemble sur une même ligne les observations relative à un même individu statistique. Ainsi, la saisie des observations relatives à un plan S comportera au moins 2 colonnes :

- Une colonne "Groupe" ou "Condition expérimentale", avec, comme variable nominale, les différents niveaux du facteur A

- Une colonne "Variable dépendante".


Dans ce cas, on utilisera le menu Statistiques - Statistiques élémentaires - Test t pour échantillons indépendants - par groupes.
Exemple : Le score ADDSC est-il significativement différent pour les garçons et les filles dans la population étudiée ?
Utilisez le menu Statistiques - Statistiques élémentaires - Test t pour échantillons indépendants - par groupes. Indiquez ADDSC comme variable dépendante et GENDER comme variable de classement.

Statistica devrait produire le résultat suivant :


Lecture des résultats :

Statistica fait un test t de Student. La valeur observée de la statistique t est t=1,66, ce qui correspond à un niveau de significativité de presque 10%. Bien que Statistica ne le mentionne pas, il fait ici un test bilatéral. Autrement dit, les différences ne sont pas significatives au seuil de 5% bilatéral.

3.2.2Données saisies "par sujet" : test sur une partie des observations


Lorsque le facteur A comporte plus de deux niveaux, il peut être utile de comparer les observations faites pour deux niveaux particuliers.
Reprenons, par exemple, les données Mireault.sta. La variable Group comporte 3 modalités (codées 1, 2 et 3). Nous souhaitons comparer les scores de la variable PVLoss sur les groupes 1 et 2.
Chargez la feuille Mireault.sta, puis utilisez le menu Statistiques - Statistiques élémentaires - Test t pour échantillons indépendants - par groupes. Indiquez PVLoss comme variable dépendante, et Group comme variable de classement. Indiquez ensuite les deux niveaux choisis pour la variable groupe, comme ci-dessous :

Vous devriez obtenir le résultat suivant :


Remarque : Le test de Fisher sur l'égalité des variances conclut ici sur une différence significative des deux variances. On pourra donc recommencer le test en utilisant la boîte à cocher "Estimation séparée des variances".

3.2.3Données saisies par variable


Statistica permet également de réaliser un test de comparaison de moyennes sur deux groupes indépendants lorsque les observations de la VD ont été saisies dans deux colonnes différentes.
Exemple : On reprend l'énoncé suivant :

Lors d'une expérience pédagogique, on s'intéresse à l'effet comparé de deux pédagogies des mathématiques chez deux groupes de 10 sujets:

- pédagogie traditionnelle : Gr1

- pédagogie moderne : Gr2.

On note la performance à une épreuve de combinatoire.

Ces données expérimentales permettent-elles d'affirmer que la pédagogie a un effet sur les résultats à l'épreuve de combinatoire?
Ouvrez une nouvelle feuille de calcul et saisissez les données suivantes :


Utilisez ensuite le menu Statistiques - Statistiques Elémentaires - Test t pour échantillons indépendants, par variables. Vous devriez obtenir le résultat suivant :

3.2.4Construire une variable calculée pour définir les deux groupes


On reprend la feuille de données ADD.sta.

La médiane de la variable ADDSC est égale à 50. On souhaiterait définir deux groupes en utilisant la position de l'observation par rapport à la médiane, et comparer ces deux groupes du point de vue de la variable GPA.
Ajoutez une colonne supplémentaire au tableau de données et définissez une variable calculée à l'aide de la formule :

=iif(v2 >=50;1 ; 0)

N.B. iif est une fonction ("si immédiat") de Statistica, analogue à la fonction SI d'Excel.

Réalisez ensuite le test sur la variable GPA pour les deux groupes ainsi définis.

3.3Test de comparaison de deux moyennes sur des groupes appareillés


On reprend l'exemple ADD.dat.

Les variables ENGG et GPA représentent les résultats obtenus en Anglais d'une part, et la moyenne des points obtenus en 9è année d'autre part. Ces résultats utilisent la même échelle de notation : le score varie de 0 à 4. Nous souhaiterions savoir si, dans la population étudiée, les scores en anglais sont égaux à la moyenne des scores.
Utilisez ensuite le menu Statistiques - Statistiques Elémentaires - Test t pour des échantillons appariés.

Sélectionnez ENGG comme variable pour constituer la première liste, et GPA comme variable pour constituer la seconde. Vous devriez obtenir le résultat suivant :


4Tests sur les proportions

4.1Test de comparaison de deux proportions sur des groupes indépendants

4.1.1Variables dichotomiques données par des effectifs



Deux échantillons provenant de deux populations différentes ont passé un test commun.

Dans le premier groupe, d'effectif 150, le taux de succès a atteint 68%. Autrement dit, 102 sujets ont passé le test avec succès, et 48 ont échoué.

Dans le deuxième groupe, d'effectif 180, le taux de succès a atteint 55,5%. Autrement dit, 100 sujets ont passé le test avec succès et 80 ont échoué.
Peut-on dire que la seconde population réussit l'épreuve moins facilement que la première ?
Statistica ne comporte pas de module spécifiquement destiné à traiter ce genre de situation. Cependant, la comparaison de deux proportions n'est qu'un cas particulier de la comparaison de deux moyennes.

Nous allons donc saisir nos données dans une feuille de calcul Statistica, de la façon suivante :



Pour faciliter l'interprétation des résultats, il sera commode de personnaliser le codage de la variable "Resultat" : Succès sera codé 1 tandis que Echec sera codé 0.
Statistica fournit les résultats suivants :


On retrouve ainsi les valeurs des proportions observées (68% et 55,55%). La valeur observée de la statistique de test est 2,32. La formule de calcul n'est pas exactement la même que celle donnée en cours, mais la différence est très faible (2,3219 ici, alors que la formule du cours donnerait 2,3201). Statistica utilise une loi de Student avec 328 ddl. Vu le nombre de degrés de liberté, cette loi est très proche d'une loi normale, et le résultat produit est tout à fait correct.
On peut aussi utiliser le menu Statistiques - Statistiques Elémentaires - Tests d'homogénéité. On complète alors la fenêtre comme suit :


Rappel des formules du cours :



avec

Exercice. 1) Faites varier les taux de succès dans les deux groupes. Que devient le résultat du test lorsque les taux varient ?

2) Faites varier les effectifs dans les deux groupes. Avec les taux de succès indiqués, quelles sont les tailles minimales des échantillons permettant d'obtenir un résultat significatif à 5% ?

4.1.2Variables dichotomiques données par leur protocole


Dans l'exemple traité précédemment, le protocole est un tableau de données à 2 colonnes et 330 lignes. Il est en fait assez facile de constituer à l'aide de Statistica un tableau répétitif de ce type.

- Ouvrez une nouvelle feuille de données de 330 observations, pour 2 variables.

- Pour la première variable, spécifiez le type "texte".

- Pour la seconde variable, spécifiez le type "Numérique", avec, comme valeurs-texte, "Succès" pour la valeur numérique 1, et Echec pour la valeur numérique 0.

- Dans la première variable, saisissez l'identifiant du premier groupe ("A" par exemple) en ligne 1, puis utilisez ensuite le menu Edition - Remplir / Centrer-Réduire le bloc - Remplir/Copier vers le bas pour recopier cette valeur jusqu'en ligne 150.

- Saisissez l'identifiant du second groupe en ligne 151, puis recopiez de même jusqu'en ligne 330

- Dans la seconde variable, saisissez la valeur 1, ou le texte Succès en ligne 1 et recopiez jusqu'en ligne 102.

- De même pour le texte Echec de la ligne 103 à la ligne 150.

- Continuez en saisissant "Succès" de la ligne 151 à la ligne 250, puis "Echec" de la ligne 251 à la ligne 330.
Réalisez ensuite un test de comparaison de moyennes en utilisant ces deux variables. Vous devriez retrouver les résultats précédents.


/home/server/d.20-bal.com/pars_docs/refs/7/6936/6936.doc – FGC – 2005-2006

similaire:

Licence de Psychologie Semestre N° 5 td n° 2 Test du khi-2, lois de distribution classiques et tests paramétriques avec Statistica iconLicence de Psychologie td n° 4 Tests statistiques avec Excel 1 Test du khi-2

Licence de Psychologie Semestre N° 5 td n° 2 Test du khi-2, lois de distribution classiques et tests paramétriques avec Statistica iconCours de M. le professeur Vincent tchen licence 1 semestre 1 (2015-2016)...

Licence de Psychologie Semestre N° 5 td n° 2 Test du khi-2, lois de distribution classiques et tests paramétriques avec Statistica iconTests : Rappel / bilan / Tests non paramétriques

Licence de Psychologie Semestre N° 5 td n° 2 Test du khi-2, lois de distribution classiques et tests paramétriques avec Statistica icon16Travail sur un tableau de contingence Test du khi-2

Licence de Psychologie Semestre N° 5 td n° 2 Test du khi-2, lois de distribution classiques et tests paramétriques avec Statistica iconTests d'hypothèses. Tests de Bayes. Rapport de Vraisemblance. Statistique...

Licence de Psychologie Semestre N° 5 td n° 2 Test du khi-2, lois de distribution classiques et tests paramétriques avec Statistica iconCourses/anova 001/document/glossaire/glos test htm >tests statistiques

Licence de Psychologie Semestre N° 5 td n° 2 Test du khi-2, lois de distribution classiques et tests paramétriques avec Statistica iconEc psr73b statistiques paramétriques et non paramétriques

Licence de Psychologie Semestre N° 5 td n° 2 Test du khi-2, lois de distribution classiques et tests paramétriques avec Statistica iconTravaux dirigés de Théorie, Cycle Licence 5 semestre Session 2015/5016
«Concept Office» et la maison Phoénix «Concept House». L’objectif de

Licence de Psychologie Semestre N° 5 td n° 2 Test du khi-2, lois de distribution classiques et tests paramétriques avec Statistica iconI- les licences restaurant et les licences de vente à emporter
«petite licence restaurant», de la «licence restaurant» mais aussi de la «petite licence à emporter» et de la «licence à emporter»...

Licence de Psychologie Semestre N° 5 td n° 2 Test du khi-2, lois de distribution classiques et tests paramétriques avec Statistica iconEn medecine generale en 20 questions
«Troisième Cycle d’Etudes Médicales» résidents est opérationnel et précède le remplacement. Le «6ème semestre» commence ce semestre....






Tous droits réservés. Copyright © 2016
contacts
d.20-bal.com