Concepts Fondamentaux en Statistique

Exemple 2 : Décompositions & ANOVA à 1 Facteur

Introduction. Vous pouvez calculer diverses statistiques descriptives (par exemple, des moyennes, écarts-types, corrélations, centiles, etc...) décomposées selon une ou plusieurs variables catégorielles (par exemple, selon le Sexe et la Région) et réaliser une Analyse de la Variance à un facteur par la procédure Décompositions et ANOVA à 1 Facteur, accessible depuis le Panneau de Démarrage du module Statistiques Élémentaires. pour cet exemple, nous utiliserons le fichier Adstudy.sta (pour ouvrir le fichier Adstudy.sta, sélectionner la commande Ouvrir des Exemples du menu Fichier ; vous trouverez ce fichier de données dans le répertoire Fichiers de Données). Après avoir choisi la procédure Décompositions et ANOVA à 1 Facteur dans le Panneau de Démarrage, sélectionnez l'onglet Tables individuelles dans la boîte de dialogue Statistiques par Groupe (Décomposition), puis cliquez sur le bouton Variables  ; sélectionnez les Mesure1 à Mesure23 comme Variables dépendantes, et les variables Sexe (sexe du sondé, Homme et Femme) et Publicité (type de publicité projetée aux individus ; Coca et Pepsi) comme Variables de classement.

Cliquez sur le bouton Codes des variables de classement et sélectionnez tous les codes pour les deux variables de classement.

Pour sélectionner tous les codes d'une variable, vous pouvez soit entrer les numéros des codes dans les champs d'éditions respectifs, cliquer sur le bouton respectif Tous, ou encore saisir un astérisque (*) dans le champ d'édition respectif. Cliquer sur le bouton OK sans spécifier de valeur revient à sélectionner toutes les valeurs de toutes les variables. Cliquez sur le bouton OK dans la boîte de dialogue Statistiques par Groupe (Décomposition) pour accéder à la boîte de dialogue Statistiques par Groupes - Résultats. Cette boîte de dialogue offre de nombreuses options et procédures pour analyser les données intra-groupes, afin de mieux comprendre les différences entre les catégories des variables de classement.

Tableau de synthèse des moyennes. Vous pouvez sélectionner les statistiques à afficher par les boutons Synthèse : Table des statistiques ou Tables Détaillées à 2 entrées ; cliquez pour cela sur l'onglet Stats Descriptives et sélectionnez toutes les options dans le cadre Statistiques. À présent, cliquez sur le bouton Tables Détaillées à 2 entrées pour produire la feuille de données des résultats.

Cette feuille de données affiche les statistiques descriptives des variables sélectionnées, en fonction des groupes spécifiés (utilisez les barres de défilement pour visualiser les autres variables dans la feuille de données des résultats). Examinons, par exemple, les moyennes de chaque groupe de cette feuille de données ; nous pouvons constater une différence substantielle entre les moyennes des Hommes et des Femmes pour la variable Mesure1. Examinons à présent les moyennes des groupes Homme et Femme pour la variable Mesure1 ; vous pouvez constater une petite différence pour les groupes Pepsi et Coca entre les deux sexes. Ainsi, les groupes définis par le sexe semblent donc assez homogènes de ce point de vue.

ANOVA 1 facteur et comparaisons post-hoc de moyennes. Vous pouvez facilement tester la significativité de ces différences grâce au bouton Analyse de Variance dans l'onglet ANOVA & tests de la boîte de dialogue Résultats. Cliquez sur ce bouton pour afficher la feuille de données avec les résultats de l'analyse de variance univariée pour chaque variable dépendante.

La procédure d'Analyse de la Variance à 1 facteur donne des résultats statistiquement significatifs pour les Mesure5, Mesure7 et Mesure9. Ces résultats significatifs indiquent que les moyennes sont assez différentes entre les groupes. Revenons maintenant à la boîte de dialogue Résultats et cliquons sur l'onglet Tests Post-hoc pour réaliser des tests post-hoc sur les différences significatives entre les groupes individuels (moyennes). Vous devez d'abord sélectionner la ou les variables sur lesquelles vous allez effectuer les comparaisons. Dans cet exemple, cliquons sur le bouton Variables et sélectionnons la variable Mesure7. Vous pouvez choisir différents tests post-hoc (d'autres tests sont disponibles dans le module GLM)  ; cliquons sur le bouton Test LSD ou comparaisons planifiées.

Le test LSD est l'équivalent d'un test t pour des échantillons indépendants, basé sur les N des groupes utilisés dans la comparaison. Les résultats du test t pour des échantillons indépendants de l'Exemple 1 montraient une différence significative entre les réponses des Hommes et des Femmes pour la Mesure7. En utilisant la procédure Décompositions et ANOVA à 1 facteur, nous pouvons constater, par le test LSD, que la différence significative n'a lieu que lorsqu'on montre la publicité Pepsi aux femmes.

Représentation graphique des résultats. Ces différences peuvent être représentées graphiquement grâce aux nombreuses options graphiques de la boîte de dialogue Statistiques par Groupes - Résultats. Par exemple, pour comparer les distributions des variables sélectionnées selon les groupes spécifiés, cliquez sur le bouton Boîtes à moustaches catégorisées de l'onglet Stats Descriptives et sélectionnez le bouton d'option Médiane/Quartiles/Étendue dans la boîte de dialogue Type de Boîte à Moustaches. Cliquez alors sur le bouton OK et sélectionnez la ou les variables appropriées pour produire les graphiques. Ci-dessous, vous pouvez observez la boîte à moustaches de la variable Mesure7.

Vous pouvez constater, dans le tracé ci-dessus, qu'il semble exister une différence dans la distribution des valeurs de la variable Mesure7 entre le groupe Femme-Pepsi et le groupe Homme-Pepsi.

Corrélations intra-groupes. Observons maintenant les corrélations entre variables dans les groupes spécifiés. Revenez à la boîte de dialoguede dialogue Statistiques par Groupes - Résultats, puis cliquez sur l'onglet Corrélations. De nombreuses options sont disponibles dans cet onglet pour afficher différentes statistiques et informations complémentaires, outre les matrices de corrélation (intra-groupes). Dans notre exemple, modifiez l'option Valeur p pour la surbrillance à 0,001, puis cliquez sur le bouton Corrélations & covariances intra-groupes afin d'obtenir la boîte de dialogue de dialogue Sélectionnez les groupes. Elle vous permet de sélectionner un groupe (ou Tous les Groupes) pour les matrices de corrélation.

Dans l'Exemple 1, nous avons produit une matrice de corrélation. Elle indiquait que la corrélation entre les variables Mesure5 et Mesure9 (r = -0,47) était hautement significative (p<0,001). La procédure Décompositions et ANOVA à 1 facteur va vous permettre de poursuivre l'exploration de cette corrélation significative en calculant les corrélations selon les niveaux des variables de classement spécifiées. Dans la boîte de dialogue Sélectionnez les groupes, choisissez l'option TsGroupes puis cliquez sur le bouton OK pour produire les quatre matrices de corrélations.

Comme vous pouvez le constater, les résultats révèlent une structure des corrélations différente selon les groupes (par exemple, la corrélation est très importante dans le groupe Femme/Pepsi et plus faible dans les trois autres groupes). Aucune des corrélations entre la Mesure5 et la Mesure9 n'était significative au niveau 0,001 ; toutefois, en modifiant la valeur du champ d'édition Valeur p pour la surbrillance à 0,05 dans l'onglet Corrélations de la boîte de dialogue Résultats et en cliquant à nouveau sur le bouton Corrélations & covariances intra-groupes, vous pourrez constater que la corrélation entre la Mesure5 et la Mesure9 est significative à ce niveau (p=0,02) pour le groupe défini par le sexe Femme et la publicité Pepsi.

Remarque : l'option Tests d'homogénéité  : r, %ages, moyennes du Panneau de Démarrage du module Statistiques Élémentaires permet de tester des différences entre des coefficients de corrélation.

Nuages de points catégorisés. Les corrélations intra-groupes peuvent être représentées graphiquement en utilisant le bouton Nuages catégorisés dans l'onglet Corrélations de la boîte de dialogue Statistiques par Groupe - Résultats. Si vous cliquez sur ce bouton, vous devrez sélectionner les variables à analyser. Sélectionnez la Mesure5 dans la liste de choix multiple 1ère liste de variables et la Mesure9 dans la liste de choix multiple 2nde liste de variables puis cliquez sur le bouton OK pour produire le tracé.

Le nuage de points catégorisé ci-dessus indique clairement une forte corrélation négative entre la Mesure5 et la Mesure9 pour le groupe Femme/Pepsi.