Tableau croisé

De EduTech Wiki
Aller à la navigation Aller à la recherche
Manuel de recherche en technologie éducative
Module: Analyse de données quantitatives
◀▬▬▶
brouillon débutant
2019/06/05

Introduction

Le tableau croisé est une technique courante pour étudier les relations entre les variables normales (catégoriques) ou ordinales. Le tableau croisé n’est pas complexe, mais les débutants ne le comprennent généralement pas très bien. Il est important de se rappeler les objectifs basiques de l’analyse de données simple:

Expliquer la variable Y avec la variable X, veut dire

  • expliquer la variance de la variable Y avec la variance de la variable X
  • montrer des co-variances

Dans un tableau croisé, cet exemple devient:

Si X = x1, quelle est la probabilité que Y = y1, Y = y2, etc.

Si X = x2, quelle est la probabilité que Y = y1, Y = y2, etc.

Puisque vous souhaitez connaître la probabilité qu’une valeur de X mène à une valeur de Y, vous devez calculer les pourcentages, comme nous allons l’expliquer ci-dessous.

Dans un tableau, la variable X est généralement placée en-haut (i.e. ses valeurs présentées dans des colonnes), mais vous pouvez faire l'inverse, i.e. placer X à gauche. Il faut toutefois veiller à ce que les pourcentages correspondent!

Etapes pour le calcul de pourcentages

  1. Calculez les pourcentages pour chaque entrée de X (i.e. « quelle est la probabilité qu’une valeur de X corresponde à une valeur de Y »)
  2. Comparez (interprétez) ensuite les pourcentages pour chaque entrée de la variable dépendante (à expliquer).

Revenons au simple paradigme expérimental sur lequel s’appuient presque toutes les analyses statistiques, puisque la recherche se fonde sur la comparaison. Note: X est à gauche (pas en-haut):

Le principe de la comparaison dans l'expérimentation
Traitement Effet (O) Absence d’effet (O) Effet total pour un groupe
traitement: (groupe X) plus grand plus petit 100 %
absence de traitement: (groupe non-X) plus petit plus grand 100 %

Vous devez interpréter ce tableau de la façon suivante: la probabilité qu’un traitement (X) produise un effet (Y) est plus élevée que la probabilité qu’une absence de traitement (absence de X) produise cet effet. Nous allons maintenant présenter un exemple réel de tableau croisé statistique.

Coefficients statistiques pour le tableau croisé

Intéressons-nous tout d’abord à quelques coefficients qui résument la force d’une relation:

  • Phi est une mesure d’associations fondée sur la loi du X2 et est généralement utilisée pour les tableaux 2 x 2.
  • Le coefficient de contingence (le C de Pearson) est un ajustement de Phi, qui a pour but de l’adapter aux tableaux plus grands que 2 par 2.
  • Le D de Somers est un coefficient courant pour les mesures ordinales (X et Y). Il existe deux variantes: « symétrique » et « Y dépendant de X ».


Il existe plusieurs tests de signification statistique:

  • Les tests s’appuyant sur la Loi du Chi2 de Pearson est de loin le plus courant. Cette statistique est utilisée pour tester l’hypothèse nulle, i.e. pas d’association entre colonnes et lignes dans un tableau. Il peut être utilisé avec des données nominales.

Dans SPSS:

  • Vous trouvez des tableaux croisés dans le menu: Analyse -> Statistiques descriptives -> Tableaux croisés
  • Vous pouvez alors sélectionner les pourcentages dans « cellules » et les coefficients dans « statistiques ». Ils deviendront « inférentiels », pas seulement « descriptifs ».

Exemple 1. Tableau croisé – Formation aux TIC X logiciel de présentation

Nous souhaitons savoir si la formation aux TIC explique l’utilisation de logiciels de présentation en classe. Ces variables sont mesurées à l’aide de questions de sondage:

  1. Avez-vous bénéficié d’une formation aux TIC auparavant?
  2. Utilisez-vous un ordinateur pour préparer des présentations en classe?

Examinons à présent les résultats dans le tableau ci-dessous:

Influence de la formation aux TIC sur l’utilisation de logiciels de présentation en classe

 

X= Avez-vous bénéficié d’une formation aux TIC auparavant?

Total

Non

Oui

 

Y= Utilisez-vous un ordinateur
pour préparer des présentations en classe?

Régulièrement

Comptage

4

45

49

% de X

44.4%

58.4%

57.0%

Occasionnellement

Comptage

4

21

25

% de X

44.4%

27.3%

29.1%

2 Jamais

Comptage

1

11

12

% de X

11.1%

14.3%

14.0%

Total

Comptage

9

77

86

% de X

100.0%

100.0%

100.0%

La probabilité que la formation à l’informatique (« oui ») ait pour conséquence une utilisation accrue d’un ordinateur pour préparer des documents est très faible (vous pouvez le constater en comparant les pourcentages ligne par ligne).

Les statistiques indiquent la même chose:

  • La loi du X2 de Pearson est de 1,15 avec un seuil de signification de 0,562. Cela signifie que la probabilité que les résultats soient aléatoires est > 50%, vous devez donc rejeter la relation
  • Coefficient de contingence = 0,115, signification = 0,562 (même résultat).

Par conséquent, nous pouvons conclure que la relation, en plus d’être très faible, ne peut pas être interprétée. En d’autres termes, il n’y a aucun moyen d’affirmer que la formation aux TIC ait pour conséquence une utilisation plus fréquente des logiciels de présentation.

Exemple 2. Tableau croisé – Opinion des enseignants X activités en classe

Nous souhaitons savoir si le fait que les enseignants soient d’accord avec l’affirmation selon laquelle les étudiants deviennent plus autonomes en utilisant internet a une influence sur la pratique en classe. Par exemple, est-ce qu’un enseignant organisera plus d’activités dans lesquelles les étudiants doivent rechercher des informations sur internet si il/elle considère qu’internet peut favoriser l’autonomie? Nous avons deux variables.

  • X = l’opinion des enseignants sur l’affirmation suivante : les étudiants deviennent plus autonomes en utilisant internet
  • Y = les activités des enseignants en classe: recherche d’information sur internet

 

X= Les apprenants deviennent plus autonomes en utilisant internet (opinion de l’enseignant)

 

0 Pas du tout d’accord

1 Pas vraiment d’accord

2 Plutôt d’accord

3 Tout à fait d’accord

Total

Y= Recherche d’informations sur internet

(pratique de l’enseignant)

0 Régulièrement

Comptage

0

2

9

11

22

% de X

.0%

18.2%

19.6%

42.3%

25.6%

1 Occasionnellement

Comptage

1

7

23

11

42

% de X

33.3%

63.6%

50.0%

42.3%

48.8%

2 Jamais

Comptage

2

2

14

4

22

% de X

66.7%

18.2%

30.4%

15.4%

25.6%

 

Total

Comptage

3

11

46

26

86

% de X

100.0%

100.0%

100.0%

100.0%

100.0%

Les résultats montrent une relation faible et significative: plus les enseignants sont d’avis que l’autonomie des étudiants augmente avec l’utilisation d’internet, plus il est probable qu’ils laisseront les étudiants utiliser internet en classe.

Le coefficient statistique que nous utilisons est « Directional Ordinal by Ordinal Measures » avec le D de Somers:

Valeurs D de Somers Signification
Symétrique -.210 .025
Y = Recherche d’information sur internet - Dépendant -.215 .025

Par conséquent, les opinions des enseignants expliquent d’une certaine manière pourquoi ils laissent les étudiants utiliser internet, mais la relation est très faible (D de Somers = 0.21)