« Tableau croisé » : différence entre les versions
mAucun résumé des modifications |
m (→Exemple 1. Tableau croisé – Formation aux TIC X logiciel de présentation : Rectification interprétation tableau) |
||
(7 versions intermédiaires par 2 utilisateurs non affichées) | |||
Ligne 2 : | Ligne 2 : | ||
|fait_partie_du_cours=Manuel de recherche en technologie éducative | |fait_partie_du_cours=Manuel de recherche en technologie éducative | ||
|fait_partie_du_module=Analyse de données quantitatives | |fait_partie_du_module=Analyse de données quantitatives | ||
|pas_afficher_sous-page=Non | |||
|page_precedente=Principes de base d'analyse statistique | |page_precedente=Principes de base d'analyse statistique | ||
|page_suivante=Analyse de la variance | |page_suivante=Analyse de la variance | ||
|statut=brouillon | |statut=brouillon | ||
|difficulté=débutant | |difficulté=débutant | ||
|cat tutoriels=SPSS | |||
}} | }} | ||
== Introduction == | == Introduction == | ||
Le tableau croisé est une technique courante pour étudier les relations entre les variables normales (catégoriques) ou ordinales. Le tableau croisé n’est pas complexe, mais les débutants ne le comprennent généralement pas très bien. Il est important de se rappeler les objectifs basiques de l’analyse de données | Le tableau croisé est une technique courante pour étudier les relations entre les variables normales (catégoriques) ou ordinales. Le tableau croisé n’est pas complexe, mais les débutants ne le comprennent généralement pas très bien. Il est important de se rappeler les objectifs basiques de l’analyse de données simples: | ||
Expliquer la variable Y avec la variable X, veut dire | Expliquer la variable Y avec la variable X, veut dire | ||
Ligne 32 : | Ligne 34 : | ||
Revenons au simple paradigme expérimental sur lequel s’appuient presque toutes les analyses statistiques, puisque la recherche se fonde sur la comparaison. Note: X est à gauche (pas en-haut): | Revenons au simple paradigme expérimental sur lequel s’appuient presque toutes les analyses statistiques, puisque la recherche se fonde sur la comparaison. Note: X est à gauche (pas en-haut): | ||
{|class="wikitable" | {| class="wikitable" | ||
|+Le principe de la comparaison dans l'expérimentation | |+Le principe de la comparaison dans l'expérimentation | ||
!Traitement | !Traitement | ||
Ligne 61 : | Ligne 63 : | ||
* Le <code>D de Somers</code> est un coefficient courant pour les mesures ordinales (X et Y). Il existe deux variantes: « symétrique » et « Y dépendant de X ». | * Le <code>D de Somers</code> est un coefficient courant pour les mesures ordinales (X et Y). Il existe deux variantes: « symétrique » et « Y dépendant de X ». | ||
Il existe plusieurs tests de signification statistique: | Il existe plusieurs tests de signification statistique: | ||
* | * Les tests s’appuyant sur la '''Loi du Chi<sup>2</sup> de Pearson''' est de loin le plus courant. Cette statistique est utilisée pour tester l’hypothèse nulle, i.e. pas d’association entre colonnes et lignes dans un tableau. Il peut être utilisé avec des données nominales. | ||
Dans SPSS: | Dans SPSS: | ||
Ligne 73 : | Ligne 75 : | ||
* Vous pouvez alors sélectionner les pourcentages dans « cellules » et les coefficients dans « statistiques ». Ils deviendront « inférentiels », pas seulement « descriptifs ». | * Vous pouvez alors sélectionner les pourcentages dans « cellules » et les coefficients dans « statistiques ». Ils deviendront « inférentiels », pas seulement « descriptifs ». | ||
Exemple 1. Tableau croisé – Formation aux TIC X logiciel de présentation | == Exemple 1. Tableau croisé – Formation aux TIC X logiciel de présentation== | ||
Nous souhaitons savoir si la formation aux TIC explique l’utilisation de logiciels de présentation en classe. Ces variables sont mesurées à l’aide de questions de sondage: | Nous souhaitons savoir si la formation aux TIC explique l’utilisation de logiciels de présentation en classe. Ces variables sont mesurées à l’aide de questions de sondage: | ||
Ligne 82 : | Ligne 84 : | ||
Examinons à présent les résultats dans le tableau ci-dessous: | Examinons à présent les résultats dans le tableau ci-dessous: | ||
<table class="datatable"><caption> Influence de la formation aux TIC sur l’utilisation de logiciels de présentation en classe</caption><tr><td colspan="3" rowspan="2" ><p> </p></td><td colspan="2" ><p>X= Avez-vous bénéficié d’une formation aux TIC auparavant? </p></td><td ><p>Total </p></td></tr><tr><td ><p>Non </p></td><td ><p>Oui</p></td><td ><p> </p></td></tr><tr><td rowspan="8" ><p>Y= Utilisez-vous un ordinateur pour préparer des présentations en classe? </p></td><td rowspan="2" ><p>Régulièrement </p></td><td ><p>Comptage</p></td><td ><p>4 </p></td><td ><p>45 </p></td><td ><p>49 </p></td></tr><tr><td ><p>% de X </p></td><td ><p>44.4% </p></td><td ><p>58.4% </p></td><td ><p>57.0% </p></td></tr><tr><td rowspan="2" ><p>Occasionnellement </p></td><td ><p>Comptage</p></td><td ><p>4 </p></td><td ><p>21 </p></td><td ><p>25 </p></td></tr><tr><td ><p>% de X </p></td><td ><p>44.4% </p></td><td ><p>27.3% </p></td><td ><p>29.1% </p></td></tr><tr><td rowspan="2" ><p>2 Jamais </p></td><td ><p>Comptage </p></td><td ><p>1 </p></td><td ><p>11 </p></td><td ><p>12 </p></td></tr><tr><td ><p>% de X </p></td><td ><p>11.1% </p></td><td ><p>14.3% </p></td><td ><p>14.0% </p></td></tr><tr><td rowspan="2" ><p>Total </p></td><td ><p>Comptage</p></td><td ><p>9 </p></td><td ><p>77 </p></td><td ><p>86 </p></td></tr><tr><td ><p>% de X </p></td><td ><p>100.0% </p></td><td ><p>100.0% </p></td><td ><p>100.0% </p></td></tr></table> | <table class="datatable"><caption> Influence de la formation aux TIC sur l’utilisation de logiciels de présentation en classe</caption><tr><td colspan="3" rowspan="2"><p> </p></td><td colspan="2"><p>X= Avez-vous bénéficié d’une formation aux TIC auparavant? </p></td><td><p>Total </p></td></tr><tr><td><p>Non </p></td><td><p>Oui</p></td><td><p> </p></td></tr><tr><td rowspan="8"><p>Y= Utilisez-vous un ordinateur <br />pour préparer des présentations en classe? </p></td><td rowspan="2"><p>Régulièrement </p></td><td><p>Comptage</p></td><td><p>4 </p></td><td><p>45 </p></td><td><p>49 </p></td></tr><tr><td><p>% de X </p></td><td><p>44.4% </p></td><td><p>58.4% </p></td><td><p>57.0% </p></td></tr><tr><td rowspan="2"><p>Occasionnellement </p></td><td><p>Comptage</p></td><td><p>4 </p></td><td><p>21 </p></td><td><p>25 </p></td></tr><tr><td><p>% de X </p></td><td><p>44.4% </p></td><td><p>27.3% </p></td><td><p>29.1% </p></td></tr><tr><td rowspan="2"><p>2 Jamais </p></td><td><p>Comptage </p></td><td><p>1 </p></td><td><p>11 </p></td><td><p>12 </p></td></tr><tr><td><p>% de X </p></td><td><p>11.1% </p></td><td><p>14.3% </p></td><td><p>14.0% </p></td></tr><tr><td rowspan="2"><p>Total </p></td><td><p>Comptage</p></td><td><p>9 </p></td><td><p>77 </p></td><td><p>86 </p></td></tr><tr><td><p>% de X </p></td><td><p>100.0% </p></td><td><p>100.0% </p></td><td><p>100.0% </p></td></tr></table> | ||
La probabilité que la formation à l’informatique (« oui ») ait pour conséquence une utilisation accrue d’un ordinateur pour préparer des documents est très | La probabilité que la formation à l’informatique (« oui ») ait pour conséquence une utilisation accrue d’un ordinateur pour préparer des documents est très forte, 58.4% (vous pouvez le constater en comparant les pourcentages ligne par ligne). | ||
Les statistiques indiquent la même chose: | Les statistiques indiquent la même chose: | ||
Ligne 94 : | Ligne 96 : | ||
Par conséquent, nous pouvons conclure que la relation, en plus d’être très faible, ne peut pas être interprétée. En d’autres termes, il n’y a aucun moyen d’affirmer que la formation aux TIC ait pour conséquence une utilisation plus fréquente des logiciels de présentation. | Par conséquent, nous pouvons conclure que la relation, en plus d’être très faible, ne peut pas être interprétée. En d’autres termes, il n’y a aucun moyen d’affirmer que la formation aux TIC ait pour conséquence une utilisation plus fréquente des logiciels de présentation. | ||
Exemple 2. Tableau croisé – Opinion des enseignants X activités en classe | == Exemple 2. Tableau croisé – Opinion des enseignants X activités en classe == | ||
Nous souhaitons savoir si le fait que les enseignants soient d’accord avec l’affirmation selon laquelle ''les étudiants deviennent plus autonomes en utilisant internet'' a une influence sur la pratique en classe. Par exemple, est-ce qu’un enseignant organisera plus d’activités dans lesquelles les étudiants doivent rechercher des informations sur internet si il/elle considère qu’internet peut favoriser l’autonomie? Nous avons deux variables. | Nous souhaitons savoir si le fait que les enseignants soient d’accord avec l’affirmation selon laquelle ''les étudiants deviennent plus autonomes en utilisant internet'' a une influence sur la pratique en classe. Par exemple, est-ce qu’un enseignant organisera plus d’activités dans lesquelles les étudiants doivent rechercher des informations sur internet si il/elle considère qu’internet peut favoriser l’autonomie? Nous avons deux variables. | ||
Ligne 102 : | Ligne 104 : | ||
* Y = les activités des enseignants en classe: recherche d’information sur internet | * Y = les activités des enseignants en classe: recherche d’information sur internet | ||
<table class="datatable"> <tr><td colspan="3" rowspan="2" ><p> </p></td><td colspan="4" ><p>X= Les apprenants deviennent plus autonomes en utilisant internet (opinion de l’enseignant) </p></td><td ><p> </p></td></tr><tr><td ><p>0 Pas du tout d’accord</p></td><td ><p>1 Pas vraiment d’accord</p></td><td ><p>2 Plutôt d’accord </p></td><td ><p>3 Tout à fait d’accord </p></td><td ><p>Total </p></td></tr><tr><td rowspan="6" ><p>Y= Recherche d’informations sur internet </p><p>(pratique de l’enseignant)</p></td><td rowspan="2" ><p>0 Régulièrement </p></td><td ><p>Comptage</p></td><td ><p>0 </p></td><td ><p>2 </p></td><td ><p>9 </p></td><td ><p>11 </p></td><td ><p>22 </p></td></tr><tr><td ><p>% de X </p></td><td ><p>.0% </p></td><td ><p>18.2% </p></td><td ><p>19.6% </p></td><td ><p>42.3% </p></td><td ><p>25.6% </p></td></tr><tr><td rowspan="2" ><p>1 Occasionnellement </p></td><td ><p>Comptage</p></td><td ><p>1 </p></td><td ><p>7 </p></td><td ><p>23 </p></td><td ><p>11 </p></td><td ><p>42 </p></td></tr><tr><td ><p>% de X </p></td><td ><p>33.3% </p></td><td ><p>63.6% </p></td><td ><p>50.0% </p></td><td ><p>42.3% </p></td><td ><p>48.8% </p></td></tr><tr><td rowspan="2" ><p>2 Jamais </p></td><td ><p>Comptage </p></td><td ><p>2 </p></td><td ><p>2 </p></td><td ><p>14 </p></td><td ><p>4 </p></td><td ><p>22 </p></td></tr><tr><td ><p>% de X </p></td><td ><p>66.7% </p></td><td ><p>18.2% </p></td><td ><p>30.4% </p></td><td ><p>15.4% </p></td><td ><p>25.6% </p></td></tr><tr><td rowspan="2" ><p> </p></td><td rowspan="2" ><p>Total </p></td><td ><p>Comptage </p></td><td ><p>3 </p></td><td ><p>11 </p></td><td ><p>46 </p></td><td ><p>26 </p></td><td ><p>86 </p></td></tr><tr><td ><p>% de X </p></td><td ><p>100.0% </p></td><td ><p>100.0% </p></td><td ><p>100.0% </p></td><td ><p>100.0% </p></td><td ><p>100.0% </p></td></tr></table> | <table class="datatable"> <tr><td colspan="3" rowspan="2"><p> </p></td><td colspan="4"><p>X= Les apprenants deviennent plus autonomes en utilisant internet (opinion de l’enseignant) </p></td><td><p> </p></td></tr><tr><td><p>0 Pas du tout d’accord</p></td><td><p>1 Pas vraiment d’accord</p></td><td><p>2 Plutôt d’accord </p></td><td><p>3 Tout à fait d’accord </p></td><td><p>Total </p></td></tr><tr><td rowspan="6"><p>Y= Recherche d’informations sur internet </p><p>(pratique de l’enseignant)</p></td><td rowspan="2"><p>0 Régulièrement </p></td><td><p>Comptage</p></td><td><p>0 </p></td><td><p>2 </p></td><td><p>9 </p></td><td><p>11 </p></td><td><p>22 </p></td></tr><tr><td><p>% de X </p></td><td><p>.0% </p></td><td><p>18.2% </p></td><td><p>19.6% </p></td><td><p>42.3% </p></td><td><p>25.6% </p></td></tr><tr><td rowspan="2"><p>1 Occasionnellement </p></td><td><p>Comptage</p></td><td><p>1 </p></td><td><p>7 </p></td><td><p>23 </p></td><td><p>11 </p></td><td><p>42 </p></td></tr><tr><td><p>% de X </p></td><td><p>33.3% </p></td><td><p>63.6% </p></td><td><p>50.0% </p></td><td><p>42.3% </p></td><td><p>48.8% </p></td></tr><tr><td rowspan="2"><p>2 Jamais </p></td><td><p>Comptage </p></td><td><p>2 </p></td><td><p>2 </p></td><td><p>14 </p></td><td><p>4 </p></td><td><p>22 </p></td></tr><tr><td><p>% de X </p></td><td><p>66.7% </p></td><td><p>18.2% </p></td><td><p>30.4% </p></td><td><p>15.4% </p></td><td><p>25.6% </p></td></tr><tr><td rowspan="2"><p> </p></td><td rowspan="2"><p>Total </p></td><td><p>Comptage </p></td><td><p>3 </p></td><td><p>11 </p></td><td><p>46 </p></td><td><p>26 </p></td><td><p>86 </p></td></tr><tr><td><p>% de X </p></td><td><p>100.0% </p></td><td><p>100.0% </p></td><td><p>100.0% </p></td><td><p>100.0% </p></td><td><p>100.0% </p></td></tr></table> | ||
Les résultats montrent une relation faible et significative: plus les enseignants sont d’avis que l’autonomie des étudiants augmente avec l’utilisation d’internet, plus il est probable qu’ils laisseront les étudiants utiliser internet en classe. | Les résultats montrent une relation faible et significative: plus les enseignants sont d’avis que l’autonomie des étudiants augmente avec l’utilisation d’internet, plus il est probable qu’ils laisseront les étudiants utiliser internet en classe. | ||
Ligne 108 : | Ligne 110 : | ||
Le coefficient statistique que nous utilisons est « Directional Ordinal by Ordinal Measures » avec le D de Somers: | Le coefficient statistique que nous utilisons est « Directional Ordinal by Ordinal Measures » avec le D de Somers: | ||
{|class="wikitable" | {| class="wikitable" | ||
! | !Valeurs | ||
! | !D de Somers | ||
! | !Signification | ||
|- | |- | ||
|Symétrique | | Symétrique | ||
|-.210 | | -.210 | ||
|.025 | | .025 | ||
|- | |- | ||
|Y = Recherche d’information sur internet - Dépendant | | Y = Recherche d’information sur internet - Dépendant | ||
|-.215 | | -.215 | ||
|.025 | | .025 | ||
|} | |} | ||
Par conséquent, les opinions des enseignants expliquent d’une certaine manière pourquoi ils laissent les étudiants utiliser internet, mais la relation est très faible (D de Somers = 0.21) | Par conséquent, les opinions des enseignants expliquent d’une certaine manière pourquoi ils laissent les étudiants utiliser internet, mais la relation est très faible (D de Somers = 0.21) |
Dernière version du 12 juin 2019 à 14:08
Manuel de recherche en technologie éducative | |
---|---|
Module: Analyse de données quantitatives | |
◀▬▬▶ | |
⚐ brouillon | ☸ débutant |
⚒ 2019/06/12 | |
Catégorie: SPSS |
Introduction
Le tableau croisé est une technique courante pour étudier les relations entre les variables normales (catégoriques) ou ordinales. Le tableau croisé n’est pas complexe, mais les débutants ne le comprennent généralement pas très bien. Il est important de se rappeler les objectifs basiques de l’analyse de données simples:
Expliquer la variable Y avec la variable X, veut dire
- expliquer la variance de la variable Y avec la variance de la variable X
- montrer des co-variances
Dans un tableau croisé, cet exemple devient:
Si X = x1, quelle est la probabilité que Y = y1, Y = y2, etc.
Si X = x2, quelle est la probabilité que Y = y1, Y = y2, etc.
Puisque vous souhaitez connaître la probabilité qu’une valeur de X mène à une valeur de Y, vous devez calculer les pourcentages, comme nous allons l’expliquer ci-dessous.
Dans un tableau, la variable X est généralement placée en-haut (i.e. ses valeurs présentées dans des colonnes), mais vous pouvez faire l'inverse, i.e. placer X à gauche. Il faut toutefois veiller à ce que les pourcentages correspondent!
Etapes pour le calcul de pourcentages
- Calculez les pourcentages pour chaque entrée de X (i.e. « quelle est la probabilité qu’une valeur de X corresponde à une valeur de Y »)
- Comparez (interprétez) ensuite les pourcentages pour chaque entrée de la variable dépendante (à expliquer).
Revenons au simple paradigme expérimental sur lequel s’appuient presque toutes les analyses statistiques, puisque la recherche se fonde sur la comparaison. Note: X est à gauche (pas en-haut):
Traitement | Effet (O) | Absence d’effet (O) | Effet total pour un groupe |
---|---|---|---|
traitement: (groupe X) | plus grand | plus petit | 100 % |
absence de traitement: (groupe non-X) | plus petit | plus grand | 100 % |
Vous devez interpréter ce tableau de la façon suivante: la probabilité qu’un traitement (X) produise un effet (Y) est plus élevée que la probabilité qu’une absence de traitement (absence de X) produise cet effet. Nous allons maintenant présenter un exemple réel de tableau croisé statistique.
Coefficients statistiques pour le tableau croisé
Intéressons-nous tout d’abord à quelques coefficients qui résument la force d’une relation:
Phi
est une mesure d’associations fondée sur la loi du X2 et est généralement utilisée pour les tableaux 2 x 2.
- Le
coefficient de contingence
(le C de Pearson) est un ajustement de Phi, qui a pour but de l’adapter aux tableaux plus grands que 2 par 2.
- Le
D de Somers
est un coefficient courant pour les mesures ordinales (X et Y). Il existe deux variantes: « symétrique » et « Y dépendant de X ».
Il existe plusieurs tests de signification statistique:
- Les tests s’appuyant sur la Loi du Chi2 de Pearson est de loin le plus courant. Cette statistique est utilisée pour tester l’hypothèse nulle, i.e. pas d’association entre colonnes et lignes dans un tableau. Il peut être utilisé avec des données nominales.
Dans SPSS:
- Vous trouvez des tableaux croisés dans le menu: Analyse -> Statistiques descriptives -> Tableaux croisés
- Vous pouvez alors sélectionner les pourcentages dans « cellules » et les coefficients dans « statistiques ». Ils deviendront « inférentiels », pas seulement « descriptifs ».
Exemple 1. Tableau croisé – Formation aux TIC X logiciel de présentation
Nous souhaitons savoir si la formation aux TIC explique l’utilisation de logiciels de présentation en classe. Ces variables sont mesurées à l’aide de questions de sondage:
- Avez-vous bénéficié d’une formation aux TIC auparavant?
- Utilisez-vous un ordinateur pour préparer des présentations en classe?
Examinons à présent les résultats dans le tableau ci-dessous:
| X= Avez-vous bénéficié d’une formation aux TIC auparavant? | Total | |||
Non | Oui |
| |||
Y= Utilisez-vous un ordinateur | Régulièrement | Comptage | 4 | 45 | 49 |
% de X | 44.4% | 58.4% | 57.0% | ||
Occasionnellement | Comptage | 4 | 21 | 25 | |
% de X | 44.4% | 27.3% | 29.1% | ||
2 Jamais | Comptage | 1 | 11 | 12 | |
% de X | 11.1% | 14.3% | 14.0% | ||
Total | Comptage | 9 | 77 | 86 | |
% de X | 100.0% | 100.0% | 100.0% |
La probabilité que la formation à l’informatique (« oui ») ait pour conséquence une utilisation accrue d’un ordinateur pour préparer des documents est très forte, 58.4% (vous pouvez le constater en comparant les pourcentages ligne par ligne).
Les statistiques indiquent la même chose:
- La loi du X2 de Pearson est de 1,15 avec un seuil de signification de 0,562. Cela signifie que la probabilité que les résultats soient aléatoires est > 50%, vous devez donc rejeter la relation
- Coefficient de contingence = 0,115, signification = 0,562 (même résultat).
Par conséquent, nous pouvons conclure que la relation, en plus d’être très faible, ne peut pas être interprétée. En d’autres termes, il n’y a aucun moyen d’affirmer que la formation aux TIC ait pour conséquence une utilisation plus fréquente des logiciels de présentation.
Exemple 2. Tableau croisé – Opinion des enseignants X activités en classe
Nous souhaitons savoir si le fait que les enseignants soient d’accord avec l’affirmation selon laquelle les étudiants deviennent plus autonomes en utilisant internet a une influence sur la pratique en classe. Par exemple, est-ce qu’un enseignant organisera plus d’activités dans lesquelles les étudiants doivent rechercher des informations sur internet si il/elle considère qu’internet peut favoriser l’autonomie? Nous avons deux variables.
- X = l’opinion des enseignants sur l’affirmation suivante : les étudiants deviennent plus autonomes en utilisant internet
- Y = les activités des enseignants en classe: recherche d’information sur internet
| X= Les apprenants deviennent plus autonomes en utilisant internet (opinion de l’enseignant) |
| |||||
0 Pas du tout d’accord | 1 Pas vraiment d’accord | 2 Plutôt d’accord | 3 Tout à fait d’accord | Total | |||
Y= Recherche d’informations sur internet (pratique de l’enseignant) | 0 Régulièrement | Comptage | 0 | 2 | 9 | 11 | 22 |
% de X | .0% | 18.2% | 19.6% | 42.3% | 25.6% | ||
1 Occasionnellement | Comptage | 1 | 7 | 23 | 11 | 42 | |
% de X | 33.3% | 63.6% | 50.0% | 42.3% | 48.8% | ||
2 Jamais | Comptage | 2 | 2 | 14 | 4 | 22 | |
% de X | 66.7% | 18.2% | 30.4% | 15.4% | 25.6% | ||
| Total | Comptage | 3 | 11 | 46 | 26 | 86 |
% de X | 100.0% | 100.0% | 100.0% | 100.0% | 100.0% |
Les résultats montrent une relation faible et significative: plus les enseignants sont d’avis que l’autonomie des étudiants augmente avec l’utilisation d’internet, plus il est probable qu’ils laisseront les étudiants utiliser internet en classe.
Le coefficient statistique que nous utilisons est « Directional Ordinal by Ordinal Measures » avec le D de Somers:
Valeurs | D de Somers | Signification |
---|---|---|
Symétrique | -.210 | .025 |
Y = Recherche d’information sur internet - Dépendant | -.215 | .025 |
Par conséquent, les opinions des enseignants expliquent d’une certaine manière pourquoi ils laissent les étudiants utiliser internet, mais la relation est très faible (D de Somers = 0.21)