« Analyse de la variance » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
mAucun résumé des modifications
Aucun résumé des modifications
 
(16 versions intermédiaires par 3 utilisateurs non affichées)
Ligne 7 : Ligne 7 :
|difficulté=débutant
|difficulté=débutant
}}
}}
[[catégorie:SPSS]]
== Introduction ==
== Introduction ==


== '''Analyse simple de la variance''' ==
L’analyse de la variance (Anova) et sa variante multivariée Manova est un des outils les plus utilisés par les expérimentateurs. Elle est également courante dans la recherche quasi-expérimentale et dans les enquêtes par sondage, comme le montre l’exemple suivant.


L’analyse de la variance (et sa variante multivariée Manova) est un des outils les plus utilisés par les expérimentateurs. Elle est également courante dans la recherche quasi-expérimentale et dans les enquêtes par sondage, comme le montre l’exemple suivant.
'''Exemple imaginaire:'''


Exemple: la présence ou l’absence de l’utilisation des TIC influence-t-elle les notes?
Question: la présence ou l’absence de l’utilisation des TIC influence-t-elle les notes?


* X a une influence sur Y si les moyennes obtenues par les différents groupes (e.g. les utilisateurs des TIC contre les non-utilisateurs des TIC) diffèrent de manière significative.
* X a une influence sur Y si les moyennes obtenues par les différents groupes (e.g. les utilisateurs des TIC contre les non-utilisateurs des TIC) diffèrent de manière significative.
Ligne 22 : Ligne 23 :


* La variance au sein des groupes X est basse (certainement plus basse que la variance générale), en d’autres termes: les groupes devraient être homogènes
* La variance au sein des groupes X est basse (certainement plus basse que la variance générale), en d’autres termes: les groupes devraient être homogènes
'''Prémisses''':


Il y a trois coefficients statistiques importants:
Les valeurs des populations doivent être normalement distribuées. Les outils statistiques proposent généralement d'effectuer un test de normalité avant l'Anova (Shapiro-Wilk). L'analyse de variance est toutefois


* '''Ecarts-types''' pour '''chaque groupe''' et pour l’'''échantillon global''': comme nous l’avons expliqué plus haut, l’écart-type indique à quelle distance de la moyenne l’individu type se situe.
relativement robuste aux écarts de la normalité et reste envisageable. Il convient cependant d'être attentif aux sujets extrêmes a fortiori dans les échantillons de petite taille ou d'envisager une analyse de variance non-paramétrique en complément.


* '''Eta''' est un coefficient de corrélation
== Les coefficients de l'analyse de la variance ==
* '''Eta<sup>2</sup>''' mesure la variance expliquée
 
Il y a plusieurs coefficients statistiques importants, principe introduit dans [[principes de base d'analyse statistique]].
 
'''Structure de la relation'''
 
* Les '''moyennes''' (M) définissent l'effet. Plus les moyennes des groupes sont écartées, plus on a un effet intéressant.
 
* '''Ecarts-types''' (SD ou ET) pour '''chaque groupe''' et pour l’'''échantillon global''': comme nous l’avons [[Statistiques descriptives|expliqué ailleurs]], l’écart-type est une mesure de '''dispersion''' et indique à quelle distance de la moyenne l’individu type se situe. Pour qu'on puisse parler d'une différence importante (et significative) des groupes, l'écart-type de chaque groupe devrait être petit (en tout cas plus petit que l'écart-type de l'échantillon global)
 
'''Force de la relation et variance expliquée'''
 
* '''Eta''' est un coefficient de corrélation (une alternative à la comparaison et discussion des moyennes et écart-types). En gros, il résume l'information "distance entre moyennes" et "homogénéité de groupes"
 
* '''Eta<sup>2</sup>''' mesure la variance expliquée.
 
'''Seuil de signification'''
 
* Le test '''T''' permet de calculer le taux de signification pour 2 groupes. On obtient une probabilité '''P''' qui indique dans quelle mesure la relation serait due au hasard. En règle générale, <code>p</code> doit être inférieur à 0.05 (5%).
 
* Le test '''F''' (une extension du T) permet de calculer le taux de signification pour 2 ou plusieurs groupes
 
=== Dans SPSS ===


Dans SPSS, l’analyse de la variance peut être trouvée à deux endroits:
Dans SPSS, l’analyse de la variance peut être trouvée à deux endroits:
Ligne 36 : Ligne 59 :
* Modèles linéaires généraux (à éviter si vous êtes un/e débutant/e)
* Modèles linéaires généraux (à éviter si vous êtes un/e débutant/e)


Exemple 3. Différences entre les enseignants formés et les futurs enseignants en formation
=== Présentation des résultats ===
 
Selon le domaine scientifique, il faut présenter plus ou moins de détails. En psychologie, la norme APA exige que l'on indique également les degrés de liberté (Degrees of freedom, '''df'''), c'est-à-dire le nombre de valeurs qui peuvent varier.
 
L'exemple suivant prend les données du premier tableau ci-dessus:
Le type de '''population''' d'enseignants explique la '''fréquence des différents types d’activités d’apprentissage''' [ F(1,84) = 6.486, p=0.013 ]
 
Les degrés de liberté (valeurs qui peuvent varier) sont 1 (on a deux groupes) et 84 (on a 85 participants).
 
== Exemple - Différences entre les enseignants formés et les futurs enseignants en formation ==
 
Dans cet exemple, nous souhaitons savoir si les futurs enseignants en formation sont différents des enseignants formés en ce qui concerne les activités en classe. Nous appelons cette variable indépendante (explicative) "population d'enseignants".


Dans cet exemple, nous souhaitons savoir si les futurs enseignants en formation sont différents des enseignants formés en ce qui concerne les activités en classe. Nous avons trois types de variables:
Nous avons trois types de variables dépendantes (à expliquer):


* La fréquence des différents types d’activités d’apprentissage (COP1)
* La fréquence des différents types d’activités d’apprentissage (COP1)
Ligne 46 : Ligne 80 :
* La fréquence du travail individuel des étudiants (COP3)
* La fréquence du travail individuel des étudiants (COP3)


Chacune de ces variables a été mesurée à l’aide d’un indice. Les indices COP1, COP2 et COP3 se situent entre 0 (peu) et 2 (beaucoup). Pour chaque variable, nous comparons les deux groupes à la moyenne.
Chacune de ces variables a été mesurée à l’aide d’un indice. Les indices COP1, COP2 et COP3 se situent entre 0 (peu) et 2 (beaucoup). Pour chaque variable, nous comparons les deux groupes (population d'enseignants) à la moyenne.


{|class="datatable"
{| class="wikitable datatable"
!'''Population '''
!'''Population d'enseignants'''
!
!
!'''COP1 Fréquence des différents types d’activités d’apprentissage '''
!'''COP1 '''
!'''COP2 Fréquence des activités d’exploration en dehors de la classe'''
'''Fréquence des différents types d’activités d’apprentissage '''
!'''COP3 Fréquence du travail individuel des étudiants '''
!'''COP2'''
'''Fréquence des activités d’exploration en dehors de la classe'''
!'''COP3 '''
'''Fréquence du travail individuel des étudiants '''
|-
|-
|1 Futur enseignant en formation
|1 Futur enseignant en formation
|Moyenne
|'''Moyenne'''
|1.528
|1.528
|1.042
|1.042
Ligne 74 : Ligne 111 :
|-
|-
|2 Enseignant formé
|2 Enseignant formé
|Moyenne
|'''Moyenne'''
|1.816
|1.816
|1.224
|1.224
Ligne 92 : Ligne 129 :
|-
|-
|Total
|Total
|Moyenne
|'''Moyenne'''
|1.655
|1.655
|1.122
|1.122
Ligne 110 : Ligne 147 :
|}
|}


'''Tableau 5: Différences entre les enseignants formés et les futurs enseignants en formation - Ecart-type et moyenne'''
'''Tableau 5: Différences entre enseignants formés et futurs enseignants en formation - Ecart-types et moyennes'''


Les écarts-types dans les groupes sont plutôt élevés (en particulier pour les étudiants), ce qui est une mauvaise chose: cela signifie que parmi les étudiants les individus sont très différents.
Les écarts-types dans les groupes sont plutôt élevés (en particulier pour les étudiants), ce qui est une mauvaise chose: cela signifie que parmi les étudiants les individus sont très différents.


Examinons à présent le tableau des analyses de variance et ses mesures d’associations. Nous voyons tout d’abord le seuil de signification, qui devrait être inférieur à 0.5.
Examinons à présent le tableau des analyses de variance et ses mesures d’associations. Nous voyons tout d’abord le seuil de signification, qui devrait être inférieur à 0.05.


{|class="datatable"
{| class="wikitable datatable"
!'''Variables (Y) expliquées par la population (X) '''
!'''Variables dépendantes expliquées par la population'''
!
!
!Somme des carrés
!Somme des carrés
Ligne 125 : Ligne 162 :
!Sig.
!Sig.
|-
|-
|COP1 Fréquence des différents types d’activités d’apprentissage<br />
|COP1 Fréquence des différents types d’activités d’apprentissage<br />'''X''' Population d'enseignants
* Population
|Entre les groupes
|Entre les groupes
|1.759
|1.759
Ligne 150 : Ligne 186 :
|
|
|-
|-
|COP2 Fréquence des activités d’exploration en dehors de la classe<br />
|COP2 Fréquence des activités d’exploration en dehors de la classe<br />'''X''' Population d'enseignants
* Population
|Entre les groupes
|Entre les groupes
|.703
|.703
Ligne 175 : Ligne 210 :
|
|
|-
|-
|COP3 Fréquence du travail individuel des étudiants<br />
|COP3 Fréquence du travail individuel des étudiants
* Population
'''X''' Population d'enseignants
|Entre les groupes<span id="_Toc227903116" class="anchor"></span>
|Entre les groupes<span id="_Toc227903116" class="anchor"></span>
|2.427
|2.427
Ligne 203 : Ligne 238 :
'''Tableau 6: Différence entre enseignants formés et futurs enseignants en formation – tableau des analyses de variance'''
'''Tableau 6: Différence entre enseignants formés et futurs enseignants en formation – tableau des analyses de variance'''


Comme vous pouvez le constater, la variable COP2 ne peut pas s’expliquer par la variable « les futurs en enseignants en formation contre les enseignants formés », car sig. = 0.13. Les deux autres relations sont statistiquement significatives et par conséquent interprétables.
Comme vous pouvez le constater, la variable COP2 ne peut pas s’expliquer par la variable « Population d'enseignants » (futurs en enseignants en formation vs. enseignants formés) , car Sig. = 0.13. Les deux autres relations sont statistiquement significatives et par conséquent interprétables.


Les mesures d’association (Eta) sont également relativement faibles, comme le montre le tableau suivant:
Les mesures d’association (Eta) sont également relativement faibles, comme le montre le tableau suivant:


{|class="datatable"
{| class="datatable"
!
!
!'''Eta '''
!'''Eta '''
Ligne 225 : Ligne 260 :
|}
|}


Résultat: les associations sont faibles, de même que la variance expliquée. La relation « COP2 » n’est pas significative. Nous pouvons affirmer que les enseignants utilisent plus d’activités d’apprentissage que les futurs enseignant en formation et qu’ils organisent plus fréquemment des travaux individuels pour les étudiants.
Résultat: les associations sont faibles, de même que la variance expliquée. La relation « COP2 » n’est pas significative. Nous pouvons affirmer que '''les enseignants (formés) utilisent plus d’activités d’apprentissage que les futurs enseignants en formation''' et qu’ils '''organisent plus fréquemment des travaux individuels''' pour les étudiants.

Dernière version du 2 avril 2021 à 00:51

Manuel de recherche en technologie éducative
Module: Analyse de données quantitatives
◀▬▬▶
brouillon débutant
2021/04/02

Introduction

L’analyse de la variance (Anova) et sa variante multivariée Manova est un des outils les plus utilisés par les expérimentateurs. Elle est également courante dans la recherche quasi-expérimentale et dans les enquêtes par sondage, comme le montre l’exemple suivant.

Exemple imaginaire:

Question: la présence ou l’absence de l’utilisation des TIC influence-t-elle les notes?

  • X a une influence sur Y si les moyennes obtenues par les différents groupes (e.g. les utilisateurs des TIC contre les non-utilisateurs des TIC) diffèrent de manière significative.

X est une condition expérimentale (par conséquent une variable nominale) et Y est généralement une variable à intervalle. La signification s’améliore lorsque:

  • Les moyennes des groupes X sont différentes (plus elles sont éloignées, mieux c'est)
  • La variance au sein des groupes X est basse (certainement plus basse que la variance générale), en d’autres termes: les groupes devraient être homogènes

Prémisses:

Les valeurs des populations doivent être normalement distribuées. Les outils statistiques proposent généralement d'effectuer un test de normalité avant l'Anova (Shapiro-Wilk). L'analyse de variance est toutefois

relativement robuste aux écarts de la normalité et reste envisageable. Il convient cependant d'être attentif aux sujets extrêmes a fortiori dans les échantillons de petite taille ou d'envisager une analyse de variance non-paramétrique en complément.

Les coefficients de l'analyse de la variance

Il y a plusieurs coefficients statistiques importants, principe introduit dans principes de base d'analyse statistique.

Structure de la relation

  • Les moyennes (M) définissent l'effet. Plus les moyennes des groupes sont écartées, plus on a un effet intéressant.
  • Ecarts-types (SD ou ET) pour chaque groupe et pour l’échantillon global: comme nous l’avons expliqué ailleurs, l’écart-type est une mesure de dispersion et indique à quelle distance de la moyenne l’individu type se situe. Pour qu'on puisse parler d'une différence importante (et significative) des groupes, l'écart-type de chaque groupe devrait être petit (en tout cas plus petit que l'écart-type de l'échantillon global)

Force de la relation et variance expliquée

  • Eta est un coefficient de corrélation (une alternative à la comparaison et discussion des moyennes et écart-types). En gros, il résume l'information "distance entre moyennes" et "homogénéité de groupes"
  • Eta2 mesure la variance expliquée.

Seuil de signification

  • Le test T permet de calculer le taux de signification pour 2 groupes. On obtient une probabilité P qui indique dans quelle mesure la relation serait due au hasard. En règle générale, p doit être inférieur à 0.05 (5%).
  • Le test F (une extension du T) permet de calculer le taux de signification pour 2 ou plusieurs groupes

Dans SPSS

Dans SPSS, l’analyse de la variance peut être trouvée à deux endroits:

  • Analyse-> comparer les moyennes
  • Modèles linéaires généraux (à éviter si vous êtes un/e débutant/e)

Présentation des résultats

Selon le domaine scientifique, il faut présenter plus ou moins de détails. En psychologie, la norme APA exige que l'on indique également les degrés de liberté (Degrees of freedom, df), c'est-à-dire le nombre de valeurs qui peuvent varier.

L'exemple suivant prend les données du premier tableau ci-dessus:

Le type de population d'enseignants explique la fréquence des différents types d’activités d’apprentissage [ F(1,84) = 6.486, p=0.013 ]

Les degrés de liberté (valeurs qui peuvent varier) sont 1 (on a deux groupes) et 84 (on a 85 participants).

Exemple - Différences entre les enseignants formés et les futurs enseignants en formation

Dans cet exemple, nous souhaitons savoir si les futurs enseignants en formation sont différents des enseignants formés en ce qui concerne les activités en classe. Nous appelons cette variable indépendante (explicative) "population d'enseignants".

Nous avons trois types de variables dépendantes (à expliquer):

  • La fréquence des différents types d’activités d’apprentissage (COP1)
  • La fréquence des activités d’exploration en dehors de la classe (COP2)
  • La fréquence du travail individuel des étudiants (COP3)

Chacune de ces variables a été mesurée à l’aide d’un indice. Les indices COP1, COP2 et COP3 se situent entre 0 (peu) et 2 (beaucoup). Pour chaque variable, nous comparons les deux groupes (population d'enseignants) à la moyenne.

Population d'enseignants COP1

Fréquence des différents types d’activités d’apprentissage

COP2

Fréquence des activités d’exploration en dehors de la classe

COP3

Fréquence du travail individuel des étudiants

1 Futur enseignant en formation Moyenne 1.528 1.042 .885
N 48 48 48
Ecart-type .6258 .6260 .5765
2 Enseignant formé Moyenne 1.816 1.224 1.224
N 38 38 38
Ecart-type .3440 .4302 .5893
Total Moyenne 1.655 1.122 1.035
N 86 86 86
Ecart-type .5374 .5527 .6029

Tableau 5: Différences entre enseignants formés et futurs enseignants en formation - Ecart-types et moyennes

Les écarts-types dans les groupes sont plutôt élevés (en particulier pour les étudiants), ce qui est une mauvaise chose: cela signifie que parmi les étudiants les individus sont très différents.

Examinons à présent le tableau des analyses de variance et ses mesures d’associations. Nous voyons tout d’abord le seuil de signification, qui devrait être inférieur à 0.05.

Variables dépendantes expliquées par la population Somme des carrés df Carré moyen F Sig.
COP1 Fréquence des différents types d’activités d’apprentissage
X Population d'enseignants
Entre les groupes 1.759 1 1.759 6.486 .013
Dans les groupes 22.785 84 .271
Total 24.544 85
COP2 Fréquence des activités d’exploration en dehors de la classe
X Population d'enseignants
Entre les groupes .703 1 .703 2.336 .130
Dans les groupes 25.265 84 .301
Total 25.968 85
COP3 Fréquence du travail individuel des étudiants

X Population d'enseignants

Entre les groupes 2.427 1 2.427 7.161 .009
Dans les groupes 28.468 84 339
Total 30.895 85

Tableau 6: Différence entre enseignants formés et futurs enseignants en formation – tableau des analyses de variance

Comme vous pouvez le constater, la variable COP2 ne peut pas s’expliquer par la variable « Population d'enseignants » (futurs en enseignants en formation vs. enseignants formés) , car Sig. = 0.13. Les deux autres relations sont statistiquement significatives et par conséquent interprétables.

Les mesures d’association (Eta) sont également relativement faibles, comme le montre le tableau suivant:

Eta Eta au carré
Var_COP1 Fréquence des différents types d’activités d’apprentissage * Population .268 .072
Var_COP2 Fréquence des activités d’exploration en dehors de la classe * Population .164 .027
Var_COP3 Fréquence du travail individuel des étudiants * Population .280 .079

Résultat: les associations sont faibles, de même que la variance expliquée. La relation « COP2 » n’est pas significative. Nous pouvons affirmer que les enseignants (formés) utilisent plus d’activités d’apprentissage que les futurs enseignants en formation et qu’ils organisent plus fréquemment des travaux individuels pour les étudiants.