Analyse de régression et corrélations de Pearson
Manuel de recherche en technologie éducative | |
---|---|
Module: Analyse de données quantitatives | |
◀▬ | |
⚐ brouillon | ☸ débutant |
⚒ 2015/09/01 |
Le principe de la régression et de la correlation de Pearson
Nous avons déjà présenté le principe de la régression linéaire. Il permet de calculer une tendance entre une variable explicative X et une variable à expliquer Y. Ces variables doivent toutes deux être des variables quantitatives.
L’analyse de régression cherche à établir une droite qui résume l'évolution de Y en fonction des valeurs de X. Cette droite maximise la prédiction (linéaire) minimise les résidus. Nous avons déjà introduit la figure suivante dans le chapitre d'introduction aux analyses quantitatives
DONNEES = droite de régression prédite + résidus (données non expliquées)
Régression et coefficients de corrélation
- Ceux coefficients de régression synthétisent le modèle, i.e. ils décrivent mathématiquement la droite.
Y = A + X * B
- B représente la pente de la droite
- A est une constante et représente l’écart par rapport au 0
Il existe ensuite 2 coefficients qui mesurent la relation et la portée du modèle:
- La corrélation de Pearson (r) synthétise la force de la relation
- R au carré (R2) représente la variance expliquée
Exemple: Age de l’enseignant et activités en dehors de la classe
Nous souhaitons répondre à la question: l’âge de l’enseignant explique-t-il les activités d’exploration en dehors de la classe? I.e. est-il plus probable que ce soient des enseignants plus âgés qui organisent des activités en dehors de la classe?
- Variable indépendante X: âge de l’enseignant
- Variable dépendante Y: fréquence des activités d’exploration organisées en dehors de la classe
Le résumé du modèle de régression produit par SPSS est présenté de la façon suivante:
R | R au carré | R au carré corrigé | Erreur de l’estimation standard | Corrélation de Pearson | Sig. (unilatéral) | N |
---|
Nous pouvons observer qu’il existe une faible corrélation (R=0.316) et que la relation est significative (.027)
R | R au carré | R au carré corrigé | Erreur de l’estimation standard | Corrélation de Pearson | Sig. (unilatéral) | N |
---|---|---|---|---|---|---|
.316 | .100 | .075 | .4138 | .316 | .027 | 38 |
Les coefficients du modèle de régression sont les suivants:
Age | .013 | .006 | .316 | 1.999 | .053 | .316 |
---|---|---|---|---|---|---|
Variable dépendante: COP2 Fréquence des activités d’exploration en dehors de la classe |
Coefficients | Coefficients standard | t | Sig. | Corrélations | ||
---|---|---|---|---|---|---|
B | Erreur standard | Beta | d’ordre zéro | |||
(Constante) | .706 | .268 | 2.639 | .012 | ||
Age | .013 | .006 | .316 | 1.999 | .053 | .316 |
Variable dépendante: COP2 Fréquence des activités d’exploration en dehors de la classe |
D’un point de vue formel, la relation est:
- Activités d’exploration en dehors de la classe =
.705 + 0.013 * AGE
Elle peut également être interprétée de la façon suivante: «on s’attend à ce que seules les personnes de plus de 99 ans puissent obtenir un résultat de 2». Voici un nuage de points pour cette relation:
Graphique (figure sans légende)
En regardant ce graphique, on s’aperçoit qu’il n’est pas nécessaire de recourir à des coefficients statistiques pour constater que la relation est plutôt faible et que la prédiction indique qu’il faudra compter 100 ans pour en arriver là .