Analyse de régression et corrélations de Pearson

De EduTech Wiki
Version datée du 31 août 2015 à 13:04 par Daniel K. Schneider (discussion | contributions) (Page créée avec « {{tutoriel |fait_partie_du_cours=Manuel de recherche en technologie éducative |fait_partie_du_module=Analyse de données quantitatives |page_precedente=Analyse de la vari... »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche
Manuel de recherche en technologie éducative
Module: Analyse de données quantitatives
◀▬
brouillon débutant
2015/08/31

= Le principe de la régression

Nous avons déjà présenté le principe de la régression linéaire. Il permet de calculer une tendance entre une variable explicative X et une variable à expliquer Y. Ces variables doivent toutes deux être des variables quantitatives.

L’analyse de régression cherche à établir une droite qui visualise l'évolution de Y en fonction des valeurs de X. Cette droite maximise la prédiction (linéaire) minimise les résidus.

Tableau 58 (c’est une figure en réalité) : principe de la régression linéaire

DONNEES = droite de régression prédite + résidus (données non expliquées)

Régression et coefficients de corrélation

  • Les deux coefficients de régression synthétisent le modèle, i.e. ils décrivent mathématiquement la droite.

Y = A + X * B

B représente la pente de la droite

A est une constante et représente l’écart par rapport au 0

  • La corrélation de Pearson (r) synthétise la force de la relation
  • R au carré (R2) représente la variance expliquée

Exemple 4. Age de l’enseignant et activités en dehors de la classe

Nous souhaitons répondre à la question: l’âge de l’enseignant explique-t-il les activités d’exploration en dehors de la classe? I.e. est-il plus probable que ce soient des enseignants plus âgés qui organisent des activités en dehors de la classe?

  • Variable indépendante X: âge de l’enseignant
  • Variable dépendante Y: fréquence des activités d’exploration organisées en dehors de la classe

Le résumé du modèle de régression produit par SPSS est présenté de la façon suivante:

R R au carré R au carré corrigé Erreur de l’estimation standard Corrélation de Pearson Sig. (unilatéral) N

Nous pouvons observer qu’il existe une faible corrélation (R=0.316) et que la relation est significative (.027)

R R au carré R au carré corrigé Erreur de l’estimation standard Corrélation de Pearson Sig. (unilatéral) N
.316 .100 .075 .4138 .316 .027 38

Tableau 8: âge de l’enseignant et activités d’exploration en dehors de la classe – résumé du modèle de régression

Les coefficients du modèle de régression sont les suivants:

Age .013 .006 .316 1.999 .053 .316
Variable dépendante: COP2 Fréquence des activités d’exploration en dehors de la classe
Coefficients Coefficients standard t Sig. Corrélations
B Erreur standard Beta d’ordre zéro
(Constante) .706 .268 2.639 .012
Age .013 .006 .316 1.999 .053 .316
Variable dépendante: COP2 Fréquence des activités d’exploration en dehors de la classe

Tableau 9: âge de l’enseignant et activités d’exploration en dehors de la classe – modèle de régression

D’un point de vue formel, la relation est:

Activités d’exploration en dehors de la classe = .705 + 0.013 * AGE

Elle peut également être interprétée de la façon suivante: «on s’attend à ce que seules les personnes de plus de 99 ans puissent obtenir un résultat de 2». Voici un nuage de points pour cette relation:

Graphique (figure sans légende)

En regardant ce graphique, on s’aperçoit qu’il n’est pas nécessaire de recourir à des coefficients statistiques pour constater que la relation est plutôt faible et que la prédiction indique qu’il faudra compter 100 ans pour en arriver là .