« Analyse de régression et corrélations de Pearson » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
mAucun résumé des modifications
Ligne 98 : Ligne 98 :


Nous pouvons donc exprimer le modèle qui explique les ''activités d’exploration en dehors de la classe'' avec l'age avec l'équation suivante:
Nous pouvons donc exprimer le modèle qui explique les ''activités d’exploration en dehors de la classe'' avec l'age avec l'équation suivante:
: <code>.705 + 0.013 * AGE</code>
: <code>Activités_exploration = .705 + 0.013 * AGE</code>


Elle peut également être interprétée de la façon suivante: «on s’attend à ce que seules les personnes de plus de 99 ans puissent obtenir un résultat de 2». Voici un nuage de points pour cette relation:
Elle peut également être interprétée de la façon suivante: «on s’attend à ce que seules les personnes de plus de 99 ans puissent obtenir un résultat de 2». Voici un nuage de points pour cette relation:

Version du 23 novembre 2015 à 14:59

Manuel de recherche en technologie éducative
Module: Analyse de données quantitatives
◀▬▬▶
brouillon débutant
2015/11/23

Le principe de la régression et de la correlation de Pearson

Nous avons déjà présenté le principe de la régression linéaire. Il permet de calculer une tendance entre une variable explicative X et une variable à expliquer Y. Ces variables doivent toutes deux être des variables quantitatives.

L’analyse de régression cherche à établir une droite qui résume l'évolution de Y en fonction des valeurs de X. Cette droite maximise la prédiction (linéaire) minimise les résidus. Nous avons déjà introduit la figure suivante dans le chapitre d'introduction aux analyses quantitatives

Structure d'une régression linéaire (la droite)

DONNEES = droite de régression prédite + résidus (données non expliquées)

Régression et coefficients de corrélation

  • Ceux coefficients de régression synthétisent le modèle, i.e. ils décrivent mathématiquement la droite.

Y = A + X * B

  • B représente la pente de la droite
  • A est une constante et représente l’écart par rapport au 0

Il existe ensuite 2 coefficients qui mesurent la relation et la portée du modèle:

  • La corrélation de Pearson (r) synthétise la force de la relation
  • R au carré (R2) représente la variance expliquée

Exemple: Age de l’enseignant et activités en dehors de la classe

Nous souhaitons répondre à la question: l’âge de l’enseignant explique-t-il les activités d’exploration en dehors de la classe? I.e. est-il plus probable que ce soient des enseignants plus âgés qui organisent des activités en dehors de la classe?

  • Variable indépendante X: âge de l’enseignant
  • Variable dépendante Y: fréquence des activités d’exploration organisées en dehors de la classe

Le résumé du modèle de régression produit par SPSS est présenté de la façon suivante. Nous pouvons observer qu’il existe une faible corrélation (R=0.316) et que la relation est significative (.027)

Age de l’enseignant et activités d’exploration en dehors de la classe – corrélation
R R au carré R au carré corrigé Erreur de l’estimation standard Corrélation de Pearson Sig. (unilatéral) N
.316 .100 .075 .4138 .316 .027 38

Les coefficients du modèle de régression sont les suivants:

Age de l’enseignant et activités d’exploration en dehors de la classe – modèle de régression
Coefficients Coefficients standard t Sig. Corrélations
B Erreur standard Beta d’ordre zéro
(Constante) .706 .268 2.639 .012
Age .013 .006 .316 1.999 .053 .316
Variable dépendante: COP2 Fréquence des activités d’exploration en dehors de la classe

Nous pouvons donc exprimer le modèle qui explique les activités d’exploration en dehors de la classe avec l'age avec l'équation suivante:

Activités_exploration = .705 + 0.013 * AGE

Elle peut également être interprétée de la façon suivante: «on s’attend à ce que seules les personnes de plus de 99 ans puissent obtenir un résultat de 2». Voici un nuage de points pour cette relation:

Modèle de régression linéaire. Est-que l'age peut expliquer les sorties ?

En regardant ce graphique, on s’aperçoit qu’il n’est pas nécessaire de recourir à des coefficients statistiques pour constater que la relation est plutôt faible et que la prédiction indique qu’il faudra compter 100 ans pour en arriver là .