Analyse de régression avec SPSS
Cet article est incomplet.
Il est jugé trop incomplet dans son développement ou dans l'expression des concepts et des idées. Son contenu est donc à considérer avec précaution.
Cet article explique
- Comment faire des simples analyses de régression avec SPSS !
- Comment sortir des graphiques
- Comment calculer des variables composites (indices) à partir de batteries de questions de type Lickert.
Voir aussi:
- Analyse de régression et corrélations de Pearson (principes)
Créer un nuage de points
Comment visualiser une simple régression linéraire avec SPSS ?
Modèle exemple
PISA 2012, élèves Suisses.
Question: Est-ce qu'on prédire l'angoisse des maths avec l'intérêt pour les maths ?
- x = intérêt pour les maths (var explicative)
- y = angoisse des maths (à expliquer)
Model Summary |
||||
Model |
R |
R Square |
Adjusted R Square |
Std. Error of the Estimate |
1 |
,339a |
,115 |
,115 |
,91096 |
a. Predictors: (Constant), Mathematics Interest |
Coefficientsa |
||||||
Model |
Unstandardized Coefficients |
Standardized Coefficients |
t |
Sig. |
||
|
B |
Std. Error |
Beta |
|
|
|
1 |
(Constant) |
-,154 |
,015 |
|
-10,268 |
,000 |
|
Mathematics Interest |
-,330 |
,015 |
-,339 |
-21,870 |
,000 |
a. Dependent Variable: Mathematics Anxiety |
L'outil Chart Builder
En Anglais:
- Menu Charts -> Chart Builder
En français:
- Menu Graphiques -> Générateur de graphiques
Ajouter la droite de régression linéaire avec l'outil Chart Editor
- Une fois que vous avez produit un graphique avec le générateur de graphiques, il faut double cliquer dessus (donc pas dans le chartbuilder, mais dans la sortie !!!)
- Vous voyez maintenant le Chart Editor, un outil qui vous permet de manipuler tous les graphiques produits par SPSS. Encore fois: Cet outil n'est pas dans le menu, il faut double-cliquer sur une sortie !
- Choisir l'icône Add Fit line at total (Ajouter une courbe d'ajustement au total). Une fenêtre "propriétés" va apparaître
- Dans la fenêtre propriétés, choisir "linéraire" (c.f. copie d'écran suivante)
Résultat
Effectivement: quand on a plus d'intérêt pour les maths, on a moins peur (donc c'est une relation statistique, ce qui ne vaut pas cause....)
On peut aussi créer des graphiques un peu plus sophistiqués:
Pour aller plus loin
Dans l'outil "Chars -> Chart Builder " choisir "Grouped scatter" au lieu de "simple scatter". Ensuite ajouter une variable catégorielle (gender ici).
Résultat: Chez les filles, l'effet est un peu plus fort.
- Dans le Chart editor ajouté des courbes: Add fit lines to subgroupes. Choisir "Loess".
- Aggrandi le graphique
Refaire les indices pour obtenir des régressions interprétables
Les indices PISA sont difficiles à interpréter car ils sont (1) standardisés et (2) calculés avec une méthode de prédiction probabiliste. Donc je conseille de les refaire plus simplement, même s'il peut y avoir des objections méthodologiques:
Les items PISA
Les 2 groupes de variables pour l'intérêt et l'angoisse des maths sont mesurées avec une simple échelle Likert:
Exemple item intérêt
ST29Q04 Maths Interest - Enjoy Maths |
|||||
|
Frequency |
Percent |
Valid Percent |
Cumulative Percent |
|
Valid |
1 Strongly agree |
1037 |
9,2 |
14,1 |
14,1 |
|
2 Agree |
2475 |
22,0 |
33,6 |
47,7 |
|
3 Disagree |
2305 |
20,5 |
31,3 |
79,1 |
|
4 Strongly disagree |
1541 |
13,7 |
20,9 |
100,0 |
|
Total |
7358 |
65,5 |
100,0 |
|
Missing |
7 N/A |
3753 |
33,4 |
|
|
|
8 Invalid |
40 |
,4 |
|
|
|
9 Missing |
78 |
,7 |
|
|
|
Total |
3871 |
34,5 |
|
|
Total |
11229 |
100,0 |
|
|
Exemple item angoisse
ST42Q05 Maths Anxiety - Get Very Nervous |
|||||
|
Frequency |
Percent |
Valid Percent |
Cumulative Percent |
|
Valid |
1 Strongly agree |
383 |
3,4 |
5,2 |
5,2 |
|
2 Agree |
1125 |
10,0 |
15,3 |
20,5 |
|
3 Disagree |
3279 |
29,2 |
44,5 |
65,0 |
|
4 Strongly disagree |
2583 |
23,0 |
35,0 |
100,0 |
|
Total |
7370 |
65,6 |
100,0 |
|
Missing |
7 N/A |
3773 |
33,6 |
|
|
|
8 Invalid |
18 |
,2 |
|
|
|
9 Missing |
68 |
,6 |
|
|
|
Total |
3859 |
34,4 |
|
|
Total |
11229 |
100,0 |
|
|
Calcul des indices
... et on refait des indices interprétables (moyenne des réponses pour chaque item) avec l'outil "Transform -> Compute variable" en SPSS
Pour l'anxiété il y a 5 variables
- X_Math_anx = MEAN(ST42Q08,ST42Q05,ST42Q03,ST42Q10,ST42Q01)
Pour l'intéret il y a 4 variables
- X_Math_interest = MEAN(ST29Q04,ST29Q01,ST29Q06,ST29Q03)
- Corrélation entre notre indicateur simpliste X_Math_anx et l'official "Mathematics Anxiety" = 0.991
- Corrélation entre notre indicateur simpliste X_Math_interest et l'official "Mathematics Interest" = 0.998
Autrement dit, on peut substituer l'indice de type Maximum Likelihood/Rasch avec un simple indice fait avec des moyennes sans se faire massacrer par les théoriciens du item reponse. L'avantage de notre indice est qu'il est plus facilement interprétable ...
Résultat descriptives
Item par item....
Statistics |
||||||
|
ST29Q04 Maths Interest - Enjoy Maths |
ST29Q01 Maths Interest - Enjoy Reading |
ST29Q06 Maths Interest - Interested |
ST29Q03 Maths Interest - Look Forward to Lessons |
ST42Q08 Maths Anxiety - Feel Helpless |
|
N |
Valid |
7358 |
7412 |
7384 |
7376 |
7351 |
|
Missing |
3871 |
3817 |
3845 |
3853 |
3878 |
Mean |
2,59 |
3,09 |
2,37 |
2,79 |
2,95 |
|
Median |
3,00 |
3,00 |
2,00 |
3,00 |
3,00 |
|
Std. Deviation |
,971 |
,829 |
,881 |
,912 |
,894 |
|
Range |
3 |
3 |
3 |
3 |
3 |
|
Minimum |
1 |
1 |
1 |
1 |
1 |
|
Maximum |
4 |
4 |
4 |
4 |
4 |
Statistics |
|||||
|
ST42Q05 Maths Anxiety - Get Very Nervous |
ST42Q03 Maths Anxiety - Get Very Tense |
ST42Q10 Maths Anxiety - Worry About Getting Poor <Grades> |
ST42Q01 Maths Anxiety - Worry That It Will Be Difficult |
|
N |
Valid |
7370 |
7345 |
7356 |
7375 |
|
Missing |
3859 |
3884 |
3873 |
3854 |
Mean |
3,09 |
2,98 |
2,37 |
2,49 |
|
Median |
3,00 |
3,00 |
2,00 |
2,00 |
|
Std. Deviation |
,838 |
,896 |
1,023 |
,946 |
|
Range |
3 |
3 |
3 |
3 |
|
Minimum |
1 |
1 |
1 |
1 |
|
Maximum |
4 |
4 |
4 |
4 |
Voilà les distributions pour nos 2 indices:
- 2=d'accord
- 3=desaccord
... en gros les petits Suisses ont n'ont pas trop d'intérêt pour les maths, mail ils n'ont pas très peur non plus. Notez toutefois un écart-type assez élevé.
Régression et nuage de points
Variable dépendante: X_Math_anx Variable indépendante: X_Math_interest
Model Summary |
||||
Model |
R |
R Square |
Adjusted R Square |
Std. Error of the Estimate |
1 |
,346a |
,120 |
,120 |
,63991 |
Coefficientsa |
||||||
Model |
Unstandardized Coefficients |
Standardized Coefficients |
t |
Sig. |
||
|
B |
Std. Error |
Beta |
|
|
|
1 |
(Constant) |
3,558 |
,039 |
|
90,852 |
,000 |
|
X_Math_interest |
-,307 |
,014 |
-,346 |
-22,424 |
,000 |
a. Dependent Variable: X_Math_anx |
Interprétation:
- La prédiction reste très faible. Le modèle n'explique que 12% de l'angoisse.
- En augmentant un point sur l'échelle intérêt(très d'accord - d'accord - pas d'accord - pas du tout d'accord) on diminue de 30% l'angoisse sur une même échelle.
Reformulé: L'intérêt des jeunes Suisses pour les Maths prédit assez mal leur peur des maths. Plus ils sont d'accord d'être désintéresses, plus ils sont (faiblement) d'accord qu'ils ont peur.