Analyse de régression avec SPSS

De EduTech Wiki
Aller à : navigation, rechercher

Pour le moment, cet article explique:

  • Comment sortir des graphiques qui affichent une droite de régression (simple)
  • Comment calculer des variables composites (indices) à partir de batteries de questions de type Lickert.

Voir aussi:

1 Créer un nuage de points

Comment visualiser une simple régression linéraire avec SPSS ?

1.1 Modèle exemple

PISA 2012, élèves Suisses.

Question: Est-ce qu'on prédire l'angoisse des maths avec l'intérêt pour les maths ?

x = intérêt pour les maths (var explicative)
y = angoisse des maths (à expliquer)


Model Summary

Model

R

R Square

Adjusted R Square

Std. Error of the Estimate

1

,339a

,115

,115

,91096

a. Predictors: (Constant), Mathematics Interest


Coefficientsa

Model

Unstandardized Coefficients

Standardized Coefficients

t

Sig.


B

Std. Error

Beta



1

(Constant)

-,154

,015


-10,268

,000


Mathematics Interest

-,330

,015

-,339

-21,870

,000

a. Dependent Variable: Mathematics Anxiety

1.2 L'outil Chart Builder

En Anglais:

  • Menu Charts -> Chart Builder

En français:

  • Menu Graphiques -> Générateur de graphiques
Scatterplot (Nuage de points) avec l'outil Chart Builder

1.3 Ajouter la droite de régression linéaire avec l'outil Chart Editor

  • Une fois que vous avez produit un graphique avec le générateur de graphiques, il faut double cliquer dessus (donc pas dans le chartbuilder, mais dans la sortie !!!)
  • Vous voyez maintenant le Chart Editor, un outil qui vous permet de manipuler tous les graphiques produits par SPSS. Encore fois: Cet outil n'est pas dans le menu, il faut double-cliquer sur une sortie !
  • Choisir l'icône Add Fit line at total (Ajouter une courbe d'ajustement au total). Une fenêtre "propriétés" va apparaître
  • Dans la fenêtre propriétés, choisir "linéraire" (c.f. copie d'écran suivante)
Ajouter une droite de régression avec l'outil d'édition de graphiques


Choisir le type de régression dans les propriétés de l'outil d'édition de graphiques

1.4 Résultat

Effectivement: quand on a plus d'intérêt pour les maths, on a moins peur (donc c'est une relation statistique, ce qui ne vaut pas cause....)

Scatterplot (Nuage de points) avec l'outil d'édition de graphiques

On peut aussi créer des graphiques un peu plus sophistiqués:

1.5 Pour aller plus loin

Dans l'outil "Chars -> Chart Builder " choisir "Grouped scatter" au lieu de "simple scatter". Ensuite ajouter une variable catégorielle (gender ici).

Nuage de points avec régression linéaire et une variable catégorielle

Résultat: Chez les filles, l'effet est un peu plus fort.

  • Dans le Chart editor ajouté des courbes: Add fit lines to subgroupes. Choisir "Loess".
  • Aggrandi le graphique
Nuage de points avec régression linéaire et 2 non-linar fits pour garçons et filles

2 Refaire les indices pour obtenir des régressions interprétables

Les indices PISA sont difficiles à interpréter car ils sont (1) standardisés et (2) calculés avec une méthode de prédiction probabiliste. Donc je conseille de les refaire plus simplement, même s'il peut y avoir des objections méthodologiques:

2.1 Les items PISA

Les 2 groupes de variables pour l'intérêt et l'angoisse des maths sont mesurées avec une simple échelle Likert:

Exemple item intérêt

ST29Q04 Maths Interest - Enjoy Maths


Frequency

Percent

Valid Percent

Cumulative Percent

Valid

1 Strongly agree

1037

9,2

14,1

14,1


2 Agree

2475

22,0

33,6

47,7


3 Disagree

2305

20,5

31,3

79,1


4 Strongly disagree

1541

13,7

20,9

100,0


Total

7358

65,5

100,0


Missing

7 N/A

3753

33,4




8 Invalid

40

,4




9 Missing

78

,7




Total

3871

34,5



Total

11229

100,0



Exemple item angoisse

ST42Q05 Maths Anxiety - Get Very Nervous


Frequency

Percent

Valid Percent

Cumulative Percent

Valid

1 Strongly agree

383

3,4

5,2

5,2


2 Agree

1125

10,0

15,3

20,5


3 Disagree

3279

29,2

44,5

65,0


4 Strongly disagree

2583

23,0

35,0

100,0


Total

7370

65,6

100,0


Missing

7 N/A

3773

33,6




8 Invalid

18

,2




9 Missing

68

,6




Total

3859

34,4



Total

11229

100,0



2.2 Calcul des indices

... et on refait des indices interprétables (moyenne des réponses pour chaque item) avec l'outil "Transform -> Compute variable" en SPSS

Pour l'anxiété il y a 5 variables

X_Math_anx = MEAN(ST42Q08,ST42Q05,ST42Q03,ST42Q10,ST42Q01)

Pour l'intéret il y a 4 variables

X_Math_interest = MEAN(ST29Q04,ST29Q01,ST29Q06,ST29Q03)
Corrélation entre notre indicateur simpliste X_Math_anx et l'official "Mathematics Anxiety" = 0.991
Corrélation entre notre indicateur simpliste X_Math_interest et l'official "Mathematics Interest" = 0.998

Autrement dit, on peut substituer l'indice de type Maximum Likelihood/Rasch avec un simple indice fait avec des moyennes sans se faire massacrer par les théoriciens du item reponse. L'avantage de notre indice est qu'il est plus facilement interprétable ...

2.3 Résultat descriptives

Item par item....

Statistics


ST29Q04 Maths Interest - Enjoy Maths

ST29Q01 Maths Interest - Enjoy Reading

ST29Q06 Maths Interest - Interested

ST29Q03 Maths Interest - Look Forward to Lessons

ST42Q08 Maths Anxiety - Feel Helpless

N

Valid

7358

7412

7384

7376

7351


Missing

3871

3817

3845

3853

3878

Mean

2,59

3,09

2,37

2,79

2,95

Median

3,00

3,00

2,00

3,00

3,00

Std. Deviation

,971

,829

,881

,912

,894

Range

3

3

3

3

3

Minimum

1

1

1

1

1

Maximum

4

4

4

4

4

Statistics


ST42Q05 Maths Anxiety - Get Very Nervous

ST42Q03 Maths Anxiety - Get Very Tense

ST42Q10 Maths Anxiety - Worry About Getting Poor <Grades>

ST42Q01 Maths Anxiety - Worry That It Will Be Difficult

N

Valid

7370

7345

7356

7375


Missing

3859

3884

3873

3854

Mean

3,09

2,98

2,37

2,49

Median

3,00

3,00

2,00

2,00

Std. Deviation

,838

,896

1,023

,946

Range

3

3

3

3

Minimum

1

1

1

1

Maximum

4

4

4

4

Voilà les distributions pour nos 2 indices:

2=d'accord
3=desaccord
Intérêt des maths
Angoisse pour les maths

... en gros les petits Suisses ont n'ont pas trop d'intérêt pour les maths, mail ils n'ont pas très peur non plus. Notez toutefois un écart-type assez élevé.

2.4 Régression et nuage de points

Variable dépendante: X_Math_anx Variable indépendante: X_Math_interest

Model Summary

Model

R

R Square

Adjusted R Square

Std. Error of the Estimate

1

,346a

,120

,120

,63991


Coefficientsa

Model

Unstandardized Coefficients

Standardized Coefficients

t

Sig.


B

Std. Error

Beta



1

(Constant)

3,558

,039


90,852

,000


X_Math_interest

-,307

,014

-,346

-22,424

,000


a. Dependent Variable: X_Math_anx

Interprétation:

La prédiction reste très faible. Le modèle n'explique que 12% de l'angoisse.
En augmentant un point sur l'échelle intérêt(très d'accord - d'accord - pas d'accord - pas du tout d'accord) on diminue de 30% l'angoisse sur une même échelle.

Reformulé: L'intérêt des jeunes Suisses pour les Maths prédit assez mal leur peur des maths. Plus ils sont d'accord d'être désintéresses, plus ils sont (faiblement) d'accord qu'ils ont peur.

Nuage de points avec régression linéaire