Analyse de régression avec SPSS

Cet article est incomplet.

Il est jugé trop incomplet dans son développement ou dans l'expression des concepts et des idées. Son contenu est donc à considérer avec précaution.

Cet article explique

Comment faire des simples analyses de régression avec SPSS !
Comment sortir des graphiques
Comment calculer des variables composites (indices) à partir de batteries de questions de type Lickert.

Voir aussi:

Analyse de régression et corrélations de Pearson (principes)

Créer un nuage de points

Comment visualiser une simple régression linéraire avec SPSS ?

Modèle exemple

PISA 2012, élèves Suisses.

Question: Est-ce qu'on prédire l'angoisse des maths avec l'intérêt pour les maths ?

x = intérêt pour les maths (var explicative)

y = angoisse des maths (à expliquer)

Model Summary
Model	R	R Square	Adjusted R Square	Std. Error of the Estimate
1	,339^a	,115	,115	,91096
a. Predictors: (Constant), Mathematics Interest

Coefficients^a
Model		Unstandardized Coefficients		Standardized Coefficients	t	Sig.
		B	Std. Error	Beta
1	(Constant)	-,154	,015		-10,268	,000
	Mathematics Interest	-,330	,015	-,339	-21,870	,000
a. Dependent Variable: Mathematics Anxiety

L'outil Chart Builder

En Anglais:

Menu Charts -> Chart Builder

En français:

Menu Graphiques -> Générateur de graphiques

Scatterplot (Nuage de points) avec l'outil Chart Builder

Ajouter la droite de régression linéaire avec l'outil Chart Editor

Une fois que vous avez produit un graphique avec le générateur de graphiques, il faut double cliquer dessus (donc pas dans le chartbuilder, mais dans la sortie !!!)
Vous voyez maintenant le Chart Editor, un outil qui vous permet de manipuler tous les graphiques produits par SPSS. Encore fois: Cet outil n'est pas dans le menu, il faut double-cliquer sur une sortie !
Choisir l'icône Add Fit line at total (Ajouter une courbe d'ajustement au total). Une fenêtre "propriétés" va apparaître
Dans la fenêtre propriétés, choisir "linéraire" (c.f. copie d'écran suivante)

Ajouter une droite de régression avec l'outil d'édition de graphiques

Choisir le type de régression dans les propriétés de l'outil d'édition de graphiques

Résultat

Effectivement: quand on a plus d'intérêt pour les maths, on a moins peur (donc c'est une relation statistique, ce qui ne vaut pas cause....)

Scatterplot (Nuage de points) avec l'outil d'édition de graphiques

On peut aussi créer des graphiques un peu plus sophistiqués:

Pour aller plus loin

Dans l'outil "Chars -> Chart Builder " choisir "Grouped scatter" au lieu de "simple scatter". Ensuite ajouter une variable catégorielle (gender ici).

Nuage de points avec régression linéaire et une variable catégorielle

Résultat: Chez les filles, l'effet est un peu plus fort.

Dans le Chart editor ajouté des courbes: Add fit lines to subgroupes. Choisir "Loess".
Aggrandi le graphique

Nuage de points avec régression linéaire et 2 non-linar fits pour garçons et filles

Refaire les indices pour obtenir des régressions interprétables

Les indices PISA sont difficiles à interpréter car ils sont (1) standardisés et (2) calculés avec une méthode de prédiction probabiliste. Donc je conseille de les refaire plus simplement, même s'il peut y avoir des objections méthodologiques:

Les items PISA

Les 2 groupes de variables pour l'intérêt et l'angoisse des maths sont mesurées avec une simple échelle Likert:

Exemple item intérêt

ST29Q04 Maths Interest - Enjoy Maths
		Frequency	Percent	Valid Percent	Cumulative Percent
Valid	1 Strongly agree	1037	9,2	14,1	14,1
	2 Agree	2475	22,0	33,6	47,7
	3 Disagree	2305	20,5	31,3	79,1
	4 Strongly disagree	1541	13,7	20,9	100,0
	Total	7358	65,5	100,0
Missing	7 N/A	3753	33,4
	8 Invalid	40	,4
	9 Missing	78	,7
	Total	3871	34,5
Total		11229	100,0

Exemple item angoisse

ST42Q05 Maths Anxiety - Get Very Nervous
		Frequency	Percent	Valid Percent	Cumulative Percent
Valid	1 Strongly agree	383	3,4	5,2	5,2
	2 Agree	1125	10,0	15,3	20,5
	3 Disagree	3279	29,2	44,5	65,0
	4 Strongly disagree	2583	23,0	35,0	100,0
	Total	7370	65,6	100,0
Missing	7 N/A	3773	33,6
	8 Invalid	18	,2
	9 Missing	68	,6
	Total	3859	34,4
Total		11229	100,0

Calcul des indices

... et on refait des indices interprétables (moyenne des réponses pour chaque item) avec l'outil "Transform -> Compute variable" en SPSS

Pour l'anxiété il y a 5 variables

X_Math_anx = MEAN(ST42Q08,ST42Q05,ST42Q03,ST42Q10,ST42Q01)

Pour l'intéret il y a 4 variables

X_Math_interest = MEAN(ST29Q04,ST29Q01,ST29Q06,ST29Q03)

Corrélation entre notre indicateur simpliste X_Math_anx et l'official "Mathematics Anxiety" = 0.991

Corrélation entre notre indicateur simpliste X_Math_interest et l'official "Mathematics Interest" = 0.998

Autrement dit, on peut substituer l'indice de type Maximum Likelihood/Rasch avec un simple indice fait avec des moyennes sans se faire massacrer par les théoriciens du item reponse. L'avantage de notre indice est qu'il est plus facilement interprétable ...

Résultat descriptives

Item par item....

Statistics
		ST29Q04 Maths Interest - Enjoy Maths	ST29Q01 Maths Interest - Enjoy Reading	ST29Q06 Maths Interest - Interested	ST29Q03 Maths Interest - Look Forward to Lessons	ST42Q08 Maths Anxiety - Feel Helpless
N	Valid	7358	7412	7384	7376	7351
	Missing	3871	3817	3845	3853	3878
Mean		2,59	3,09	2,37	2,79	2,95
Median		3,00	3,00	2,00	3,00	3,00
Std. Deviation		,971	,829	,881	,912	,894
Range		3	3	3	3	3
Minimum		1	1	1	1	1
Maximum		4	4	4	4	4

Statistics
		ST42Q05 Maths Anxiety - Get Very Nervous	ST42Q03 Maths Anxiety - Get Very Tense	ST42Q10 Maths Anxiety - Worry About Getting Poor <Grades>	ST42Q01 Maths Anxiety - Worry That It Will Be Difficult
N	Valid	7370	7345	7356	7375
	Missing	3859	3884	3873	3854
Mean		3,09	2,98	2,37	2,49
Median		3,00	3,00	2,00	2,00
Std. Deviation		,838	,896	1,023	,946
Range		3	3	3	3
Minimum		1	1	1	1
Maximum		4	4	4	4

Voilà les distributions pour nos 2 indices:

2=d'accord

3=desaccord

Intérêt des maths

Angoisse pour les maths

... en gros les petits Suisses ont n'ont pas trop d'intérêt pour les maths, mail ils n'ont pas très peur non plus. Notez toutefois un écart-type assez élevé.

Régression et nuage de points

Variable dépendante: X_Math_anx Variable indépendante: X_Math_interest

Model Summary
Model	R	R Square	Adjusted R Square	Std. Error of the Estimate
1	,346^a	,120	,120	,63991

Coefficients^a
Model		Unstandardized Coefficients		Standardized Coefficients	t	Sig.
		B	Std. Error	Beta
1	(Constant)	3,558	,039		90,852	,000
	X_Math_interest	-,307	,014	-,346	-22,424	,000

a. Dependent Variable: X_Math_anx

Interprétation:

La prédiction reste très faible. Le modèle n'explique que 12% de l'angoisse.

En augmentant un point sur l'échelle intérêt(très d'accord - d'accord - pas d'accord - pas du tout d'accord) on diminue de 30% l'angoisse sur une même échelle.

Reformulé: L'intérêt des jeunes Suisses pour les Maths prédit assez mal leur peur des maths. Plus ils sont d'accord d'être désintéresses, plus ils sont (faiblement) d'accord qu'ils ont peur.

Nuage de points avec régression linéaire

Analyse de régression avec SPSS

Sommaire

Créer un nuage de points

Modèle exemple

L'outil Chart Builder

Ajouter la droite de régression linéaire avec l'outil Chart Editor

Résultat

Pour aller plus loin

Refaire les indices pour obtenir des régressions interprétables

Les items PISA

Calcul des indices

Résultat descriptives

Régression et nuage de points

Menu de navigation

Analyse de régression avec SPSS

Créer un nuage de points

Modèle exemple

L'outil Chart Builder

Ajouter la droite de régression linéaire avec l'outil Chart Editor

Résultat

Pour aller plus loin

Refaire les indices pour obtenir des régressions interprétables

Les items PISA

Calcul des indices

Résultat descriptives

Régression et nuage de points

Menu de navigation

Rechercher