Statistiques descriptives et échelles

De EduTech Wiki
Version datée du 30 mai 2019 à 09:39 par Marc Metziger (discussion | contributions) (→‎Types de variables quantitatives)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche
Manuel de recherche en technologie éducative
Page d'entrée du module
Statistiques descriptives et échelles
▬▶
brouillon débutant
2019/05/30 ⚒⚒ 2015/08/27
Autres pages du module

Introduction

Ce chapitre présentera d'abord les types de variables, ensuite les statistiques descriptives simples, la préparation de données, et finalement la construction d'échelles simples.

L'objectif des statistiques descriptives est de résumer les distributions de données. Il sont surtout utiles pour accompagner des analyses qualitatives. Dans un design quantitatif, elles servent principalement à vérifier et/ou connaître la population analysée. En outre, les statistiques descriptives (en particulier la moyenne et l'écart-type) sont à la base de la plupart des techniques d'analyse statistique "classiques" que l'on abordera en partie dans le module suivant.

Objectifs d'apprentissage

  • Comprendre le concept de variable statistique comparé à celui de variable théorique.
  • Etre capable de faire la distinction entre les trois principaux types de données.
  • Identifier, interpréter et utiliser des mesures simples de tendance centrale et de dispersion.
  • Etre capable de créer et d'interpréter des graphiques de distribution simples.
  • Comprendre quelques principes de la préparation de données.
  • Etre capable de créer des échelles additives simples.

Types de variables et de données

L'analyse de données quantitatives concerne les nombres, i.e. les quantités variables qui sont recueillies au moyen de différentes mesures. On peut citer comme exemples les questionnaires de sondage, les tests, les conditions expérimentales ou les observations plus qualitatives qui ont été transformées en nombres. Les variables statistiques sont ce qu'on mesure avec différentes méthodes (e.g. questions de sondage, items de test, observations, éléments de données enregistrées par le système), et ce qu'on manipule, e.g. deux conditions expérimentales.

Un des principaux objectifs de l'analyse statistique est de résumer la structure que l'on peut trouver dans les données. Une première étape dans l'analyse de données statistique est de résumer la distribution des variables, et une deuxième étape consiste à calculer les indices de plusieurs variables qui mesurent un concept théorique unique.

Rappelons tout d'abord la distinction entre variables dépendantes et indépendantes:

  • Les variables indépendantes sont des mesures ou des conditions qu'on utilisera afin d'expliquer (i.e. prédire) d'autres variables
  • Les variables dépendantes sont celles qui sont expliquées par les variables indépendantes

Les statistiques descriptives ne font pas de différence entre ces variables. A vous de décider quelles variables devraient expliquer quelque chose et ce qu'elles devraient expliquer.

Types de variables quantitatives

Il existe différents types ou formes de données quantitatives. Selon le type de données, vous pouvez ou ne pouvez pas effectuer certaines sortes d'analyses. Il existe trois types de données de base et la littérature recourt à différents noms pour désigner ces derniers:

Taxonomie des types de données quantitatives
Types de mesures Description Exemples
nominales ou catégories énumération de catégories homme, femme

région A, région B,

widget interactif A, widget interactif B

ordinales échelles ordonnées 1er, 2ème, 3ème

oui/non

rarement/occasionnellement/...

intervalles ou quantitatives

(ou "échelle" dans SPSS)

mesure avec un intervalle 1, 10, 5, 6 (sur une échelle allant de 1 à 10)

indice

180 cm, 160 cm, 170 cm

Dans les designs de recherche quantitatifs, il n'est pas très intéressant de présenter des statistiques descriptives. Cependant, elles jouent un rôle important dans les premières étapes de l'analyse de données, e.g. vous pouvez vérifier les distributions de données et prendre des décisions plus avisées sur les techniques d'analyse de données inférentielle.

Par ailleurs, on utilise souvent les statistiques descriptives pour comparer différents cas dans les designs de systèmes comparatifs, ou pour résumer les données qualitatives dans des études plus qualitatives. Dans tous les cas, évitez de remplir les pages de votre thèse avec des quantités astronomiques de diagrammes Excel!

Récapitulons. Les statistiques descriptives ont deux principaux rôles dans l'analyse des données:

  • résumer un ensemble de variables pour les comparer par-delà les systèmes, e.g. comparer le niveau de culture scientifique d'un pays avec une moyenne de l'OCDE.
  • résumer un ensemble de données de façon à faciliter la sélection de techniques appropriées pour analyser les relations entre les variables (statistiques inférentielles).

De plus, les coefficients (nombres qui résument les informations) des statistiques descriptives sont à la base de statistiques plus avancées, e.g. les modèles de relations causales ou les techniques de réduction multidimensionnelle des données.