Préparation des données quantitatives

De EduTech Wiki
Aller à la navigation Aller à la recherche
Manuel de recherche en technologie éducative
Module: Statistiques descriptives et échelles
◀▬▬▶
brouillon débutant
2015/08/26 ⚒⚒ 2015/08/27

Préparation des données quantitatives

Avant de commencer tout travail d'analyse intéressant, vous devrez effectuer une certaine quantité de travail de préparation, en particulier:

  • Trouver et apprendre à utiliser un programme de statistiques
  • Importer les données et les nettoyer
  • Dresser la documentation (à l'intérieur du programme), e.g. créer des noms et des labels de variables ainsi que d'items de réponse, des valeurs manquantes et une sélection du type de données. Si vous ne faites pas cela correctement, vous le regretterez plus tard...

Programmes de statistiques

Premièrement, vous devriez sélectionner un bon programme de statistiques.

  • Si possible, prévoyez d'utiliser un programme de statistiques du commerce comme SPSS ou Statistica. De cette façon, vous obtiendrez à la fois un soutien sur place et un accès à une énorme gamme de méthodes d'analyse.

Il existe également de bons logiciels gratuits (mais ces programmes sont légèrement plus difficiles à utiliser):

Tout d'abord on mentionnera des logiciels destinés à l'enseignement dans des zones économiquement défavorisés, par exemple:

  • IDAMS Statistical Software, qui est sponsorisé par l'UNESCO

Il existe ensuite certains logiciels gratuits qui permettent de réaliser des analyses que vous ne pouvez pas effectuer avec les logiciels du commerce, e.g. la visualisation avancée des données où des statistiques avancées "dernier cri". Cependant, ces systèmes sont plutôt destinés aux experts. E.g.:

  • R est un langage et un environnement disponible gratuitement pour le calcul statistique et les graphiques, qui fournit une grande variété de techniques statistiques et graphiques: modélisation linéaire et non linéaire, tests statistiques, analyse par séries chronologiques, classification, typologie, etc.

N'utilisez pas de programmes comme Excel. Vous ne ferez que perdre votre temps puisque vous ne pouvez pas même effectuer les statistiques les plus élémentaires requises pour tout travail sérieux. Utilisez des programmes à feuilles de calcul pour les résumés de données simples comme les diagrammes circulaires uniquement si vous considérez que vous pouvez vous en tirer avec ces derniers ou si le principal objet de votre mémoire n'implique aucune sorte d'analyse de données sérieuse.

Documentation des données

Tous les programmes statistiques requièrent que vous documentiez les données. Les étapes minimales de la documentation sont les suivantes:

(1) Entrez les données

  • Attribuez un nombre à chaque item de réponse (prévu quand vous concevez le questionnaire). Si vous importez les données depuis un outil comme "Survey Monkey" il est peut-être nécessaire de recoder (cf. ci-dessous)
  • Nous vous suggérons également d'entrer un code clair pour les valeurs manquantes (pas de réponse), e.g. -1, mais un blanc peut aussi convenir.

(2) Assurez-vous que votre ensemble de données est complet et sans erreurs.

  • Certaines statistiques descriptives simples (minimums, maximums, valeurs manquantes, etc.) peuvent aider à détecter de graves erreurs de codage (e.g. 55 au lieu de 5).

(3) Apprenez comment documenter les données dans votre programme de statistiques

  • Entrez les labels pour les variables, les labels pour les items de réponses, les instructions affichées (e.g. les points décimaux à montrer)
  • Définissez les types de données (intervalles, ordinales or nominales)

Recoder des données

(à faire)

  • Remplacer des chaînes de caractères avec des nombres
  • Inverser des échelles
  • Regrouper des valeurs (éventuellement)