« Catégories et codes dans l'analyse qualitative » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
Ligne 49 : Ligne 49 :
* Utilisez des catégories claires et opérationnelles
* Utilisez des catégories claires et opérationnelles
* Utilisez deux ou trois codeurs (vous et d'autres chercheurs) et calculez un indice d’intercodage. S’il est bas, vous devrez revoir votre schéma de codage.
* Utilisez deux ou trois codeurs (vous et d'autres chercheurs) et calculez un indice d’intercodage. S’il est bas, vous devrez revoir votre schéma de codage.
Il existe plusieurs formules pour calculer la fidélité inter-codeurs, dont la plus simple est:
Il existe plusieurs formules pour calculer la fidélité inter-codeurs, dont la plus simple est celle proposée par Miles & Huberman (2003):


: <code>Fiabilité= nombre d’arrangements de codage/nombre total de codes (accords plus désaccords)</code>
: <code> Fiabilité = nombre d’accords / (nombre total d’accords + nombre total de désaccords)  
Miles & Huberman (2003) proposent la formule suivante:
</code>


Il existe également des logiciels, comme [http://cat.texifter.com/ CAT], qui permettent de calculer statistiquement la fiabilité du codage à l'aide du [https://fr.wikipedia.org/wiki/Kappa_de_Fleiss Kappa de Fleiss] lorsqu'il y a plus de deux codeurs mais l'interprétation reste controversée.
Il existe également des logiciels, comme [http://cat.texifter.com/ CAT], qui permettent de calculer statistiquement la fiabilité du codage à l'aide du [https://fr.wikipedia.org/wiki/Kappa_de_Fleiss Kappa de Fleiss] lorsqu'il y a plus de deux codeurs mais l'interprétation reste controversée.

Version du 15 avril 2016 à 13:50

Manuel de recherche en technologie éducative
Module: Analyse de données qualitatives
◀▬▬▶
2016/04/15

Le codage

La première étape de l’analyse des données qualitatives est le codage. Un code est une étiquettes (ou label ou balise ou tag) utilisé pour marquer une variable (concept) et/ou une valeur trouvée dans un texte. Comme nous l’avons mentionné précédemment, l’avantage du codage est qu’il permet de trouver toutes les informations sur les variables intéressantes pour votre recherche. De plus, il améliore la fiabilité de votre recherche.

Le principe de base de la technique du codage est assez simple:

  1. Un code est assigné à chaque (sous)catégorie, i.e. chaque variable théorique avec laquelle vous travaillez. En d’autres termes, vous devez identifier des noms de variables
  2. En outre, vous pouvez assigner pour chaque code un ensemble de variables possibles, e.g. positives/neutres/négatives
  3. Vous devrez ensuite passer en revue systématiquement tous vos textes (documents, entretiens, transcriptions, dialogue enregistrés, etc.) et marquer toutes les occurrences de variables.
  4. Il existe plusieurs stratégies de codages très différentes:
  • Création de manuels de codage (codebooks) en partant de votre théorie
  • Codage par induction (selon la théorie ancrée)
  • Codage hybride (demi-codebook, demi-inductif)
  • Codage par catégories ontologiques

Tableau 15: Principes de codage pour les données qualitatives


Le moyen le plus sûr et le plus fiable de coder est d’utiliser un logiciel spécialisé, e.g. Atlas ou Nivo, mais cela nécessite beaucoup de temps! Pour des travaux plus petits (e.g. un mémoire de master), nous suggérons de marquer simplement les textes sur papier au moyen de la méthode suivante:

  1. Vous pouvez faire des photocopies réduites des textes pour gagner un peu d’espace dans les marges.
  2. Soulignez ou entourez les éléments de texte que vous pouvez lier à une variable, puis écrivez le code dans la marge. Utilisez un stylo effaçable.
  3. Assurez-vous de passer en revue les différents codes et autre marques que vous pourriez laisser sur le papier.

En ce qui concerne l’étiquetage de codes, nous suggérons de procéder de la façon suivante:

  • N’utilisez pas de longues listes de codes «à plat», mettez en place une hiérarchie (selon les dimensions identifiées)
  • Chaque code doit être court et mnémotechnique (optimisez). E.g. pour coder «catégorie principale» – «sous-catégorie» («valeur»), utiliser un code tel que:
CE-CLIM(+)
Au lieu de:
contexte externe - climat (positif)
  • Ne commencez jamais à coder sans avoir une idée de votre stratégie de codage. Soit votre code-book est déterminé par vos questions de recherche et vos théories associées, cadres et grilles d’analyse; soit vous apprenez vraiment à utiliser une stratégie inductive telle que la «théorie ancrée» (voir ci-dessous).

Fiabilité de codage

Assigner un code à un segment de texte n’est pas toujours évident et coder des passages similaires exactement de la même manière l’est encore moins. En d’autres termes, la question de la fiabilité du codage se pose.

Il y a deux façons d’améliorer la fiabilité:

  • Utilisez des catégories claires et opérationnelles
  • Utilisez deux ou trois codeurs (vous et d'autres chercheurs) et calculez un indice d’intercodage. S’il est bas, vous devrez revoir votre schéma de codage.

Il existe plusieurs formules pour calculer la fidélité inter-codeurs, dont la plus simple est celle proposée par Miles & Huberman (2003):

Fiabilité = nombre d’accords / (nombre total d’accords + nombre total de désaccords)


Il existe également des logiciels, comme CAT, qui permettent de calculer statistiquement la fiabilité du codage à l'aide du Kappa de Fleiss lorsqu'il y a plus de deux codeurs mais l'interprétation reste controversée.

Création et gestion d’un codebook

Création d’un codebook selon la théorie

Dans cette stratégie de codage, la liste de variables (et leurs codes) est définie par l’intermédiaire d’un raisonnement théorique (e.g. cadres analytiques, grilles d’analyse) et par conséquent également par des concepts que vous avec utilisé pour formuler vos questions de recherche et/ou vos hypothèses. Voici une partie d’un codebook d’études en innovation (environ 100 codes):

Catégories Codes Références théoriques
propriétés de l’innovation PI .... (remplissez pour votre propre codebook).....
contexte externe CE
démographie CE-D
soutien pour la réforme CE-S
contexte interne CI
processus d’adoption PA
chronologie officielle PA-CO
dynamique du site étudié DS
assistance externe et interne AEI
liens de causalité LC

Tableau 16: codebook d’études en innovation (extrait)

Avant de penser à votre propre codebook, vous devez vraiment passer en revue la littérature pertinente et essayer de trouver des codebooks existants (qu’il vous faudra peut-être adapter). E.g. ci-dessous se trouve un exemple d’utilisation de codes pour l’analyse des types de problèmes professionnels d’enseignants en informatique turcs (Deryakulu & Olkun, 2007).

  1. Conflit de rôle

  2. Procédures d’initiation des enseignants inadéquates

  3. Absence d’infrastructures technologiques et de soutien technique requis

  4. Statut de l’informatique dans le programme scolaire

  5. Absence d’appréciation et de retours favorables des collègues

  6. Absence de soutien des administrateurs

  7. Evolution rapide des connaissances nécessaires pour l’enseignement de l’informatique

  8. Absence de programme informatique cohérent

  9. Absence de programmes de formation des enseignants avant leur entrée en fonction

  10. Classes très grandes

  11. Etudiants indifférents

  12. Inspection et supervision inadéquates

Codage par induction conformément à la théorie ancrée

La théorie ancrée (Glaser, Strauss) correspond à un ensemble d’approches qui se focalisent sur l’interprétation et sur la construction de théories, i.e. c’est une approche totalement inductive. Le chercheur commence par coder un petit ensemble de données puis augmente l’échantillon en fonction des questions théoriques qui apparaissent. Les catégories (codes) peuvent être révisées à tout moment.

La théorie ancrée commence avec une situation de recherche. Au sein de cette situation, votre tâche, en tant que chercheur, consiste à comprendre ce qui se passe, comment les acteurs remplissent leurs rôles. Vous ferez cela principalement par l’intermédiaire d’observations, de conversations et d’entretiens. Après chaque période de collecte de données, vous devez noter les éléments clés: j’ai étiqueté cela comme «prise de notes».

La comparaison constante est le cœur du processus. Dans un premier temps vous devez comparer les interviews (ou d’autres données). La théorie prend forme rapidement. Lorsque c’est le cas, comparez les données à la théorie. Les résultats de cette comparaison sont écrits dans la marge comme du codage. Votre tâche consiste à identifier les catégories (qui correspondent à peu près aux thèmes ou aux variables) et leurs propriétés (leurs sous-catégories).

Théorie ancrée: un schéma concis, extrait le 15 octobre 2008.

Le codage de phénomènes s’effectue à la fois de façon isolée et avec des relations (codage axial). Les catégories d’observation abstraites suivantes pourraient constituer un point de départ pour le codage axial.

  • conditions (causes d’un phénomène perçu)
  • interactions entre les acteurs
  • stratégies et tactiques utilisées par les acteurs
  • conséquences des actions

Pour utiliser cette approche, vous devez vraiment vous documenter, car en tant que débutant, vous pouvez facilement tomber dans un piège, en particulier les biais de sélection et de confirmation, i.e. vous regardez uniquement les choses qui vous intéressent pour une raison ou pour une autre.

Codage par catégories ontologiques

Au lieu de créer initialement un codebook à partir de variables trouvées dans vos questions de recherche ou un codage «inductif» dans le contexte de la théorie ancrée, il est possible de commencer en créant ou en utilisant un vocabulaire pour un domaine donné. Cette stratégie est un compromis entre la théorie ancrée et la méthode axée sur la théorie que nous avons présentée initialement.

Le tableau suivant comprend une liste d’éléments que vous pouvez observer dans une organisation (Bogdan et Biklen, cité par Miles & Huberman: 1994 61)

Types Explication
Contexte/situation information sur le contexte
Définition de la situation interprétation par les gens de la situation analysée
Perspectives façons globales de voir la situation
Façons de voir gens et objets perception détaillée de certains éléments
Processus séquences d’événements, flux, transitions, points de changements, etc.
Activités structures des comportements réguliers
Evénements activités spécifiques (non régulières)
Stratégies façon d’attaquer un problème (stratégies, méthodes, techniques)
Relations et structure sociale liens informels
Méthodes commentaires du chercheur sur le travail (annotations)

Tableau 17: Les codes Bogdan et Biklen pour analyser des organisations

Dans la littérature, vous trouverez de nombreux autres «schémas explicatifs». En technologie éducative, par exemple, il existe plusieurs codebooks relativement simples pour l’analyse de conversations et de groupes de discussion asynchrones (forums). De Wever et al. (2006) fournissent un bon aperçu global. Certains schémas de code sont simples. E.g. Cobos et Pifarré (2008) ont analysé la «construction collaborative de connaissances sur internet» avec le schéma de codage suivant:

Code explication exemple
Explication Demande à clarifier certaines parties du document Le lien suivant, qui apparaît dans votre document, ne fonctionne pas à présent, mais était-ce le cas il y a une semaine?
Support Exprime un accord explicite avec les idées du document ou l’organisation des informations J’estime que ce document est très utile et facile à lire
Ajouts Suggère des ajouts au document: idées, opinions ou organisation des informations Je pense qu’il conviendrait d’ajouter un index des différentes parties de l’article
Suppression Suggère des suppressions du document: idées, opinions ou organisation des informations Le résumé contient des exemples; étaient-ils vraiment nécessaires?
Correction Suggère des changements au document. Ils se rapportent à des idées, à des opinions ou à l’organisation des informations Je pense que la conclusion du premier paragraphe contient une erreur: «moteur» devrait être «motivation».

Tableau 18: Codebook pour la «construction collaborative de connaissances sur internet»

Pena et Nichols (2004) ont utilisé les catégories suivantes pour analyser les interactions entre étudiants et la construction de signification dans les discussions d’un système de bulletins électroniques:

  • Questions
  • Réponse
  • Clarification
  • Interprétation
  • Conflit
  • Affirmation
  • Construction de consensus
  • Jugement
  • Réflexion
  • Support
  • Autres

Il existe des codebooks plus complexes: à titre d’exemple, voici un résumé des messages d’étudiants dans le codebook d’Eilon et Kliachko (2004).

Groupe «Niveau A» Ces catégories indiquent la construction de connaissances et une contribution significative à l’apprentissage par pairs
Compréhension Fournit une preuve écrite de la compréhension des sujets étudiés par les catégories suivantes:
Reproduction- 1 Reproduit les points, les idées, les arguments ou les messages principaux trouvés dans les informations entrantes en référence à leur source et avec une évaluation critique.
Direction Redirige les autres aux sources pertinentes pour les sujets étudiés (imprimés et en ligne).
Clarifiaction par questions Localise les domaines ambigus, difficiles ou problématiques dans le nouveau matériel. Décrit le contexte de la question et la raison de la poser.
Clarification par réponses Fournit des explications et des réponses correctes, pertinentes et complètes. Fonde les réponses sur les informations récupérées tout en critiquant ses origines.
Réflexion Fournit des preuves écrites des processus métacognitifs que l’apprenant applique lorsqu’il étudie de nouveaux sujets dans les catégories suivantes:
Liens/diffusion Combine les nouvelles informations avec ses connaissances préalables. Transmet les nouvelles connaissances aux autres domaines, en particulier les problèmes STS.
Evaluation critique Evalue les nouvelles informations de façon critique.
Transformation Applique les nouvelles informations d’une façon originale et créative, établit des inférences, donne des exemples originaux.
Groupe «Niveau B» Ces catégories indiquent une contribution probable à l’apprentissage par pairs, par les catégories suivantes:
Documentation Documente les expériences relatives à l’apprentissage ou les contributions individuelles au groupe.
Reproduction- 2 Reproduit les points, les idées, les arguments ou les messages principaux trouvés dans les informations entrantes sans évaluation de ces dernières ou ajouts originaux.
Résultats d’apprentissage Présente le groupe et les résultats individuels d’apprentissage.
Questions/réponses techniques Questions ou remarques à propos de tout sujet qui n’est pas en lien direct avec la compréhension des sujets étudiés.
Connaissance personnelle Présente les connaissances personnelles ou les expériences de la vie de tous les jours.
Groupe «Niveau C» Ces catégories indiquent aucune contribution (ou contribution contraire) à l’apprentissage par pairs, par les catégories suivantes:
Questions non pertinentes/non expliquées Pose des questions sans donner de contexte ou de raisons pour les poser.
Citations ponctuelles Inclut des citations sans leur contexte et sans explication.
Réponses non pertinentes/sans réponse Fournit des réponses non pertinentes ou incorrectes aux questions envoyées par d’autres étudiants.
Commentaires émotionnels/personnels Inclut des commentaires personnels, qui auraient dû être envoyés par e-mail, comme l’a demandé l’enseignant.

Tableau 19: codebook des messages d’étudiants (Elion et Kliachko, 2004)

Codes de deuxième niveau (de type pattern)

Certains chercheurs codent également des patrons (relations). Alors que le codage simple (ci-dessus) transforme les données en atomes (catégories), le codage pour révéler des patterns identifie les relations entre les atomes. Le codage pour révéler des patterns est également l’une des étapes de la théorie ancrée inductive. Le but ultime est de détecter (et de coder) des régularités, mais également des variations et des singularités.

Voici quelques opérations suggérées:

  1. Détection de co-présence entre deux valeurs de deux variables:
    • E.g. les personnes favorables à une nouvelle technologie (e.g. TIC en classe) ont tendance à l’utiliser.
  2. Détection d’exceptions
    • E.g. les enseignants favorables à la technologie mais qui ne l’utilisent pas en classe.
    • Dans ce cas, vous pouvez introduire une nouvelle variable pour expliquer l’exception, e.g. l’attitude du supérieur hiérarchique, de l’administration, un conflit de but (la culture du groupe s’y oppose), etc.
    • Les exceptions peuvent également provoquer un changement de niveau d’analyse (de l’individu à l’organisation)

Attention: comme dans l’analyse statistique, la co-présence ne prouve pas la causalité.