« Catégories et codes dans l'analyse qualitative » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
Aucun résumé des modifications
mAucun résumé des modifications
 
(6 versions intermédiaires par 3 utilisateurs non affichées)
Ligne 11 : Ligne 11 :
(…) Une méthode (celle que nous préférons) consiste à établir une « liste de départ » de codes avant le travail sur le terrain. Cette liste provient du cadre conceptuel, des questions de recherche, hypothèses, zones problématiques et variables clés que le chercheur introduit dans l’étude. (…)  
(…) Une méthode (celle que nous préférons) consiste à établir une « liste de départ » de codes avant le travail sur le terrain. Cette liste provient du cadre conceptuel, des questions de recherche, hypothèses, zones problématiques et variables clés que le chercheur introduit dans l’étude. (…)  


Il existe au moins deux autres méthodes, tout aussi honorables d’élaboration de codes. D’une part, un chercheur plus inductif peut s’opposer à la précodification des données tant qu’il ne les a pas collectées, étudié la façon dont elles fonctionnent ou s’intègrent dans le contexte, et déterminé le nombre de variétés qu’elles présentent. On retrouve là en fait l’approche plus empiriquement « enracinée » défendue par Glaser & Strauss (1967) qui offre de nombreux avantages. Les données coïncident bien avec les codes qui les représentent et on est plus proche d’un « code pratique » que du « code générique tous usages » issu d’une liste de départ préfabriquée. (…)  
Il existe au moins deux autres méthodes, tout aussi honorables d’élaboration de codes. D’une part, un chercheur plus inductif peut s’opposer à la précodification des données tant qu’il ne les a pas collectées, étudié la façon dont elles fonctionnent ou s’intègrent dans le contexte, et déterminé le nombre de variétés qu’elles présentent. On retrouve là en fait l’approche plus empiriquement « enracinée » défendue par Glaser & Strauss (1967) qui offre de nombreux avantages. Les données coïncident bien avec les codes qui les représentent et on est plus proche d’un « code pratique » que du « code générique tous usages » issu d’une liste de départ préfabriquée. (…)  


Une autre possibilité, à mi-chemin entre ces deux approches, est de créer un plan général de codage qui ne soit pas lié au contenu mais indique les grands domaines dans lesquels les codes devront être inductivement conçus »." Miles, M. & Huberman, M. (2003, pp. 112-119). Analyse des données qualitatives. 2e édition. De Boeck Université.
Une autre possibilité, à mi-chemin entre ces deux approches, est de créer un plan général de codage qui ne soit pas lié au contenu mais indique les grands domaines dans lesquels les codes devront être inductivement conçus »." Miles, M. & Huberman, M. (2003, pp. 112-119). Analyse des données qualitatives. 2e édition. De Boeck Université.
Ligne 23 : Ligne 23 :
# Un code est assigné à chaque (sous)catégorie, i.e. chaque variable théorique avec laquelle vous travaillez. En d’autres termes, vous devez identifier des ''noms de variables''
# Un code est assigné à chaque (sous)catégorie, i.e. chaque variable théorique avec laquelle vous travaillez. En d’autres termes, vous devez identifier des ''noms de variables''
# En outre, vous pouvez assigner pour chaque code un ensemble de variables possibles, e.g. ''positives/neutres/négatives''
# En outre, vous pouvez assigner pour chaque code un ensemble de variables possibles, e.g. ''positives/neutres/négatives''
# Vous devrez ensuite passer en revue systématiquement tous vos textes (documents, entretiens, transcriptions, dialogue enregistrés, etc.) et marquer toutes les occurrences de variables.
# Vous devrez ensuite passer en revue systématiquement tous vos textes (documents, entretiens, transcriptions, dialogues enregistrés, etc.) et marquer toutes les occurrences de variables.
# Il existe plusieurs stratégies de codages très différentes:
# Il existe plusieurs stratégies de codages très différentes:
#* Création de manuels de codage (codebooks) en partant de votre théorie
#* Création de manuels de codage (codebooks) en partant de votre théorie
Ligne 34 : Ligne 34 :
-----
-----


Le moyen le plus sûr et le plus fiable de coder est d’utiliser un logiciel spécialisé, e.g. Atlas ou Nivo, mais cela nécessite du temps d'apprentissage qui sera, en partie gagné lors de l'analyse. Pour de petites études et/ou pour vous familiariser avec le codage, vous pouvez tout à fait utiliser du papier et marquer les textes selon la méthode suivante:
Le moyen le plus sûr et le plus fiable de coder est d’utiliser un logiciel spécialisé, e.g. [http://www.atlasti.com/ ATLAS.ti] ou [https://www.qsrinternational.com/nvivo-qualitative-data-analysis-software/home Nvivo], mais cela nécessite du temps d'apprentissage qui sera, en partie gagné lors de l'analyse. Pour de petites études et/ou pour vous familiariser avec le codage, vous pouvez tout à fait utiliser du papier et marquer les textes selon la méthode suivante:


# Faites des ''photocopies'' réduites des textes pour gagner un peu d’espace dans les marges.
# Faites des ''photocopies'' réduites des textes pour gagner un peu d’espace dans les marges.
Ligne 53 : Ligne 53 :


== Bonnes pratiques de codage (avec codebook) ==
== Bonnes pratiques de codage (avec codebook) ==
=== Version humoristique ===
Section entièrement réalisée par un groupe d'étudiants MALTT Yoshi dans le cadre du cours de Méthodologie qualitative: Léonard Truscello, Samuel Schmid, Anne-Laure Maillard.
Vous faites des cauchemars toutes les nuits à cause de la méthodo, vous ne comprenez rien du tout au codage et vous n’avez jamais eu un alpha de Krippendorff supérieur à 0.4 ! Finalement vous avez toujours cherché une synthèse des bonnes pratiques en matière de codage, un tutoriel simple qui vous permet de comprendre facilement comment coder et d’être capable d’argumenter votre codage avec des références littéraires de qualité. Ce tutoriel est fait pour vous ! Vous allez apprendre à coder avec des exemples qui vont faire passer les subtilités du codage pour de simples banalités ! Tous vos amis vont vous jalouser à force de voir vos alpha de Krippendorff au-dessus de 0.95. N’attendez plus et commencez à coder !!!
'''Le codage, mais à quoi ça sert ?'''
Le codage est une des activités fondamentales de l’analyse qualitative. Dans le cadre d’une recherche qualitative, les données récoltées, par exemple des entretiens sous forme d’enregistrement, vont être retranscrites généralement sous forme de citations exactes qu’on appelle “verbatim” dans le but d’être analysées. Les données sous forme de verbatim sont en général abondantes, difficiles à traiter directement et parfois pas en rapport avec le sujet de la recherche. Par conséquent, il est nécessaire de faire un tri de l’information en fonction de catégories en rapport avec le sujet de recherche, c’est cette étape de tri qu’on appelle le codage. Les catégories sont en générale définies par la personne qui fait la recherche et le tri dans les catégories se fait par d’autres personnes. Finalement, on va comparer, grâce à des programmes comme Atlas, les différents tris pour voir s’ils sont cohérents. Si les tris sont cohérents, cela signifie que la recherche peut continuer à partir de ces informations triées, sinon il faut refaire une session de tri, modifier les différentes catégories ou encore recommencer une série d’entretien avant de pouvoir continuer.
'''Mais un code, c’est quoi en fait ?'''
Le code c’est le petit nom qu’on donne aux catégories ou aux sous-catégories. C’est une forme d’étiquette courte (réf: <nowiki>https://edutechwiki.unige.ch/fr/Cat%C3%A9gories_et_codes_dans_l%27analyse_qualitative</nowiki> ), par exemple un ou deux mot ou encore un acronyme qui identifie la catégorie. Exemple : pour une catégorie sur les transactions de marchandise organiques, on utiliserait “tr-org”. Le fait que le code soit court permet de l’utiliser sans que cela prenne trop de place.
Exemple sur Atlas :
[[Fichier:Code.png|alt=Code dans Atlas-ti|néant|cadre|Code dans Atlas-ti]]
'''Ah c’est juste ça ? Super ! Par contre comment je fais si je ne me souviens plus de la catégorie associée à mon code ?'''
[[Fichier:Codebook_dans_Atlas-ti.png|alt=Codebook dans Atlas-ti|néant|cadre|Codebook dans Atlas-ti]]
Alors là, l’organisation des chercheur.se.s est optimale, ils ont une sorte de glossaire de tous les codes avec leur nom complet, leur description et même des exemples. Les chercheurs appellent ce glossaire le “codebook” (le livre des codes), il est indispensable au codage. En général, c’est la personne qui fait la recherche qui le fournit. Les codes des sous-catégories sont classés en fonction des codes des catégories.
Dans l’image ci-dessus on peut voir la présentation du codebook sur Atlas. À gauche on retrouve les catégories (au nombre de deux), en haut à droite les sous-catégories et en bas à droite la description du code sélectionné (ici: “Compet_ConfigEnvNum~”) avec un exemple.
'''J’ai compris ce que c’est le “codebook”, en revanche je ne comprends plus ce que je dois faire. Si c’est la personne qui fait la recherche qui le fournit, je fais quoi moi ?'''
Ah bah tu vas coder ! C’est le but du tutoriel. Le codage c’est l’activité d’associer les bouts du document à analyser (e.g. la retranscription verbatim) aux catégories ou sous-catégories correspondantes, c’est-à-dire les codes qu’on vient de voir juste avant. Donc quand tu codes, concrètement, tu vas souligner ou surligner un bout du texte et écrire en marge le.s code.s correspondant.s.
[[Fichier:Ex codage.png|alt=Exemple de codage dans Atlas-ti|néant|cadre|Exemple de codage dans Atlas-ti]]
'''C’est simple non ?'''
Oui, mais c’est là que ça devient subtil. Il faut déterminer ce que tu vas souligner. Une astuce pour ce faire, c’est se mettre dans la peau d’une personne qui va lire les parties codées du document, c’est-à-dire les bouts de textes surlignés sous forme de citation, sans pouvoir lire le reste du document. Cette personne ne pourra pas lire le document pour mieux comprendre le contexte de la citation, toute l’information pertinente doit se trouver dans la citation codée. C’est possible pour un même bout de texte d’associer plusieurs codes. C’est aussi possible d’avoir des codes pour des citations qui se chevauchent.
[[Fichier:Ex code-chevauchement.png|alt=Exemple d'attribution de deux codes différents à un même segment|néant|cadre|Exemple d'attribution de deux codes différents à un même segment]]
Un autre élément du codage qui est aussi important est de commenter un codage, cela permet de donner plus d’informations à la personne qui les lira.
'''Ah je comprends mieux, bon ça parait logique quand même. Autre question, qu’est-ce que je fais si l’information du texte est pas clair ?'''
Il faut respecter un principe très facile : “ne pas faire de supposition”. Si tu n’es pas sûr.e du code, tu ne l’associe pas et lorsqu’une information liée à un code est sous-entendue, tu ne la mets pas non plus. Autrement le tri est trop subjectif, trop dépendant des personnes qui codent. Il faut coder ce qui est textuellement explicite, ce sur quoi on ne peut pas discuter.
[[Fichier:Codage Objectif-PasInterpretation.png|alt=Le codage: un travail objectif|néant|cadre|Le codage: un travail objectif]]
Dans ce bout de texte surligné, on comprend que l’on parle de compétences liées à la conception de formation. On pourrait supposer que si l’on conçoit des formations, on conçoit aussi des évaluations. Étant donné que ce n’est pas explicite, il ne faut pas le mettre et donc n’avoir que le codage “Compet_ConcevoirFormation”.
Voilà maintenant tu as tout compris au codage. Si tu veux aller plus loin et maîtriser un logiciel de codage comme Atlas, je te conseille de regarder les vidéos suivantes recommandées au sein du cours de méthodo de Tecfa.
Celle-ci pour te familiariser avec l’interface d’Atlas:https://www.youtube.com/watch?time_continue=5&v=m5G7mQPgL-g
Et celle-là pour coder avec Atlas : https://www.youtube.com/watch?v=nVoVQEvK7OM
=== Version plus "standard" ===
Section entièrement réalisée par un groupe d'étudiants MALTT Yoshi dans le cadre du cours de Méthodologie qualitative: Loïc Berthod, Katrine Briguet, Nicolas Burau, Nivine Ismail, Mathilde Gacek.
Section entièrement réalisée par un groupe d'étudiants MALTT Yoshi dans le cadre du cours de Méthodologie qualitative: Loïc Berthod, Katrine Briguet, Nicolas Burau, Nivine Ismail, Mathilde Gacek.


Ligne 66 : Ligne 112 :


La deuxième étape correspond à la question de la taille des segments à coder. D’une manière générale, le découpage doit être suffisamment long pour avoir du sens hors contexte. L’analyse est en effet réalisée avec les segments sélectionnés uniquement. Il faut donc qu’ils puissent être interprétés. Il faut ainsi coder l’information qui est importante et utilisable.
La deuxième étape correspond à la question de la taille des segments à coder. D’une manière générale, le découpage doit être suffisamment long pour avoir du sens hors contexte. L’analyse est en effet réalisée avec les segments sélectionnés uniquement. Il faut donc qu’ils puissent être interprétés. Il faut ainsi coder l’information qui est importante et utilisable.
[[Fichier:Ex codage-2.png|alt=Coder des segments utilisables par la suite|néant|cadre|Coder des segments utilisables par la suite]]


Si plusieurs codes semblent imbriqués, la sélection de l’ensemble et l’attribution de deux ou plusieurs codes doivent être privilégiés. Dans ce cas de figure, il est également possible de réaliser un découpage, tant que les segments conservent leur sens une fois extraits du texte.
Si plusieurs codes semblent imbriqués, la sélection de l’ensemble et l’attribution de deux ou plusieurs codes doivent être privilégiés. Dans ce cas de figure, il est également possible de réaliser un découpage, tant que les segments conservent leur sens une fois extraits du texte.
Ligne 95 : Ligne 142 :
=== Création d’un manuel de codage selon la théorie ===
=== Création d’un manuel de codage selon la théorie ===


Dans cette stratégie de codage, la liste de variables (et leurs codes) est définie par l’intermédiaire d’un raisonnement théorique (e.g. cadres analytiques, grilles d’analyse) et par conséquent également par des concepts que vous avec utilisé pour formuler vos questions de recherche et/ou vos hypothèses. Voici un extrait d’un manuel de codage d’études en innovation (environ 100 codes):
Dans cette stratégie de codage, la liste de variables (et leurs codes) est définie par l’intermédiaire d’un raisonnement théorique (e.g. cadres analytiques, grilles d’analyse) et par conséquent également par des concepts que vous avez utilisé pour formuler vos questions de recherche et/ou vos hypothèses. Voici un extrait d’un manuel de codage d’études en innovation (environ 100 codes):


{| class="wikitable"
{| class="wikitable"

Dernière version du 23 avril 2021 à 09:29

Manuel de recherche en technologie éducative
Module: Analyse de données qualitatives
◀▬▬▶
2021/04/23

Le codage

"La codification relève de l’analyse. Examiner une série de notes de terrain, transcrites ou synthétisées, et les disséquer avec intelligence, tout en préservant intactes les relations entre les segments de données, constituent le cœur de l’analyse. Cette partie de l’analyse comprend la façon dont vous différenciez et combinez les données extraites et les réflexions que vous avez sur cette information.

Les codes sont des étiquettes qui désignent des unités de signification pour l’information descriptive ou inférentielle compilée au cours d’une étude. Les codes sont habituellement attachés à des « segments » de taille variable – mots, locutions, phrases ou paragraphes entiers, connectés ou déconnectés d’un contexte spécifique. Ils peuvent prendre la forme d’une étiquette catégorielle simple ou d’une étiquette plus complexe (par exemple, une métaphore). (…) Une méthode (celle que nous préférons) consiste à établir une « liste de départ » de codes avant le travail sur le terrain. Cette liste provient du cadre conceptuel, des questions de recherche, hypothèses, zones problématiques et variables clés que le chercheur introduit dans l’étude. (…)

Il existe au moins deux autres méthodes, tout aussi honorables d’élaboration de codes. D’une part, un chercheur plus inductif peut s’opposer à la précodification des données tant qu’il ne les a pas collectées, étudié la façon dont elles fonctionnent ou s’intègrent dans le contexte, et déterminé le nombre de variétés qu’elles présentent. On retrouve là en fait l’approche plus empiriquement « enracinée » défendue par Glaser & Strauss (1967) qui offre de nombreux avantages. Les données coïncident bien avec les codes qui les représentent et on est plus proche d’un « code pratique » que du « code générique tous usages » issu d’une liste de départ préfabriquée. (…)

Une autre possibilité, à mi-chemin entre ces deux approches, est de créer un plan général de codage qui ne soit pas lié au contenu mais indique les grands domaines dans lesquels les codes devront être inductivement conçus »." Miles, M. & Huberman, M. (2003, pp. 112-119). Analyse des données qualitatives. 2e édition. De Boeck Université.

La première étape de l’analyse des données qualitatives consiste donc à coder. Un code est une étiquette (ou label, balise, tag) utilisé pour marquer une variable (concept) et/ou une valeur trouvée dans un texte. L’avantage du codage est qu’il permet de retrouver toutes les informations sur les variables intéressantes pour votre recherche. De plus, il améliore la fiabilité de votre recherche s'il est réalisé dans les règles de l'art (i.e. vérification rigoureuse du codage par différents chercheurs).

Le principe de base de la technique du codage est assez simple:

  1. Un code est assigné à chaque (sous)catégorie, i.e. chaque variable théorique avec laquelle vous travaillez. En d’autres termes, vous devez identifier des noms de variables
  2. En outre, vous pouvez assigner pour chaque code un ensemble de variables possibles, e.g. positives/neutres/négatives
  3. Vous devrez ensuite passer en revue systématiquement tous vos textes (documents, entretiens, transcriptions, dialogues enregistrés, etc.) et marquer toutes les occurrences de variables.
  4. Il existe plusieurs stratégies de codages très différentes:
    • Création de manuels de codage (codebooks) en partant de votre théorie
    • Codage par induction (selon la théorie ancrée)
    • Codage hybride (demi-codebook, demi-inductif)
    • Codage par catégories ontologiques

Tableau 15: Principes de codage pour les données qualitatives


Le moyen le plus sûr et le plus fiable de coder est d’utiliser un logiciel spécialisé, e.g. ATLAS.ti ou Nvivo, mais cela nécessite du temps d'apprentissage qui sera, en partie gagné lors de l'analyse. Pour de petites études et/ou pour vous familiariser avec le codage, vous pouvez tout à fait utiliser du papier et marquer les textes selon la méthode suivante:

  1. Faites des photocopies réduites des textes pour gagner un peu d’espace dans les marges.
  2. Soulignez ou entourez les éléments de texte que vous pouvez lier à une variable, puis écrivez le code dans la marge. Utilisez un stylo effaçable!
  3. Assurez-vous de passer en revue les différents codes et autres marques que vous pourriez laisser sur le papier.

En ce qui concerne l’étiquetage de codes, nous suggérons de procéder de la façon suivante:

  • N’utilisez pas de longues listes de codes «à plat», mettez en place une hiérarchie (selon les dimensions identifiées)
  • Chaque code doit être court et mnémotechnique (optimisez). E.g. pour coder «catégorie principale» – «sous-catégorie» («valeur»), utiliser un code tel que:
CE-CLIM(+)
Au lieu de:
contexte externe - climat (positif)
  • Ne commencez jamais à coder sans avoir une idée de votre stratégie de codage. Soit votre manuel de codage est déterminé par vos questions de recherche et les théories, cadres et grilles d’analyse associés, soit vous apprenez vraiment à utiliser une stratégie inductive telle que la «théorie ancrée» qui est beaucoup plus difficile.

Voici un exemple de manuel de codage.

Bonnes pratiques de codage (avec codebook)

Version humoristique

Section entièrement réalisée par un groupe d'étudiants MALTT Yoshi dans le cadre du cours de Méthodologie qualitative: Léonard Truscello, Samuel Schmid, Anne-Laure Maillard.

Vous faites des cauchemars toutes les nuits à cause de la méthodo, vous ne comprenez rien du tout au codage et vous n’avez jamais eu un alpha de Krippendorff supérieur à 0.4 ! Finalement vous avez toujours cherché une synthèse des bonnes pratiques en matière de codage, un tutoriel simple qui vous permet de comprendre facilement comment coder et d’être capable d’argumenter votre codage avec des références littéraires de qualité. Ce tutoriel est fait pour vous ! Vous allez apprendre à coder avec des exemples qui vont faire passer les subtilités du codage pour de simples banalités ! Tous vos amis vont vous jalouser à force de voir vos alpha de Krippendorff au-dessus de 0.95. N’attendez plus et commencez à coder !!!

Le codage, mais à quoi ça sert ?

Le codage est une des activités fondamentales de l’analyse qualitative. Dans le cadre d’une recherche qualitative, les données récoltées, par exemple des entretiens sous forme d’enregistrement, vont être retranscrites généralement sous forme de citations exactes qu’on appelle “verbatim” dans le but d’être analysées. Les données sous forme de verbatim sont en général abondantes, difficiles à traiter directement et parfois pas en rapport avec le sujet de la recherche. Par conséquent, il est nécessaire de faire un tri de l’information en fonction de catégories en rapport avec le sujet de recherche, c’est cette étape de tri qu’on appelle le codage. Les catégories sont en générale définies par la personne qui fait la recherche et le tri dans les catégories se fait par d’autres personnes. Finalement, on va comparer, grâce à des programmes comme Atlas, les différents tris pour voir s’ils sont cohérents. Si les tris sont cohérents, cela signifie que la recherche peut continuer à partir de ces informations triées, sinon il faut refaire une session de tri, modifier les différentes catégories ou encore recommencer une série d’entretien avant de pouvoir continuer.

Mais un code, c’est quoi en fait ?

Le code c’est le petit nom qu’on donne aux catégories ou aux sous-catégories. C’est une forme d’étiquette courte (réf: https://edutechwiki.unige.ch/fr/Cat%C3%A9gories_et_codes_dans_l%27analyse_qualitative ), par exemple un ou deux mot ou encore un acronyme qui identifie la catégorie. Exemple : pour une catégorie sur les transactions de marchandise organiques, on utiliserait “tr-org”. Le fait que le code soit court permet de l’utiliser sans que cela prenne trop de place.

Exemple sur Atlas :

Code dans Atlas-ti
Code dans Atlas-ti

Ah c’est juste ça ? Super ! Par contre comment je fais si je ne me souviens plus de la catégorie associée à mon code ?

Codebook dans Atlas-ti
Codebook dans Atlas-ti

Alors là, l’organisation des chercheur.se.s est optimale, ils ont une sorte de glossaire de tous les codes avec leur nom complet, leur description et même des exemples. Les chercheurs appellent ce glossaire le “codebook” (le livre des codes), il est indispensable au codage. En général, c’est la personne qui fait la recherche qui le fournit. Les codes des sous-catégories sont classés en fonction des codes des catégories.

Dans l’image ci-dessus on peut voir la présentation du codebook sur Atlas. À gauche on retrouve les catégories (au nombre de deux), en haut à droite les sous-catégories et en bas à droite la description du code sélectionné (ici: “Compet_ConfigEnvNum~”) avec un exemple.

J’ai compris ce que c’est le “codebook”, en revanche je ne comprends plus ce que je dois faire. Si c’est la personne qui fait la recherche qui le fournit, je fais quoi moi ?

Ah bah tu vas coder ! C’est le but du tutoriel. Le codage c’est l’activité d’associer les bouts du document à analyser (e.g. la retranscription verbatim) aux catégories ou sous-catégories correspondantes, c’est-à-dire les codes qu’on vient de voir juste avant. Donc quand tu codes, concrètement, tu vas souligner ou surligner un bout du texte et écrire en marge le.s code.s correspondant.s.

Exemple de codage dans Atlas-ti
Exemple de codage dans Atlas-ti

C’est simple non ?

Oui, mais c’est là que ça devient subtil. Il faut déterminer ce que tu vas souligner. Une astuce pour ce faire, c’est se mettre dans la peau d’une personne qui va lire les parties codées du document, c’est-à-dire les bouts de textes surlignés sous forme de citation, sans pouvoir lire le reste du document. Cette personne ne pourra pas lire le document pour mieux comprendre le contexte de la citation, toute l’information pertinente doit se trouver dans la citation codée. C’est possible pour un même bout de texte d’associer plusieurs codes. C’est aussi possible d’avoir des codes pour des citations qui se chevauchent.

Exemple d'attribution de deux codes différents à un même segment
Exemple d'attribution de deux codes différents à un même segment

Un autre élément du codage qui est aussi important est de commenter un codage, cela permet de donner plus d’informations à la personne qui les lira.

Ah je comprends mieux, bon ça parait logique quand même. Autre question, qu’est-ce que je fais si l’information du texte est pas clair ?

Il faut respecter un principe très facile : “ne pas faire de supposition”. Si tu n’es pas sûr.e du code, tu ne l’associe pas et lorsqu’une information liée à un code est sous-entendue, tu ne la mets pas non plus. Autrement le tri est trop subjectif, trop dépendant des personnes qui codent. Il faut coder ce qui est textuellement explicite, ce sur quoi on ne peut pas discuter.

Le codage: un travail objectif
Le codage: un travail objectif

Dans ce bout de texte surligné, on comprend que l’on parle de compétences liées à la conception de formation. On pourrait supposer que si l’on conçoit des formations, on conçoit aussi des évaluations. Étant donné que ce n’est pas explicite, il ne faut pas le mettre et donc n’avoir que le codage “Compet_ConcevoirFormation”.

Voilà maintenant tu as tout compris au codage. Si tu veux aller plus loin et maîtriser un logiciel de codage comme Atlas, je te conseille de regarder les vidéos suivantes recommandées au sein du cours de méthodo de Tecfa.

Celle-ci pour te familiariser avec l’interface d’Atlas:https://www.youtube.com/watch?time_continue=5&v=m5G7mQPgL-g

Et celle-là pour coder avec Atlas : https://www.youtube.com/watch?v=nVoVQEvK7OM

Version plus "standard"

Section entièrement réalisée par un groupe d'étudiants MALTT Yoshi dans le cadre du cours de Méthodologie qualitative: Loïc Berthod, Katrine Briguet, Nicolas Burau, Nivine Ismail, Mathilde Gacek.

Le codage est un processus qui a pour but d’explorer ligne par ligne, étape par étape, les

textes d’interview ou d’observations (Berg, 2003, cité par Andreani; Conchon, 2005). Il est utilisé dans le cadre d’entretiens qualitatifs. Le codage consiste à décrire, classer et transformer les données qualitatives brutes en fonction d’une grille d’analyse. L’objectif est donc de retranscrire des informations d’un entretien qualitatif dans le but de les analyser de manière méthodique, à mettre de l’ordre dans les informations pour en tirer les bonnes conclusions, le tout de la part de codeurs neutres pour assurer la qualité de la recherche.

Le but de cette synthèse est de pouvoir donner quelques recommandations pratiques à tout codeur débutant.

En premier lieu, la lecture attentive du codebook est une étape cruciale du processus. Il s’agit de comprendre ce que signifie la problématique, l’objectif de l’étude et la question de recherche. Puis vient la définition de la catégorie de code et la compréhension de la sous-question de recherche. Dans tout le processus à venir, ces éléments doivent rester en questionnement de fond. Il est ensuite nécessaire de comprendre précisément à quoi fait référence chaque code grâce à sa définition et son exemple. Le processus se poursuit par la lecture en entier des données collectées en attribuant à chaque idée pertinente un code tiré du codebook.

Avant de débuter le codage proprement dit voici quelques recommandations utiles. Comme évoqué précédemment, la première étape correspond à une très bonne connaissance du codebook et de ses différents éléments. Il est en effet important de se pencher attentivement sur chaque code et son exemple, tout en ayant en toile de fond la question de recherche principale en tête. Pour obtenir un codage de qualité, il ne doit pas y avoir de discussion entre les codeurs au sujet du codebook. Celui-ci doit doit se révéler suffisamment clair, précis et objectif pour éviter toute erreur d’interprétation sur l’un ou l’autre code.

La deuxième étape correspond à la question de la taille des segments à coder. D’une manière générale, le découpage doit être suffisamment long pour avoir du sens hors contexte. L’analyse est en effet réalisée avec les segments sélectionnés uniquement. Il faut donc qu’ils puissent être interprétés. Il faut ainsi coder l’information qui est importante et utilisable.

Coder des segments utilisables par la suite
Coder des segments utilisables par la suite

Si plusieurs codes semblent imbriqués, la sélection de l’ensemble et l’attribution de deux ou plusieurs codes doivent être privilégiés. Dans ce cas de figure, il est également possible de réaliser un découpage, tant que les segments conservent leur sens une fois extraits du texte.

Enfin, il faut éviter toute interprétation et ne s’arrêter qu’au critère objectif. L’analyse ne se fera qu’une fois le codage terminé.

Pour effectuer ce codage, un des logiciels recommandé est Atlas.ti. En plus de la retranscription et du codage, ce programme permet de réaliser des analyses multiples. Il sert à obtenir des représentations visuelles et des cartes perceptuelles à partir de programmes d’analyse statistique des données. Par exemple, il peut étudier les relations entre les catégories et les modéliser. Il produit également des diagrammes d’associations d’idées ou des cartes mentales. Le programme calcule la fréquence des catégories, fait ressortir les mots formant les catégories, puis permet une visualisation graphique grâce à des networks et au query tool. Le but des networks est de permettre une meilleure visualisation des données grâce à la génération d’arbres ou de schémas. Le query tool permet de faire une analyse plus précise en définissant des conditions.

Exemple de visualisation réalisée avec l'outil Network view

Ce logiciel donne également la possibilité de faire le calcul de l’Inter Coder Agreement entre plusieurs codages. Cet indicateur mesure l’accord existant entre différents codeurs en tenant compte de la probabilité que les codages concordent par hasard. Il donne ainsi une estimation fondée de la fiabilité du codage, indispensable pour mener une analyse de qualité. Atlas.ti se révèle ainsi être un logiciel très complet, qui permet de réaliser une analyse poussée et valide d’entretiens qualitatifs, pour peu qu’on le maîtrise correctement.

En conclusion, cette synthèse permet à un codeur débutant d’avoir une base pour appréhender le codage d’un entretien qualitatif. Une mauvaise connaissance des bonnes pratiques peut amener à un codage approximatif. Le codebook représente l’intermédiaire, le lien, entre l’entretien et l’analyse. Une bonne compréhension et un bon usage de celui-ci est donc primordial. Mais une segmentation correcte est également nécessaire pour offrir à l’analyste la possibilité de faire une analyse pertinente des données.

Par ailleurs, le logiciel Atlas.ti offre une multitude de possibilités pour coder mais également pour analyser des données non structurées (textes, multimédias…). Sa conception facilite le travail en équipe grâce à la possibilité de créer des projets multi-utilisateurs.

Fiabilité de codage

Assigner un code à un segment de texte n’est pas toujours évident et coder des passages similaires exactement de la même manière l’est encore moins. En d’autres termes, la question de la fiabilité du codage se pose.

Il y a deux façons d’améliorer la fiabilité:

  • Utilisez des catégories claires et opérationnelles
  • Utilisez deux ou trois codeurs (vous et d'autres chercheurs) et calculez un indice d’intercodage. S’il est bas, vous devrez revoir votre schéma de codage.

Il existe plusieurs formules pour calculer la fidélité inter-codeurs, dont la plus simple est celle proposée par Miles & Huberman (2003):

Fiabilité = nombre d’accords / (nombre total d’accords + nombre total de désaccords)

Il existe également des logiciels, comme CAT, qui permettent de calculer statistiquement la fiabilité du codage à l'aide du Kappa de Fleiss lorsqu'il y a plus de deux codeurs mais l'interprétation reste controversée.

Création et gestion d’un manuel de codage

Création d’un manuel de codage selon la théorie

Dans cette stratégie de codage, la liste de variables (et leurs codes) est définie par l’intermédiaire d’un raisonnement théorique (e.g. cadres analytiques, grilles d’analyse) et par conséquent également par des concepts que vous avez utilisé pour formuler vos questions de recherche et/ou vos hypothèses. Voici un extrait d’un manuel de codage d’études en innovation (environ 100 codes):

Catégories Codes Références théoriques
propriétés de l’innovation PI .... (remplissez pour votre propre manuel de codage).....
contexte externe CE
démographie CE-D
soutien pour la réforme CE-S
contexte interne CI
processus d’adoption PA
chronologie officielle PA-CO
dynamique du site étudié DS
assistance externe et interne AEI
liens de causalité LC

Tableau 16: Manuel de codage d’études en innovation (extrait)

Avant de penser à votre propre manuel de codage, vous devez vraiment passer en revue la littérature pertinente et essayer de trouver des manuels de codage existants (qu’il vous faudra peut-être adapter). E.g. ci-dessous se trouve un exemple d’utilisation de codes pour l’analyse des types de problèmes professionnels d’enseignants en informatique en Turquie (Deryakulu & Olkun, 2007).

  1. Conflit de rôle

  2. Procédures d’initiation des enseignants inadéquates

  3. Absence d’infrastructures technologiques et de soutien technique requis

  4. Statut de l’informatique dans le programme scolaire

  5. Absence d’appréciation et de retours favorables des collègues

  6. Absence de soutien des administrateurs

  7. Evolution rapide des connaissances nécessaires pour l’enseignement de l’informatique

  8. Absence de programme informatique cohérent

  9. Absence de programmes de formation des enseignants avant leur entrée en fonction

  10. Classes très grandes

  11. Etudiants indifférents

  12. Inspection et supervision inadéquates

Codage par induction conformément à la théorie ancrée

La théorie ancrée (Glaser, Strauss) correspond à un ensemble d’approches qui se focalisent sur l’interprétation et sur la construction de théories, i.e. c’est une approche totalement inductive. Le chercheur commence par coder un petit ensemble de données puis augmente l’échantillon en fonction des questions théoriques qui apparaissent. Les catégories (codes) peuvent être révisées à tout moment.

La théorie ancrée commence avec une situation de recherche. Au sein de cette situation, votre tâche, en tant que chercheur, consiste à comprendre ce qui se passe, comment les acteurs remplissent leurs rôles. Vous ferez cela principalement par l’intermédiaire d’observations, de conversations et d’entretiens. Après chaque période de collecte de données, vous devez noter les éléments clés: j’ai étiqueté cela comme «prise de notes».

La comparaison constante est le cœur du processus. Il s'agit de comparer les interviews (ou d’autres données) jusqu'à saturation. La théorie prend forme rapidement. Lorsque c’est le cas, comparez les données à la théorie. Les résultats de cette comparaison sont écrits dans la marge comme du codage. Votre tâche consiste à identifier les catégories (qui correspondent à peu près aux thèmes ou aux variables) et leurs propriétés (leurs sous-catégories).

Théorie ancrée: un schéma concis, extrait le 15 octobre 2008.

Le codage de phénomènes s’effectue à la fois de façon isolée et avec des relations (codage axial). Les catégories d’observation abstraites suivantes pourraient constituer un point de départ pour le codage axial.

  • conditions (causes d’un phénomène perçu)
  • interactions entre les acteurs
  • stratégies et tactiques utilisées par les acteurs
  • conséquences des actions

Pour utiliser cette approche, vous devez vraiment vous documenter, car en tant que débutant, vous pouvez facilement tomber dans un piège, en particulier les biais de sélection et de confirmation, i.e. vous regardez uniquement les choses qui vous intéressent pour une raison ou pour une autre.

Codage par catégories ontologiques

Au lieu de créer initialement un manuel de codage à partir de variables trouvées dans vos questions de recherche ou de réaliser un codage «inductif» dans le contexte de la théorie ancrée, il est possible de commencer en utilisant un vocabulaire pour un domaine donné. Cette stratégie est un compromis entre la théorie ancrée et la méthode axée sur la théorie que nous avons présentée initialement.

Le tableau suivant comprend une liste d’éléments que vous pouvez observer dans une organisation (Bogdan et Biklen, 1992 cités par Miles & Huberman: 1994 61)

Types Explication
Contexte/situation information sur le contexte
Définition de la situation interprétation par les gens de la situation analysée
Perspectives façons globales de voir la situation
Façons de voir gens et objets perception détaillée de certains éléments
Processus séquences d’événements, flux, transitions, points de changements, etc.
Activités structures des comportements réguliers
Evénements activités spécifiques (non régulières)
Stratégies façon d’attaquer un problème (stratégies, méthodes, techniques)
Relations et structure sociale liens informels
Méthodes commentaires du chercheur sur le travail (annotations)

Tableau 17: Les codes Bogdan et Biklen pour analyser des organisations

Dans la littérature, vous trouverez de nombreux autres «schémas explicatifs». En technologie éducative, par exemple, il existe plusieurs manuels de codage relativement simples pour l’analyse de conversations et de groupes de discussion asynchrones (forums). De Wever et al. (2006) fournissent un bon aperçu global. Certains schémas de code sont simples. E.g. Cobos et Pifarré (2008) ont analysé la «construction collaborative de connaissances sur internet» avec le schéma de codage suivant:

Code explication exemple
Explication Demande à clarifier certaines parties du document Le lien suivant, qui apparaît dans votre document, ne fonctionne pas à présent, mais était-ce le cas il y a une semaine?
Support Exprime un accord explicite avec les idées du document ou l’organisation des informations J’estime que ce document est très utile et facile à lire
Ajouts Suggère des ajouts au document: idées, opinions ou organisation des informations Je pense qu’il conviendrait d’ajouter un index des différentes parties de l’article
Suppression Suggère des suppressions du document: idées, opinions ou organisation des informations Le résumé contient des exemples; étaient-ils vraiment nécessaires?
Correction Suggère des changements au document. Ils se rapportent à des idées, à des opinions ou à l’organisation des informations Je pense que la conclusion du premier paragraphe contient une erreur: «moteur» devrait être «motivation».

Tableau 18: Codebook pour la «construction collaborative de connaissances sur internet»

Pena-Shaff et Nichols (2004) ont utilisé les catégories suivantes pour analyser les interactions entre étudiants et la construction de signification dans les discussions d’un système de bulletins électroniques:

  • Questions
  • Réponse
  • Clarification
  • Interprétation
  • Conflit
  • Affirmation
  • Construction de consensus
  • Jugement
  • Réflexion
  • Support
  • Autres

Il existe des manuels de codage plus complexes: à titre d’exemple, voici un résumé des messages d’étudiants dans le manuel d’Eilon et Kliachko (2004).

Groupe «Niveau A» Ces catégories indiquent la construction de connaissances et une contribution significative à l’apprentissage par pairs
Compréhension Fournit une preuve écrite de la compréhension des sujets étudiés par les catégories suivantes:
Reproduction- 1 Reproduit les points, les idées, les arguments ou les messages principaux trouvés dans les informations entrantes en référence à leur source et avec une évaluation critique.
Direction Redirige les autres aux sources pertinentes pour les sujets étudiés (imprimés et en ligne).
Clarification par questions Localise les domaines ambigus, difficiles ou problématiques dans le nouveau matériel. Décrit le contexte de la question et la raison de la poser.
Clarification par réponses Fournit des explications et des réponses correctes, pertinentes et complètes. Fonde les réponses sur les informations récupérées tout en critiquant ses origines.
Réflexion Fournit des preuves écrites des processus métacognitifs que l’apprenant applique lorsqu’il étudie de nouveaux sujets dans les catégories suivantes:
Liens/diffusion Combine les nouvelles informations avec ses connaissances préalables. Transmet les nouvelles connaissances aux autres domaines, en particulier les problèmes STS.
Evaluation critique Evalue les nouvelles informations de façon critique.
Transformation Applique les nouvelles informations d’une façon originale et créative, établit des inférences, donne des exemples originaux.
Groupe «Niveau B» Ces catégories indiquent une contribution probable à l’apprentissage par pairs, par les catégories suivantes:
Documentation Documente les expériences relatives à l’apprentissage ou les contributions individuelles au groupe.
Reproduction- 2 Reproduit les points, les idées, les arguments ou les messages principaux trouvés dans les informations entrantes sans évaluation de ces dernières ou ajouts originaux.
Résultats d’apprentissage Présente le groupe et les résultats individuels d’apprentissage.
Questions/réponses techniques Questions ou remarques à propos de tout sujet qui n’est pas en lien direct avec la compréhension des sujets étudiés.
Connaissance personnelle Présente les connaissances personnelles ou les expériences de la vie de tous les jours.
Groupe «Niveau C» Ces catégories indiquent aucune contribution (ou contribution contraire) à l’apprentissage par pairs, par les catégories suivantes:
Questions non pertinentes/non expliquées Pose des questions sans donner de contexte ou de raisons pour les poser.
Citations ponctuelles Inclut des citations sans leur contexte et sans explication.
Réponses non pertinentes/sans réponse Fournit des réponses non pertinentes ou incorrectes aux questions envoyées par d’autres étudiants.
Commentaires émotionnels/personnels Inclut des commentaires personnels, qui auraient dû être envoyés par e-mail, comme l’a demandé l’enseignant.

Tableau 19: Manuel de codage des messages d’étudiants (Elion et Kliachko, 2004)

Codes de cycle 2 (de type pattern)

Certains chercheurs codent également des patterns (thèmes, modèles, tendances). Alors que le codage de cycle 1 (ci-dessus) consiste à classer les données dans des catégories, il s'agit ensuite de réfléchir et de regarder si une tendance sous-jacente apparait. Autrement dit, si on peut réorganiser ces catégories pour faire émerger du sens. Le but ultime est de détecter des régularités, mais également des variations et des singularités. Saldaña (2013) compare le fait de coder avec le fait de cuisiner.

"Quand je fais les courses (travail de terrain), je peux mettre 20 produits différents (ex: entretiens) dans mon caddie (fiches de contact et journal). Quand je passe à la caisse (logiciels CAQDAS) et que chaque produit (donnée) muni d’un code barres est scanné (codage de cycle 1), le rangeur (analyste) va mettre les produits surgelés dans un sac (catégorie 1), les produits frais dans un autre (catégorie 2), les viandes dans un troisième, etc.

Sur le chemin du retour, je pense à ce que je vais cuisiner (réflexion et mémos). Je déballe les produits (codage de cycle 2) et les range dans la cuisine: réfrigérateur (concept 1), placard (concept 2), congélateur (concept 3), etc. Et lorsque je suis prêt à préparer ce fameux repas (interprétation), je sors ce dont j’ai besoin (l’essentiel) parmi tout ce que j’avais acheté (analysé) pour le cuisiner (rédiger)." Saldaña, J. (2013). The coding manual for qualitative researchers. London: Sage. (pp. 208-9). (notre traduction française)

Résumé

Le codage est déjà une forme d'analyse et permet de classer vos données pour les organiser visuellement dans la phase suivante de l'analyse et, enfin, pouvoir les interpréter.