« Designs statistiques » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
mAucun résumé des modifications
 
(8 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 3 : Ligne 3 :
|fait_partie_du_module=Designs de recherche orientés test de théorie
|fait_partie_du_module=Designs de recherche orientés test de théorie
|page_precedente=Designs quasi-expérimentaux
|page_precedente=Designs quasi-expérimentaux
|page_parente=Designs de recherche orientés test de théorie
|page_suivante=Design comparaison de systèmes similaires
|page_suivante=Design comparaison de systèmes similaires
|statut=à améliorer
|statut=à améliorer
Ligne 11 : Ligne 10 :
== Introduction  ==
== Introduction  ==
    
    
D’une certaine manière, les designs statistiques sont conceptuellement liés aux designs expérimentaux. Les designs statistiques formulent des lois, i.e. les cas individuels n’ont aucun intérêt (à moins que quelque chose ne se passe mal). L’avantage de ce design est qu’il est possible de tester un nombre relativement important de lois (hypothèses) avec des données statistiques. On qualifie souvent de telles analyses de '''corrélationnelles''', car elles ont pour but de démontrer des relations statistiques entre des variables.
D’une certaine manière, les designs statistiques sont conceptuellement liés aux designs expérimentaux. Les designs statistiques formulent des lois ayant pour vocation d'être généralisées à une population, les cas individuels n’ont donc pas d'intérêt. L’avantage de ce design est qu’il est possible de tester un nombre relativement important de lois (hypothèses) avec des données statistiques. On qualifie souvent de telles analyses de '''corrélationnelles''', car elles ont pour but de démontrer des relations statistiques entre des variables, sans pour autant inférer de lien causal.


De tels designs de recherche s’appuient sur un raisonnement théorique antérieur, car:   
De tels designs de recherche s’appuient sur un raisonnement théorique antérieur, car:   


1. les mesures, i.e. les questionnaires ont une fiabilité (au sens large du terme) limitée:   
# les mesures, i.e. les [[Validation_de_questionnaire#Fiabilité | questionnaires ont une fiabilité]] (au sens large du terme) limitée:   
 
#* ce que les gens disent peut ne pas correspondre à ce qu’ils font   
* ce que les gens disent peut ne pas correspondre à ce qu’ils font   
#* ce que vous demandez pourrait ne pas mesurer ce que vous voulez observer   
 
# il y a une surdétermination statistique,   
* ce que vous demandez pourrait ne pas mesurer ce que vous voulez observer   
#* vous pouvez trouver des corrélations entre variables, mais comme nous l’avons vu précédemment, les corrélations ne sont pas nécessairement synonymes de causalités.   
 
# vous ne pouvez pas obtenir une «image inductive» en posant une dizaine de questions fermées.   
2. il y a une surdétermination statistique,   
 
* vous pouvez trouver des corrélations entre variables, mais comme nous l’avons vu précédemment, les corrélations ne sont pas nécessairement synonymes de causalités.   
 
3. vous ne pouvez pas obtenir une «image inductive» en posant une dizaine de questions fermées.   


Le design de recherche dominant est mené de façon descendante et comprend en partie la doctrine du rationalisme critique de Popper, que l’on appelle également le falsificationnisme. Comment procéder?   
Le design de recherche dominant est mené de façon descendante et comprend en partie la doctrine du rationalisme critique de Popper, que l’on appelle également le falsificationnisme. Comment procéder?   


# Commencez par formuler des hypothèses (des modèles qui contiennent des variables et des relations que vous pouvez mesurer)   
{{bloc important|
# Commencez par formuler des hypothèses (des modèles qui contiennent des variables que vous pouvez mesurer plus des relations que vous désirez tester)   
# Mesurez les variables (e.g. à l’aide d’un questionnaire et/ou d’un test)   
# Mesurez les variables (e.g. à l’aide d’un questionnaire et/ou d’un test)   
# Testez alors les relations à l’aide d’outils statistiques   
# Testez alors les relations à l’aide d’outils statistiques   
# Testez alors des hypothèses alternatives selon le même principe. Vous devez également montrer que vos hypothèses ne sont pas falsifiables.   
# Testez alors des hypothèses alternatives selon le même principe. Vous devez également montrer que vos hypothèses ne sont pas falsifiables.   
}}


Le design statistique le plus utilisé en technologie éducative est l’enquête par sondage.
Le design statistique le plus utilisé en technologie éducative est l’enquête par sondage. Toutefois, avec l'incrémentation d'environnements en ligne, on utilise de plus en plus de données "analytiques" qui collectent de l'information concernant le comportement en ligne. Il existe aussi une foule de données socio-économique (par exemple cueillis lors de recensements populaires). Finalement, il existe des études larges comme [http://www.pisa.org PISA] et qui admistrent des tests à des élèves.


==  Introduction à l’enquête par sondage  ==
==  Introduction à l’enquête par sondage  ==
 


La méthode de l'enquête par sondage a maintenant plus de soixante ans et est bien documentée dans les manuels de méthodologie. Elle consiste à recueillir des informations auprès des gens sur leurs attitudes, comportements, expériences, conditions socio-économiques, etc. par le biais d’un questionnaire. Ce questionnaire peut être administré au format papier, lors d’un entretien présentiel, par téléphone ou par internet. Généralement l'enquête par sondage cherche à tester une théorie sur une assez grande population (e.g. "les étudiants de sciences sociales" ou "les adolescents à la fin de l'enseignement obligatoire dans les pays de l'OCDE"). Le questionnaire ne peut être administré à l’entièreté d’une population et seul un échantillon représentatif, typiquement quelques centaines de personnes, est sollicité pour répondre aux questions.   
La méthode de l'enquête par sondage a maintenant plus de soixante ans et est bien documentée dans les manuels de méthodologie. Elle consiste à recueillir des informations auprès des gens sur leurs attitudes, comportements, expériences, conditions socio-économiques, etc. par le biais d’un questionnaire. Ce questionnaire peut être administré au format papier, lors d’un entretien présentiel, par téléphone ou par internet. Généralement l'enquête par sondage cherche à tester une théorie sur une assez grande population (e.g. "les étudiants de sciences sociales" ou "les adolescents à la fin de l'enseignement obligatoire dans les pays de l'OCDE"). Le questionnaire ne peut être administré à l’entièreté d’une population et seul un échantillon représentatif, typiquement quelques centaines de personnes, est sollicité pour répondre aux questions.   
Ligne 57 : Ligne 52 :
6. Stratégies d’échantillonnage   
6. Stratégies d’échantillonnage   


7. Identification des méthodes d’analyse </td> </tr> </table> 
7. Identification des méthodes d’analyse  
}}
}}
: Tableau 19: Eléments d’un plan de recherche pour une enquête par sondage   
: Tableau 19: Eléments d’un plan de recherche pour une enquête par sondage   
Ligne 72 : Ligne 67 :
4. Codage et vérification + construction d’échelle  
4. Codage et vérification + construction d’échelle  


5. Analyse statistique des données </td> </tr> </table> 
5. Analyse statistique des données
}}
}}
Tableau 20: Mise en oeuvre d’une enquête par sondage   
Tableau 20: Mise en oeuvre d’une enquête par sondage   
Ligne 78 : Ligne 73 :
Conseils pour la rédaction:   
Conseils pour la rédaction:   


1. Séparez la présentation des résultats de la discussion   
# Séparez la présentation des résultats de la discussion   
 
# Comparez toujours vos résultats à la théorie   
2. Comparez toujours vos résultats à la théorie   
# Assurez-vous de rendre votre texte lisible, e.g. placez vos résultats dans des tableaux
 
3. Assurez-vous de rendre votre texte lisible, e.g. placez vos résultats dans des tableaux


==  Niveaux de raisonnement et obstacles à la validité  ==
==  Niveaux de raisonnement et obstacles à la validité  ==
 
Nous avons précédemment vu qu’il existe un écart entre le raisonnement théorique et les données empiriques. En tant que chercheur, vous devez être en mesure de formuler des questions de recherche générales à un niveau global et être capable de les relier, par l’intermédiaire de l’opérationnalisation, à des indicateurs et indices précis au niveau des données. Vous devez également comprendre que l’interprétation de données statistiques est complexe et requiert un raisonnement et des connaissances sur les obstacles à la validité interne (Tableau 21).  <table class=MsoNormalTable border=1 cellspacing=0 cellpadding=0 width="96%"
style='width:96.76%;margin-left:9.0pt;border-collapse:collapse;border:none'> <tr style='page-break-inside:avoid;height:40.75pt'> <td width="27%" valign=top style='width:27.0%;border:solid windowtext 1.0pt;
  background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;height:40.75pt'>
''Niveau de raisonnement '' </td> <td width="22%" valign=top style='width:22.84%;border:solid windowtext 1.0pt;
  border-left:none;background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;
  height:40.75pt'>
''Variables '' </td> <td width="26%" valign=top style='width:26.94%;border:solid windowtext 1.0pt;
  border-left:none;background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;
  height:40.75pt'>
''Cas'' </td> <td width="23%" valign=top style='width:23.22%;border:solid windowtext 1.0pt;
  border-left:none;background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;
  height:40.75pt'>


''Relations (causes)'' </td> </tr> <tr style='page-break-inside:avoid;height:51.8pt'> <td width="27%" valign=top style='width:27.0%;border:solid windowtext 1.0pt;
Nous avons précédemment vu qu’il existe un écart entre le raisonnement théorique et les données empiriques. En tant que chercheur, vous devez être en mesure de formuler des questions de recherche générales à un niveau global et être capable de les relier, par l’intermédiaire de l’opérationnalisation, à des indicateurs et indices précis au niveau des données. Vous devez également comprendre que l’interprétation de données statistiques est complexe et requiert un raisonnement et des connaissances sur les obstacles à la validité interne (Tableau 21).
  border-top:none;background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;
  height:51.8pt'>


''Théorie'' </td> <td width="22%" valign=top style='width:22.84%;border-top:none;border-left:
<table class="wikitable">
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
<tr> <th valign=top>Niveau de raisonnement </th>
  background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;height:51.8pt'>  
<th>Variables</th>
<th>Cas</th>
<th>Relations (causes)</th>
</tr>
<tr> <td>  


concept /catégorie  </td> <td width="26%" valign=top style='width:26.94%;border-top:none;border-left:
''Théorie'' </td> <td>  
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;height:51.8pt'>  


dépendent de la portée de votre théorie </td> <td width="23%" valign=top style='width:23.22%;border-top:none;border-left:
concept /catégorie </td> <td>  
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;height:51.8pt'>  


sont exprimées verbalement à un niveau de langue élevé </td> </tr> <tr style='page-break-inside:avoid;height:51.8pt'> <td width="27%" valign=top style='width:27.0%;border:solid windowtext 1.0pt;
dépendent de la portée de votre théorie  </td> <td>  
  border-top:none;background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;
  height:51.8pt'>  


''Hypothèse '' </td> <td width="22%" valign=top style='width:22.84%;border-top:none;border-left:
sont exprimées verbalement à un niveau de langue élevé </td> </tr> <tr> <td>  
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;height:51.8pt'>  


variables et valeurs (attributs)  </td> <td width="26%" valign=top style='width:26.94%;border-top:none;border-left:
''Hypothèse '' </td> <td>  
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;height:51.8pt'>  


population mère (élèves, écoles)  </td> <td width="23%" valign=top style='width:23.22%;border-top:none;border-left:
variables et valeurs (attributs)  </td> <td> population mère (élèves, écoles)  </td> <td>  
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;height:51.8pt'>  


clairement énoncées comme des causalités ou des cooccurrences  </td> </tr> <tr style='page-break-inside:avoid;height:38.85pt'> <td width="27%" valign=top style='width:27.0%;border:solid windowtext 1.0pt;
clairement énoncées comme des causalités ou des cooccurrences  </td> </tr> <tr> <td>  
  border-top:none;background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;
  height:38.85pt'>  


''Opérationnalisation '' </td> <td width="22%" valign=top style='width:22.84%;border-top:none;border-left:
''Opérationnalisation '' </td> <td>  
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;height:38.85pt'>  


dimensions et indicateurs  </td> <td width="26%" valign=top style='width:26.94%;border-top:none;border-left:
dimensions et indicateurs  </td> <td>  
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;height:38.85pt'>  


échantillonnage suffisamment bon  </td> <td width="23%" rowspan=3 valign=top style='width:23.22%;border-top:none;
échantillonnage suffisamment bon  </td> <td rowspan=3>  
  border-left:none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;height:38.85pt'>  


sont des relations statistiques entre des variables statistiques (e.g. échelles composées, variables socio-démographiques) </td> </tr> <tr style='page-break-inside:avoid;height:51.8pt'> <td width="27%" valign=top style='width:27.0%;border:solid windowtext 1.0pt;
sont des relations statistiques entre des variables statistiques (e.g. échelles composées, variables socio-démographiques) </td> </tr> <tr> <td>  
  border-top:none;background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;
  height:51.8pt'>  


''Mesure '' </td> <td width="22%" valign=top style='width:22.84%;border-top:none;border-left:
''Mesure '' </td> <td>  
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;height:51.8pt'>  


indicateurs observés (e.g. questions de sondage)  </td> <td width="26%" valign=top style='width:26.94%;border-top:none;border-left:
indicateurs observés (e.g. questions de sondage)  </td> <td>  
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;height:51.8pt'>  


sujets dans l’échantillon  </td> </tr> <tr style='page-break-inside:avoid;height:78.7pt'> <td width="27%" valign=top style='width:27.0%;border:solid windowtext 1.0pt;
sujets dans l’échantillon  </td> </tr> <tr> <td>  
  border-top:none;background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;
  height:78.7pt'>  


''Statistiques '' </td> <td width="22%" valign=top style='width:22.84%;border-top:none;border-left:
''Statistiques '' </td> <td>  
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;height:78.7pt'>  


mesures (e.g. réponses aux questions), échelles (mesures composées)  </td> <td width="26%" valign=top style='width:26.94%;border-top:none;border-left:
mesures (e.g. réponses aux questions), échelles (mesures composées)  </td> <td>  
  none;border-bottom:solid windowtext 1.0pt;border-right:solid windowtext 1.0pt;
  background:#FFFF99;padding:3.75pt 6.0pt 3.75pt 6.0pt;height:78.7pt'>  


données (variables numériques) </td> </tr> </table>   
données (variables numériques) </td> </tr> </table>   
Ligne 179 : Ligne 125 :
Tableau 21: Niveaux de raisonnement dans une approche avec méthodes statistiques   
Tableau 21: Niveaux de raisonnement dans une approche avec méthodes statistiques   


''Typologie des erreurs de validité interne'' 
'''Typologie des erreurs de validité interne'''
 
''''Erreur de type 1: '''' Vous croyez qu’un lien statistique entre deux variables est pertinent, car il existe une bonne corrélation entre ces deux variables, mais «en réalité» cette corrélation n’existe pas. Il se peut que la raison principale soit une variable qui influence les deux. 
 
* En termes complexes: vous rejetez à tort l’hypothèse nulle (pas de lien entre les variables) 
 
''''Erreur de type 2: '''' Vous croyez qu’un lien n’existe pas ... mais «en réalité» il y a bien relation entre les deux variables. 


* E.g., vous calculez un coefficient de corrélation et les résultats indiquent qu’il est très faible ou insignifiant. Un lien pourrait toutefois exister. La relation n’était peut-être pas linéaire, ou peut-être qu’une autre variable a causé un effet d’interaction...   
; Erreur de type 1
:Vous croyez qu’un lien statistique entre deux variables est pertinent, car il existe une bonne corrélation entre ces deux variables, mais «en réalité» cette corrélation n’existe pas. Il se peut que la raison principale soit une variable qui influence les deux.  
: En termes complexes: vous rejetez à tort l’hypothèse nulle (pas de lien entre les variables)  


* En termes plus complexes: vous acceptez à tort l’hypothèse nulle   
; Erreur de type 2
: Vous croyez qu’un lien n’existe pas ... mais «en réalité» il y a bien relation entre les deux variables. 
: E.g., vous calculez un coefficient de corrélation et les résultats indiquent qu’il est très faible ou insignifiant. Un lien pourrait toutefois exister. La relation n’était peut-être pas linéaire, ou peut-être qu’une autre variable a causé un effet d’interaction... 
: En termes plus complexes: vous acceptez à tort l’hypothèse nulle   


Les méthodes statistiques vous permettent de tester d’autres hypothèses et par conséquent de diminuer les risques d’erreurs de validité internes. Comme toujours: réfléchissez!
Les méthodes statistiques vous permettent de tester d’autres hypothèses et par conséquent de diminuer les risques d’erreurs de validité internes. Comme toujours: réfléchissez!
Ligne 195 : Ligne 140 :
==  Exemples d’enquêtes par sondage  ==
==  Exemples d’enquêtes par sondage  ==
    
    
=== Exemple Facteurs qui favorisent l’utilisation des TIC par les enseignants ===


''Exemple'': Facteurs qui favorisent l’utilisation des TIC par les enseignants'' 
Luis Gonzalez (2004): Etude pilote sur la mise en oeuvre et les perceptions des TIC. Mémoire de Master en technologie éducative, Université de Genève, ([http://tecfaetu.unige.ch/staf/staf-h/gonzalez/staf25/memoire-STAF.pdf PDF])  
 
Luis Gonzalez (2004): Etude pilote sur la mise en oeuvre et les perceptions des TIC. Mémoire de Master en technologie éducative, Université de Genève
 
[http://tecfaetu.unige.ch/staf/staf-h/gonzalez/staf25/memoire-STAF.pdf http://tecfaetu.unige.ch/staf/staf-h/gonzalez/staf25/memoire-STAF.pdf]   


Le but principal de ce travail de recherche, est «d’étudier les facteurs qui favorisent l’utilisation des TIC par les enseignants».   
Le but principal de ce travail de recherche, est «d’étudier les facteurs qui favorisent l’utilisation des TIC par les enseignants».   


''Facteurs:'' 
; Facteurs
 
: L’auteur définit 8 facteurs et postule qu’il existe des relations entre eux (Figure 36):   
L’auteur définit 8 facteurs et postule qu’il existe des relations entre eux (Figure 36):   
 
 


[[Fichier:Relation entre les facteurs - Mémoire L. Gonzalez, 2004, p. 18.jpeg|cadre|néant|Figure 36: Relation entre les facteurs (Mémoire L. Gonzalez, 2004, p. 18)]]
[[Fichier:Relation entre les facteurs - Mémoire L. Gonzalez, 2004, p. 18.jpeg|cadre|néant|Figure 36: Relation entre les facteurs (Mémoire L. Gonzalez, 2004, p. 18)]]
 


''Hypothèses'': 
; Hypothèses


Voici un extrait de ce mémoire (pp. 18-19) :   
Voici un extrait de ce mémoire (pp. 18-19) :   


&#8220;Mon hypothèse principale postule l’existence d’une corrélation entre les facteurs suivants et la
Mon hypothèse principale postule l’existence d’une corrélation entre les facteurs suivants et la mise en oeuvre des TIC par les enseignants:   
 
mise en oeuvre des TIC par les enseignants:   


* Le type de support offert par le cadre institutionnel   
* Le type de support offert par le cadre institutionnel   
* Leurs compétences pédagogiques   
* Leurs compétences pédagogiques   
* Leurs compétences techniques   
* Leurs compétences techniques   
* La formation reçue, que ce soit la formation de base ou la formation continue   
* La formation reçue, que ce soit la formation de base ou la formation continue   
* Leur sentiment d’auto-efficacité   
* Leur sentiment d’auto-efficacité   
* Leur perception des technologies   
* Leur perception des technologies   
* Leur perception de l’usage pédagogique des TIC   
* Leur perception de l’usage pédagogique des TIC   
* Leur rationalisation et digitalisation pédagogique   
* Leur rationalisation et digitalisation pédagogique   


Ligne 240 : Ligne 169 :


* La perception de l’usage pédagogique est corrélée avec les compétences pédagogiques de l’enseignant   
* La perception de l’usage pédagogique est corrélée avec les compétences pédagogiques de l’enseignant   
* La perception des technologies est corrélée avec celle de l’usage pédagogique   
* La perception des technologies est corrélée avec celle de l’usage pédagogique   
* La dimension de radicalisation et de digitalisation pédagogique est corrélée avec la perception des technologies   
* La dimension de radicalisation et de digitalisation pédagogique est corrélée avec la perception des technologies   
* La formation est corrélée avec les compétences pédagogiques et techniques   
* La formation est corrélée avec les compétences pédagogiques et techniques   
* Le sentiment d’auto-efficacité de est corrélé avec les compétences pédagogiques et techniques   
* Le sentiment d’auto-efficacité de est corrélé avec les compétences pédagogiques et techniques   
* La dimension de radicalisation et de digitalisation pédagogique est corrélée avec le sentiment d’auto-efficacité&#8221;   
* La dimension de radicalisation et de digitalisation pédagogique est corrélée avec le sentiment d’auto-efficacité&#8221;   


''Méthode d’échantillonnage (p. 20)'' 
; Méthode d’échantillonnage (p. 20)
 
* Echantillon représentatif de futurs enseignants du primaire (étudiants), N = 48   
* Echantillon représentatif de futurs enseignants du primaire (étudiants), N = 48   
* Echantillon non-représentatif d’enseignants du primaire, N = 38   
* Echantillon non-représentatif d’enseignants du primaire, N = 38   
* Un e-mail a été envoyé à tous les enseignants de Genève disposant d’une adresse électronique, auto-sélection (!)   
* Un e-mail a été envoyé à tous les enseignants de Genève disposant d’une adresse électronique, auto-sélection (!)   


* Remarque: le questionnaire était très long, quelques enseignants qui avaient commencé à le remplir ont abandonné après un certain temps.
Remarque: le questionnaire était très long, quelques enseignants qui avaient commencé à le remplir ont abandonné après un certain temps. Ce type d’échantillonnage convient à une étude pilote ou à un petit travail de mémoire de Master   
 
* Ce type d’échantillonnage convient à une étude pilote ou à un petit travail de mémoire de Master
 
''Design du questionnaire'' 
 
Dans la mesure du possible, les définitions de chaque «domaine conceptuel» (voir ci-dessus) ainsi que les séries de questions et les échelles ont été adaptées depuis la littérature. 
 
''Collecte de données'' 
 
Les données ont été recueillies par l’intermédiaire d’un questionnaire en ligne (à l’aide de l’interface phpESP) 
 
''Purification de l’instrument''  


Cela a été fait par «une analyse factorielle et un regroupement des items définissant des indices susceptibles de résumer les variables» (i.e. les 8 facteurs) p. 21. Remarque: si vous utilisez des instruments publiés et sérieusement testés, cette opération n’est pas nécessaire!  
; Design du questionnaire
: Dans la mesure du possible, les définitions de chaque «domaine conceptuel» (voir ci-dessus) ainsi que les séries de questions et les échelles ont été adaptées depuis la littérature.   


''Perception de l’usage pédagogique des TIC''  
; Collecte de données
: Les données ont été recueillies par l’intermédiaire d’un questionnaire en ligne (à l’aide de l’interface phpESP)  


Dans le questionnaire, ce concept est mesuré avec deux ''séries de questions'' (échelles).   
; Purification de l’instrument
: Cela a été fait par «une analyse factorielle et un regroupement des items définissant des indices susceptibles de résumer les variables» (i.e. les 8 facteurs) p. 21. Remarque: si vous utilisez des instruments publiés et sérieusement testés, cette opération n’est pas nécessaire!  


La perception de l’utilisation pédagogique des TIC se mesure avec deux séries de questions: une première série interroge sur l’attitude des individus à l’égard de «déclarations officielles» sur l’utilisation des ressources informatiques dans l’éducation. La deuxième série mesure l’utilité attribuée à différents types de ressources utilisant l’informatique.   
; Perception de l’usage pédagogique des TIC
 
: Dans le questionnaire, ce concept est mesuré avec deux ''séries de questions'' (échelles). 
Les deux séries de questions utilisent les mêmes types de réponses: 1=pas du tout d’accord, 2=pas vraiment d’accord, 3=plutôt d’accord, 4=tout à fait d’accord.   
: La perception de l’utilisation pédagogique des TIC se mesure avec deux séries de questions: une première série interroge sur l’attitude des individus à l’égard de «déclarations officielles» sur l’utilisation des ressources informatiques dans l’éducation. La deuxième série mesure l’utilité attribuée à différents types de ressources utilisant l’informatique.   
: Les deux séries de questions utilisent les mêmes types de réponses: 1=pas du tout d’accord, 2=pas vraiment d’accord, 3=plutôt d’accord, 4=tout à fait d’accord.   


A partir de ces questions, trois indices ont été produits (pp.28-9):   
A partir de ces questions, trois indices ont été produits (pp.28-9):   
* Var_PUP1 ― degré d’importance des outils d’entraide et de collaboration pour les élèves   
* Var_PUP1 ― degré d’importance des outils d’entraide et de collaboration pour les élèves   
* Var_PUP2 ― degré d’importance des outils de communication entre élèves   
* Var_PUP2 ― degré d’importance des outils de communication entre élèves   
* Var_PUP3 ― accord sur ce qui favorise les apprentissages de type constructiviste
* Var_PUP3 ― accord sur ce qui favorise les apprentissages de type constructiviste

Dernière version du 16 avril 2022 à 10:46

Manuel de recherche en technologie éducative
Module: Designs de recherche orientés test de théorie
◀▬▬▶
à améliorer débutant
2022/04/16 ⚒⚒ 2015/03/27

Introduction

D’une certaine manière, les designs statistiques sont conceptuellement liés aux designs expérimentaux. Les designs statistiques formulent des lois ayant pour vocation d'être généralisées à une population, les cas individuels n’ont donc pas d'intérêt. L’avantage de ce design est qu’il est possible de tester un nombre relativement important de lois (hypothèses) avec des données statistiques. On qualifie souvent de telles analyses de corrélationnelles, car elles ont pour but de démontrer des relations statistiques entre des variables, sans pour autant inférer de lien causal.

De tels designs de recherche s’appuient sur un raisonnement théorique antérieur, car:

  1. les mesures, i.e. les questionnaires ont une fiabilité (au sens large du terme) limitée:
    • ce que les gens disent peut ne pas correspondre à ce qu’ils font
    • ce que vous demandez pourrait ne pas mesurer ce que vous voulez observer
  2. il y a une surdétermination statistique,
    • vous pouvez trouver des corrélations entre variables, mais comme nous l’avons vu précédemment, les corrélations ne sont pas nécessairement synonymes de causalités.
  3. vous ne pouvez pas obtenir une «image inductive» en posant une dizaine de questions fermées.

Le design de recherche dominant est mené de façon descendante et comprend en partie la doctrine du rationalisme critique de Popper, que l’on appelle également le falsificationnisme. Comment procéder?

  1. Commencez par formuler des hypothèses (des modèles qui contiennent des variables que vous pouvez mesurer plus des relations que vous désirez tester)
  2. Mesurez les variables (e.g. à l’aide d’un questionnaire et/ou d’un test)
  3. Testez alors les relations à l’aide d’outils statistiques
  4. Testez alors des hypothèses alternatives selon le même principe. Vous devez également montrer que vos hypothèses ne sont pas falsifiables.

Le design statistique le plus utilisé en technologie éducative est l’enquête par sondage. Toutefois, avec l'incrémentation d'environnements en ligne, on utilise de plus en plus de données "analytiques" qui collectent de l'information concernant le comportement en ligne. Il existe aussi une foule de données socio-économique (par exemple cueillis lors de recensements populaires). Finalement, il existe des études larges comme PISA et qui admistrent des tests à des élèves.

Introduction à l’enquête par sondage

La méthode de l'enquête par sondage a maintenant plus de soixante ans et est bien documentée dans les manuels de méthodologie. Elle consiste à recueillir des informations auprès des gens sur leurs attitudes, comportements, expériences, conditions socio-économiques, etc. par le biais d’un questionnaire. Ce questionnaire peut être administré au format papier, lors d’un entretien présentiel, par téléphone ou par internet. Généralement l'enquête par sondage cherche à tester une théorie sur une assez grande population (e.g. "les étudiants de sciences sociales" ou "les adolescents à la fin de l'enseignement obligatoire dans les pays de l'OCDE"). Le questionnaire ne peut être administré à l’entièreté d’une population et seul un échantillon représentatif, typiquement quelques centaines de personnes, est sollicité pour répondre aux questions.

Voici la structure type d’un plan de recherche pour une enquête par sondage (Tableau 19):

1. Revue de littérature menant aux questions de recherche générales et/ou au cadre d’analyse

2. Vous pouvez utiliser une approche qualitative dans le cadre d’une étude préliminaire pour étudier de nouveaux domaines de recherche et les citer ici.

3. Définition des hypothèses

4. Opérationnalisation des hypothèses, e.g. définition des échelles et des questionnaires liés

5. Définition de la population mère

6. Stratégies d’échantillonnage

7. Identification des méthodes d’analyse

Tableau 19: Eléments d’un plan de recherche pour une enquête par sondage

La mise en oeuvre de ce type de recherche (en dehors de la rédaction) se déroule en cinq étapes (Tableau 20):

1. Elaboration du questionnaire (avec des entrées de préférence provenant d’échelles publiées)

2. Test du questionnaire avec 2-3 sujets

3. Sondage (entretiens présentiels, en ligne ou par écrit)

4. Codage et vérification + construction d’échelle

5. Analyse statistique des données

Tableau 20: Mise en oeuvre d’une enquête par sondage

Conseils pour la rédaction:

  1. Séparez la présentation des résultats de la discussion
  2. Comparez toujours vos résultats à la théorie
  3. Assurez-vous de rendre votre texte lisible, e.g. placez vos résultats dans des tableaux

Niveaux de raisonnement et obstacles à la validité

Nous avons précédemment vu qu’il existe un écart entre le raisonnement théorique et les données empiriques. En tant que chercheur, vous devez être en mesure de formuler des questions de recherche générales à un niveau global et être capable de les relier, par l’intermédiaire de l’opérationnalisation, à des indicateurs et indices précis au niveau des données. Vous devez également comprendre que l’interprétation de données statistiques est complexe et requiert un raisonnement et des connaissances sur les obstacles à la validité interne (Tableau 21).

Niveau de raisonnement Variables Cas Relations (causes)
Théorie concept /catégorie dépendent de la portée de votre théorie sont exprimées verbalement à un niveau de langue élevé
Hypothèse variables et valeurs (attributs) population mère (élèves, écoles) clairement énoncées comme des causalités ou des cooccurrences
Opérationnalisation dimensions et indicateurs échantillonnage suffisamment bon sont des relations statistiques entre des variables statistiques (e.g. échelles composées, variables socio-démographiques)
Mesure indicateurs observés (e.g. questions de sondage) sujets dans l’échantillon
Statistiques mesures (e.g. réponses aux questions), échelles (mesures composées) données (variables numériques)

Tableau 21: Niveaux de raisonnement dans une approche avec méthodes statistiques

Typologie des erreurs de validité interne

Erreur de type 1
Vous croyez qu’un lien statistique entre deux variables est pertinent, car il existe une bonne corrélation entre ces deux variables, mais «en réalité» cette corrélation n’existe pas. Il se peut que la raison principale soit une variable qui influence les deux.
En termes complexes: vous rejetez à tort l’hypothèse nulle (pas de lien entre les variables)
Erreur de type 2
Vous croyez qu’un lien n’existe pas ... mais «en réalité» il y a bien relation entre les deux variables.
E.g., vous calculez un coefficient de corrélation et les résultats indiquent qu’il est très faible ou insignifiant. Un lien pourrait toutefois exister. La relation n’était peut-être pas linéaire, ou peut-être qu’une autre variable a causé un effet d’interaction...
En termes plus complexes: vous acceptez à tort l’hypothèse nulle

Les méthodes statistiques vous permettent de tester d’autres hypothèses et par conséquent de diminuer les risques d’erreurs de validité internes. Comme toujours: réfléchissez!

Exemples d’enquêtes par sondage

Exemple Facteurs qui favorisent l’utilisation des TIC par les enseignants

Luis Gonzalez (2004): Etude pilote sur la mise en oeuvre et les perceptions des TIC. Mémoire de Master en technologie éducative, Université de Genève, (PDF)

Le but principal de ce travail de recherche, est «d’étudier les facteurs qui favorisent l’utilisation des TIC par les enseignants».

Facteurs
L’auteur définit 8 facteurs et postule qu’il existe des relations entre eux (Figure 36):
Figure 36: Relation entre les facteurs (Mémoire L. Gonzalez, 2004, p. 18)
Hypothèses

Voici un extrait de ce mémoire (pp. 18-19) :

Mon hypothèse principale postule l’existence d’une corrélation entre les facteurs suivants et la mise en oeuvre des TIC par les enseignants:

  • Le type de support offert par le cadre institutionnel
  • Leurs compétences pédagogiques
  • Leurs compétences techniques
  • La formation reçue, que ce soit la formation de base ou la formation continue
  • Leur sentiment d’auto-efficacité
  • Leur perception des technologies
  • Leur perception de l’usage pédagogique des TIC
  • Leur rationalisation et digitalisation pédagogique

Les hypothèses secondaires sont les suivantes:

  • La perception de l’usage pédagogique est corrélée avec les compétences pédagogiques de l’enseignant
  • La perception des technologies est corrélée avec celle de l’usage pédagogique
  • La dimension de radicalisation et de digitalisation pédagogique est corrélée avec la perception des technologies
  • La formation est corrélée avec les compétences pédagogiques et techniques
  • Le sentiment d’auto-efficacité de est corrélé avec les compétences pédagogiques et techniques
  • La dimension de radicalisation et de digitalisation pédagogique est corrélée avec le sentiment d’auto-efficacité”
Méthode d’échantillonnage (p. 20)
  • Echantillon représentatif de futurs enseignants du primaire (étudiants), N = 48
  • Echantillon non-représentatif d’enseignants du primaire, N = 38
  • Un e-mail a été envoyé à tous les enseignants de Genève disposant d’une adresse électronique, auto-sélection (!)

Remarque: le questionnaire était très long, quelques enseignants qui avaient commencé à le remplir ont abandonné après un certain temps. Ce type d’échantillonnage convient à une étude pilote ou à un petit travail de mémoire de Master

Design du questionnaire
Dans la mesure du possible, les définitions de chaque «domaine conceptuel» (voir ci-dessus) ainsi que les séries de questions et les échelles ont été adaptées depuis la littérature.
Collecte de données
Les données ont été recueillies par l’intermédiaire d’un questionnaire en ligne (à l’aide de l’interface phpESP)
Purification de l’instrument
Cela a été fait par «une analyse factorielle et un regroupement des items définissant des indices susceptibles de résumer les variables» (i.e. les 8 facteurs) p. 21. Remarque: si vous utilisez des instruments publiés et sérieusement testés, cette opération n’est pas nécessaire!
Perception de l’usage pédagogique des TIC
Dans le questionnaire, ce concept est mesuré avec deux séries de questions (échelles).
La perception de l’utilisation pédagogique des TIC se mesure avec deux séries de questions: une première série interroge sur l’attitude des individus à l’égard de «déclarations officielles» sur l’utilisation des ressources informatiques dans l’éducation. La deuxième série mesure l’utilité attribuée à différents types de ressources utilisant l’informatique.
Les deux séries de questions utilisent les mêmes types de réponses: 1=pas du tout d’accord, 2=pas vraiment d’accord, 3=plutôt d’accord, 4=tout à fait d’accord.

A partir de ces questions, trois indices ont été produits (pp.28-9):

  • Var_PUP1 ― degré d’importance des outils d’entraide et de collaboration pour les élèves
  • Var_PUP2 ― degré d’importance des outils de communication entre élèves
  • Var_PUP3 ― accord sur ce qui favorise les apprentissages de type constructiviste