« Text mining de forums » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
mAucun résumé des modifications
Ligne 18 : Ligne 18 :
*
*


==Text mining appliqué au forum d'une formation à distance==
==Text mining appliqué au forum d'une formation à distance : solutions exemplaires==


===Constitution du corpus===
===Constitution du corpus===

Version du 17 novembre 2014 à 19:34

Introduction

Dans les dispositifs de formation hybrides ou les dispositifs de formation entièrement à distance, les forums sont régulièrement utilisés pour établir et stimuler l’interaction de l’enseignant avec les étudiants, mais également l'interaction entre pairs (entre étudiants).

Les forums peuvent être utiles à l'enseignant pour évaluer les étudiants, mais aussi pour évaluer son enseignement. En effet, les discussions asynchrones peuvent être sources d'apprentissage puisque la participation des étudiants au forum leur permet de réfléchir sur les contenus du cours, ainsi que d'échanger et de confronter leurs points de vue avec ceux des autres étudiants, dans une perspective socio-constructivste. Les messages postés par les étudiants dans les forums de cours sont des données très utiles, dans le sens où elles permettent à l'enseignant d'observer des informations sur les étudiants, que ce soit sur un étudiant particulier ou sur sa classe en général. Effectivement, l'enseignant peut par exemple voir quels sont les contenus, thématiques, parties du cours qui posent problème aux étudiants, il peut alors adapter son enseignement en fonction de ces informations.

Toutefois, si l’enseignant a un grand nombre d’étudiant cette analyse « manuelle » peut prendre énormément de temps : l'enseignant doit passer en revue l'ensemble des fils de discussions et l'ensemble des messages pour obtenir des données.

Le text mining permet d'automatiser le traitement de volumes conséquents de contenus textuels pour en extraire les principales caractéristiques et tendances, afin de relever de manière statistique les sujets, les connaissances, les thèmes qui y sont évoqués. Cette technique permet alors à l'enseignant d'automatiser le traitement des données contenues dans le forum de son cours et d'obtenir rapidement des éléments permettant l'évaluation des étudiants et/ou de son enseignement.

Afin de montrer en quoi et comment le text mining permet ceci, nous avons pris l'exemple d'une formation à distance aux compétences numériques proposée aux étudiants de première année de Bachelor dans le cadre de la Faculté de Psychologie et des Sciences de l'Education. Nous nous intéresserons au premier module, le module traitement de texte qui comporte six chapitres. Les étudiants sont suivis et accompagnés par des tuteurs via un cours sur la plateforme Moodle de l'UNIGE. Il est demandé aux étudiants qu'ils participent activement et régulièrement au forum de leur groupe. L'idée étant que chaque étudiant poste un message minimum par semaine, que ce soit une réaction, une question ou une réponse en lien avec le chapitre en cours. Cette participation est l'une des conditions pour obtenir l'attestation de suivi de formation au terme de celle-ci.

Les questions auxquelles nous souhaitons répondre

  • Pour chaque chapitre, quels sont les termes qui semblent poser problème aux étudiants ?
  • Pour l'ensemble du module traitement de texte, quels sont les termes qui semblent poser problème aux étudiants ?

Text mining appliqué au forum d'une formation à distance : solutions exemplaires

Constitution du corpus

Le corpus est constitué de six fils de discussion issu du forum d'un des groupes du cours à distance aux compétences numériques. Chacun des ces fils de discussion correspond à un chapitre du module traitement de texte :

  • Chapitre 1 : Dossiers, fichiers et documents
  • Chapitre 2 : L'environnement des logiciels de traitement de texte
  • Chapitre 3 : Mise en forme de texte
  • Chapitre 4 : Mise en forme des caractères et des paragraphes
  • Chapitre 5 : Les styles
  • Chapitre 6 : Eléments de mise en page du document

Chaque fil de discussion contient en moyenne une vingtaine de messages.

Filtrage/nettoyage

Transformation des documents

Analyses et interprétation des résultats