Discussion:Text mining de forums

De EduTech Wiki
Aller à : navigation, rechercher

1 Commentaire STIC III -- Mattia A. Fritz (discussion) 19 janvier 2015 à 13:17 (CET)

Bonjour Margot,

même si ton travail n'est pas encore terminé, je commence à commenter les parties qui me semblent achevée.

Je trouve ton introduction et tes références bibliographiques très pertinentes. Je pensais que les forums pouvaient être des outils étudiés en général(on en a eu la preuve d'ailleurs dans le séminaire de recherche) mais tu as trouvé des références très ciblées, avec des indices, etc. en relation avec tes objectifs.

Tes questions de recherches me semblent à ce propos cohérentes avec les éléments théoriques que tu as pu repérer dans la littérature. Je trouve à chaque fois ta comparaison entre le particulier du chapitre et l'ensemble du module très pertinente. Dans un hypothétique plan séquentiel, les deux critères pourraient bien être exploités pour analyser les changements au fil des années.

En ce qui concerne le traitement des questions 2 et 3, je n'ai pas vraiment de commentaires sur la démarche. Bien entendu dès que des manipulation sont envisagées, il y toujours différentes manières pour obtenir un résultat (c'est d'ailleurs ce que tu montres justement dans la question 2 avec l'utilisation de deux logiciels). Je me limite donc à un petit commentaire de forme: dans la partie de la question 2 qui concerne Voyant Tool, je trouve que les captures d'écran qui présentent les nombre des messages ne soient pas vraiment utiles. Je pense que tu peux juste montrer la première ainsi qu'on dispose d'un repère graphique du résultat obtenu, mais pour l'ensemble des résultats le tableau récapitulatif est suffisant.

Bien cordialement, Mattia

1.1 Re: Commentaire STIC III -- Margot.baehler (discussion) 19 janvier 2015 à 19:00 (CET)

Bonjour Mattia,

Merci beaucoup pour tes commentaires :)

Tu as raison pour Voyant Tools, je vais simplement laisser la première capture d'écran, ce sera plus agréable pour la lecture.

Bonne soirée,

Margot

2 Commentaire STIC III -- Axelle.rollier (discussion) 26 janvier 2015 à 18:09 (CET)

Salut Margot,

Je trouve que ton travail est très bien et cohérent et je n'ai donc pas grand chose à y redire.

J'ai juste une petite interrogation qui m'est venue à propos de ta question 2. Dans le cadre de cet article, tu as anonymisé les noms des participants au forum et tu utilises leur username pour compter les messages. Or, comme tu l'as dis, les prénoms des étudiants peuvent apparaitre dans le corps du message. Du coup, si on utilise ta méthode pour compter les messages, sans anonymiser les étudiants, il y a aura forcément un conflit entre les nom des utilisateurs et ceux dans le message. Dans ce cas là, il faudrait segmenter différemment les messages. Qu'en penses-tu?

Très bonne fin de journée à toi,

Axelle

2.1 Re: Commentaire STIC III -- Margot.baehler (discussion) 26 janvier 2015 à 18:19 (CET)

Bonjour Axelle,

Merci beaucoup pour ton commentaire et ta question !

Alors, en effet, il faudrait faire en sorte que le username soit dissocié du prénom/nom de l'étudiant pouvant apparaître dans le corps du message (par exemple lorsque l'étudiant salue l'étudiant auquel il répond ou lorsque l'étudiant signe son message).

Si l'enseignant souhaite savoir quel étudiant a écrit quoi, il serait tout à fait possible de remplacer chaque username par un UserXXXXX non anonyme, par exemple en ayant un tableau récapitulant prénom/nom de l'étudiant et le user qui lui a été attribué.

Bonne soirée,

Margot

2.2 Re: Commentaire STIC III -- Daniel K. Schneider (discussion) 4 février 2015 à 17:42 (CET)

Travail assez intéressant et sérieux. Toutefois, dans l'exemple il me manque un peu de texte mining et du social network analysis au sens où cela a été défini au début du texte (speech acts)

Les infos (autres que les nuages de mots) que vous avez finalement extrait sont intéressantes, mais à priori ce serait au développeur de la plateforme de fournir ce type d'analytics.