« STIC:Mons2014 » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
 
(9 versions intermédiaires par le même utilisateur non affichées)
Ligne 29 : Ligne 29 :
(adapté à l'audience et à la dynamique du séminaire)
(adapté à l'audience et à la dynamique du séminaire)


=== Introduction et survol ===
=== Introduction et survol (mardi matin) ===


(voir Power Point)
Voir Power Point: disponible ici: http://tecfa.unige.ch/tecfa/talks/schneide/mons2014/


* Les hype cycles: https://hypecycle.umn.edu/
* Motivation
* Motivation
* Diversité de méthodes de traitements informatisés de texte et d'outils: textométrie, linguistique de corpus, text mining, annotations, etc.
* Diversité de méthodes de traitements informatisés de texte et d'outils: textométrie, linguistique de corpus, text mining, annotations, etc.
Ligne 38 : Ligne 39 :
* Workflow pour les analyses statistiques
* Workflow pour les analyses statistiques


=== Tour d'outils en ligne ===
=== Tour d'outils en ligne (mardi après-midi) ===


* [[:en:Special:RunQuery/Data_mining_and_learning_analytics_tools_query|Formulaire de recherche]] (EduTechWiki Anglais: Sélectionnez "text mining")
* [[:en:Special:RunQuery/Data_mining_and_learning_analytics_tools_query|Formulaire de recherche]] (EduTechWiki Anglais: Sélectionnez "text mining")
Ligne 47 : Ligne 48 :
* Lexos: http://lexos.wheatoncollege.edu/
* Lexos: http://lexos.wheatoncollege.edu/
* Docuburst: http://vialab.science.uoit.ca/docuburst/
* Docuburst: http://vialab.science.uoit.ca/docuburst/
* TextAlyser: http://textalyser.net
* ...
* ...


=== Introduction au text mining avec R ===
=== Introduction au text mining avec R (mercredi) ===


Articles sur R:
* [[Tutoriels R]]
* [[Tutoriels R]]
* [[Premiers pas avec R]]
* [[Les données R]]
* [[Importer des données dans R]]
* ( [[Traitement de données alphanumériques avec R]] )
* ( [[Analyses statistiques avec R]] )
* [[Text mining avec R]]
* '''[[Tutoriel tm text mining package]]''' - [[Tutoriel tm text mining package/wiki category script]]
* '''[[Tutoriel koRpus]]''' - '''[[Tutoriel koRpus/test script]]'''
* '''[[Analyse de sentiments avec R]]''' - '''[[Analyse de sentiments avec R/test_script]]'''


=== Usages pédagogiques ===
Voir aussi:
* [[Text mining]]
* [[Clustering et classification hiérarchique en text mining]]
* [[Web scraping]]
* [[Text_mining de forums]]
* [[IRaMuTeQ]]
 
=== Usages pédagogiques et suite ===
 
* Discussion finale


== Ressources ==
== Ressources ==
Ligne 68 : Ligne 89 :
* Voir aussi Krajka, Jarosław (2007) Corpora and Language Teachers: From Ready-Made to Teacher-Made Collections. CORELL: Computer Resources for Language Learning 1, 36-55. [http://www.ucam.edu/sites/default/files/corell/JKrajka.pdf PDF]
* Voir aussi Krajka, Jarosław (2007) Corpora and Language Teachers: From Ready-Made to Teacher-Made Collections. CORELL: Computer Resources for Language Learning 1, 36-55. [http://www.ucam.edu/sites/default/files/corell/JKrajka.pdf PDF]


; Extraire des texte d'un Mediawiki
; Extraire des textes d'un Mediawiki
: Au lieu d'enregistrer une page en HTML, il vaut mieux sortir une version XMLisée via l'[http://www.mediawiki.org/wiki/API:Main_pageAPI Mediawiki]
: Au lieu d'enregistrer une page en HTML, il vaut mieux sortir une version XMLisée via l'[http://www.mediawiki.org/wiki/API:Main_pageAPI Mediawiki]


Ligne 74 : Ligne 95 :
* <nowiki>http://fr.wikipedia.org/w/api.php?action=parse&format=xml&page=</nowiki>
* <nowiki>http://fr.wikipedia.org/w/api.php?action=parse&format=xml&page=</nowiki>
: Exemple: http://fr.wikipedia.org/w/api.php?action=parse&format=xml&page=mons
: Exemple: http://fr.wikipedia.org/w/api.php?action=parse&format=xml&page=mons
[[Catégorie: Cours et travaux]]

Dernière version du 18 mars 2020 à 23:41

Séminaire Analyse de Données Textuelles

Unité de technologie de l'éducation
Département des Sciences et de la Technologie de l'Education
Université de Mons
Mercredi/jeui 3/4 décembre 2014

Animateur

Daniel K. Schneider
TECFA, Université de Genève

Résumé du programme

Titre: Méthodes et outils d'analyse de données textuelles, un nouveau souffle ?

L'analyse de données textuelles, notamment sous le label "text mining" connait un nouvel essor grâce à son usage dans les technologies web (indexage, recherche et analytique). Le text mining est aussi utilisé dans le « learning analytics ». Ces derniers ont aussi comme objectif de permettre aux enseignants et aux apprenants de « comprendre ce qui se passe », c’est-à-dire, donner un aperçu du comportement et des productions des participants. Certains comportements et productions sont textuels (travaux, forums, pages wiki, messages, etc.)

Dans ce séminaire nous allons nous pencher sur des outils "text mining" et nous interroger comment ils pourraient contribuer à la qualité de l'enseignement et de l'apprentissage.

La première journée sera d'abord consacrée à une petite introduction aux divers méthodes d'analyse automatique de texte. On explorera ensuite les nouveaux outils en ligne qui permettent d'effectuer des analyses simples de façon conviviale (Voyant, Taporware, DocuBurst, etc).

La deuxième journée sera consacré à une initiation au logiciel R et aux extensions diverses pour récupérer, préparer, transformer et analyser des textes. R semble devenir une solution de choix dans la recherche et malgré l'absence d'une interface conviviale. Un autre avantage de R est qu'on peut l'interfacer avec une plateforme en ligne afin de produire des analyses en temps réel. S'il reste du temps, on fera un petit tour d'autres outils.

Nous allons finir le séminaire avec une discussion sur quelques scénarios d'usage.

Programme détaillé

(adapté à l'audience et à la dynamique du séminaire)

Introduction et survol (mardi matin)

Voir Power Point: disponible ici: http://tecfa.unige.ch/tecfa/talks/schneide/mons2014/

  • Les hype cycles: https://hypecycle.umn.edu/
  • Motivation
  • Diversité de méthodes de traitements informatisés de texte et d'outils: textométrie, linguistique de corpus, text mining, annotations, etc.
  • Outils
  • Workflow pour les analyses statistiques

Tour d'outils en ligne (mardi après-midi)

Liste de logiciels qu'on discutera

Introduction au text mining avec R (mercredi)

Articles sur R:

Voir aussi:

Usages pédagogiques et suite

  • Discussion finale

Ressources

Listes d'outils
Textes en ligne
  • Projet Gutenberg: https://www.gutenberg.org/
  • Voir aussi Krajka, Jarosław (2007) Corpora and Language Teachers: From Ready-Made to Teacher-Made Collections. CORELL: Computer Resources for Language Learning 1, 36-55. PDF
Extraire des textes d'un Mediawiki
Au lieu d'enregistrer une page en HTML, il vaut mieux sortir une version XMLisée via l'Mediawiki
  • http://edutechwiki.unige.ch/fmediawiki/api.php?action=parse&format=xml&page=...
  • http://fr.wikipedia.org/w/api.php?action=parse&format=xml&page=
Exemple: http://fr.wikipedia.org/w/api.php?action=parse&format=xml&page=mons