« Outils text mining » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
mAucun résumé des modifications
 
(7 versions intermédiaires par 2 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
{{tutoriel}}
{{tutoriel
|fait_partie_du_cours=Analytique et exploration de données‎‎
|fait_partie_du_module=Outils text mining
|est_module_de=Analytique et exploration de données‎‎
|statut=brouillon
|voir_aussi=DocuBurst, T-Lab
|cat tutoriels=Outils text mining
}}
== Introduction ==
== Introduction ==


Cet article tente de faire un petit résumé d'outils "text mining". Nous interprétons la notion de "text mining" de façon très large, c-a-d on s'intéresse à tous les outils produits par des disciplines variées comme la Linguistique de corpus, Traitement automatique des langues (TAL), Analyse de discours, Text mining (forage de textes / analyse exploratoire de textes), Textométrie, Analyse de contenu, Traitement automatique du langage naturel (TALN), Linguistique computationnelle, Analyse qualitative assistée par ordinateur.
Cet article tentera (un jour....) de faire un petit résumé d'outils "text mining". Nous interprétons la notion de "text mining" de façon très large, c-a-d on s'intéresse à tous les outils produits par des disciplines variées comme la Linguistique de corpus, Traitement automatique des langues (TAL), Analyse de discours, Text mining (forage de textes / analyse exploratoire de textes), Textométrie, Analyse de contenu, Traitement automatique du langage naturel (TALN), Linguistique computationnelle, Analyse qualitative assistée par ordinateur.


Ces outils peuvent avoir des objectifs très variés. Il existe de outils très spécialisés ou à l'opposé des "boites à outils à tout faire". Certains sont faciles à utiliser d'autre sont difficiles. Voici une liste non organisée en ce qui concerne les objectifs: Indexation et recherche, comparaison, Résumés automatiques, détection de plagiat, classification de documents, détection de thèmes, Concordances de mots, lisibilité, diversité, Correction d’orthographe et style, annotation, ....
Ces outils peuvent avoir des objectifs très variés. Il existe de outils très spécialisés ou à l'opposé des "boites à outils à tout faire". Certains sont faciles à utiliser d'autre sont difficiles. Voici une liste non organisée en ce qui concerne les objectifs: Indexation et recherche, comparaison, Résumés automatiques, détection de plagiat, classification de documents, détection de thèmes, Concordances de mots, lisibilité, diversité, Correction d’orthographe et style, annotation, ....


Les outils documentés dans ce wiki sont (en principe) indexés dans le boitier de navigation (en haut à droite).
== Listes d'outils ==


== Liens ==
'''Dans ce wiki:'''
 
[[Catégorie:Outils text mining|Outils text mining]] (index de logiciels décrits dans ce wiki):
* [[AntConc]]
* [[DocuBurst]]
* [[IRaMuTeQ]]
* [[Lexos]]
* [[LightSide]]
* [[Orange Textable]]
* [[RapidMiner Studio]]
* [[T-Lab]]
* [[Tropes]]
* [[Voyant Tools]]
 
'''Tutoriels R, dans ce wiki:'''
 
* [[Text mining avec R]] (index de plusieurs modules décrits dans ce wiki)
 
; Avec Python
* [http://www.clips.ua.ac.be/pages/pattern Pattern]
** De Smedt, T. & Daelemans, W. (2012). Pattern for Python. Journal of Machine Learning Research, 13: 2031–2035.
* Pleins d'autres ....


=== Listes d'outils ailleurs ===
=== Listes d'outils ailleurs ===

Dernière version du 4 septembre 2015 à 09:52

Analytique et exploration de données‎‎
Module: Outils text mining
Page d'entrée du module
Analytique et exploration de données‎‎
brouillon
2015/09/04
Voir aussi
Catégorie: Outils text mining

Introduction

Cet article tentera (un jour....) de faire un petit résumé d'outils "text mining". Nous interprétons la notion de "text mining" de façon très large, c-a-d on s'intéresse à tous les outils produits par des disciplines variées comme la Linguistique de corpus, Traitement automatique des langues (TAL), Analyse de discours, Text mining (forage de textes / analyse exploratoire de textes), Textométrie, Analyse de contenu, Traitement automatique du langage naturel (TALN), Linguistique computationnelle, Analyse qualitative assistée par ordinateur.

Ces outils peuvent avoir des objectifs très variés. Il existe de outils très spécialisés ou à l'opposé des "boites à outils à tout faire". Certains sont faciles à utiliser d'autre sont difficiles. Voici une liste non organisée en ce qui concerne les objectifs: Indexation et recherche, comparaison, Résumés automatiques, détection de plagiat, classification de documents, détection de thèmes, Concordances de mots, lisibilité, diversité, Correction d’orthographe et style, annotation, ....

Listes d'outils

Dans ce wiki: (index de logiciels décrits dans ce wiki):

Tutoriels R, dans ce wiki:

Avec Python
  • Pattern
    • De Smedt, T. & Daelemans, W. (2012). Pattern for Python. Journal of Machine Learning Research, 13: 2031–2035.
  • Pleins d'autres ....

Listes d'outils ailleurs