Outils text mining
Analytique et exploration de données | |
---|---|
Module: Outils text mining | |
Page d'entrée du module Analytique et exploration de données |
|
⚐ brouillon | ☸ |
⚒ 2015/01/24 | |
Voir aussi | |
Catégorie: Outils text mining |
Introduction
Cet article tente de faire un petit résumé d'outils "text mining". Nous interprétons la notion de "text mining" de façon très large, c-a-d on s'intéresse à tous les outils produits par des disciplines variées comme la Linguistique de corpus, Traitement automatique des langues (TAL), Analyse de discours, Text mining (forage de textes / analyse exploratoire de textes), Textométrie, Analyse de contenu, Traitement automatique du langage naturel (TALN), Linguistique computationnelle, Analyse qualitative assistée par ordinateur.
Ces outils peuvent avoir des objectifs très variés. Il existe de outils très spécialisés ou à l'opposé des "boites à outils à tout faire". Certains sont faciles à utiliser d'autre sont difficiles. Voici une liste non organisée en ce qui concerne les objectifs: Indexation et recherche, comparaison, Résumés automatiques, détection de plagiat, classification de documents, détection de thèmes, Concordances de mots, lisibilité, diversité, Correction d’orthographe et style, annotation, ....
Les outils documentés dans ce wiki sont (en principe) indexés dans le boitier de navigation (en haut à droite).
Listes d'outils
- (index de logiciels décrits dans ce wiki)
- Text mining avec R (index de plusieurs modules décrits dans ce wiki)
- Avec Python
- Pattern
- De Smedt, T. & Daelemans, W. (2012). Pattern for Python. Journal of Machine Learning Research, 13: 2031–2035.
- Pleins d'autres ....
Listes d'outils ailleurs
- Portal: Data mining and learning analytics tools
- Dirt Directory, text mining category. Probably the best source.
- Méthodes qualitatives informatisées
- Bookmarks for Corpus-based Linguists (David Lee), et surtout Software, Tools, Freq Lists, etc.
- Text Analysis Info. Overview on software that analyses texts and other sources of human communication
- LigPipe's competition
- TAPoR, text analysis portal
- Software (Cognitive Computation Group, University of Illinois)
- Text Mining at Wikipedia.