Outils text mining
Outils text mining | |
---|---|
⚐ | ☸ |
⚒ 2014/12/17 |
Introduction
Cet article tente de faire un petit résumé d'outils "text mining". Nous interprétons la notion de "text mining" de façon très large, c-a-d on s'intéresse à tous les outils produits par des disciplines variées comme la Linguistique de corpus, Traitement automatique des langues (TAL), Analyse de discours, Text mining (forage de textes / analyse exploratoire de textes), Textométrie, Analyse de contenu, Traitement automatique du langage naturel (TALN), Linguistique computationnelle, Analyse qualitative assistée par ordinateur.
Ces outils peuvent avoir des objectifs très variés. Il existe de outils très spécialisés ou à l'opposé des "boites à outils à tout faire". Certains sont faciles à utiliser d'autre sont difficiles. Voici une liste non organisée en ce qui concerne les objectifs: Indexation et recherche, comparaison, Résumés automatiques, détection de plagiat, classification de documents, détection de thèmes, Concordances de mots, lisibilité, diversité, Correction d’orthographe et style, annotation, ....
Les outils documentés dans ce wiki sont (en principe) indexés dans le boitier de navigation (en haut à droite).
Liens
Listes d'outils ailleurs
- Portal: Data mining and learning analytics tools
- Dirt Directory, text mining category. Probably the best source.
- Méthodes qualitatives informatisées
- Bookmarks for Corpus-based Linguists (David Lee), et surtout Software, Tools, Freq Lists, etc.
- Text Analysis Info. Overview on software that analyses texts and other sources of human communication
- LigPipe's competition
- TAPoR, text analysis portal
- Software (Cognitive Computation Group, University of Illinois)
- Text Mining at Wikipedia.