Text mining avec R

De EduTech Wiki
Version datée du 25 septembre 2014 à 14:52 par Daniel K. Schneider (discussion | contributions) (Page créée avec « {{Ebauche}} Voir aussi: * R == Importation de documents == tm est conçu pour marcher avec une variété de formats: textes simple, des articles/papiers en PDF ou... »)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
Aller à la navigation Aller à la recherche

Cet article est une ébauche à compléter. Une ébauche est une entrée ayant un contenu (très) maigre et qui a donc besoin d'un auteur.


Voir aussi:

Importation de documents

tm est conçu pour marcher avec une variété de formats: textes simple, des articles/papiers en PDF ou Word, des documents Web (HTML, XML, SGML), etc.


Transformations

stemDocument()

stripWhitespace()

tmTolower()

Méthodes d'analyse

Liens

  • Ingo Feinerer, Kurt Hornik, David Meyer (2008). Text Mining Infrastructure in R, Journal of Statistical software, Vol. 25, Issue 5, http://www.jstatsoft.org/v25/i05/ (open contents)
    • Article complet qui introduit le paquet tm (version 2008). Il contient aussi des exemples.