Text mining avec R

De EduTech Wiki

Version datée du 25 septembre 2014 à 14:52 par Daniel K. Schneider (discussion | contributions) (Page créée avec « {{Ebauche}} Voir aussi: * R == Importation de documents == tm est conçu pour marcher avec une variété de formats: textes simple, des articles/papiers en PDF ou... »)

(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)

Aller à la navigation Aller à la recherche

Cet article est une ébauche à compléter. Une ébauche est une entrée ayant un contenu (très) maigre et qui a donc besoin d'un auteur.

Voir aussi:

R

Importation de documents

tm est conçu pour marcher avec une variété de formats: textes simple, des articles/papiers en PDF ou Word, des documents Web (HTML, XML, SGML), etc.

Transformations

stemDocument()

stripWhitespace()

tmTolower()

Méthodes d'analyse

Liens

Ingo Feinerer, Kurt Hornik, David Meyer (2008). Text Mining Infrastructure in R, Journal of Statistical software, Vol. 25, Issue 5, http://www.jstatsoft.org/v25/i05/ (open contents)
- Article complet qui introduit le paquet tm (version 2008). Il contient aussi des exemples.

Stefan Theussl, Ingo Feinerer & Kurt Hornik, Distributed Text Mining with tm, http://www.rinfinance.com/agenda/2010/Theussl+Feinerer+Hornik.pdf

Jon Starkweather, Introduction to basic Text Mining in R, http://it.unt.edu/benchmarks/issues/2014/01/rss-matters

Récupérée de « https://edutechwiki.unige.ch/fmediawiki/index.php?title=Text_mining_avec_R&oldid=38087 »

Catégories :