Tutoriel tm text mining package/lire pages web script
Aller à la navigation
Aller à la recherche
library(tm) #Une longue procédure pour avoir une liste d'articles dans un string URL_list <- c("http://monsite/bla", "http://monsite/bleh", "...") # un vecteur qui contient des strings vides ("") URL_list <- character(length(titles)) #On construit le corpus # wiki.source <- URISource(URL_list) wiki.source <- Corpus(URISource(URL_list), readerControl = list(language="fr")) # Vérification wiki.source #Inspecter le corpus inspect(VCorpus(wiki.source))