« Tutoriel koRpus » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
(Page créée avec « {{tutoriel}} Korpus est une autre bibliothèque R d'analyse de textes, spécialisée pour la construction d'indices à partir d'une représentation linguistique de t... »)
 
mAucun résumé des modifications
Ligne 1 : Ligne 1 :
{{tutoriel}}
{{tutoriel
 
|fait_partie_du_cours=Tutoriels R
 
|page_precedente=Text mining avec R
|page_parente=Tutoriels R
|statut=brouillon
|pages_prérequises=Text mining
}}
Korpus est une autre bibliothèque [[R]] d'analyse de textes, spécialisée pour la construction d'indices à partir d'une représentation linguistique de textes.
Korpus est une autre bibliothèque [[R]] d'analyse de textes, spécialisée pour la construction d'indices à partir d'une représentation linguistique de textes.



Version du 24 novembre 2014 à 16:57

Tutoriels R
◀▬
brouillon
2014/11/24
Prérequis
Sous-pages et productions:

Korpus est une autre bibliothèque R d'analyse de textes, spécialisée pour la construction d'indices à partir d'une représentation linguistique de textes.

Installation

  • Le paquet koRpus est disponible via R
  • Par contre, pour pouvoir pleinement profiter il faut aussi installer/configurer Treetagger et qui nécessite aussi l'installation du langage Perl. Les liens sont disponibles dans la documentation de ce paquet.

Sous Ubuntu, on peut installer Treetagger de la façon suivante:

  • Installer Perl si ce n'est pas déjà fait
sudo apt-get install perl
  • Créer un répertoire, par exemple tree-tagger
  • Télécharger tous les fichiers indiqués dans le manuel
sh install-tagger.sh
  • Editer le fichier ~/.bashrc et ajouter (par exemple)
export PATH=/home/votre_login/tree-tagger/cmd:/home/votre_login/tree-tagger/bin:$PATH
  • Tester:
echo 'Vive big brother!' | tree-tagger-english
	reading parameters ...
	tagging ...
	 finished.
Vive	NP	Vive
big	JJ	big
brother	NN	brother
!	SENT	!