IRaMuTeQ

De EduTech Wiki
Aller à la navigation Aller à la recherche

IRaMuTeQ extension de R

Introduction

IRaMuTeQ est une interface de R proposant plusieurs outils d’analyse, dans le but d’analyser sur des corpus et des matrices.

Cette interface propose les différents outils suivants:

  • Mise en forme du texte (Nettoyage du texte, lemmatisation, clé d’analyse…)
  • Analyse statistique textuel
  • Spécificité et AFC
  • Classification méthode de Reinert
    • Analyse de similitude
    • Nuage de mots
    • Réédition graphique

Installation

dialogueIramuteqcheminR

Mise en forme du texte

ATTENTION IRaMuTeQ est une interface sensible à la case (Chat ? chat). Les textes doivent être nettoyés pour qu’ils soient correctement analysés.

Texte du titre

Nettoyage du texte Mais IRaMuTeQ dispose d’un outil bien pratique permettant de nettoyé les textes.

  • Passer le corpus en minuscule
  • Retirer les caractères en dehors de cette liste
  • Remplacer des appostrophe par des espaces
  • Remplacer des tirets par des expaces
  • Conserver la ponctuation
  • Pas d’espaces entre deux formes

Lemmatisation

Il propose aussi un outil de lemmatisation. Ce dernier permet de transformer les verbes à l’aide d’un dictionnaire :

  • De mettre tous les verbes à l’infinitif
  • Les noms au singulier
  • Les adjectifs au masculin singulier

Clé d’analyse

L’interface propose aussi de définir certaines clés d’analyse. En effet, dans certains contexte il n’est pas nécessaire de considérer l’ensemble des catégories grammaticales (surtout les mots outils) et donc il est possible de les modifier la sélection un paramètre (forme active ou supplémentaire).