Tutoriels R

De EduTech Wiki
Aller à la navigation Aller à la recherche
Analytique et exploration de données
Module: Tutoriels R
Page d'entrée du module
Analytique et exploration de données
▬▶
à améliorer débutant
2014/12/19 ⚒⚒ 2014/11/19
Voir aussi
Catégorie: R

Introduction

R est un langage de programmation et un environnement open-source permettant le traitement des données et les analyses statistiques. Sur cette page nous proposons un tutoriel permettant de s’initier à cet environnement. Dans un premier temps, nous présenterons les bases du fonctionnement de R. Par la suite, nous introduirons le traitement des données alphanumériques (analyse qualitative). Dans un troisième temps nous introduirons le traitement des données numériques (analyse quantitative). Enfin, nous nous focaliserons sur la génération et l'analyse des graphes et réseaux.

Nous proposons plusieurs tutoriaux pratiques permettant d'introduire le lecteur au logiciel R.

Le logiciel R
GUI R
Text mining avec R
Logiciels basés sur R

Pourquoi préférer R à d'autres logiciels de traitement de données ?

  • Il s’agit d’un logiciel gratuit à code source ouvert
  • Il est compatible avec les systèmes Windows, MAC OS et Linux
  • Il s’agit d’un logiciel très puissant et complet : en gros, il permet de tout faire !
  • Il est en essor permanent
  • En cas de problème, des milliers d'utilisateurs sont prêts à vous aider ! Cliquez ici pour accéder à une communauté française assez active
  • La syntaxe est relativement simple, et s'apparente beaucoup à celle de Matlab
  • R est très stable

Limites de R

  • L'interface standard n'est pas user-friendly. L’application R Studio et l’interface graphique R-Commander permettent de surmonter cette limite.

Publique cible

Le public cible de R est constitué par toute personne désirant manipuler, traiter et analyser des données numériques ou alphanumériques.

D’après cereghd0, il ne faut pas avoir des compétences informatiques particulières pour apprendre à utiliser R. Cela dit, des connaissances de base en programmation faciliteraient la tâche, notamment si on pense utiliser les paquets "text mining" de R.

Installation de R

Installer sur Windows et Mac

Pour installer R dirigez-vous sur http://cran.r-project.org/ et télécharger l’environnement convenant au système d’exploitation de votre ordinateur. Ensuite, installer aussi un "front-end" (voir ci-dessous).

Installer sur Ubuntu

Installer R sur Linux est un petit peu plus compliqué, dans Debian/Ubuntu ce package n'est pas dans la liste de distribution par exemple.

Vérifiez d'abord la version de votre Ubuntu:

lsb_release -a
et regardez le codename, par exemple "precise" ou "trusty"

Tips pour Ubuntu:

  • Il faut vérifier l'archive de téléchargement, par exemple éditer à la main le fichier /etc/apt/sources.list. Les Suisses mettront quelque chose comme:
deb http://stat.ethz.ch/CRAN/bin/linux/ubuntu trusty/
Notez le "trusty" est le codename pour les installations Ubuntu 14LTS, pour d'autres versions changez cela ! Suivez les instructions, sur http://cran.r-project.org/
  • Il faut aussi radicalement tuer des anciennes versions installées à la main, par exemple:
sudo apt-get --purge remove r-base
  • Installer
sudo apt-get update
sudo apt-get install r-base

Installation de front-end plus conviviaux

RStudio

On conseille d'installer RStudio, une interface à R améliorée. RStudio améliore par exemple la gestion des scripts (vos séquences d'instruction) et des packages (extensions).

RKWard

RKWard est une initiative plus récente et qui propose un véritable GUI, en tout cas pour certaines statistiques et visualisations.

Installation:

Les explications et les liens se trouvent dans le wiki de source forge
  • Windows
Soit on peut installer un paquet complet, soit on peut installer R et KDE séparément. La dernière solution est préférable (car cela vous évite d'installer une autre version de R) mais elle est plus compliquée...
  • Mac
Il faut installer R d'abord ensuite trouver un fichier *.dmg qui correspond à cette version
  • Sous Ubuntu:
sudo apt-get install RKWard
rkward

Rattle

Rattle est une interface graphique pour le data mining et qui tourne dans R et qui permet de faire qqs. analyses rapides, simplement.

Pour l'installation, lire:

Ce paquet permet de lire différent types de données, dont des fichiers CSV ou encore des *.txt (qu'on a par exemple exporté avec tm Corpus

Lire: Williams, G. (2009). Rattle: A Data Mining GUI for R, The R Journal Vol. 1/2, December 2009

Autres

Il existe aussi des logiciels qui utilisent R, et qui nécessite aucune connaissance au niveau du "langage de commande". Un exemple est IRaMuTeQ, un logiciel d'analyse de texte.

Packages, bibliographie et liens

Learning Analytics Moodle, une production locale

cereghd0 a créé des fonctions permettant d'analyser les rapports de Moodle concernant l'activité des utilisateurs : Learning Analytics Moodle. Ce logiciel est destiné aux enseignants et aux chercheurs en technologies éducatives.

Packages utiles

Voir selon le type d'analyse, par exemple:

R du côté serveur

  • Rserve, a TCP/IP server which allows other programs to use facilities of R. Il existe un client PHP.
  • FastRweb, an infrastructure that allows any webserver to use R scripts for generating content on the fly, such as web pages or graphics. Marche avec Rserve.

Liens

Manuels et résumés

  • RDocumentation.org. Manuel de référence complet pour la plupart des paquets. Correspond au help interne, mais plus simple à utiliser. Les aides sont regroupés par thème, par exemple NaturalLanguageProcessing, sinon utilisez le formulaire de recherche.

Sites R

(tutoriels, exemples, etc.)

Bibliographie

  • Adler, J. (2011). R, L’essentiel. Pearson.
  • Chevalier, B. (2005). Logiciels libres Open source : qu'est-ce que c'est ? Paris : H & K.
  • Cornillon, P.A. (2010). Statistiques avec R (2ème édition augmentée). Rennes : Presses Universitaires de Rennes.
  • Howell, D. (1998). Méthodes statistiques en sciences humaines. Bruxelles : Editions De Boeck Université.
  • Jean, B. (2011). Du bon usage des licences libres. Framasoft (coll. Framabook).
  • Millot, G. (2008). Comprendre et réaliser les tests statistiques à l’aide de R (1ère édition). Bruxelles : Editions De Boeck Université.
  • Smets-Solanes, J.P. (1999). Logiciels libres : liberté, égalité, business. Paris : Edispher.

Remerciements

Une première version de cette série a été crée par Donato C. Cereghetti dans une long article intitulé R. (2013). EduTech Wiki. Page consultée le 16:17, novembre 19, 2014 à partir de http://edutechwiki.unige.ch/fmediawiki/index.php?title=R&oldid=40471.