« Tutoriels R » : différence entre les versions
m (→Rattle) |
|||
Ligne 93 : | Ligne 93 : | ||
> rattle () | > rattle () | ||
</source> | </source> | ||
Ce paquet permet de lire différent types de données, dont des fichiers CSV ou encore des *.txt (qu'on a par exemple exporté avec tm Corpus | |||
=== Autres === | === Autres === |
Version du 28 novembre 2014 à 16:16
Tutoriels R | |
---|---|
▬▶ | |
⚐ | ☸ débutant |
⚒ 2014/11/28 | ⚒⚒ 2014/11/19 |
Voir aussi | |
Catégorie: R |
Introduction
R est un langage de programmation et un environnement open-source permettant le traitement des données et les analyses statistiques. Sur cette page nous proposons un tutoriel permettant de s’initier à cet environnement. Dans un premier temps, nous présenterons les bases du fonctionnement de R. Par la suite, nous introduirons le traitement des données alphanumériques (analyse qualitative). Dans un troisième temps nous introduirons le traitement des données numériques (analyse quantitative). Enfin, nous nous focaliserons sur la génération et l'analyse des graphes et réseaux.
Nous proposons plusieurs tutoriaux pratiques permettant d'introduire le lecteur au logiciel R.
- Premiers pas avec R
- Les données R
- Traitement de données alphanumériques avec R
- Analyses statistiques avec R
- Text mining avec R
- Tutoriel tm text mining package
- Tutoriel koRpus
Pourquoi préférer R à d'autres logiciels de traitement de données ?
- Il s’agit d’un logiciel gratuit à code source ouvert
- Il est compatible avec les systèmes Windows, MAC OS et Linux
- Il s’agit d’un logiciel très puissant et complet : en gros, il permet de tout faire !
- Il est en essor permanent
- En cas de problème, des milliers d'utilisateurs sont prêts à vous aider ! Cliquez ici pour accéder à une communauté française assez active
- La syntaxe est relativement simple, et s'apparente beaucoup à celle de Matlab
- R est très stable
Limites de R
- L'interface standard n'est pas user-friendly. L’application R Studio et l’interface graphique R-Commander permettent de surmonter cette limite.
Publique cible
Le public cible de R est constitué par toute personne désirant manipuler, traiter et analyser des données numériques ou alphanumériques.
D’après cereghd0, il ne faut pas avoir des compétences informatiques particulières pour apprendre à utiliser R. Cela dit, des connaissances de base en programmation faciliteraient la tâche.
Installation de R
Installer sur Windows et Mac
Pour installer R dirigez-vous sur http://cran.r-project.org/ et télécharger l’environnement convenant au système d’exploitation de votre ordinateur. Ensuite, installer aussi un "front-end" (voir ci-dessous).
Installer sur Ubuntu
Installer R sur Linux est un petit peu plus compliqué, dans Debian/Ubuntu ce package n'est pas dans la liste de distribution par exemple.
Vérifiez d'abord la version de votre Ubuntu:
lsb_release -a
- et regardez le codename, par exemple "precise" ou "trusty"
Tips pour Ubuntu:
- Il faut vérifier l'archive de téléchargement, par exemple éditer à la main le fichier
/etc/apt/sources.list
. Les Suisses mettront quelque chose comme:
deb http://stat.ethz.ch/CRAN/bin/linux/ubuntu trusty/
- Notez le "trusty" est le codename pour les installations Ubuntu 14LTS, pour d'autres versions changez cela ! Suivez les instructions, sur http://cran.r-project.org/
- Il faut aussi radicalement tuer des anciennes versions installées à la main, par exemple:
sudo apt-get --purge remove r-base
- Installer
sudo apt-get update sudo apt-get install r-base
Installation de front-end plus conviviaux
RStudio
On conseille d'installer RStudio, une interface à R améliorée. RStudio améliore par exemple la gestion des scripts (vos séquences d'instruction) et des packages (extensions).
RKWard
RKWard est une initiative plus récente et qui propose un véritable GUI, en tout cas pour certaines statistiques et visualisations.
Installation:
- Sous Ubuntu:
- sudo apt-get install RKWard
- rkward
Rattle
Rattle est une interface graphique pour le data mining et qui tourne dans R et qui permet de faire qqs. analyses rapides, simplement.
> install.packages("rattle", lib="/usr/local/lib/R/site-library")
> library (rattle)
Rattle: A free graphical interface for data mining with R.
Version 3.3.0 Copyright (c) 2006-2014 Togaware Pty Ltd.
Type 'rattle()' to shake, rattle, and roll your data.
> rattle ()
Ce paquet permet de lire différent types de données, dont des fichiers CSV ou encore des *.txt (qu'on a par exemple exporté avec tm Corpus
Autres
Il existe aussi des logiciels qui utilisent R, et qui nécessite aucune connaissance au niveau du "langage de commande". Un exemple est IraMuTeQ, un logiciel d'analyse de texte.
Packages, bibliographie et liens
Learning Analytics Moodle, une production locale
cereghd0 a créé des fonctions permettant d'analyser les rapports de Moodle concernant l'activité des utilisateurs : Learning Analytics Moodle. Ce logiciel est destiné aux enseignants et aux chercheurs en technologies éducatives.
Packages utiles
Voir selon le type d'analyse, par exemple:
R du côté serveur
- Rserve, a TCP/IP server which allows other programs to use facilities of R. Il existe un client PHP.
- FastRweb, an infrastructure that allows any webserver to use R scripts for generating content on the fly, such as web pages or graphics. Marche avec Rserve.
Liens
Manuels et résumés
- R Reference Card. Résumé officiel des commandes R.
- Yanchang Zhao's R Reference Card for Data Mining, aussi disponible à http://www.rdatamining.com/
- RDocumentation.org. Manuel de référence complet pour la plupart des paquets. Correspond au help interne, mais plus simple à utiliser. Les aides sont regroupés par thème, par exemple NaturalLanguageProcessing, sinon utilisez le formulaire de recherche.
Sites R
(tutoriels, exemples, etc.)
- Tutoriels R de E.Horber (UniGE) Français/Anglais
- R Tutorials by William B. King. This is a good source for doing simple and advanced classical statistics with R
- Statmethods.net (Quick-R)
- RDM R Data Mining
- Introduction to R (Tutoriel avec exercices). Demande de s'enregistrer
Bibliographie
- Adler, J. (2011). R, L’essentiel. Pearson.
- Burns, Patrick (2011). The R Inferno (PDF).
- Beauguitte, L. (2012). Analyser les réseaux avec R (packages statnet, igraph et tnet). http://cel.archives-ouvertes.fr/docs/00/68/78/71/PDF/fmr12_analyse_de_graphe_avec_R.pdf
- Barnier, J. (2011). L'analyse des réseaux avec R. http://alea.fr.eu.org/git/doc_reseaux_r.git/blob_plain/HEAD:/networks.pdf
- Chevalier, B. (2005). Logiciels libres Open source : qu'est-ce que c'est ? Paris : H & K.
- Cornillon, P.A. (2010). Statistiques avec R (2ème édition augmentée). Rennes : Presses Universitaires de Rennes.
- Howell, D. (1998). Méthodes statistiques en sciences humaines. Bruxelles : Editions De Boeck Université.
- Huillet, J. Initiation à l’environnement R. http://cict.fr/~stpierre/doc-R.pdf
- Jean, B. (2011). Du bon usage des licences libres. Framasoft (coll. Framabook).
- Millot, G. (2008). Comprendre et réaliser les tests statistiques à l’aide de R (1ère édition). Bruxelles : Editions De Boeck Université.
- Smets-Solanes, J.P. (1999). Logiciels libres : liberté, égalité, business. Paris : Edispher.
- R Programming/Text Processing Wikibook.
Remerciements
Une première version de cette série a été crée par Donato C. Cereghetti dans une long article intitulé R. (2013). EduTech Wiki. Page consultée le 16:17, novembre 19, 2014 à partir de http://edutechwiki.unige.ch/fmediawiki/index.php?title=R&oldid=40471.