« Importer des données dans R » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
mAucun résumé des modifications
Ligne 17 : Ligne 17 :
== Lecture de données tabulaires ==
== Lecture de données tabulaires ==


Les fonctions '''''read.table()''''' et '''''read.csv()''''' permettent de lire et importer  des fichiers ''.txt'' et ''.csv''.  
Les fonctions '''''read.table()''''' et '''''read.csv()''''' permettent de lire et importer  des fichiers ''.txt'' et ''.csv''. Le résultat va se trouver dans une structure de type "data frame".


R peut directement lire un fichier depuis un URL.
R peut directement lire un fichier depuis un URL.


L'intégration de la fonction '''''file.choose()''''' permet à l'utilisateur de sélectionner un fichier.
L'intégration de la fonction <code>file.choose()</code> permet à l'utilisateur de sélectionner un fichier.


<source lang="matlab" enclose="div">
<source lang="matlab" enclose="div">

Version du 25 novembre 2014 à 21:11

Tutoriels R
◀▬▬▶
brouillon intermédiaire
2014/11/25 ⚒⚒ 2014/11/25
Voir aussi

Introduction

Il existe une multitude de possibilité pour importer des données R et ensuite les gérer.

  • R possède des fonctionnalités de base pour lire des fichiers en entier ou encore des fichiers structurés
  • Plusieurs extensions ajoutent des méthodes spécifiques pour lire et éventuellement déjà traiter des données. Parfois les résultats seront stockés dans des structures de données non-standardes (listes).

Lecture de données tabulaires

Les fonctions read.table() et read.csv() permettent de lire et importer des fichiers .txt et .csv. Le résultat va se trouver dans une structure de type "data frame".

R peut directement lire un fichier depuis un URL.

L'intégration de la fonction file.choose() permet à l'utilisateur de sélectionner un fichier.

# Le fichier data.txt est lu est stocké dans un nouveau objet R nommé Database
Database <- read.table("data.txt", header = TRUE)

# Le séparateur utilisé dans le fichier délimité est la virgule
Database <- read.table(file.choose(), header = TRUE, sep = ",")

# Fichier de type CSV. Le séparateur utilisé dans le fichier csv est le point-virgule
Database <- read.csv(file.choose(), header = TRUE, sep= ";")

# Fichier de type CSV depuis un serveur web (ce fichier contient des stats de google webmaster tools pour edutechwiki ...)

Database <- read.csv("http://tecfa.unige.ch/guides/R/data/edutechwiki-fr-gw-oct-6-2014.csv", header = TRUE, sep= ",")

# Fichier de type Excel qui contient une simple matrice, la première ligne contient les noms de variables
library(xlsx)
Database <- read.xlsx("c:/dks/myexcel.xlsx", 1)

Visualiser les tableaux:

  • Dans RStudio, cliquer sur le variable (par ex. "Database" ci-dessus) dans le panneau Environment
  • Sinon, utilisez: summary(DB), dim(Database), etc.