Importer des données dans R

De EduTech Wiki
Aller à la navigation Aller à la recherche
Tutoriels R
◀▬▬▶
brouillon intermédiaire
2014/11/25 ⚒⚒ 2014/11/25
Voir aussi

Introduction

Il existe une multitude de possibilité pour importer des données R et ensuite les gérer.

  • R possède des fonctionnalités de base pour lire des fichiers en entier ou encore des fichiers structurés
  • Plusieurs extensions ajoutent des méthodes spécifiques pour lire et éventuellement déjà traiter des données. Parfois les résultats seront stockés dans des structures de données non-standardes (listes).

Lecture de données tabulaires

Les fonctions read.table() et read.csv() permettent de lire et importer des fichiers .txt et .csv. Le résultat va se trouver dans une structure de type "data frame".

R peut directement lire un fichier depuis un URL.

L'intégration de la fonction file.choose() permet à l'utilisateur de sélectionner un fichier.

# Le fichier data.txt est lu est stocké dans un nouveau objet R nommé Database
Database <- read.table("data.txt", header = TRUE)

# Le séparateur utilisé dans le fichier délimité est la virgule
Database <- read.table(file.choose(), header = TRUE, sep = ",")

# Fichier de type CSV. Le séparateur utilisé dans le fichier csv est le point-virgule
Database <- read.csv(file.choose(), header = TRUE, sep= ";")

# Fichier de type CSV depuis un serveur web (ce fichier contient des stats de google webmaster tools pour edutechwiki ...)

Database <- read.csv("http://tecfa.unige.ch/guides/R/data/edutechwiki-fr-gw-oct-6-2014.csv", header = TRUE, sep= ",")

# Fichier de type Excel qui contient une simple matrice, la première ligne contient les noms de variables
library(xlsx)
Database <- read.xlsx("c:/dks/myexcel.xlsx", 1)

Visualiser les tableaux:

  • Dans RStudio, cliquer sur le variable (par ex. "Database" ci-dessus) dans le panneau Environment
  • Sinon, utilisez: summary(DB), dim(Database), etc.