« Importer des données dans R » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
Ligne 17 : Ligne 17 :
== Lecture de données tabulaires ==
== Lecture de données tabulaires ==


Les fonctions '''''read.table()''''' et '''''read.csv()''''' permettent de lire et importer  des fichiers ''.txt'' et ''.csv''. Le résultat va se trouver dans une structure de type "data frame".
Les fonctions <code>read.table()</code>, <code>read.csv()</code> et <code>read.csv()</code> permettent de lire et importer  des fichiers ''.txt'' et ''.csv''. Le résultat va se trouver dans une structure de type "data frame".
 
Ces trois fonctions sont identiques, mais possèdent d'autres défauts. La syntaxe de read.table() est assez riche est compliquée. Ci-dessous, on indique juste quelques exemples.


R peut directement lire un fichier depuis un URL.
R peut directement lire un fichier depuis un URL.


L'intégration de la fonction <code>file.choose()</code> permet à l'utilisateur de sélectionner un fichier.
On peut indiquer source la fonction <code>file.choose()</code>. Cela permet à l'utilisateur de sélectionner un fichier.


<source lang="matlab" enclose="div">
<source lang="matlab" enclose="div">
Ligne 30 : Ligne 32 :
Database <- read.table(file.choose(), header = TRUE, sep = ",")
Database <- read.table(file.choose(), header = TRUE, sep = ",")


# Fichier de type CSV. Le séparateur utilisé dans le fichier csv est le point-virgule
# Fichier de type CSV. Le séparateur utilisé dans le fichier csv est le point-virgule. On force un encodage UTF-8
Database <- read.csv(file.choose(), header = TRUE, sep= ";")
Database <- read.csv(file.choose(), header = TRUE, sep= ";", encoding="UTF-8")


# Fichier de type CSV depuis un serveur web (ce fichier contient des stats de google webmaster tools pour edutechwiki ...)
# Fichier de type CSV depuis un serveur web (ce fichier contient des stats de google webmaster tools pour edutechwiki ...)


Database <- read.csv("http://tecfa.unige.ch/guides/R/data/edutechwiki-fr-gw-oct-6-2014.csv", header = TRUE, sep= ",")
Database_webmaster <- read.csv("http://tecfa.unige.ch/guides/R/data/edutechwiki-fr-gw-oct-6-2014.csv", header = TRUE, sep= ",")


# Fichier de type Excel qui contient une simple matrice, la première ligne contient les noms de variables
# Fichier de type Excel qui contient une simple matrice, la première ligne contient les noms de variables
Ligne 44 : Ligne 46 :
Visualiser les tableaux:
Visualiser les tableaux:
* Dans RStudio, cliquer sur le variable (par ex. "Database" ci-dessus) dans le panneau Environment
* Dans RStudio, cliquer sur le variable (par ex. "Database" ci-dessus) dans le panneau Environment
* Sinon, utilisez: summary(DB), dim(Database), etc.
* Sinon, utilisez: summary(DB), dim(Database), etc. Pour afficher une colonne utilisez la syntax "$" ou "[..]"

Version du 25 novembre 2014 à 21:19

Tutoriels R
◀▬▬▶
brouillon intermédiaire
2014/11/25 ⚒⚒ 2014/11/25
Voir aussi

Introduction

Il existe une multitude de possibilité pour importer des données R et ensuite les gérer.

  • R possède des fonctionnalités de base pour lire des fichiers en entier ou encore des fichiers structurés
  • Plusieurs extensions ajoutent des méthodes spécifiques pour lire et éventuellement déjà traiter des données. Parfois les résultats seront stockés dans des structures de données non-standardes (listes).

Lecture de données tabulaires

Les fonctions read.table(), read.csv() et read.csv() permettent de lire et importer des fichiers .txt et .csv. Le résultat va se trouver dans une structure de type "data frame".

Ces trois fonctions sont identiques, mais possèdent d'autres défauts. La syntaxe de read.table() est assez riche est compliquée. Ci-dessous, on indique juste quelques exemples.

R peut directement lire un fichier depuis un URL.

On peut indiquer source la fonction file.choose(). Cela permet à l'utilisateur de sélectionner un fichier.

# Le fichier data.txt est lu est stocké dans un nouveau objet R nommé Database
Database <- read.table("data.txt", header = TRUE)

# Le séparateur utilisé dans le fichier délimité est la virgule
Database <- read.table(file.choose(), header = TRUE, sep = ",")

# Fichier de type CSV. Le séparateur utilisé dans le fichier csv est le point-virgule. On force un encodage UTF-8
Database <- read.csv(file.choose(), header = TRUE, sep= ";", encoding="UTF-8")

# Fichier de type CSV depuis un serveur web (ce fichier contient des stats de google webmaster tools pour edutechwiki ...)

Database_webmaster <- read.csv("http://tecfa.unige.ch/guides/R/data/edutechwiki-fr-gw-oct-6-2014.csv", header = TRUE, sep= ",")

# Fichier de type Excel qui contient une simple matrice, la première ligne contient les noms de variables
library(xlsx)
Database <- read.xlsx("c:/dks/myexcel.xlsx", 1)

Visualiser les tableaux:

  • Dans RStudio, cliquer sur le variable (par ex. "Database" ci-dessus) dans le panneau Environment
  • Sinon, utilisez: summary(DB), dim(Database), etc. Pour afficher une colonne utilisez la syntax "$" ou "[..]"