« Importer des données dans R » : différence entre les versions
Aller à la navigation
Aller à la recherche
Ligne 82 : | Ligne 82 : | ||
1 socioconstructivisme 603 109% 188 109% 31% NA 1.3 NA | 1 socioconstructivisme 603 109% 188 109% 31% NA 1.3 NA | ||
</source> | </source> | ||
Et voici un piechart moche pour un peu égayer la lecture.... | |||
<source lang="matlab"> | |||
pie(Database_webmaster$Impressions[1:20], | |||
main="EduTechWiki Web Search Piechart", col=rainbow(20), | |||
labels=Database_webmaster$Query[1:20]) | |||
</source> | |||
[[Fichier:Piechart-moche.png|500px|vignette|droite|Exemple d'un gateau raté ...]] |
Version du 25 novembre 2014 à 20:38
Tutoriels R | |
---|---|
◀▬▬▶ | |
⚐ brouillon | ☸ intermédiaire |
⚒ 2014/11/25 | ⚒⚒ 2014/11/25 |
Voir aussi | |
Introduction
Il existe une multitude de possibilité pour importer des données R et ensuite les gérer.
- R possède des fonctionnalités de base pour lire des fichiers en entier ou encore des fichiers structurés
- Plusieurs extensions ajoutent des méthodes spécifiques pour lire et éventuellement déjà traiter des données. Parfois les résultats seront stockés dans des structures de données non-standardes (listes).
Lecture de données tabulaires
Les fonctions read.table()
, read.csv()
et read.csv()
permettent de lire et importer des fichiers .txt et .csv. Le résultat va se trouver dans une structure de type "data frame".
Ces trois fonctions sont identiques, mais possèdent d'autres défauts. La syntaxe de read.table() est assez riche est compliquée. Ci-dessous, on indique juste quelques exemples.
R peut directement lire un fichier depuis un URL.
On peut indiquer source la fonction file.choose()
. Cela permet à l'utilisateur de sélectionner un fichier.
# Le fichier data.txt est lu est stocké dans un nouveau objet R nommé Database
Database <- read.table("data.txt", header = TRUE)
# Le séparateur utilisé dans le fichier délimité est la virgule
Database <- read.table(file.choose(), header = TRUE, sep = ",")
# Fichier de type CSV. Le séparateur utilisé dans le fichier csv est le point-virgule. On force un encodage UTF-8
Database <- read.csv(file.choose(), header = TRUE, sep= ";", encoding="UTF-8")
# Fichier de type CSV depuis un serveur web (ce fichier contient des stats de google webmaster tools pour edutechwiki ...)
Database_webmaster <- read.csv("http://tecfa.unige.ch/guides/R/data/edutechwiki-fr-gw-oct-6-2014.csv", header = TRUE, sep= ",")
# Fichier de type Excel qui contient une simple matrice, la première ligne contient les noms de variables
library(xlsx)
Database <- read.xlsx("c:/dks/myexcel.xlsx", 1)
Visualiser les tableaux:
- Dans RStudio, cliquer sur le variable (par ex. "Database" ci-dessus) dans le panneau Environment
- Sinon, utilisez: summary(DB), dim(Database), etc.
- Pour afficher une colonne out d'autres détails utilisez la syntaxe "$" ou "[..]" expliquée dans l'article Les données R
summary(Database_webmaster)
Query Impressions Change Clicks Change.1
10 minutes à perdre wiki: 1 Min. : 1.00 ∞ :2089 Min. : 0.0000 ∞ :4009
123d : 1 1st Qu.: 1.00 : 444 1st Qu.: 0.0000 -100% : 192
12 3d : 1 Median : 2.00 100% : 191 Median : 0.0000 : 80
123d autodesk : 1 Mean : 14.35 -50% : 180 Mean : 0.5511 100% : 46
123d autodesk tutorial : 1 3rd Qu.: 6.00 200% : 86 3rd Qu.: 0.0000 -50% : 26
123d beta : 1 Max. :7500.00 50% : 74 Max. :188.0000 200% : 17
(Other) :4483 (Other):1425 (Other): 119
CTR Change.2 Avg..position Change.3
0% :3817 Min. :-100.0 Min. : 1.00 Min. :-200.00
100% : 82 1st Qu.: -6.0 1st Qu.: 6.50 1st Qu.: -1.00
3% : 51 Median : 4.0 Median : 9.20 Median : 0.40
50% : 44 Mean : 9.9 Mean : 20.49 Mean : 1.06
4% : 33 3rd Qu.: 20.0 3rd Qu.: 21.00 3rd Qu.: 2.00
25% : 32 Max. : 100.0 Max. :500.00 Max. : 300.00
(Other): 430 NA's :3643 NA's :2347
>
> Database_webmaster$Query[1:10]
[1] socioconstructivisme constructivisme socio constructivisme
[4] scénario pédagogique behaviorisme théorie de l'action raisonnée
[7] xslt tutorial curriculum définition bpmn
[10] xslt
4489 Levels: 10 minutes à perdre wiki 123d 12 3d 123d autodesk 123d autodesk tutorial ... вебмастер тулс
> Database_webmaster[1,]
Query Impressions Change Clicks Change.1 CTR Change.2 Avg..position Change.3
1 socioconstructivisme 603 109% 188 109% 31% NA 1.3 NA
Et voici un piechart moche pour un peu égayer la lecture....
pie(Database_webmaster$Impressions[1:20],
main="EduTechWiki Web Search Piechart", col=rainbow(20),
labels=Database_webmaster$Query[1:20])