« Manipuler des données avec dplyr » : différence entre les versions
Ligne 9 : | Ligne 9 : | ||
== Installation == | == Installation == | ||
dplyr est l'un des paquets qui composent l'écosystème [[Introduction à Tidyverse|Tidyverse]]. Il peut donc être installé deux deux manières : | |||
* | * Paquet individuel | ||
* | * Paquet ''global'' Tidyverse | ||
=== Paquet dplyr individuel === | |||
Pour installer seulement le paquet dplyr, la commande est la suivante : | |||
<source lang="R"> | |||
# Installation individuelle | |||
install.packages("dplyr") | |||
</source> | |||
Pour utiliser le paquet il faudra à ce moment le charger : | |||
<source lang="R"> | |||
library(dplyr) | |||
</source> | |||
=== Paquet ''global'' Tidyverse === | |||
Si vous installez le paquet ''global'' [[Introduction à Tidyverse|Tidyverse]], dplyr est installé automatiquement. | |||
<source lang="R"> | |||
# Installation de Tidyverse | |||
install.packages("tidyverse") | |||
</source> | |||
L'installation de l'écosystème Tidyverse est conseillé, car dplyr peut s'intégrer facilement avec d'autres manipulations sur les données comme selection, filtrage, agrégation, etc. | |||
Pour utiliser le paquet vous pouvez à ce moment choisir si : | |||
* Charger seulement dplyr | |||
*: <source lang="R"> | |||
library(dplyr) | |||
</source> | |||
* Charger tous les paquets de Tidyverse | |||
*: <source lang="R"> | |||
library(tidyverse) | |||
</source> | |||
Voir [[Introduction à Tidyverse]] pour plus de détails. |
Version du 9 juillet 2020 à 14:43
Introduction
dplyr est un paquet de R faisant partie de l'écosystème Tidyverse utile pour manipuler des données en format rectangulaire (i.e. lignes et colonnes). Il utilise une grammaire basée sur les actions les plus fréquentes dans la manipulations des données comme par exemple filtrer, agréger, sélectionner, transformer, etc. Le paquet dplyr peut être d'ailleurs utilisé également dans le cadre des la visualisation des données avec R, notamment en combinaison avec le paquet ggplot2. Cet article propose un survol des manipulations les plus fréquentes, ainsi que des ressources complémentaires.
Prérequis
L'article nécessite de connaissances de base de R. La lecture de l'article Introduction à Tidyverse est également recommandé.
Installation
dplyr est l'un des paquets qui composent l'écosystème Tidyverse. Il peut donc être installé deux deux manières :
- Paquet individuel
- Paquet global Tidyverse
Paquet dplyr individuel
Pour installer seulement le paquet dplyr, la commande est la suivante :
# Installation individuelle
install.packages("dplyr")
Pour utiliser le paquet il faudra à ce moment le charger :
library(dplyr)
Paquet global Tidyverse
Si vous installez le paquet global Tidyverse, dplyr est installé automatiquement.
# Installation de Tidyverse
install.packages("tidyverse")
L'installation de l'écosystème Tidyverse est conseillé, car dplyr peut s'intégrer facilement avec d'autres manipulations sur les données comme selection, filtrage, agrégation, etc.
Pour utiliser le paquet vous pouvez à ce moment choisir si :
- Charger seulement dplyr
library(dplyr)
- Charger tous les paquets de Tidyverse
library(tidyverse)
Voir Introduction à Tidyverse pour plus de détails.