« Organiser des données avec tidyr » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
(Page créée avec « == Introduction == [https://tidyr.tidyverse.org/ Tidyr] est un paquet de R faisant partie de l'écosystème Tidyverse qui permet d'organ... »)
 
Ligne 2 : Ligne 2 :


[https://tidyr.tidyverse.org/ Tidyr] est un paquet de [[R]] faisant partie de l'écosystème [[Introduction à Tidyverse|Tidyverse]] qui permet d'organiser des données afin de faciliter la [[manipuler des données avec dplyr|manipulation]], la [[visualisation des données avec ggplot2|visualisation]], ou la [[introduction à la modélisation des données avec R|modélisation]]. Dans cet article, le terme ''organisation'' des données est une traduction limitative du correspondant ''tidy'' en anglais. Par ''organisation'' il faut en effet entendre plus en général les différentes actions qui permettent de préparer un ou plusieurs jeu de données : nettoyer les données, structurer les variables/colonnes, exclure les données manquantes, etc.
[https://tidyr.tidyverse.org/ Tidyr] est un paquet de [[R]] faisant partie de l'écosystème [[Introduction à Tidyverse|Tidyverse]] qui permet d'organiser des données afin de faciliter la [[manipuler des données avec dplyr|manipulation]], la [[visualisation des données avec ggplot2|visualisation]], ou la [[introduction à la modélisation des données avec R|modélisation]]. Dans cet article, le terme ''organisation'' des données est une traduction limitative du correspondant ''tidy'' en anglais. Par ''organisation'' il faut en effet entendre plus en général les différentes actions qui permettent de préparer un ou plusieurs jeu de données : nettoyer les données, structurer les variables/colonnes, exclure les données manquantes, etc.
Cette page intègre des éléments techniques du fonctionnement du paquet '''tidyr''' avec des éléments théoriques et pratiques sur les principes du ''tidy data'' (Wickham, 2014) selon une perspective liée au parcours [[pensée computationnelle avec R]].
=== Note sur la version ===
Cette page se réfère à la version <code>1.1.x</code> de Tidyr (voir [[versionnage sémantique]]). Les informations contenus abordent cependant des principes fondamentaux du ''tidy data'' et devraient par conséquent rester valides pour des versions successives.
=== Prérequis ===
L'article nécessite de connaissances de base de [[R]], notamment au niveau des structures de données de type <code>data.frame</code> ou <code>tibble</code> (i.e. organisées en lignes et colonnes). La lecture préalable de l'article [[Introduction à Tidyverse]] est également recommandée.
== Installation et chargement ==
dplyr est l'un des paquets qui composent l'écosystème [[Introduction à Tidyverse|Tidyverse]]. Il peut donc être installé deux deux manières :
* Paquet individuel
* Paquet ''global'' Tidyverse
=== Paquet tidyrindividuel ===
Pour installer seulement le paquet tidyr, la commande est la suivante :
<source lang="R">
# Installation individuelle
install.packages("tidyr")
</source>
Pour utiliser le paquet il faudra à ce moment le charger :
<source lang="R">
library(tidyr)
</source>
=== Paquet ''global'' Tidyverse ===
Si vous installez le paquet ''global'' [[Introduction à Tidyverse|Tidyverse]], tidyrest installé automatiquement.
<source lang="R">
# Installation de Tidyverse
install.packages("tidyverse")
</source>
L'installation de l'écosystème Tidyverse est conseillée, car tidyr peut s'intégrer facilement avec d'autres paquets de l'écosystème Tidyverse comme [[Manipuler des données avec dplyr|dplyr pour manipuer des données]] ou [[visualisation des données avec ggplot2|ggplot2 pour les visualiser]].
Pour utiliser le paquet vous pouvez à ce moment choisir si :
* Charger seulement tidyr
*: <source lang="R">
library(tidyr)
</source>
* Charger tous les paquets de Tidyverse
*: <source lang="R">
library(tidyverse)
</source>
Voir [[Introduction à Tidyverse]] pour plus de détails.


[[Catégorie: R]]
[[Catégorie: R]]

Version du 12 octobre 2021 à 15:06

Introduction

Tidyr est un paquet de R faisant partie de l'écosystème Tidyverse qui permet d'organiser des données afin de faciliter la manipulation, la visualisation, ou la modélisation. Dans cet article, le terme organisation des données est une traduction limitative du correspondant tidy en anglais. Par organisation il faut en effet entendre plus en général les différentes actions qui permettent de préparer un ou plusieurs jeu de données : nettoyer les données, structurer les variables/colonnes, exclure les données manquantes, etc.

Cette page intègre des éléments techniques du fonctionnement du paquet tidyr avec des éléments théoriques et pratiques sur les principes du tidy data (Wickham, 2014) selon une perspective liée au parcours pensée computationnelle avec R.

Note sur la version

Cette page se réfère à la version 1.1.x de Tidyr (voir versionnage sémantique). Les informations contenus abordent cependant des principes fondamentaux du tidy data et devraient par conséquent rester valides pour des versions successives.

Prérequis

L'article nécessite de connaissances de base de R, notamment au niveau des structures de données de type data.frame ou tibble (i.e. organisées en lignes et colonnes). La lecture préalable de l'article Introduction à Tidyverse est également recommandée.

Installation et chargement

dplyr est l'un des paquets qui composent l'écosystème Tidyverse. Il peut donc être installé deux deux manières :

  • Paquet individuel
  • Paquet global Tidyverse

Paquet tidyrindividuel

Pour installer seulement le paquet tidyr, la commande est la suivante :

# Installation individuelle
install.packages("tidyr")

Pour utiliser le paquet il faudra à ce moment le charger :

library(tidyr)

Paquet global Tidyverse

Si vous installez le paquet global Tidyverse, tidyrest installé automatiquement.

# Installation de Tidyverse
install.packages("tidyverse")

L'installation de l'écosystème Tidyverse est conseillée, car tidyr peut s'intégrer facilement avec d'autres paquets de l'écosystème Tidyverse comme dplyr pour manipuer des données ou ggplot2 pour les visualiser.

Pour utiliser le paquet vous pouvez à ce moment choisir si :

  • Charger seulement tidyr
    library(tidyr)
    
  • Charger tous les paquets de Tidyverse
    library(tidyverse)
    

Voir Introduction à Tidyverse pour plus de détails.