« Introduction à Tidyverse » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
Aucun résumé des modifications
Ligne 16 : Ligne 16 :


* [https://r4ds.had.co.nz/ R for Data Science] de Garrett Grolemund et Hadley Wickham. Il existe une traduction française du livre sous le titre ''R pour les data sciences''.
* [https://r4ds.had.co.nz/ R for Data Science] de Garrett Grolemund et Hadley Wickham. Il existe une traduction française du livre sous le titre ''R pour les data sciences''.
=== Prérequis ===
Aucune connaissance préalable n'est nécessaire pour suivre le contenu de cet article. Cependant, pour maximiser sa compréhension et la possibilité d'appliquer directement les éléments traités, les articles suivants peuvent être très utils :
* {{ Goblock | [[Introduction à la programmation]] }}
*:
* {{ Goblock | [[Introduction conceptuelle à R]] }}
=== Code des exemples ===
Le code des exemples est disponible dans un ''repository'' GitHub :
* À faire
Pour pouvoir tester le code à votre tour, il est conseillé d'avoir un [[Mise en place d'un environnement de travail avec R|un environnement de travail ''typique'']] pour R. En alternative, vous pouvez utiliser une version dans le ''cloud'' que vous pouvez directement modifier sans installation sur votre poste de travail:
* À faire

Version du 19 novembre 2019 à 15:35

Cet article est en construction: un auteur est en train de le modifier.

En principe, le ou les auteurs en question devraient bientôt présenter une meilleure version.



Introduction

Tidyverse est une collection de paquets de R qui se caractérise par le choix délibéré d'appliquer certains principes au Data Science. Les paquets qui font partie de l'écosystème de Tidyverse implémentent ces principes à travers le partage d'une syntaxe similaire, uniformité dans les formats de Input et Output des fonctions, et une philosophie commune, inspirée par la notion de Tidy data (Wickham, 2014). La flexibilité et possibilité d'extension de l'écosystème Tidyverse font ainsi que les paquets puissent être utilisés indifféremment par des novices en R ou des utilisateurs expérimentés, pour des projets simples ou complexes.

Dans cette page nous proposons un aperçu de cet écosystème, avec des exemples simples et destinés à un public novice en R. Les paquets principaux qui composent le Tidyverse sont ensuite abordés de manière plus spécifiques dans des pages dédiées ou des références à des ressources externes.

Note sur la version

Cette page se réfère à la version 1.2.X de Tidyverse (voir versionnage sémantique). Même si l'écosystème des paquets liés au Tidyverse est constamment en évolution, les informations contenues dans cet article devrait être valable dans la plupart des cas également pour des versions successives.

Crédits

L'écosystème lié à Tidyvese est en général très ouvert et attentif aux novices/débutants en R. Il existe par conséquent des nombreuses ressources dans le web - surtout en anglais - disponibles sous Licence Creative Commons qui prévoit l'utilisation libre, pour des finalités non commerciales, avec attribution de la source. Cet article reprend plusieurs concepts et quelques exemples, en les adaptant au contexte d'intérêt de ce wiki, depuis :

  • R for Data Science de Garrett Grolemund et Hadley Wickham. Il existe une traduction française du livre sous le titre R pour les data sciences.

Prérequis

Aucune connaissance préalable n'est nécessaire pour suivre le contenu de cet article. Cependant, pour maximiser sa compréhension et la possibilité d'appliquer directement les éléments traités, les articles suivants peuvent être très utils :

Code des exemples

Le code des exemples est disponible dans un repository GitHub :

  • À faire

Pour pouvoir tester le code à votre tour, il est conseillé d'avoir un un environnement de travail typique pour R. En alternative, vous pouvez utiliser une version dans le cloud que vous pouvez directement modifier sans installation sur votre poste de travail:

  • À faire