« Importer et exporter des données avec Tidyverse » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
Ligne 3 : Ligne 3 :
== Introduction ==
== Introduction ==


L'ecosystème [[introduction à Tidyverse|Tidyverse]] met à disposition plusieurs fonctions pour importer et exporter des données qui représentent des alternatives aux [[importer des données dans R|modalités mises à disposition de base par R]].  
L'ecosystème [[introduction à Tidyverse|Tidyverse]] met à disposition plusieurs fonctions pour importer et exporter des données qui représentent des alternatives aux [[importer des données dans R|modalités mises à disposition de base par R]]. Cet article propose un aperçu technique des ces fonctions, ainsi que quelques éléments de réflexion et des bonnes pratiques pour l'organisation et la structuration des fichiers qui contiennent des données.  


=== Avantages des fonctions Tidyverse ===
=== Avantages des fonctions Tidyverse ===
Ligne 39 : Ligne 39 :


De plus, il est conseillé de disposer du logiciel [[RStudio]] qui facilite certaines opérations à travers une interface graphique, bien qu'au final, l'importation se fait directement avec du code.  
De plus, il est conseillé de disposer du logiciel [[RStudio]] qui facilite certaines opérations à travers une interface graphique, bien qu'au final, l'importation se fait directement avec du code.  
== Bonnes pratiques générales ==


[[Catégorie:R]]
[[Catégorie:R]]

Version du 14 octobre 2021 à 14:51

Cet article est en construction: un auteur est en train de le modifier.

En principe, le ou les auteurs en question devraient bientôt présenter une meilleure version.



Introduction

L'ecosystème Tidyverse met à disposition plusieurs fonctions pour importer et exporter des données qui représentent des alternatives aux modalités mises à disposition de base par R. Cet article propose un aperçu technique des ces fonctions, ainsi que quelques éléments de réflexion et des bonnes pratiques pour l'organisation et la structuration des fichiers qui contiennent des données.

Avantages des fonctions Tidyverse

Les avantages d'utiliser les fonctions de Tidyverse concernent principalement :

  • Possibilité d'importer depuis différentes sources (fichiers de text, spreadsheet, autres logiciels d'analyse statistique, ...) ;
  • Homogénéité des formats des données une fois importées, indépendamment du type de source originale ;
  • Les données sont déjà prêtes pour le traitement successif, comme par exemple l'organisation, la manipulation, la visualisation, la modélisation, ou la communication des résultats.
  • Possibilité de créer un flux d'importation automatisé qui maintient les données originales, c'est-à-dire les données brutes récoltés
  • Exportation des données dans des formats propices à l'archivage et au partage (formats textuels plutôt que formats propriétaires ou nécessitant de logiciels particuliers)

Objectifs de l'article

L'article vise à un double objectif :

  • Technique
    Fournir des exemples d'importations et exportations de données qui peuvent être utiles dans des situations fréquentes en sciences sociales ;
  • Pratique
    Sensibiliser à l'importance de bien organiser les données, en appliquant des bonnes pratiques sur l'organisation des fichiers et l'organisation des données à l'intérieur des fichiers.

Pour atteindre ces objectifs, l'article utilise certains fonctions des paquets tidyr et dplyr qui sont traités de manière plus approfondies dans les articles :

L'article représente cependant une introduction à l'importation et exportation des données, tandis que des contraintes plus strictes sont de plus en plus fréquentes et même demandées dans certaines situations (e.g. projet pour des fonds, etc.). Vous pouvez considérer cet article comme un premier pas dans ces directions plus articulées.

Prérequis

L'article s'adresse à un public débutant dans l'importation et l'exportation des données avec un langage de programmation et ne requière donc pas de conniassances préalables particulières. Les articles suivantes peuvent néanmoins fournir des informations utiles avant de suivre les contenus présentés dans cette page :

De plus, il est conseillé de disposer du logiciel RStudio qui facilite certaines opérations à travers une interface graphique, bien qu'au final, l'importation se fait directement avec du code.

Bonnes pratiques générales