« Mise en place d'un environnement de travail avec R » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
Ligne 69 : Ligne 69 :


== Environnement serveur ==
== Environnement serveur ==
Dans l'environnement serveur, l'environnement typique est centralisé sur un serveur et l'accès se fait à travers un navigateur web. Dans cette section, nous allons proposer un type d'installation basée sur [https://www.rstudio.com/products/rstudio/download-server/ RStudio server], ''Open Source Edition'' (il existe également un version commerciale). Les passages techniques pour la mise en place de ce type d'environnement sont bien expliqué dans la documentation officielle, donc dans cette page nous proposons plutôt quelques informations sur les cadres d'utilisation possibles, ainsi que les avantages et désavantages.
=== RStudio server ''Open Source Edition'' ===
=== Avantages et désavantages de l'environnement serveur ===


== Environnement ''cloud'' ==
== Environnement ''cloud'' ==

Version du 15 juillet 2019 à 11:04

Cet article est en construction: un auteur est en train de le modifier.

En principe, le ou les auteurs en question devraient bientôt présenter une meilleure version.



Introduction

La flexibilité de R fait ainsi que la mise en place d'un environnement de travail puisse se faire de nombreuses manières, comportant souvent des passages plus compliqués par rapport à l'installation d'un logiciel traditionnel. Dans cet article, nous illustrerons et analyserons les avantages et désavantages de trois types d'environnements possibles :

  1. Installation locale
    Cette option consiste dans l'installation d'un environnement sur son propre ordinateur. Il s'agit de l'environnement le plus fréquent, au moins à présent (2019), et implique le contrôle totale de la part de l'utilisateur.
  2. Installation sur un serveur
    Cette option consiste à mettre en place l'environnement sur un serveur partagé par plusieurs utilisateurs (e.g. un labo ou équipe de recherche). De cette manière, certaines des opérations nécessaires au fonctionnement et au maintient de l'environnement sont centralisées et effectuées souvent par une seule personne (e.g. administrateur du serveur).
  3. Utilisation dans le cloud
    Cette option consiste à utiliser une infrastructure qui a déjà été mise en place et pour laquelle le maintient est garantie par une entité externe (e.g. une entreprise). Des plans gratuits ou payants peuvent différer en fonction du nombre des projets ou puissance de calcule disponible, ainsi que du support.

Nous utiliserons l'installation locale en tant que référence pour illustrer les différents éléments nécessaires dans un environnement de travail fonctionnel à l'utilisation de R. On retrouve les mêmes éléments dans les environnements serveur et cloud, qui sont tout simplement une abstraction et optimisation de l'environnement local pour plusieurs utilisateurs.

Cette page propose en général des informations conceptuelles sur la mise en place de l'environnement de travail et renvoie aux pages individuelles des différents logiciels pour les opérations spécifiques d'installation et configuration qui, dans l'option en local, peuvent varier en fonction du système d'exploitation utilisé.

Environnement d'essai/test

Si vous découvrez R pour la première fois et vous désirez commencer avec de la pratique, sans passer du temps à mettre en place un environnement que vous n'êtes pas sûrs d'utiliser par la suite, nous vous conseillons de commencer directement par l'environnement cloud (voir plus bas dans la page). Vous aurez à tout moment la possibilité de passer à un autre environnement plus tard. De plus, les trois environnements peuvent être utilisés de manière interchangeable avec relativement peu d'effort.

Environnement local

Dans cette section, nous proposons l'illustration d'un environnement de travail typique, c'est-à-dire qui peut s'adapter à la plupart des cadres d'utilisation de R dans le contexte des sciences sociales. Dans un premier temps, nous illustrerons les éléments qui composent l'environnement et comment ils s'articulent entre eux. Ensuite, nous conseillons un ordre d'installation de ces composantes. Enfin, nous analyserons avantages et désavantages d'une installation en locale et, en guise de conclusion, fournirons quelques alternatives.

Composantes d'un environnement de travail typique

Un environnement de travail typique se compose des éléments suivants. Pour chaque élément, nous proposons une brève description qui sera ensuite approfondie dans la page dédiée (veuillez noter que l'ordre avec lequel les éléments sont présentés ne correspond pas à l'ordre conseillé pour l'installation qui est illustré dans la section suivante) :

  • R
    Il s'agit de l'élément essentiel de l'environnement, sans lequel rien ne serait possible. L'installation de R permet à l'ordinateur de disposer de l'interprète capable de lire et exécuter le code.
  • RStudio
    Environnement de développement intégré (ou IDE depuis l'anglais Integrated Development Environment) qui fait de collant entre l'interprète du code et les opérations nécessaires à l'utilisateur pour mener à bien ses projets (écriture des scripts, aide à la syntaxe, output graphiques, organisation des fichiers, etc.).
  • Git
    Système de gestion de versions qui permet de tracer l'historique des changements de fichiers à différents moments dans l'évolution d'un projet.
  • LaTeX
    Système de préparation de documents techniques et scientifiques qui permet la mise en page d'éléments complexes (e.g. formules, layout en colonnes, ...). La connaissance de LaTeX n'est souvent pas nécessaire, mais l'installation est indispensable surtout pour la création de report en PDF. La création de report dans d'autres formats (e.g. HTML, Microsoft Word, ...) et par contre gérée par un autre outil, Pandoc, qui est installé automatiquement avec RStudio.

Conceptuellement, ces composantes s'articulent de la manière suivante :

Articulation des composantes d'un environnement de travail typique en R

Ordre d'installation conseillé

Les éléments peuvent être installés plus ou moins de manière indépendante et sans un ordre précis, cependant, nous conseillons de procéder de la manière suivante :

  1. Installez et configurez d'abord Git
  2. Installez R ensuite
  3. Installez et configurez RStudio
  4. Installez LaTeX

Avantages et désavantages de l'installation en locale

L'installation en locale représente l'installation traditionnelle à laquelle la plupart des utilisateurs sont habitués. Elle présente les avantages suivants :

  • Contrôle totale de l'utilisateur sur la version à installer et la position du logiciel sur l'ordinateur (même s'il est souvent conseillé d'accepter la position suggérée par le programme d'installation)
  • Décider si et quand mettre à jour à une nouvelle version
  • Possibilité de travailler hors ligne
  • Disponibilité des fichiers sur son propre ordinateur, ce qui permet d'y accéder plus facilement avec d'autres logiciels

Par contre, il faut prévoir les désavantages suivants :

  • L'installation des différents logiciels nécessite de temps et certains opérations peuvent être plus ou moins difficiles en fonction des connaissances informatiques de l'utilisateur
  • Même si peu probable, la mise à jour d'un logiciel peut comporter un problème de compatibilité avec un autre
  • Les logiciels qui composent l'environnement dépendent l'un de l'autre et doivent donc connaître la position des autres (ce qu'on appelle le parcours ou PATH en anglais). Parfois, il est nécessaire de spécifier le parcours d'un autre logiciel (e.g. Git) à l'intérieur d'un deuxième (e.g. RStudio) pour que les deux puissent communiquer
  • Pour travailler sur différents postes de travail (e.g. portable, fixe au bureau, ...) il est nécessaire de trouver un système de synchronisation des fichiers. Des solutions comme Dropbox, Google drive ou OneDrive, pour l'instant, ne sont pas idéales, surtout si utilisées avec les projets de RStudio (voir la page dédiée pour plus d'informations à ce propos)

Alternatives

Environnement serveur

Dans l'environnement serveur, l'environnement typique est centralisé sur un serveur et l'accès se fait à travers un navigateur web. Dans cette section, nous allons proposer un type d'installation basée sur RStudio server, Open Source Edition (il existe également un version commerciale). Les passages techniques pour la mise en place de ce type d'environnement sont bien expliqué dans la documentation officielle, donc dans cette page nous proposons plutôt quelques informations sur les cadres d'utilisation possibles, ainsi que les avantages et désavantages.

RStudio server Open Source Edition

Avantages et désavantages de l'environnement serveur

Environnement cloud

L'environnement cloud permet d'utiliser un environnement complet dont la gestion est externalisée à une autre entité, par exemple une entreprise, qui s'occupe de mettre à disposition à la fois l'infrastructure (i.e. le hardware) et les logiciels (i.e. software). À présent (juillet 2019) nous sommes au courant d'une seule possibilité de ce type, proposé par RStudio cloud, qui est de plus en version alpha (voir versionnage sémantique), c'est-à-dire encore en phase de développement. Néanmoins, elle peut représenter une bonne solution surtout pour les cadres d'utilisation suivants :

  • Découverte de l'environnement typique sans la nécessité d'installer et configurer tous les logiciels nécessaires
  • Utilisation dans le cadre de la formation et de l'enseignement :
    • Encore une fois, les apprenants peuvent tout de suite commencer à explorer et utiliser l'environnement, sans les étapes (et les problèmes) d'installation
    • Il est possible de partager des environnements, par exemple avec des données ou des scripts d'exemples déjà disponibles, afin que tous les apprenants puissent démarrer avec les mêmes conditions

Dans cette section, nous proposons un survol de RStudio cloud, dans l'attente d'une version plus stable, et analyserons les avantages et désavantages d'un environnement cloud.

RStudio cloud

Pour l'instant voir RStudio cloud.

Il s'agit d'une version alpha (voir versionnage sémantique), donc encore en phase de développement

Avantages et désavantages de l'environnement cloud