Knime

De EduTech Wiki
Aller à la navigation Aller à la recherche

Introduction

Dans les dernières années, comprendre, informer et améliorer l’apprentissage avec les données ont saisi l’intérêt des chercheurs et praticiens en science de l’éducation. Cette approche est convenue d’appeler l’Analytique d’Apprentissage (Learning Analytics en anglais). En tant qu’une discipline pédagogique emergente, l’analytique d’apprentissage consiste à tracer et analyser toutes les données produites par les apprenants et leurs contextes afin d’optimiser l’apprentissage et les environnements d’apprentissage. Ce processus nécessite l’exploitation et la modélisation des données numériques. Pour l'instant, « La plupart des logiciels utilisés actuellement par l’Analytique de l’Apprentissage sont des outils d’analyse du web, mais appliqués aux contenus et aux interactions d’apprenants » (Briand, 2018). Cet article vise à présenter Knime Analytics Plateform (appelé Knime après), un outil d’open source et gratuit dédié à l’exploration des données et à l’apprentissage automatique. Nous allons comprendre ses fonctionnalités et utilisation dans le traitement des données, et ensuite discuter ses avantages et limites dans l’analytique d’apprentissage.

Fonctionnalités

Pour comprendre les fonctionnalités de Knime, on commence par comprendre trois éléments clefs : le nœud, le flux de travail et la table de travail.

Nœuds(nodes en anglais)

Knime compose d’un ensemble de fonctions pour l’exploration de données telles que lire/rédiger les fichiers, transformer les données (regrouper, combiner, filtrer etc.), former les modèles, créer les visualisations etc. Chaque fonction est représentée par un nœud qui est affiché par une petite boîte colorée sur l’interface de Knime (voir l’image).

Les nœuds(fonctions) se regroupent sous différentes catégories dans le répertoire des nœuds . Par exemple, sous la catégorie appelée « Manipulation », on peut trouver des nœuds (fonctions) permettant de traiter les données enregistrées dans les tableaux, tels que rejoindre ou diviser les cellules, modifier le contenu d’une cellule etc. Pour utiliser un nœud, il faut le glisser et déposer dans la table de travail.

Une fois un nœud est affiché dans la table de travail, on peut voir de haut en bas quatre parties (voir l’image d’un nœud affiché dans la table de travail) :

  • Le nom de ce nœud qui indique aussi la fonction,
  • La boîte colorée avec des flèches noires qui servent à connecter ce nœud avec les autres ainsi permettent la transmission des données entre différents noeuds. Donc ces flèches noires sont aussi appelées comme port d’entrée ou port de sortie (Input port/output port en anglais)
  • Les feux de circulation qui indiquent l’état de l’exécution:
le feu rouge indique que le nœud n’est pas configuré ;
le feu jaune indique que le nœud est configuré mais pas exécuté ;
le feu vert indique que le nœud a été exécuté avec succès ;
S’il apparaît une croix rouge, cela signifie qu’il y a une erreur lors de l’exécution.
  • Zone de description où on peut décrire en abrégé ce qu’on veut réaliser avec ce nœud.
Deux noeuds déposés dans la table de travail avec les annotations de tous les éléments décrits dans le texte

Le flux de travail (workflow en anglais)

Le flux de travail (workflow en anglais) est l’ensemble des étapes du traitement des données établies par les utilisateurs.

*Par exemple, lire les données --> filtrer certaines informations --> visualiser le résultat. 

Ces étapes sont représentées par les nœuds, soit les fonctions. (voir une image d’un exemple du flux de travail). La communauté de Knime offre beaucoup des templates des flux de travail et on peut utiliser directement ceux qui correspondent à nos besoins.

Un flux de travail: les noeuds sont liés en fonction de l'ordre de différents traitements des données

La table de travail (workbench en anglais)

La table de travail est un espace où on crée le flux de travail. On glisse et dépose en ordre les nœuds (fonctions) dont on a besoin dans la table de travail. Knime va suivre les étapes établies et exécuter les fonctions pour exploiter les données importées.

L’interface de Knime

Une fois on a compris ces trois éléments clefs de Knime, on peut voir la disposition de son interface.

L'interface de Knime avec les annotations

Les étapes d’utilisation

Nous allons expliquer l’utilisation de Knime étape par étape avec les illustrations. Les opérations détaillées se trouvent directement sur les illustrations.

  • Étape 1 :

Création d’un nouveau flux de travail.

Étape 1 de l'utilisation de Knime
  • Étape 2 :

L’importation des données à traiter. Pour importer les données, il faut glisser et déposer directement le fichier dans la table de travail. Knime reconnaît le type de fichier et choisit un nœud approprié pour lire le fichier. Le nœud de lecture et sa fenêtre de configuration sortent automatiquement une fois le fichier a été importé.

Étape 2-1 de l'utilisation de Knime
Étape 2-2 de l'utilisation de Knime
  • Étape 3 :

Une fois tout est configure, on peut noter que le feu de circulation devient jaune. Cliquez à droit et choisissez « execute » pour exécuter la fonction, soit lire le fichier.

Étape 3 de l'utilisation de Knime
  • Étape 4 :

Choisissez les autres nœuds dont vous avez besoin et mettez-les en ordre que vous souhaitez de suivre pour traiter vos données. Connectez les nœuds l’un avec l’autre pour créer le flux de travail. Configurez les nœuds si nécessaire et exécutez les fonctions.

Étape 4 de l'utilisation de Knime

Les avantages de Knime dans l’analytique d’apprentissage

Dans le champ de la science des données, Knime est sorti du commun grâce à son intégration des différentes fonctions typiques d’analyse des données implantées sous forme modulaire. Par rapport aux outils statistiques généralistes (R, SAS, Stata, SPSS, etc), Knime possède une large sélection d’algorithmes (Canellas, 2021). Donc les tâches d’analyse de donnée que Knime permet de compléter sont riches, y compris l’extraction, la transformation et le chargement de données, l’analytique statistique, la visualisation des données, le text mining et data mining, la modélisation du flux de travail pour l’exploitation des données etc. Un autre avantage de Knime est que les algorithmes du traitement de données sont représentés graphiquement par les nœuds, ce qui permet une utilisation très intuitive sans peu ou pas de connaissances en programmation. En plus cet outil est gratuit, d’open source et facilement installable.

Si on évalue sa valeur d‘usage dans le champ de l’Analytique d’Apprentissage, Knime est aussi très performant en confrontant deux défis de l’analyse de donnée de l’Analytique d’Apprentissage.

Premièrement l’analytique d’apprentissage nécessite une analyse des données massives. Les traces brutes captées depuis les apprenants et les environnements d’apprentissage « constituent rarement des données immédiatement utiles pour les chercheurs» (Peraya, 2019). Donc il faut reconstruire et modéliser ces traces brutes, ce qui peut être une tâche complexe. Knime permet de faciliter la préparation des données en proposant des fonctions telles que la gestion des valeurs manquantes, la normalisation des données, la transformation des données et la sélection des caractéristiques.

Secondairement, « la visualisation et la communication de données constituent le composant central de l’Analytique de l’Apprentissage. Elles favorisent la transformation de l’analyse de la donnée en action pédagogique » (Briand, 2018). Pour ce point, Knime offre une variété de fonctions pour visualiser les résultats d’analyse des données, y compris des graphiques et des tableaux etc., ce qui facilite beaucoup la compréhension des données analysées et ainsi favorise l’atteint des objectifs de l’analytique d’apprentissage.

Les limites de Knime dans l’Analytique d’Apprentissage

Même si Knime a une interface graphique qui facilite la compréhension des opérations impliquées dans le processus d’analyse de données, pour profiter de ses fonctionnalités avancées, par exemple, concevoir fonctions personnalisées du traitement de donnée dans Knime, il faut avoir une certaine connaissance en programmation. Knime a été développé originalement pour l’industrie pharmaceutique. Même si maintenant il est beaucoup utilisé dans les autres projets concernant la science des données, ses fonctionnalités ne répondent pas parfaitement à des besoins spécifiques dans l’Analytique d’Apprentissage. Par exemple, il ne couvre pas l’étape de tracer et collecter les données comme l’outil Gismo.

Ressources

Site officiel de Knime

Références

Briand, 2018. Qu’est-ce que l’Analytique de l’Apprentissage (Learning Analytics) https://www.innovation-pedagogique.fr/article3050.html

Peraya, D. (2019). Les Learning analytics en question. Panorama, limites, enjeux et visions d’avenir. Distances et médiations des savoirs. Distance and Mediation of Knowledge, (25).

Camila Canellas, 2021. Métamodèle d’analytique des apprentissages avec le numérique. Environnements Informatiques pour l’Apprentissage Humain. Sorbonne Université. NNT: 2021SORUS538