« LightSide » : différence entre les versions
Aucun résumé des modifications |
mAucun résumé des modifications |
||
(4 versions intermédiaires par 2 utilisateurs non affichées) | |||
Ligne 1 : | Ligne 1 : | ||
{{tutoriel | |||
|fait_partie_du_cours=Analytique et exploration de données | |||
|fait_partie_du_module=Outils text mining | |||
|statut=à améliorer | |||
|dernière_modif=2014/11/19 | |||
|cat tutoriels=Outils text mining | |||
|difficulté=avancé | |||
}} | |||
== Introduction == | == Introduction == | ||
[[Fichier:LogoLightSide.png|150px|vignette|droite|Logo LightSide]] | [[Fichier:LogoLightSide.png|150px|vignette|droite|Logo LightSide]] | ||
Ligne 5 : | Ligne 13 : | ||
==Présentation== | ==Présentation== | ||
[[Fichier: | [[Fichier:InterfacePrincipalLightSide.png|600px|vignette|Interface Principale de LightSide]] | ||
LightSide se compose de 6 onglets qui suivent tout le processus de [http://fr.wikipedia.org/wiki/Apprentissage_automatique/ l’apprentissage automatique]. Le premier onglet permet de transformer des documents en tableaux descriptifs, le deuxième permet d’ajuster les tableaux manuellement et dans le troisième on utilise des algorithmes modernes pour découvrir des patterns latents, ce qui donne comme résultat un classificateur qui est capable d’imiter l’annotation faite par les humains. Les derniers trois onglets permettent à l’utilisateur d’explorer les modèles formés et de les utiliser pour annoter des données. Le quatrième onglet offre des outils d’analyse d’erreur qui donnent l’occasion aux chercheurs de comprendre ce que leurs modèles arrivent à bien faire et ce qu’ils n’arrivent pas à faire. Le cinquième onglet permet de comparer les résultats entre deux modèles formés et le dernier onglet permet d’utiliser les modèles formés résultants pour annoter des données qui n’ont pas été annotées auparavant. | LightSide se compose de 6 onglets qui suivent tout le processus de [http://fr.wikipedia.org/wiki/Apprentissage_automatique/ l’apprentissage automatique]. Le premier onglet permet de transformer des documents en tableaux descriptifs, le deuxième permet d’ajuster les tableaux manuellement et dans le troisième on utilise des algorithmes modernes pour découvrir des patterns latents, ce qui donne comme résultat un classificateur qui est capable d’imiter l’annotation faite par les humains. Les derniers trois onglets permettent à l’utilisateur d’explorer les modèles formés et de les utiliser pour annoter des données. Le quatrième onglet offre des outils d’analyse d’erreur qui donnent l’occasion aux chercheurs de comprendre ce que leurs modèles arrivent à bien faire et ce qu’ils n’arrivent pas à faire. Le cinquième onglet permet de comparer les résultats entre deux modèles formés et le dernier onglet permet d’utiliser les modèles formés résultants pour annoter des données qui n’ont pas été annotées auparavant. | ||
Ligne 23 : | Ligne 31 : | ||
*[http://ankara.lti.cs.cmu.edu/side// Site Officiel LightSide] | *[http://ankara.lti.cs.cmu.edu/side// Site Officiel LightSide] | ||
*[http://ankara.lti.cs.cmu.edu/side/LightSide_Researchers_Manual.pdf/ Manuel LightSide] | *[http://ankara.lti.cs.cmu.edu/side/LightSide_Researchers_Manual.pdf/ Manuel LightSide] | ||
[[Catégorie:Analytique et exploration de données]] |
Dernière version du 18 décembre 2014 à 17:06
Analytique et exploration de données | |
---|---|
Module: Outils text mining | |
⚐ à améliorer | ☸ avancé |
⚒ 2014/12/18 | ⚒⚒ 2014/11/19 |
Catégorie: Outils text mining |
Introduction
LightSide est une plate-forme de recherche open source disponible pour la recherche en éducation et pour la recherche générale. On peut télécharger la version stable (mars 14, 2014) ou une version à tester (octobre 30, 2014). Cette présentation correspond à la version stable.
Présentation
LightSide se compose de 6 onglets qui suivent tout le processus de l’apprentissage automatique. Le premier onglet permet de transformer des documents en tableaux descriptifs, le deuxième permet d’ajuster les tableaux manuellement et dans le troisième on utilise des algorithmes modernes pour découvrir des patterns latents, ce qui donne comme résultat un classificateur qui est capable d’imiter l’annotation faite par les humains. Les derniers trois onglets permettent à l’utilisateur d’explorer les modèles formés et de les utiliser pour annoter des données. Le quatrième onglet offre des outils d’analyse d’erreur qui donnent l’occasion aux chercheurs de comprendre ce que leurs modèles arrivent à bien faire et ce qu’ils n’arrivent pas à faire. Le cinquième onglet permet de comparer les résultats entre deux modèles formés et le dernier onglet permet d’utiliser les modèles formés résultants pour annoter des données qui n’ont pas été annotées auparavant.
On peut lire le manuel, en anglais, dont la dernière actualisation remonte au printemps de 2014 (version 2.2.11). Le manuel est assez complet et inclut l’information sur l’installation ainsi que sur l’extraction des données, la structuration des données, l’analyse des erreurs, la comparaison des modèles, l’apprentissage automatique (machine learning en anglais) et un glossaire de termes en relation avec l’interface.
Utilisation
Pour l’utilisation de cet outil les données doivent se trouver dans un tableur (type Excel). La première ligne devra présenter les noms des différents champs de données, chaque colonne devrait présenter les données et à gauche on devrait trouver les labels donnés par un humain. Le format du document doit être un fichier au format CSV .
Développeurs
Carnegie Mellon University’s.
- Elijah Mayfield
- David Adamson
- Carolyn Rosé