« Voyant Tools » : différence entre les versions
Aucun résumé des modifications |
(→Cirrus) |
||
Ligne 29 : | Ligne 29 : | ||
==== Cirrus ==== | ==== Cirrus ==== | ||
* [http://hermeneuti.ca/voyeur/tools/Cirrus Cirrus] : outil permettant d'illustrer la fréquence des mots d'un ou plusieurs textes dans un nuage. | * [http://hermeneuti.ca/voyeur/tools/Cirrus Cirrus] : outil permettant d'illustrer la fréquence des mots d'un ou plusieurs textes dans un nuage de mot. | ||
(image du site officiel de la version beta de l'outil)<br /> | (image du site officiel de la version beta de l'outil)<br /> | ||
[[Fichier:VT_cirrus.png]] | [[Fichier:VT_cirrus.png]] |
Version du 11 novembre 2014 à 14:26
Indroduction
Voyant Tools appelé aussi Voyeur est un environnement d'analyse de texte en ligne. Son interface est faîte pour être facilement utilisée tout en étant flexible et puissante. Il fait parti d'Hermeneuti.ca, un projet collaboratif qui a pour but de développer des outils d'analyse de texte. Il est toujours en phase beta car certaines fonctionnalités n'ont pas encore été intégrées.
Présentation
Caractéristiques clées de Voyant Tools
- Utiliser des textes venant de nombreux formats (HTML, XML, PDF, RTF et doc)
- Utiliser des textes venant d'URL ou de fichiers uploadés
- Faire des analyses lexicales, y compris l'étude de fréquence et de distribution des données
- exporter des données vers d'autres outils (XML, etc.)
- Intégrer des fonctionnalités de Voyeur sur des sites web
Outils proposés par Voyant Tools
Voyant Tools propose de nombreux outils différents concernant l'analyse de texte. Pour plus de détails (en anglais) concernant les fonctions de l'outil, cliquez dessus.
Certains outils comme Lava ou Term Fountain, nécessitent une version trop ancienne de java trop ancienne et ne semblent plus fonctionner.
Outils triés par ordre alphabétique
Bubblelines
- Bubblelines : outil de visualisation des répétitions des mots dans un ou plusieurs documents.
Bubbles
- Bubbles : outil illustrant la fréquence des mots grâce à des bulles plus ou moins grosses.
(image du site officiel de la version beta de l'outil)
Cirrus
- Cirrus : outil permettant d'illustrer la fréquence des mots d'un ou plusieurs textes dans un nuage de mot.
(image du site officiel de la version beta de l'outil)
Corpus Grid
- Corpus Grid : outil présentant de façon générale le corpus sous forme de table.
(image du site officiel de la version beta de l'outil)
Corpus Summary
- Corpus Summary : outil permettant d'avoir une vue d'ensemble, de forme textuelle, du corpus actuel.
(image du site officiel de la version beta de l'outil)
Corpus Term Frequencies
- Corpus Term Frequencies : outil montrant une table de la fréquence et la répartition des mots dans un corpus entier.
(image du site officiel de la version beta de l'outil)
Collocate Term Frequencies
- Collocate Term Frequencies : outil présentant sous forme de table la fréquence des mots autour d'un mot clé. (ne semble pas disponible)
Document Term Frequencies
- Document Term Frequencies : outil présentant une table de la fréquence des mots pour chaque document dans le corpus. (ne semble pas fonctionner)
Document KWICs
- Document KWICs : outils illustrant une table de mots clés avec leur contexte.
(image du site officiel de la version beta de l'outil)
Entities Browser
- Entities Browser : visualisation d'entités nommées. (ne semble pas disponible)
Knots
- Knots : outil de visualisation qui aide à comprendre la pertinence des mots dans un ou plusieurs documents.
(image du site officiel de la version beta de l'outil)
Lava
- Lava : outil permettant d'afficher plusieurs niveaux d'un corpus dans un environnement 3D.
(image du site officiel de la version beta de l'outil)
Links
- Links : outils permettant de visualiser la fréquence des mots et leur proximité.
(image du site officiel de la version beta de l'outil)
Mandala
- Mandala : outil de visualisation qui importe les fichiers textuels pour effectuer des analyses sur la fréquence et la liaison des mots.
(image du site officiel de la version beta de l'outil)
Reader
- Reader : outil permettant la lecture de documents dans un corpus.
(image du site officiel de la version beta de l'outil)
ScatterPlot
- ScatterPlot : outil permettant la création d'un nuage de points dans un graphe représentant les termes, espacés par leur variation.
(image du site officiel de la version beta de l'outil)
Term Frequencies Chart
- Term Frequencies Chart : outil permettant de savoir comment sont répartis les termes par texte dans un corpus grâce à un graphique.
(image du site officiel de la version beta de l'outil)
Term Fountain
- Term Fountain : outil permettant de visualiser sous forme de fontaine la fréquence des mots.
(image du site officiel de la version beta de l'outil)
Retrouvez l'ensemble des informations sur les outils sur cette page (en).
Présentation de l'interface générale (beta)
Interface d'accueil
Sur la figure 1, nous avons l'interface d'accueil lorsque nous arrivons sur le site.
Interface générale
Sur la figure 2, l'interface lorsque le texte a été analysé.