DocuBurst

De EduTech Wiki
Aller à la navigation Aller à la recherche

Logiciel DocuBurst

DocuBurst_Logo

Aperçu des fonctions de DocuBurst

Outil de visualisation de document, il peut être utilisé pour:

  • Télécharger vos propres documents texte
  • Création de résumés créatifs visuels
  • Exploration des mots-clés pour découvrir des thèmes ou des sujets de documents
  • Recherche de modèles de mots intra- documents, tels que les relations de caractère
  • Comparaison de documents
  • Possibilité de commenter les résultats obtenus, annoter et partager avec d'autres visualisations

"What is this document about?"


What is this document about? is a common question when navigating large document databases. In a physical library, visitors can browse shelves of books related to their interest, casually opening those with relevant titles, thumbing through tables of contents, glancing at some pages, and deciding whether this volume deserves further attention. In a digital library (or catalogue search of a traditional library) we gain the ability to coalesce documents which may be located in several areas of a physical library into a single listening of potentially interesting documents. (Collins, Carpendale & Penn, 2009)

DocuBurst est un outil de visualisation de document gratuit basé sur le Web pour explorer le contenu d'un texte. Plus un spécifique est une structure de visualisation hiérarchique de substantifs qui se présente de la façon suivante:

Step 0

DocuBurst combine la fréquence des mots avec la structure crée par l'homme dans des bases de données lexicales pour concevoir une visualisation qui reflète aussi le contenu sémantique. L'utilisateur a la possibilité de télécharger son propre texte ou voir ceux fournis par d'autres DocuBurst présente une graphique interactif appelé "radial sunburst diagram" qui organise les noms extraits du texte fourni par l'utilisateur, en fonction de leur sens , et les colore en fonction de la fréquence, révélant des thèmes communs dans le texte. La visualisation montre également les noms propres (par exemple les noms de personnages ) dans un nuage de mots liés . La visualisation peut être agrandie , filtrée , ou recentré pour cibler des types de mots d'intérêt (par exemple, «animal» des mots ou des mots de "sentiment " ) . La visualisation fournit également un outil de comparaison pour contraster l'utilisation de mot sur ​​deux documents différents.

Son utilité

Le développement de logiciels d'analyse de données textuelles essaient à/de répondre aux problèmes d'aujourd'hui de gestion de l'information de document texte. Cette application aide à la compréhension d'un ou plusieurs documentes texte. Grace aux caractéristiques du logiciels on a la possibilité de visualiser de façon géométrique et sémantique nos documents texte. De cette manière, une analyse du contenu devrait être plus facile.
L'objectif principale est celui de fournir à l'utilisateur des résumés interactifs des textes qui sont comparés à un coup d'oeil. Cette approche peut servir de support pour une prise de décision lors de la sélection des textes d'intérêts (par exemple pour une recherche) ou comme points de références lors de l'exploration de passages textuels spécifiques. En utilisant cette technique d'affichage des différences entre deux ou plusieurs documents, DocuBurst peut être utile pour la détection de plagiats, pour des catégorisation de documents ou pour l'attribution d'auteur.

Public cible

  • Etudiants
  • Enseignants/Tuteurs/Managers
  • Chercheurs

Comment se structure-il?

  • Il commence par un mots racine très générique (le noeud principale du radiale) pour ensuite s'étendre vers l'extérieur vers des mots plus spécifiques (Step 1).
Step 1
  • Les couleurs les plus sombres de DocuBurst représentent des mots qui se produisent le plus souvent dans le document . Les mots de couleur claire apparaissent moins souvent (children) (Step 2).
Step 2
  • Les tranches sont placés après le noeud. Elles indiquent la fréquence des mots ditent "children".
Step 2
  • À côté du radial des substantifs, il y a une nuage de mots qui sont disposés en fonction du nombre de fois qu'ils apparaissent dans le document. Cette nuage est une visualisation non structurée des noms propres (ex: nom propres, villes, lieux, compagnies,...).
Step 3
  • Quand un mot est sélectionné sur la DocuBurst , la barre de score affiche le score du mot dans le document . Ce score représente la force avec le mot apparaît dans le document.
Step 4

Interagir avec DocuBurst

Il y a trois niveau de lecture d'un document avec DocuBurst.

Explorer DocuBurst

Cette première lecture du document ce focalise sur le radiale. En passant la souris sur un mot ceci met en évidence d'autres mots qui se situent près de lui dans le document.

Radiale1

On faisant clic gauche sur un mot on le sélectionne.

Radiale2

On faisant clic droite sur un mot ceci fait apparaitre les sous-catégories associées à ce mot.

Radiale3

Si on double clic un mot ceci fait apparaitre un nouveau DocuBurst pour le mot sélectionné.

Radiale4

Explorer le nuage des mots

Passez la souris sur un mot pour mettre en évidence d'autres mots trouvés près de lui dans le document.

Radiale5

Click sur un mot pour le sélectionner et filtrer le nuage de mots pour faire apparaitre autour les mots trouvés près de lui dans le document.

Radiale6

Explorer DocuBurst et le nuage des mots

Normalement le radial et la nuage des mots apparaissent ensemble. Une double analyse simultané est donc faisable. Comme vu précédemment en cliquant sur un mot ceci apparaît dans le DocuBurst, dans la nuage de mots et dans le paragraphe à gauche de la page.

Paragraphe - Radial - Nuage

Clic droite du mouse sur le mot pour faire apparaitre les sous-catégories associées au mot.

Paragraphe - Radial - Nuage

En mettant en évidence un mot (ex: animal), tous les éléments associés au mots animal apparaissent autour du radiale et dans le nuage de mots. Tous ces mots sont présentes dans le documents. Enfin le paragraphe (côté gauche) montrent où «animal» se produit dans le document.

Paragraphe - Radial - Nuage

Comparaison de documents

En sélectionnant deux documents depuis la page d'accueil, un DocuBurst comparatif est créé. Le DocuBurst et la nuage contiennent des mots des deux documents . Dans cette exemple, les livres Alice au pays des merveilles et La Petite Sirène, sont comparées en utilisant le DocuBurst enracinée au mot «poisson». Le bleu et le vert servent pour distinguer les différents documents alors que les mots en rouge se retrouvent dans les deux documents.

comparaison de documents

Tutoriel d'explication

Tutoriel d'explication de DocuBurst

Bibliographie et Ressources