Discussion:Voyant Tools
Analyse Candide -- Garretv0 (discussion) 17 décembre 2014 à 10:33 (CET)
Arnaud , j'ai un peu regardé ta phase d'analyse. J'ai vu que ton outil permettait de faire certaines choses qui sont similaires à l'outil taporware seulement que tes fonctions ont un nom différent. Ta fonctionnalité Cirrus correspond à la fonctionnalité de Word Cloud, celle de Keywords in Context à la fonctionnalité de concordance et celle de Words in Documents à la fonctionnalité de List Words. Ta fonctionnalité Cirrus semble bien meilleure que celle Word Cloud apportée par taporware.
Cependant je remarque que nos deux outils ne nous détectent même pas le même nombre d'occurrences pour nos mots les plus fréquents... Word semble me détecter 374 occurrences donc semble donner raison à mon outil qui m'en détecte 373 (l'occurrence restante étant collé à un autre mot n'est pas détectée).
Ensuite je trouve ta fonctionnalité Word Trends très intéressante. Elle correspond à la fonctionnalité Distribution dans taporware. Cependant j'ai vu que tu avais scindé le texte en 10 parties. Ma question est alors la suivante: Est-il possible avec ton outil de scinder par chapitre? J'ai pour ma part dû créer un XML pour le faire mais je trouve les résultats plus intéressants car on peut voir directement dans quel chapitre un personnage apparait et dans lesquels il est cité. Je t'invites à regarder ma partie distribution dans ma phase d'analyse: Taporware#Phase_d.27analyse
Re: Analyse Candide -- Arnaud (discussion) 17 décembre 2014 à 12:55 (CET)
- Salut Victor, Je n'ai pas encore regardé ton analyse mais tes retours sur la mienne sont intéressants. Pour la première analyse, je ne l'ai pas encore spécifié mais j'ai utilisé un .doc et voyant tools ne semble pas m'offrir la possibilité de diviser en chapitre mais en segments (qui semblent être définis arbitrairement). Pourrais-tu m'envoyer ton xml pour voir si Voyant tools reconnait les chapitres. Cela pourrait être intéressant à rajouter dans mon tutoriel. L'autre solution aurait été de faire un corpus composé d'un texte pour chaque chapitre.
"Cependant je remarque que nos deux outils ne nous détectent même pas le même nombre d'occurrences" C'est étrange, après vérification, libreOffice m'en détecte aussi 374. Je vais peut-être mettre une petite phrase dans mon analyse pour relever ce fait.
Re: Re: Analyse Candide -- Garretv0 (discussion) 17 décembre 2014 à 13:18 (CET)
- Mon XML est disponible à l'adresse suivante: http://tecfaetu.unige.ch/etu-maltt/utopia/garretv0/stic-3/periode_2/version_traite/xml/. Tu y trouvera d'autres fichiers comme le XSL et la DTD. Tu y trouvera aussi les fichiers XML pour le premier et deuxième chapitre.
Re: Re: Re: Analyse Candide -- Arnaud (discussion) 17 décembre 2014 à 13:20 (CET)
- merci je vais regarder cela!