STIC Discussion:STIC III (2014)/Module 3

De EduTech Wiki
Aller à la navigation Aller à la recherche

DocuBurst -- Kamanda0 (discussion) 18 novembre 2014 à 10:34 (CET) -- Kamanda0 (discussion) 18 novembre 2014 à 10:34 (CET)

bonjour,

concernant le travail du 3ème module, est-ce que ça vous va si je continue ma page wiki sur mon logiciel DocuBurst et si je approfondie un peu le discours sur le fonctionnement de docuburst dans le contexte du plagiat (comme on avait abordé en classe pendant la présentation)? Est-ce que vous avez des autres suggestions?

Bonne journée

Yeelen

Re: DocuBurst -- Kamanda0 (discussion) 18 novembre 2014 à 10:34 (CET) -- Daniel K. Schneider (discussion) 18 novembre 2014 à 16:36 (CET)

Bonjour,

Continuer avec Docuburst est une toute à fait une option. Par contre, il faut bien vérifier si c'est vraiment utile pour le plagiat. Je vous suggère de chercher des articles (formels ou non) qui disent que oui. Si oui: les résumer (et citer) et ensuit implémenter votre propre exemple complet. Si non: cherchez une autre utilité de Docuburst similaire, par exemple comparer des pages et voir s'ils sont similaires (vous pouvez prendre des pages réalisés par des étudiants MALTT dans un domaine comme VIP, STIC, etc.)

Re: Re: DocuBurst -- Kamanda0 (discussion) 18 novembre 2014 à 10:34 (CET) -- Kamanda0 (discussion) 15 décembre 2014 à 15:16 (CET)

Merci beaucoup pour votre reponse. Je vais suivre vos propositions. Yeelen.

Re: Re: DocuBurst -- Kamanda0 (discussion) 18 novembre 2014 à 10:34 (CET) -- Kamanda0 (discussion) 16 décembre 2014 à 13:59 (CET)

Bonjour,

j'ai testé deux pages similaires en français mais le logiciel n'a pas de vocabulaire en français mais se base seulement sur des termes anglais...c'est dommage...donc j'a ajouté ça dans mon tutoriel dans la partie "avantages et limites" qui était encore vide...je continue pour tester la même chose avec des textes en anglais...A part ça des fois c'est difficile l'upload des textes personnels car c'est difficile de le retrouver dans la liste des documents téléchargés (pour ensuite générer le docuburst). Est-ce que vous avez déjà testé le logiciels? Est-ce que vous avez aussi noté se type de problème? Peut être je peux aussi l'insérer dans les limites...

Bonne journée :)

Yeelen

-- Camacab0 (discussion) 13 décembre 2014 à 00:57 (CET)

Bonsoir,

Comme discuté j'ai cherché comment utiliser les fonctionnalités de RapidMiner Studio afin de puiser/extraire directement des donneés depuis Twitter. Il s'avère qu'en fait c'est très facile à faire, et inclut dans RapidMiner sauf que c'est une option payante supplémentaire.

Du coup je reviens vers vous pour savoir que faire ? Si il y a possibilité d'obtenir une licence ça m'irait très bien personnellement, mais si je dois trouver un moyen de faire ça "gratuitement" avec des outils libres, pourquoi pas, ça pourrait également être intéressant.

Annexe : RapidMiner Cloud Twitter

Dans l'attente d'une réponse, merci.

Re: -- Daniel K. Schneider (discussion) 13 décembre 2014 à 02:26 (CET)

vous avez une idée combien cela coute, prix université et/ou étudiant ?

Re: Re: -- Camacab0 (discussion) 14 décembre 2014 à 11:59 (CET)

Oui, je ne pense pas que cela soit très intéressant, car cela sera difficile à garder et à faire profiter à d'autres élèves. Il faut tout d'abord posséder une license de RapidMiner Studio, ainsi qu'une souscription à leur offre Cloud.

Pour cela : il est nécessaire de payer l'abonnement Cloud (39$/mois) + des frais d'activation ($78). À noter que les frais d'activation (78$) intègrent une mois d'abonnement et 100 crédits Cloud (d'une valeur de $39).

Donc non seulement le service est payant, mais il n'existe que sous forme d'abonnement (donc pas de one-time payement) et il faut ensuite acheter des crédits selon la quantité de "data" que l'on veut importer.

En attendant votre réponse j'ai continué à explorer sur le web des moyens d'extraire des données de Twitter, sans avoir à souscrire à cette offre (qui me semble inutile dans mon cas précis). J'ai eut l'occasion de tester différentes méthodes, mais l'une d'elles a très bien fonctionné. J'ai utilisé le service tiers Zapier, qui propose gratuitement à tout utilisateur (et en utilisant ses informations de connexion - pour twitter et google drive dans mon cas) de planifier une extraction de contenu depuis des sites tels Twitter.

>> J'ai ainsi pu définir le hashtag m'intéressant (#edtech), un repertoire dans mon Google Drive, et les informations relatives à chaque tweet qui m'intéressent. J'ai activé le service afin de voir si cela marchait, et cela marche en effet très bien. Toutes les 5 minutes le service Zapier va chercher sur Twitter les nouveaux tweets contenant le hashtag #edtech et me crée pour chacun d'entre eux un fichier .txt contenant le texte du tweet.

Je pensais donc partir de là, et utiliser RapidMiner pour rassembler tous ces petits fichiers textes en un seul, et ensuite explorer certaines analyses sur le contenu de cette "base de données" de tweets relatifs aux technologies éducatives.

Re: Re: Re: -- Daniel K. Schneider (discussion) 14 décembre 2014 à 12:29 (CET)

Ok d'accord pour une solution gratuite et votre stratégie :) Si jamais Zapier ne donne pas satisfaction, il y a tjrs des outils comme R pour collecter ....