Discussion:Analyses statistiques avec R

De EduTech Wiki
Aller à la navigation Aller à la recherche
La version imprimable n’est plus prise en charge et peut comporter des erreurs de génération. Veuillez mettre à jour les signets de votre navigateur et utiliser à la place la fonction d’impression par défaut de celui-ci.

Commentaires sur R -- Ortaer 4 janvier 2013 à 16:10 (CET)

Bonjour,

Premièrement merci pour l'article détaillée sur R. J'ai juste quelques commentaires et remarques.

J'ai fait l'italique et bold les fonctions (comme help.start()) ou les symboles du logiciel. J'ai pensé que c'est plus visible comme ça.

Au début de l'article, tu avais écrit les avantages de R. Est-ce qu'il y a aussi des limites du programme? S'il y a, tu peux les ajouter.

Quel est le public cible du R (par exemple seulement les informaticien ou tout le monde) ? Est-ce qu'on doit apprendre facilement ou on doit savoir bien utiliser l'informatique etc.

Tu as écrit "2 - Fondement de R". Est-ce que c'est mieux si on écrit "Présentation du logiciel R" ?

Dans la chapitre "2.5 - Les objets de R", je n'a pas bien compris la phrase "Les objets sont des entités stockés dans la mémoire de R." C'est "entités/stockés" ou directement "entités stockés"?

Encore dans la chapitre 2.5, peut être on peut donner plus de détailles sur la fonctionnement des "objets". Par exemple exactement pourquoi on doit les créer?

Aussi, est-ce que c'est possible de donner un peu plus de détailles sur "2.6 Charger des jeux des données de R"? Est-ce que ce fonctionnement est seulement pour voir les données d'un jeu, comment on peut l'utiliser statistiquement?

Dans plusieurs chapitres ("4.4.2 Test sur un coefficient de corrélation" ou "4.5.1 Test de T sur un échantillon unique") on parle de la fonction de t.test() et dans chaque partie il y a une explication différente comme il y a plusieurs types de t.test() mais c'est toujours la même fonction. Alors c'est-à-dire qu'on peut faire plusieurs choses avec la fonction t.test() ou on peut faire des différent choses dans des différents fonctions grâce à t.test()? Peut-être tu peux changer un peu la catégorisation de ces chapitres. Par exemple;

1 - t.test()fonction

1.1 - Utilisation sur un échantillon unique:
Dans cette partie la fonction t.test() permet de comparer une moyenne observée à une moyenne théorique etc....


Enfin, tu peux aussi lier la page "Learning Analytics Moodle : un logiciel d'analyse des rapports d'utilisation de Moodle" à la page de R.

Bon courage :)

Re: Commentaires sur R -- Cereghd0 9 janvier 2013 à 11:40 (CET)

Salut Ipek ! Merci pour tes commentaires, très pertinents. Voici mes corrections suite à tes suggestions :

http://edutechwiki.unige.ch/fmediawiki/index.php?title=R&action=historysubmit&diff=26579&oldid=26520

En ce qui concerne l'observation sur la fonction t.test()... il s'agit d'une fonction qui permet d'effectuer plusieurs analyses statistiques différentes qui se basent sur la même loi - la loi de student. C'est pour cela que je préfère garder la structure actuelle.

Commentaires complémentaires sur "R" + page "Learning Analytics Moodle : un logiciel d'analyse des rapports d'utilisation de Moodle" -- Loic.boujol 5 janvier 2013 à 19:08 (CET)

Hello Donato,

J’ai bien lu tes 2 articles sur R ainsi que les commentaires d'Ipek.

Très franchement, je trouve ta contribution vraiment bien écrite et complète. Pour les besoin de l’exercice, je passerai quand même en revue les différents critères demandés par Daniel.

Bon, tu me connais...les analyses statistiques et moi, on est super amis, hein ? ;-)

Alors, voici mes commentaires en vrac:

  • Difficile d’évaluer le volume, vu qu’on ne sait pas à quoi s’attendait Daniel. En ce qui me concerne, le volume de ta contribution m’a permis de découvrir et comprendre R (en partie seulement, mais là, ce sont mes manques en stat qui me posent problème et non ta contribution, axée plus haut niveau selon moi). Le fait de lier cet article à une analyse concrète de Moodle me semble un vrai plus. Du coup, il me semblerait pertinent que tu mettes en lien tes deux contributions wiki, celles-ci étant directement liées. (par ex dans la partie 1 : introduction)
  • Niveau structure, je te reconnais bien là. Tout est parfaitement découpé, présenté et clair. Et en plus, de manière synthétique. Le lecteur s’en porte très bien. Joli !
  • Section 1.1 : « En cas de problème, des milliers d'utilisateurs sont prêts à vous aider ! » Un petit lien vers la communauté serait bienvenu ;)
  • Idem, lorsque tu recommandes par exemple l’interface R-commander ou R-Studio, mets les liens si possible, c’est plus sympa pour la navigation. Ou pour la section 5 (Graphe et réseau) « igraph » et « statnet ». Perso, j’apprécie avoir les liens hypertexte directement dans la structure du texte que je suis en train de lire, ça m’évite de devoir scroller jusqu’en bas et revenir ensuite à me lecture.
  • Ta contribution R est vraiment axée pratique. Je trouve tout à fait adapté la façon dont tu as à chaque fois accompagné le texte d’un exemple liés aux fonctions, objets, etc. On est plus dans une contribution de type mode d’emploi et la contribution analyse de Moodle devient dans ce sens un vrai plus.
  • Lorsque j’ai parlé du fait que ton article me semble destiné à un public de connaisseur, peut-être aurait-il été intéressant de créer un petit lexique pour les termes spécifiques aux analyses statistiques. Cela dit, je sais que ce genre de travail prend du temps et n'est peut-être pas approprié. C'est mon manque de connaissance qui me fait penser qu'un lexique m'aurait aider à (presque) tout comprendre.
  • J’apprécie aussi le fait que tu aies valorisé l’aspect traitement de données via R. Cela permet de mieux comprendre la logique de ce logiciel en s’attaquant à des exercices plus simples.
  • Côté éthique, j’ai apprécié que tu écrives les noms des élèves en utilisant les initiales, ce qui évite de les référencer sans leur accord sur le net. Tu donnes par contre les noms complets dans tes graphiques. Cela dit, vu le thème du travail, ce n’est pas si important. Mais des données plus sensibles liées au learning analytics devraient selon moi être codées.
  • Tu n’as pas signé ton article. Utilise : 4x le signe ~ pour la signature automatique.
  • Concernant la bibliographie, tu présentes plusieurs ouvrages mais tu n’en parle pas directement dans ton texte. J’imagine que c’est certainement un choix de ta part.
  • « Aucune » trace d’échanges dans la section discussion (module 1 et 2) de Stic-III, excepté pour transmettre le lien de ton travail. Peut-être un oubli, ou seulement le fait que tu savais exactement où tu allais avec ton projet et que tu n’avais simplement pas besoin de plus d’info.
  • Concernant ta contribution « Learning Analytics Moodle : un logiciel d'analyse des rapports d'utilisation de Moodle », j’aurai apprécié avoir une brève description du cadre d’analyse ou du moins du Master Maltt et de l’utilisation que l’on fait de Moodle au sein de ce master. Juste quelques lignes. A mon avis, ça permettrait au lecteur de mieux comprendre ton analyse. A part ça, cette seconde contribution me semble très propice à la thématique du learning analytics.
  • J’aurais apprécié avoir une petite section donnant ton avis sur la pertinence de l’utilisation du logiciel dans le cadre d’une activité de learning analytics. Ca permettrait aussi de valoriser ce logiciel au sein d’un contexte qui, à priori, ne lui est pas directement destiné.

Alors, que dire comme conclusion si ce n’est que comme pour le travail de Julien, c’est un VGJ ! (Vraiment Good Job ;-)

A+ Díonato ! Loïc

Re: Commentaires complémentaires sur "R" + page "Learning Analytics Moodle : un logiciel d'analyse des rapports d'utilisation de Moodle" -- Cereghd0 9 janvier 2013 à 15:17 (CET)

Merci pour tes remarques Loic,

Ici les corrections après tes suggestions :

1/Pour répondre à tes remarques... en fait, mon idée était de réaliser un tutoriel pratique à R de manière à "amorcer" la page portant sur le "Learning Analytics Moodle". J'estime que pour pouvoir utiliser le code que j'ai développé pour R, il faut avoir un minimum de bases du langage R (même si elles ne sont pas strictement indispensables). Je suis content que tu aies apprécie cela. L'idée de privilégier une approche pratique m'est venue en consultant plusieurs tutoriels de R. Je me suis aperçu que la plupart des auteurs s'investissent dans des blablas souvent inutiles et difficiles à comprendre. Au contraire, les exemples sont très parlants ! À partir des outputs, l'utilisateur peut inférer ce qu'il y a derrière au code. Il s’agit bien d’un apprentissage actif.

2/La bibliographie contient tous les ouvrages que j'ai consultés pour rédiger cette page. Etant donné que mon texte représente un tutoriel, je n’ai pas trouvé nécessaire citer ces ouvrages directement dans le texte. C’est un choix :-D

3/En fait, oui : pas de trace d'échanges de ma part... d'ailleurs je découvre que maintenant l'existence de vos discussions dans les discussions du Module1 ! En ce qui concerne l'organisation et le suivi de mon travail, j'ai suis allé chez Daniel à plusieurs reprises afin de discuter de mes 2 projets : comme je suis pratiquement toujours à unimail, je préfère garder le contact "en présentiel" :-D en ce qui concerne le tutoriel de R, je me suis basé sur plusieurs tutoriels et j'ai essayé d'en tirer le mieux de chacun… je n’avais pas besoin d’un aide supplémentaire. En ce qui concerne l'implémentation des fonctions du Learning Analytics Moodle, j'ai rencontré beaucoup de difficultés/bugs (surtout dans la fonction d’importation des données) ; mais en sachant que Daniel n'est pas un utilisateur de R, j'ai essayé de résoudre les problèmes à partir d’autres ressources (internet et manuels R). Une fois les objectifs fixés, j’ai donc avancé de manière indépendante.

4/En ce qui concerne les images, j’ai pixélisé les noms des apprenants. C’est beaucoup mieux, on perd en compréhension, mais on gagne en protection des données. Enfin, si je trouve le temps, j'ajouterai le lexique : promis ! :P

5/Ta remarque concernant l’utilisation que l’on fait de Moodle au sein de la maîtrise MALTT me semble intéressante ; mais j’ai décidé de ne pas modifier la page wiki "Learning Analytics Moodle" pour deux raisons :

a/La base des données concernant le cours COMEL présente un problème : elle ne représente pas l’ensemble des activités que nous avons réellement effectuées. 
La cause de  ce problème n’a pas été encore identifiée. Probablement elle s’explique par le processus de « clonage » du cours COMEL ou bien par un problème 
au niveau de paramétrage du cours. Bref, lors de ce cours nous avons utilisé Moodle de manière intense (forum, wiki, ressources,…) ; alors que si on regarde 
les divers outputs... on dirait qu’on n’a rien fait ! :-D Je crois donc qu’il vaut mieux ne pas décrire l’utilisation que l’on fait de Moodle : on risquerait 
d’avoir des incohérences entre ce que l’on dit et ce que les analyses suggèrent.
b/La fonction « INTRA_profil_cours() » a été justement conçue pour répondre à ta question : quelle est l’utilisation que l’on fait de Moodle au sein d’un cours donné ?

6/Je réponds enfin à ta remarque concernant la pertinence de R dans le cadre des learning analytics. En fait, R est un logiciel destiné au traitement et à l’analyse des données ; peu importe leur nature. R permet de traiter des données quantitatives ou qualitatives de n’importe quelle provenance. R est un langage de programmation qui te permet de tout faire : il ne se limite pas à l’analyse statistique ! Par exemple, il y a deux années j’avais élaboré sous R un logiciel qui permet d’analyser la structure musicale des fichiers midi. Enfin, j’aurais pu implémenter ces fonction avec MATLAB ou Mathematica ; d’autres logiciels qui permettent le calcul numérique. J’ai choisi R car il est open-source et parce que c'est le logiciel que je maîtrise le plus !