BASES:Cours BASES 2021-22/L'auto-évaluation et l'évaluation par les pairs au sein d'un groupe dans le cadre d'une activité en présence : une approche développementale

De EduTech Wiki
Aller à la navigation Aller à la recherche

Auteur-es : Hélène Parmentier & Victoria Gilles & Nicola Zanetti

1 Problématique et questions de recherche

1.1 Problématique

Dans le cadre du cours BASES du Master MALTT, nous nous intéressons à la question de l'évaluation.

L'évaluation joue un rôle fondamental dans notre société. Depuis notre enfance, et jusqu’à l’âge adulte, nous sommes pour la plupart habitués à considérer l’évaluation dans nos parcours d’études comme étant une prérogative de l’enseignant. En d’autres termes, ce sont les enseignants qui corrigent, révisent et évaluent nos travaux à travers une note représentée par un chiffre (ou une lettre). L’évaluation sommative consiste en effet à “récolter des notes pour décider si l’étudiant peut ou non être accepté en regard du règlement des études, soit pour poursuivre dans le niveau supérieur, soit pour se voir décerner le diplôme.” (Hadi Bouzidi et Jaillet, 2007). Elle est également souvent utilisée dans un cadre professionnel pour juger, par exemple, le travail d'un employé. Néanmoins, cette façon « traditionnelle » de considérer l’évaluation peut avoir des effets négatifs, comme reléguer le plaisir d’apprendre au second plan des motivations à étudier, derrière celle d’obtenir de bons résultats (Kohn, 2013). Elle peut provoquer du stress, de l'appréhension, mais également une volonté de montrer ce que l'on est capable de faire. Ce type d’évaluation, dite sommative, ne représente que superficiellement le travail de l’apprenant, et a pour inconvénient de ne fournir aucune indication sur ce dont il a besoin pour améliorer son apprentissage.

A l’inverse, les évaluations formatives ont été principalement pensées en réponse à l’évaluation traditionnelle de type sommative qui peut avoir des conséquences très négatives sur l’apprentissage des élèves (Morrissette, 2010). En citant Andrade et Cizek(2007), Morrissette consigne une liste des objectifs visés par l’évaluation formative : identifier les forces et les faiblesses de l’élève, aider l’élève à réfléchir à ses propres processus d’apprentissage et à guider ses démarches en vue de progresser, ainsi qu’accroître son autonomie et sa prise de responsabilité face à ses apprentissages et orienter la planification de l’enseignement. Pour Black et al. (2002), "une évaluation formative est une évaluation dont la priorité principale, dans sa conception et sa pratique, est de servir l'objectif de promouvoir l'apprentissage des étudiants. Elle diffère donc de l'évaluation conçue dans un but d'"accountability", ou de classement, ou de certification de compétences. Une activité d'évaluation peut aider les apprenants si elle fournit des informations que les enseignants et leurs étudiants peuvent utiliser comme feedbacks pour s'autoévaluer ou s'évaluer les uns les autres et pour modifier les activités d'enseignement et d'apprentissage dans lesquelles ils sont engagés. Une telle évaluation devient une "évaluation formative" quand la preuve est en fait utilisée pour adapter le travail d'enseignement afin de lui permettre de répondre aux besoins d'apprentissage." (p. 10) Nous sommes, en effet, loin de la définition de Hadi Bouzidi et Jaillet (2007) qui mettait l’emphase sur le caractère “sanctionnel” de l’évaluation sommative.

Cette synthèse se penchera sur deux types d'évaluation à visée plutôt formative et qui sont souvent moins utilisés dans l'enseignement : l'auto-évaluation et l'évaluation par les pairs. En effet, ces deux modalités ne sont pas toujours aisées à mettre en place, en particulier en fonction de l'âge des apprenants. On a décidé d'exclure l'évaluation sommative dans notre synthèse parce que, comme expliqué auparavant cela ne donne que une vision superficielle du travail de l'élève et comme souvent le but d'une évaluation par les pairs ou d'une autoévaluation est plutôt celle d'identifier eventuels points de force et de faiblesse dans un travail, on c'est apérçus qu'il est plus pertinent de se concentrer sur l'évaluation formative.

Pour Morissette (2010), l'évaluation par les pairs (peer-assessment) est un type d’évaluation qui s’effectue entre élèves. En d’autres termes, un étudiant évalue le travail d'un autre étudiant (et éventuellement vice-versa). Cette méthode a été reconnue par différents auteurs comme étant efficace pour l'apprentissage selon différents aspects. Il a été établi que certaines variables peuvent néanmoins influencer l'efficacité de ce type d'évaluation, comme la composition des groupes et le niveau des étudiants qui s'évaluent. Morissette met aussi en avant le fait que dans le monde francophone, l'évaluation par les pairs est davantage perçue comme un mode de régulation des apprentissages entre pairs plutôt que comme une méthode d’évaluation en soi. Pour Topping (1998), "l'évaluation par les pairs peut être définie comme un arrangement entre pairs pour étudier la quantité, le niveau, la valeur, la qualité ou la réussite des produits ou résultats de l'apprentissage d'autres individus partageant le même statut"(p.250). Par ailleurs, "elle peut être quantitative, qualitative ou les deux, sommative, formative ou les deux, en face à face ou à distance ou les deux. Toutefois, les plus grands enjeux cognitifs et socio-émotionnels pourraient provenir de l'évaluation qualitative formative par les pairs en face à face ".(McLuckie et al., 2004, p.566).

L’autoévaluation est une forme d'évaluation où "l’élève est amené à formuler des jugements conscients sur sa propre production et/ou processus d’apprentissage, à évaluer ses manières d’agir lorsqu’il apprend et à identifier des stratégies et actions à entreprendre pour améliorer sa compréhension et développer ses compétences. L’autoévaluation est ici considérée comme un processus fondamental de l’autorégulation de l’apprentissage." (Morales villaBona, 2015, p.121). Morales VillaBona (2015) décrit aussi l'auto-évaluation de groupe dont l'unité est, cette fois-ci, le groupe. Il y a dans ce cas une grande dimension collaborative et un besoin de dialoguer pour trouver ensemble des stratégies pour s'entraider et progresser en tant que groupe. Cependant, il met en garde contre les jugements qui peuvent apparaître dans certaines situations. La présence de l'enseignant et un cadre de classe sécurisant doivent avoir été mis en place au préalable. Pour Andrade et Du (2007), "l'autoévaluation est une procédure d'évaluation formative durant laquelle des apprenants réfléchissent sur et évaluent la qualité de leur travail et de leur apprentissage, jugent à quel point ils ont atteint des buts ou critères explicitement établis, identifient les forces et les faiblesses de leur travail et le révisent en conséquence"(p.160).

Plus précisément, le groupe Sherman s'intéresse à l'approche développementale de l’auto-évaluation et de l'évaluation par les pairs au sein d'un groupe, dans le cadre d'une activité en présence. Nous nous intéressons donc :

- à la partie formative (vs. sommative) de l'évaluation : nous nous intéressons en particulier à l'autoévaluation et à l'évaluation par les pairs.

- à un sujet situé dans un collectif (vs. individuel), le groupe : notre analyse porte, même pour l'autoévaluation, sur les membres d'un groupe.

- à un sujet en activité : il peut s'agir d'une activité en classe, en formation, dans un groupe projet, etc. ;

- à un sujet physique (vs. virtuel) : les membres du groupe sont physiquement regroupés ensemble pour une activité.

- à un sujet situé dans une classe d’âge : les travaux consultés concernent des publics d’enfants élèves du primaire, d’adolescents élèves du secondaire ou d’adultes étudiants ou professionnels.

Notre recherche vise à déterminer les facteurs de réussite de la pratique de l’autoévaluation et de l’évaluation par les pairs au sein d’un groupe, dans le cadre d’une activité en présence, en prêtant particulièrement attention aux points de convergences que des publics d’âges différents peuvent partager, ou au contraire à leurs spécificités.

1.2 Questions de recherche

Dans chacune des questions suivantes, nous nous pencherons par ailleurs sur les aspects développementaux éventuels à prendre en compte
Question de recherche Justification Dimension principale
Quelles conditions réunir pour optimiser les bénéfices de l’évaluation par les pairs et de l’autoévaluation sur l’apprentissage ? Nous nous pencherons sur les conditions qui semblent nécessaires pour permettre à ces deux types d’évaluation d’offrir des gains d’apprentissage. Cette question est donc relative à la dimension pédagogique de l’évaluation. Cette question est fondamentale car par les pairs ou par soi-même, l’évaluation formative se pose comme un moyen d’améliorer l’apprentissage en opposition à l’évaluation sommative qui ne viserait qu’à “accuser réception” (ou non) de cet apprentissage. Pédagogique
D’un point de vue psychologique, quels sont les effets positifs de l’autoévaluation et de l’évaluation sur les pairs ? Quels en sont les effets négatifs, et comment les éviter ? Cette question traite des aspects psychologiques de l’évaluation. Nous nous interrogerons sur les effets psychologiques de ces deux types d’évaluation et sur les moyens disponibles pour réduire d’éventuels effets négatifs. Les liens entre les gains d’apprentissage et les “états internes” des individus étant ténus, il est important de savoir si, par exemple, l’évaluation par les pairs ou l’autoévaluation engagent davantage l’apprenant dans son apprentissage. Psychologique
Quelle médiation numérique pour soutenir l’autoévaluation et l’évaluation par les pairs ? Cette question est relative à la dimension numérique de l’évaluation. Nous verrons quelles solutions numériques sont proposées aujourd’hui pour soutenir ces types d’évaluation. En effet, nous verrons que les évaluations formatives entre pairs ou auto-administrées font, par exemple, souvent face à l’obstacle de la charge de travail supplémentaire qu’elles font peser sur l’équipe enseignante. Il est donc important de déterminer si des solutions existantes peuvent notamment contribuer à amoindrir cette charge. Numérique

2 Réponses aux questions de recherche

2.1 Quelles conditions réunir pour optimiser les bénéfices de l’évaluation par les pairs et de l’autoévaluation sur l’apprentissage ?

2.1.1 On ne naît pas évaluateur, on le devient

De nombreuses études ont tenté d’évaluer l’impact sur les gains d’apprentissage de l’évaluation formative, avec des résultats variables selon les études. Dans celle de Gielen et al. (2010), les auteurs ont étudié l’efficacité de l’évaluation par les pairs sur l’apprentissage et plus particulièrement sur certaines caractéristiques du contenu et du style de feedback fourni, ainsi qu’une consigne particulière pour soutenir la pratique du feedback. Une recherche quasi-expérimentale à mesures répétées (pré-test/traitement/post-test) a été utilisée et les travaux de rédaction en néerlandais de 43 élèves de deux classes du secondaire ont montré que recevoir des commentaires justifiés augmentait bien la performance, mais uniquement pour les élèves les moins performants au départ. Les résultats indiquent que la justification des feedbacks avait un effet plus important sur leur efficacité que leur justesse. De fait, le seul critère ayant un impact significatif sur la performance est le critère de justification, ce qui fait dire aux auteurs : « Unfortunately, the only characteristic with a significant impact on performance, namely justification, is also among the most difficult to teach ». La consigne consistant à demander aux évaluateurs de réfléchir au feedback après l'évaluation par les pairs n'a pas augmenté les gains d'apprentissage de manière significative.

Cette difficulté à produire un feedback critique a été relevée d'une manière différente par Tsivitanidou et al.(2006). Dans leur étude, les auteurs ont introduit un outil d’évaluation par les pairs auprès de 38 élèves de 14 ans. Partant du principe que l’apprentissage est un processus participatif, leur objectif était de vérifier si cet outil pouvait mener à un dialogue, mais aussi de déterminer les types de feedbacks demandés et fournis par les élèves, et enfin si les feedbacks reçus étaient effectivement utilisés par les élèves pour améliorer le travail correspondant. Les élèves travaillaient en classe sur un EIAH doté d’un outil de feedback. Leur mission était de créer une pizza saine en tenant compte des valeurs nutritionnelles des ingrédients, de l’exercice physique quotidien, etc. Dans cette étude, les pairs répondaient le plus souvent aux demandes de feedbacks qui leur étaient adressées et prenaient en compte les modifications proposées. Toutefois, les feedbacks positifs étaient bien plus nombreux que les feedbacks négatifs et les élèves avaient tendance à les donner uniquement quand ils en recevaient. Enfin, les demandes de feedbacks s’amenuisaient au fil de la mission.

On retrouve l’importance de la justification du feedback dans le modèle proposé par Hattie et Timperley (2009). Pour les auteurs, le feedback est plus efficace lorsqu’il fournit les informations nécessaires pour permettre à l’étudiant de s’autoréguler tout en augmentant sa capacité d’apprentissage ainsi que sa motivation et sa confiance.

Selon Ryan et Deci (2002), "when intrinsically motivated, people engage in activities freely, being sustained by the experience of interest and enjoyment. Thus, intrinsic motivation is non-instrumentally focused, instead originating from satisfactions inherent in action, whereas extrinsic motivation is focused toward and dependent on contingent outcomes that are separable from the action per se."(p.10)

Dans leur étude, les auteurs proposent un modèle de feedback qui permet d’identifier les circonstances dans lesquelles le feedback a un plus grand impact. Hattie et Timperley (2007) affirment que le type de feedback et la façon de le donner peuvent produire des résultats différents. À cet égard, Sadler (1989) a identifié trois critères pour qu’une évaluation ou autoévaluation soit faite correctement. Selon ce modèle, il est nécessaire de : (a) avoir conscience du niveau attendu, par exemple dans un exercice, (b) avoir conscience de son propre niveau par rapport au niveau attendu, et (c) effectuer les actions nécessaires pour combler les lacunes identifiées (Sadler, 1989). En d’autres termes, il faut que les étudiants prennent conscience de leurs capacités de façon réaliste, et qu’ils aient par ailleurs une idée claire des objectifs pour savoir dans quelle direction aller. De façon similaire, le modèle proposé par Hattie et Timperley cherche à répondre aux questions « Où je vais ? », « Comment je vais ? » et « Où j’irai après ? » afin d’augmenter l’engagement des étudiants et d’améliorer leur compréhension.

2.1.2 Un changement de paradigme dont la charge pèse sur les enseignants

Permettre à des enfants de développer leur capacité à s'auto-évaluer et à évaluer leurs pairs n'est pas une tâche facile. Peu d'enseignants mettent en place ce type d'évaluations, car "L’évaluation formative impliquant des interactions fréquentes entre l’enseignant et ses étudiants et l’élaboration de feedbacks, de consignes et d’orientations, alourdit la charge de travail de l’enseignant." (Hadi Bouzidi et Jaillet, 2007)

De fait, The Education Hub, un site internet Néo-zélandais qui regroupe des articles sur les pratiques pédagogiques des enseignants de Nouvelle-Zélande, traite justement dans un article (2018) d'auto-évaluation et des moyens de la mettre en place efficacement en classe (Tab. 1). La liste interminable des éléments à intégrer par l’enseignant, découpée séquentiellement (avant, pendant, après l’évaluation) témoigne de la charge de travail que peut représenter l’introduction de ce type d’évaluation dans une classe.

Le premier conseil fourni par l’article (Tab. 1) est d’expliciter les bénéfices d’être capable de s’autoévaluer. En effet, former les élèves à la pratique de l'évaluation formative permettrait l'émergence d'une culture du feedback qui en retour produirait un effet sur la conception qu'en ont les élèves. L’enjeu est assurément culturel également : l’étude de Peterson & Irving (2008) qui s’intéressait à la conception des étudiants du secondaire de l’évaluation et du feedback a trouvé que les élèves n’accordaient de la valeur aux feedbacks que s’ils étaient formels. A contrario, lorsque les feedbacks venaient d’autres élèves ou n’étaient pas accompagnés d’une note, ils percevaient l’évaluation comme non pertinente. Cette étude, menée via 5 focus groupes avec 41 élèves de 4 écoles néo-zélandaises, a conclu que l’évaluation informelle, l’autoévaluation et l’évaluation par les pairs n’étaient pas perçues comme légitimes auprès des élèves du secondaire.

Les élements nécessaires pour intégrer une autoévaluation en trois phases
Avant : la préparation Pendant : les outils Après : la réflexion
  • Expliciter les bénéfices aux élèves d'être capable de s'auto-évaluer.
  • Donner aux élèves l'occasion de participer à des discussions de groupe et à des évaluations, ce qui renforce la précision et l'impact de l'auto-évaluation.
  • Enseigner directement aux élèves comment s'auto-évaluer et leur donner l'occasion de s'exercer à l'auto-évaluation et de recevoir un retour d'information et de l'aide.
  • Permettre aux élèves de contribuer à la création de normes ou de critères. Cela permet à l'apprenant de s'investir dans le processus d'auto-évaluation.
  • Créer un environnement de classe sûr et non-jugeant.
  • Utiliser l'auto-évaluation comme un outil d'évaluation formative et non sommative.
  • Donner aux élèves la possibilité de discuter de leurs auto-évaluations avec leur enseignant. De plus, discuter de toute différence entre l'auto-évaluation de l'élève et l'évaluation de l'enseignant peut être une approche pédagogique puissante pour améliorer l'apprentissage de l'élève.
  • Une grille d'évaluation, afin que les élèves puissent comparer leur travail aux critères et évaluer le niveau qu'ils ont atteint.
  • Les scripts consistent en des questions spécifiques qui sont structurées en une progression claire d'étapes, afin de guider les apprenants sur la meilleure façon de réaliser une tâche. Ceux-ci peuvent également être utilisés pour évaluer le travail des pairs.
  • Un journal d'apprentissage est un endroit où les élèves peuvent réfléchir par écrit à la manière dont leur apprentissage se déroule, à ce pour quoi ils ont besoin d'aide et à l'efficacité des différentes stratégies d'apprentissage.
  • Un portfolio est une collection de travaux gérée par l'étudiant qui montre son apprentissage et le développement de ses compétences. Ils peuvent constituer un point de convergence pour les discussions sur l'évaluation et la fixation des objectifs avec les enseignants. Ils peuvent être numériques, plutôt que sur papier, ce qui résout les problèmes de stockage et les risques de perte ou de détérioration.
  • Une carte de sortie (exit card dans le texte) est un petit morceau de papier ou un post-it remis à chaque élève à la fin d'une leçon, sur lequel ils écrivent un commentaire afin d'auto-évaluer ce qu'ils ont appris pendant la leçon et ce pour quoi ils vont avoir besoin d'aide supplémentaire. L'enseignant les récupère afin de pouvoir planifier la suite de sa leçon.
  • Les feux de signalisation sont un système simple que les élèves peuvent utiliser pour indiquer leur perception de la compréhension d'un travail particulier. À l'aide d'une icône de feu de circulation, les élèves étiquettent leur travail en vert, jaune ou rouge selon qu'ils pensent avoir une bonne compréhension (vert), partielle (jaune) ou faible (rouge). Cela peut aider l'enseignant à créer des groupes de travail, par exemple. On peut également donner aux élèves une liste de concepts ou de sujets clés dans le contenu de la leçon jusqu'à présent, et leur demander de réfléchir aux domaines dans lesquels ils estiment qu'ils ont compris (vert), et à ceux sur lesquels ils pensent devoir encore travailler (jaune ou rouge). Les feux de circulation peuvent également être utilisés pour l'évaluation par les pairs.
  • Dans le cadre de la notation en binôme, des paires d'élèves échangent et évaluent les travaux. L'évaluation en binôme donne aux élèves l'occasion de mettre en pratique les compétences d'évaluation et ouvre le dialogue à ce qui est important pour progresser.
  • Le Temps consacré à l'amélioration et à la réflexion est un moment de la leçon où le seul objectif est que les élèves lisent et utilisent les commentaires qu'ils ont reçus.
  • Chaque élève devra disposer de nombreux retours documentés (de lui-même, de l'enseignant et de ses pairs) auxquels il pourra répondre.

Finalement, si l’on peut penser que l’autoévaluation et l’évaluation par les pairs permettent effectivement des gains d’apprentissage, ces derniers semblent être conditionnés à une formation adéquate des apprenants à ces pratiques mais aussi à un travail de “légitimation” des évaluations formatives en général. Or, pour mettre en œuvre ce travail, les enseignants ont besoin de ressources, en particulier de temps.

2.2 D’un point de vue psychologique, quels sont les effets positifs de l’autoévaluation et de l’évaluation sur les pairs ? Quels en sont les effets négatifs, et comment les éviter ?

2.2.1 Régulation, motivation et sentiment d’efficacité personnelle

Nous avons vu avec l'étude de Peterson et Irving (2008) que l'évaluation formative ne fonctionne pas si les élèves ne la perçoivent pas comme légitime. Une étude de van Gennip et al. (2010) a étudié les variables psychologiques interpersonnelles dans le cadre de l’évaluation par les pairs sur 62 étudiants néerlandais de 16 à 19 ans répartis dans 17 groupes (dont 5 groupes témoins) pour travailler sur un projet de conception et de construction robotique pendant 6 semaines. Leurs résultats indiquent notamment que les élèves en condition d’évaluation par les pairs avaient un meilleur score de sécurité psychologique et que cette sécurité résulte dans de meilleures dispositions vis-à-vis de l’évaluation par les pairs, qui à leur tour conduisent à un sentiment d’apprentissage plus élevé. Les auteurs décrivent le sentiment de sécurité psychologique comme une "croyance partagée qu'il est sans danger de prendre des risques interpersonnels dans un groupe d'individus". Pour Bandura (1997), le sentiment d'efficacité personnelle est un jugement subjectif de son propre niveau de compétence dans l’exécution de certains comportements ou l'obtention de certains résultats à venir. Dans l’étude de Panadero et al. (2012), deux outils d’autoévaluation sont comparés (grille/évaluation performance et scripts/évaluation processus) sur des critères d’auto-régulation, de gains d'apprentissage et d’efficacité personnelle en interaction avec deux autres variables (feedback et type de consigne formatifs ou orientés performance). L'autorégulation peut être définie comme "la réalisation par un individu d'efforts systématiques pour diriger ses pensées, ses émotions et ses actions vers l'atteinte de ses buts" (Zimmerman, 2000, p.14). A Madrid, 120 élèves de 15-16 ans ont analysé à 3 reprises des paysages en cours de géographie dans l’une des 12 conditions expérimentales différentes (modalités : type de consigne (2), outil d’autoévaluation (3 dont le groupe contrôle), type de feedback (2)). Les résultats indiquent que le recours au script a eu un meilleur effet sur l’autorégulation que le recours aux grilles et que le groupe contrôle, et que l’utilisation de ces outils d’autoévaluation permettaient tous les deux un gain d’apprentissage supérieur au groupe contrôle. Toutefois, les interactions entre les variables n’étaient pas significatives à l’exception d’une : quand l’autoévaluation via la grille était suivie d’un feedback formatif, le sentiment d’efficacité personnelle augmentait significativement plus que dans n’importe quelle condition. Les auteurs pensent que la combinaison de la clarté du critère de performance fourni par la grille ajouté à l’information fournie par le feedback formatif ont rendu ce résultat possible. D'autres études ne retrouvent pas le même effet sur le sentiment d'efficacité personnelle. C'est le cas de celle de Meusen-Beekman et al. (2016) dans laquelle les auteurs ont aléatoirement assigné 695 élèves néerlandais de 11 à 13 ans dans 3 conditions expérimentales en classe (autoévaluation, évaluation par les pairs, groupe contrôle) durant plus de 6 mois. Leur objectif était d’évaluer l’impact d’une évaluation formative en travaux de rédaction sur l'autorégulation des élèves, leur motivation et leur sentiment d’efficacité personnelle. Leurs résultats indiquent que l’évaluation formative a eu un effet positif sur la motivation et l'autorégulation des élèves, mais aussi que les élèves ont bénéficié autant de l’autoévaluation que de l’évaluation par les pairs sur les 3 dimensions. Les résultats ne permettent pas d’indiquer que l’autoévaluation et l’évaluation par les pairs ont eu un effet positif sur le sentiment d’efficacité personnelle des élèves, et les auteurs pensent que cela pourrait être dû au fait que les travaux n’étaient pas assez stimulants (pas assez difficiles).

Une étude de Stephanie J. Hanrahan et Geoff Isaacs (2001) a également trouvé un lien entre l’évaluation par les pairs et la motivation, mais chez les adultes cette fois. Dans cette étude, ils ont fait évaluer, par des étudiants de Bachelor, des travaux écrits de leurs pairs. Les étudiants devaient également évaluer leur propre travail. Les auteurs ont ensuite demandé aux étudiants de fournir les points positifs et négatifs des deux exercices. Les participants ont indiqué que l’évaluation par les pairs les a motivés à faire mieux, en particulier pour faire bonne impression auprès de leurs camarades. Toutefois, ils n’ont pas fourni les mêmes réponses au sujet de l’autoévaluation. Une autre étude, menée par Naomi Elliott et Agnes Higgins (2005) sur des étudiants d’un programme postgraduate de la Clinical Health Sciences Education, montre que l’évaluation et l’auto-évaluation ont des effets positifs sur la motivation. Une bonne partie des étudiants ont en effet déclaré se sentir plus motivés, surtout parce que cela donne plus de cohésion au groupe et motive les membres à faire des contributions significatives. On retrouve ici l’effet de pression sociale vu chez Hanrahan et Isaacs (2001). Toutefois, dans l’étude d’Elliott et Higgins (2005) apparait aussi la valence négative de cette pression, puisque des étudiants ont indiqué que c’est la peur qui leur a donné une force motivante, craignant que s’ils ne travaillaient pas, les autres membres du groupe auraient porté un jugement négatif sur eux.

Concernant les enfants, Villányi et al. (2018) ont développé un outil innovant basé sur une tablette informatique pour appréhender l’auto-évaluation de la compréhension des mathématiques et de la lecture chez les élèves. Ils ont noté que la confiance des élèves dans la réalisation d'une tâche diminuait à mesure que la difficulté de la tâche augmentait. Les corrélations entre les scores d'auto-évaluation des élèves et leurs scores aux tests standardisés étaient modérées à importantes. Ils ont donc conclu que les élèves de troisième et quatrième année ont la capacité de fournir des auto-évaluations précises de leurs compétences lorsqu'on leur fournit un outil d'auto-évaluation adéquat. Les auteurs indiquent que l’autoévaluation permet aux élèves de réfléchir sur leurs apprentissages et d’exprimer leurs pensées par rapport à leurs apprentissages, ce qu’on peut rapprocher de stratégies métacognitives, même naissantes. Une autre étude, empirique, de Gruber Jost et Vieille-Grosjean (2019) examine un exemple d'auto-évaluation des compétences chez les élèves de l'école primaire. Pour les auteurs, l’autoévaluation permet à l’élève d’engager un nouveau mouvement dans l’apprendre, de révéler son potentiel de compétences et de tisser un lien avec l’enseignant. Elle favoriserait également une co-responsabilité entre enseignant et élève dans l’apprentissage.

2.2.2 Des traits, des biais, et comment en limiter les effets

Si de nombreuses études pointent les effets psychologiques positifs, et notamment cognitifs, de l’autoévaluation et de l’évaluation par les pairs en termes d’autorégulation, de motivation, de sécurité psychologique ou encore d’efficacité personnelle, certains éléments nécessitent de la vigilance.

Par exemple, on peut légitimement interroger l'objectivité des apprenants. N'y a-t-il pas des traits individuels qui influencent la qualité de l'évaluation formative, quelle que soit la qualité du travail à évaluer ? L’étude de AlFallay (2004) se penche sur le rôle de certains traits psychologiques (estime de soi, anxiété, type de motivation et intensité et performance) sur la justesse de l’autoévaluation et de l’évaluation par les pairs chez 78 étudiants saoudiens qui viennent de finir le lycée et qui intègrent un cours intensif de présentations orales en anglais durant 13 semaines. Les résultats indiquent que les traits “positifs” sont prédictifs d’évaluation plus justes, à l’exception de l’anxiété qui prédit de meilleures évaluations lorsqu’elle est élevée (trait « négatif »). Par ailleurs, AlFallay indique que les meilleurs auto évaluateurs sont les étudiants avec une faible estime d’eux-mêmes, alors que les moins bons sont ceux dont la motivation est extrinsèque (instrumentale). Bouffard et al. (2013) propose une revue des travaux concernant les biais d’auto-évaluation de compétences cognitive ou scolaire chez des élèves (10-11 ans) et des étudiants. En appui sur l’analyse de cette revue de littérature, les auteurs indiquent que lors de l'autoévaluation, un apprenant peut parfois "surgénéraliser" et exagérer l’importance d’aspects négatifs mineurs et avoir un sentiment de responsabilité envers ces aspects. En effet, les auteurs précisent que "la réussite est considérée comme obligatoire et devant aller de soi et où est amplifiée l’importance accordée aux erreurs et aux échecs" (p.180).

L’auteur précise également qu’une personne qui surestime ses capacités tend à faire des erreurs de jugement ayant des conséquences négatives. Par exemple, se croyant plus compétente qu’elle ne l’est, elle consacrerait moins de temps et d’efforts que la tâche à exécuter ne le demande et, ce faisant, obtiendrait une performance moins bonne. AlFallay, lui, indique que la pratique et les feedbacks positifs semblent avoir contribué significativement à la justesse des évaluations produites par les étudiants. Voilà de quoi souligner une nouvelle fois le rôle important d'une formation à l'évaluation chez les apprenants, en enseignant tant les feedbacks positifs, que ceux négatifs. Des biais peuvent intervenir en raison également des enjeux sociaux, puissants en contexte scolaire. A ce sujet, Bélair et Coen (2015), indiquent que parfois, pour l’élève, le message est plus dur à entendre de la part de ses pairs que venant d’un adulte. En effet, l'élève peut voir l'adulte comme celui qui détient les connaissances et qui a alors les compétences pour l'évaluer. Cependant, il peut considérer ses pairs comme étant au même niveau que lui et donc ne pas voir la légitimité des évaluations. Encore plus dans le cas où celles-ci sont négatives. Un élève attendra plus souvent de la part de ses pairs un message consolateur et encourageant. Par ailleurs, n’ayant ni les connaissances ni les compétences professionnelles nécessaires, les commentaires des élèves sont, entre autres, souvent influencés par les liens d’amitié, sont généralement vagues et portent fréquemment sur des éléments négligeables, ce qui augmente la frustration des enseignants. Effectivement, il s'agit déjà là d'une compétence très complexe à enseigner, mais malgré tout, les commentaires ne sont pas conformes aux attentes de l'enseignant. Ce travail en plus qu'il fournit ne paie pas toujours, ce qui pourrait justifier une démotivation de la part de l'enseignant et donc un abandon de cette modalité. Finalement, une véritable formation à l’autoévaluation et à l’évaluation par les pairs pourrait limiter les traits psychologiques influençant nos jugements, ainsi que les biais, notamment de désirabilité sociale. Il n'y a pour le moment aucune formation existante sur le sujet de l'évaluation par les pairs chez les enseignants de tous niveaux. Armés des bons outils, les enseignants pourrait pratiquer l'auto-évaluation par les pairs avec un minimum de frustration. On peut penser aux grilles d’évaluation qui “cadrent” la procédure sans empêcher les bénéfices en termes de régulation et de motivation.

Ces recherches témoignent de l'impact psychologique de l'autoévaluation et de l'évaluation par les pairs via des outils, parfois numériques. Nous allons maintenant nous interroger sur les outils numériques destinés à soutenir ces types d'évaluation.

2.3 Quelle médiation numérique pour soutenir l’autoévaluation et l’évaluation par les pairs ?

2.3.1 Pour les élèves du primaire

A l'heure actuelle, très peu d'outils existent pour développer l'auto-évaluation et l'évaluation par les pairs pour les enfants. Hayashi et Al. (2016) ont utilisé un outil d'HCI (Human Computer Interaction): "Le Mannequin d'auto-évaluation (SAM) de Lang et Bradley est un outil d'évaluation qui a été utilisé avec succès dans différents domaines pour susciter les réponses affectives dans les trois niveaux de valence, d'excitation et de dominance." (p.1) Ils ont utilisé cet outil pour évaluer les émotions des enfants au travers d'"emojis" pour demander aux enfants d'évaluer l'intensité de leurs émotions après un événement social. Etant donné son caractère "pictographique", SAM permet de travailler avec des enfants ne sachant pas encore lire et écrire. Cependant cette étude ne traite pas exactement d'auto-évaluation au sens "apprentissage" du terme, mais traite plutôt d'une réflexion quant à l'accessibilité d'une technologie pour des enfants. La HEP Vaud propose une formation continue en 2022 nommée "Numérique et évaluation des apprentissages: collaborer en petits collectifs à la construction et la gestion qualité de tests standardisés formatifs en ligne" qui " vise à fournir des réponses concrètes aux enseignant-e-s et formateur-trice-s qui souhaitent réaliser des évaluations standardisées des apprentissages en petits collectifs, telles que des tests à visée formative portant sur des niveaux taxonomiques tels que la connaissance, la compréhension, l'application ou l'analyse." Cependant, il existe, à nouveau, très peu de formation continue, ce qui semble logique, puisque peu de logiciels existent et que cette pratique est très peu mise en œuvre pour le moment. Une piste de réflexion pourrait être de réussir à développer une plateforme ou un logiciel permettant d'utiliser et de réaliser numériquement les huit outils proposés par The Education Hub (c'est à dire Rubrics, Scripts, Journals, Portfolios, Traffic lights, Exit cards, Paired marking et Dedicated Improvement and Reflection Time), afin que l'enseignant aie en tout temps, sous la main, toutes les auto-évaluations et évaluations par les pairs de ses élèves. Cela pourrait se traduire, par exemple, par une grille d'évaluation réalisée par l'enseignant sur laquelle peuvent se baser les élèves pour réaliser leurs commentaires directement au sein de celle-ci. Ceci pourrait permettre de repenser son cours en fonction des apprentissages relevés par les élèves. Du côté des apprenants, ceux-ci pourraient également régulièrement avoir accès, même depuis la maison, à leurs évaluations et, pourquoi pas, également l'utiliser pour des devoirs en dehors de l'école ou pour des activités extra-scolaires.

2.3.2 Pour les élèves du secondaire

De nombreux outils existants peuvent rendre possible la mise en place d'une évaluation formative en classe. Toutefois, les classes au secondaire ont parfois des effectifs importants et cela devient alors difficile pour les enseignants de trouver un bénéfice dans un exercice chronophage ou complexe à prendre en main. Certains chercheurs se sont affairés à trouver des solutions qui soient acceptables et utilisables par les enseignants. C'est le cas de Sung et al. (2005). Leur étude décrit l'application monopage web (web-SPA) d’autoévaluation et d’évaluation par les pairs conçu et proposé à 76 élèves de 14/15 ans, de deux classes de Junior School à Taiwan, et propose une procédure d’autoévaluation et d’évaluation par les pairs (PFSPA). Dans cette étude, l’outil et son application ont permis une autoévaluation plus objective des élèves, une meilleure cohérence entre leur autoévaluation, l’évaluation par leurs pairs et l’évaluation des enseignants. Par ailleurs, les activités d’évaluation ont permis d’améliorer la qualité du travail fourni par les élèves de manière significative. Finalement, prendre en compte les difficultés de mise en oeuvre que de tels dispositifs peuvent poser aux enseignants peut nous amener à nous interroger sur leur pertinence. Dans leur méta-analyse, Li et al. (2020) ont synthétisé les résultats de 58 études et 134 tailles d’effet. Leurs conclusions indiquent notamment que " le facteur le plus prédictif d’un effet positif de l’évaluation par les pairs sur l’apprentissage est la formation à l’évaluation " (p.204), mais aussi que " la médiation numérique est associée avec de meilleurs gains d’apprentissage que l’évaluation par les pairs réalisée sur papier " (p.193).

2.3.3 Pour les adultes

L’étude menée par de Raquel M. Crespo Garcia et Abelardo Pardo (2010) présente et démontre l’efficacité d’un outil pour soutenir l’évaluation par les pairs de façon adaptative. Une évaluation par les pairs adaptative se différencie d’une évaluation « classique » dans le sens où elle cherche à associer les évaluateurs et les évalués en fonction de profils afin de trouver une sorte de complémentarité. Dans ce contexte, l’outil va permettre de former ces associations de manière correcte. Au risque de simplifier considérablement le fonctionnement de l'outil, on peut le résumer en disant qu'on peut utiliser différents modèles de profils étudiants selon les circonstances et les objectifs pour effectuer les associations. Il est précisé que les capacités et les connaissances des étudiants sont une variable clé, car l’outil s'inspire de la zone proximale de développement (ZPD) de Vygotsky et autres théories de l'apprentissage. En d’autres termes, l'outil identifie les étudiants qui ont un haut niveau de compétence avec des étudiants avec un bas niveau de compétence et les apparie afin que l’un évalue le travail de l'autre et vice-versa. Les résultats démontrent que ces associations ont eu un effet positif notamment sur le niveau des étudiants.

Une autre étude menée par Roll et al. (2011) présente un outil, le "Self-Assessment Tutor", destiné à soutenir l’autoévaluation. L’étude se base sur le fait que beaucoup d’étudiants n’arrivent pas à s’autoévaluer de façon correcte et tendent à se surestimer ou sous-estimer. Dans ce contexte, l’outil cherche à améliorer les capacités d’autoévaluation des étudiants. Pour y parvenir, des exercices sont montrés aux étudiants dans un premier temps, puis l'étudiant doit prédire s'il est capable de le résoudre sans erreur ou pas. Deuxièmement, l'outil demande à l'étudiant de résoudre les exercices et ensuite de se rappeler ce qu'il avait répondu dans la phase initiale (oui je peux le résoudre sans erreur, ou non). Dans une phase finale l'outil exhorte l'étudiant à réfléchir s'il a fait l'exercice de façon correcte. Les résultats indiquent des effets positifs surtout pour les étudiants qui ont tendance à se sous-estimer. Les auteurs ont précisé que cela n’a pas eu beaucoup d’effet sur ceux qui tendent à se surestimer car il semble que ces étudiants refusent de reconnaître leurs erreurs.

3 Discussion

L’évaluation par les pairs et l’autoévaluation dans l’éducation des adultes est un domaine très vaste et les exemples vus dans la synthèse ne représentent qu’une partie très limitée de ce qui existe dans la littérature en anglais et français. Cependant, les spécialistes s'accordent à dire que les bénéfices de l’autoévaluation et l’évaluation par les pairs sur l’apprentissage et la motivation est sont des compétences importantes à mettre en oeuvre, même s’il faut être attentif au contexte et la façon d’effectuer ces pratiques (Elliott et Higgins (2005), AlFallay (2004), Bouffard et al. (2013)). Selon certains spécialistes, l’évaluation par les pairs et l’autoévaluation sont vues comme des compétences à apprendre et il faut instruire les étudiant sur comment le faire de façon correcte ((Hadi Bouzidi et Jaillet (2007), Hattie et Timperley (2009), Sadler (1989)). L’exemple des outils numériques montrent comment la technologie peut supporter l’évaluation et l’autoévaluation de façons différentes : par exemple, le premier outil aide à l’évaluation par les pairs en cherchant à associer les étudiants plus adaptés à travailler ensemble selon leur profil et en créant une complémentarité qui permet d'améliorer leur façon d’apprendre. Le deuxième outil permettra plutôt d'apprendre comment mieux s'évaluer tout en réduisant le risque de biais.

En ce qui concerne l'évaluation par les pairs et l'auto-évaluation au sein d'un groupe d'étudiants, nous n'avons pas trouvé de mention spécifique sur ce cas particulier dans les lectures, il est alors difficile de faire des généralités. Toutefois, il y a des traces qui permettent de faire des hypothèses de compréhension. D'abord, on sait que la composition des groupes peut influencer l'apprentissage. L'outil qui associe les étudiants pour l'évaluation montre l'importance de mettre ensemble les étudiants avec diverses compétences. Alors, si dans un groupe il y a des activités d'évaluation par les pairs, il semblerait logique de penser que des groupes avec des niveaux de compétences hétérogènes soient avantagés dans les évaluations par les pairs que dans le cas de groupes qui n'ont que des personnes très compétentes ou moins compétentes. Cependant, il n'est toujours pas spécifié si cela pourrait également vrai dans le cas de l'auto-évaluation. Il serait intéressant d'en bénéficier en s'autoévaluant lorsque quelqu'un se compare aux autres membres qu'il perçoit être plus ou moins compétents. Il est bien possible que cela soit à double tranchant: en se comparant aux autres, il peut avoir une source de motivation de type "Je voudrais être comme les autres membres du groupe et je vais faire plus d'efforts pour y arriver". Toutefois, cela peut aussi mener à des effets néfastes du type "les autres membres du groupe sont trop forts, je ne serai jamais comme eux, donc ça ne vaut pas la peine de faire l'effort". Cela pourrait donner matière à réflexion dans le cadre d'une étude plus poussée.

Voici maintenant des pistes concrètes que l’on pourrait relever pour mettre en place ces types d’évaluation :

Premièrement, les ressources sur Education Hub, qui s’adresse aux enfants comme aux adultes.

Deuxièmement, ce sont des pratiques qu’il ne faut pas forcément en faire tout le temps, mais parfois, afin d’habituer ainsi que de sensibiliser et ne pas alourdir la charge de travail de l’enseignant.

Troisièmement, une piste de réflexion pourrait être de réussir à développer une plateforme ou un logiciel permettant d'utiliser et de réaliser numériquement les huit outils proposés par The Education Hub, afin que l'enseignant aie en tout temps, sous la main, toutes les auto-évaluations et évaluations par les pairs de ses élèves. Ceci pourrait permettre de repenser son cours en fonction des apprentissages relevés par les élèves. Du côté des apprenants, ceux-ci pourraient également régulièrement avoir accès, même depuis la maison, à leurs évaluations et, pourquoi pas, également l'utiliser pour des devoirs en dehors de l'école ou pour des activités extra-scolaires.

Finalement, continuer de développer l’outil numérique de Raquel M. Crespo Garcia et Abelardo Pardo (2010) pour supporter l’évaluation par les pairs de façon adaptative.

4 Références

  • Bandura, A. (1997). Self-efficacy: The exercise of control. W H Freeman/Times Books/ Henry Holt & Co.
  • Bélair, L. M., & Coen, P. (2015). Évaluation et autoévaluation : Quels espaces de formation ? (1re éd.). DE BOECK SUP.
  • Bouffard, T., Pansu, P., & Boissicat, N. (2013). Quand se juger meilleur ou moins bon qu’il ne l’est s’ avère profitable ou nuisible à l’élève. Revue française de pédagogie. Recherches en éducation, (182), 117-140.
  • Crespo García, R., Pardo, A. (2010). A Supporting System for Adaptive Peer Review based on Learners ' Profiles.
  • Gielen, S., Peeters, E., Dochy, F., Onghena, P., & Struyven, K. (2010). The effectiveness of peer feedback for learning : The effects of constructiveness, accuracy and embedding in the learning environment. Learning and Instruction, 20(4), 304‑315.
  • Gruber Jost, S., & Vieille-Grosjean, H. (2019). De l’évaluation à l’autoévaluation: d’un apprentissage défensif à un apprentissage expansif. Contextes et didactiques. Revue semestrielle en sciences de l’éducation, (13).
  • Hanrahan, S.J., Isaacs, G. (2001) Assessing Self- and Peer- assessment: The students' views. Higher Education Research & Development, 20:1, 53-70, DOI: 10.1080/07294360123776
  • Hayashi, E.C., Posada, J., Maike, V.R., & Baranauskas, M.C. (2016). Exploring new formats of the Self-Assessment Manikin in the design with children. Proceedings of the 15th Brazilian Symposium on Human Factors in Computing Systems.
  • Li, H., Xiong, Y., Hunter, C. V., Guo, X., & Tywoniw, R. (2020). Does peer assessment promote student learning? A meta-analysis. Assessment & Evaluation in Higher Education, 45(2), 193‑211. https://doi.org/10.1080/02602938.2019.1620679
  • Meusen-Beekman, K., Joosten-ten Brinke, D., & Boshuizen, E. (2016). Effects of formative assessments to develop self-regulation among sixth grade students : Results from a randomized controlled intervention. Studies in Educational Evaluation, 51, 126‑136. https://doi.org/10.1016/j.stueduc.2016.10.008
  • Morales villaBona, F. (2015). Autoévaluation et collaboration: analyse des interactions entre élèves à l’école primaire. Évaluation et autoévaluation. Quels espaces de formation, 119-136.
  • Morrissette, J. (2010). Un panorama de la recherche sur l’évaluation formative des apprentissages. Mesure et évaluation en éducation, 33(3), 1–27. https://doi.org/10.7202/1024889ar
  • Panadero, E., Tapia, J. A., & Huertas, J. A. (2012). Rubrics and self-assessment scripts effects on self-regulation, learning and self-efficacy in secondary education. Learning and Individual Differences, 22(6), 806‑813. https://doi.org/10.1016/j.lindif.2012.04.007
  • Roll I., Aleven V., McLaren B.M., Koedinger K.R. (2011). Metacognitive Practice Makes Perfect: Improving Students’ Self-Assessment Skills with an Intelligent Tutoring System. Dans Biswas, G., Bull, S., Kay, J., Mitrovic, A. (eds), Artificial Intelligence in Education. AIED 2011. Lecture Notes in Computer Science, vol 6738. Springer, Berlin, Heidelberg. https://doi.org/10.1007/978-3-642-21869-9_38
  • Ryan, R. M., & Deci, E. L. (2002). Overview of self-determination theory: An organismic-dialectical perspective.
  • Tsivitanidou, O., Zacharia, Z., Hovardas, T., & Nicolaou, A. (2006). Peer assessment among secondary school students : Introducing a peer feedback tool in the context of a computer supported inquiry learning environment in science. Journal of Computers in Mathematics and Science Teaching, 31.
  • Van Gennip, N. A. E., Segers, M. S. R., & Tillema, H. H. (2010). Peer assessment as a collaborative learning activity : The role of interpersonal variables and conceptions. Learning and Instruction, 20(4), 280‑290. https://doi.org/10.1016/j.learninstruc.2009.08.010
  • Villányi, D., Martin, R., Sonnleitner, P., Siry, C., & Fischbach, A. (2018). A Tablet-Computer-Based Tool to Facilitate Accurate Self-Assessments in Third- and Fourth-Graders. International Journal of Emerging Technologies in Learning (iJET), 13(10), pp. 225–251. https://doi.org/10.3991/ijet.v13i10.8876
  • Zimmerman, B. J. (2000). Attaining self-regulation: A social cognitive perspective. In M. Boekaerts, P. R. Pintrich, & M. Zeidner (Eds.), Handbook of self-regulation (pp. 13–39). Academic Press. https://doi.org/10.1016/B978-012109890-2/50031-7