Aspects émotionnels de la visioconférence
Resumé - Abstract
Mots-clés : émotions, visioconférence, communication face à face, théorie du groundin, communication verbale et non verbale, analogique, digital. |
HISTOIRE ET CONTEXTE
Comme le remarque Birrien (1992) dans son ouvrage moderne d'histoire, à partir des années quatre-vingt, l’outil informatique est devenu plus accessible aux profanes avec l'arrivée des micro-processeurs. Dans les années nonante un tournant arrive avec la convergence de l'informatique, de l'Internet et des télécommunications d'où émergent les technologies de l'information et de la communication. Aujourd’hui, grâce à la miniaturisation poussée des microprocesseurs, certains moyens de communication à distance se rapprochent de plus en plus de la communication face à face. La visioconférence est par exemple un moyen médiatique qui se caractérise par la transmission à distance, interactive et synchronique, d’informations visuelles et auditives (les images et le son) d'un site vers un ou plusieurs autres.
Elle permet donc aux utilisateurs d’exprimer leurs émotions par le biais du multimédia. C’est un plus. L’utilisateur prend en effet mieux conscience par ce biais de la présence sociale de l’autre. C’est pourquoi, il est pertinent de se pencher plus en détails sur l’aspect émotionnel de la visioconférence, d’en définir les concepts principaux et d’en mettre en évidence les enjeux, notamment ceux pédagogiques.
DEFINITIONS ET CONCEPTS
La visioconférence
La visionconférence est une situation de communication médiatisée essentiellement par des moyens informatiques ou technologiques regroupant la vidéo et l’audio, ceci synchroniquement et par le multimédia. On peut la différencier ainsi de la communication face à face, comme schématisé ci-dessous.
Elle permet donc aux utilisateurs d’exprimer leurs émotions par le biais du multimédia. C’est un plus. L’utilisateur prend en effet mieux conscience par ce biais de la présence sociale de l’autre. C’est pourquoi, il est pertinent de se pencher plus en détails sur l’aspect émotionnel de la visioconférence, d’en définir les concepts principaux et d’en mettre en évidence les enjeux, notamment ceux pédagogiques.
En comparant ces deux schémas et en réfléchissant sur l'article de Wang et Chen (2009), on observe que la situation de communication médiatisée par visioconférence s’approche de plus en plus de la situation naturelle en face en face, avec toutefois des différences notoires répertoriées ci-dessous :
VISIOCONFERENCE
- L’émetteur et le récepteur ne sont pas tout deux immergés dans un environnement physique commun. L’émetteur et le récepteur peuvent par contre partager un même contexte de type verbal (contextes des mots) ou gestuel, toujours à travers le champ étroit de l'écran.
- La syncrhonicité des échanges dépend des possibilités technologiques.
- La vision de l’autre est limitée par la taille de l’écran.
- La perception de l’autre a lieu par le biais d’un écran plat. De ce fait, la perception dans l’espace en 3D impliquant des mécanismes d’orientation et de localisation est fortement limitée. Les émotions sont perçues moins en profondeur.
- La netteté et les détails perçus dans l’écran dépendent de la technologie. Ils sont normalement moins clairs et détaillés qu’en situation face à face.
- Le sentiment de présence de l’autre est moins prégnant, même s’il existe vraiment.
- La communication est multimodale et synchronique, on peut y adjoindre des processus assynchrones
- Les échanges verbaux sont plus formels et fréquents de part la formalisation informatique.
- Les apprenants sont condamnés à ne pas pouvoir se toucher.
FACE A FACE
- Le contexte et l’environnement physique sont communs à l’émetteur et au desintaire. Ils sont tous deux immergés complètement dedans.
- Les interactions se font naturellement en temps réel.
- La vision de l’autre est limitée à la perception physiologique de chacun, mais est toujours plus large qu'en visioconférence.
- La perception de l’autre se fait dans un espace en trois dimensions, impliquant des mécanismes d’orientation et de localisation dans l’espace. Les sons perçus, les gestes et les mimiques, tout comme les émotions ont ainsi plus de profondeur.
- En situation face à face, la vision des choses et des êtres vivants est habituellement claire, détaillée et poignante.
- Le sentiment de présence de l’autre est très prégnant.
- La communication est multimodale et synchronique.
- Les échanges verbaux sont moins formels et fréquents. Souvent les émotions peuvent prendre le dessus sur la cognition.
- Les communiquants peuvent avoir un contact rapproché et même charnel, ce qui peut émouvoir.
Le côté émotionnel de la visioconférence
Vu ce qui précède, on peut conclcure que la visioconférence permet d’exprimer et de percevoir des émotions plus facilement, que d’autres moyens de communciation basés uniquement sur l’audio, l’image statique ou le texte sur écran.
Pour David et Myers (2004) l’émotion est pertinemment une "réponse de l’ensemble de l’organisme qui met en jeu :
- une activation physiologique
- des comportements expressifs et
- des expériences conscientes."
Les émotions ont donc une dimension physiologique (ex. sueurs, larmes, grimaces, battements du cœurs, respirations courtes, rires, pupilles dilatées, etc.), mais aussi une dimention cognitive dans biens des cas. De plus, elles impliquent souvent des interprétations subjectives liées à la situation et au contexte. Par exemple, si quelqu’un entend un dimanche soir des bruits anormaux dans sa maison, cela peut l’effrayer. Cependant, une autre personne pourrait avoir une tout autre réaction, même pas d’émotions en fait, sachant que c’est habituellement son chat qui entre à la maison à ce moment précis de la journée. L’émotion dépend donc souvent du cadre d’interprétation du sujet et de la situation dans laquelle il se trouve. Trancher qui vient avant, l’émotion ou la cognition, n’est pas l’objet du présent développement. Il est pertinent par contre d’avancer, comme le notent Polkar et Kistler (2002), que les émotions sont reconnaissables et communicables universellement par l’intermédiaire des expressions faciales. Matsumoto et Ekman (1989) en dénotent six essentielles et universellement reconnaissables, soit positives, soit négatives, c’est-à-dire le dégoût, la colère, la peur, le bohneur, la tristesse et la surprise :
Il y tout de même une part de subjectivité dans la perception des émotions, puisque Pollak et Kistler (2003) ont observé que les enfants ayant subis des sévices corporels perçoivent plus intensément la colère sur des photos d’hommes. Pour conclure, on peut déduire que puisqu’il est possible de percevoir des émotions sur des photos, ceci l’est également par l’intermédiaire de la visioconférence. Guichon (2009) s’est par exemple penché sur les émotions et leur expression dans des séquences pédagogiques utilisant justement la visioconférence. Il est donc pertinent également d’appréhender dans ce qui suit comment les émotions se communiquent par ce biais.
Les fonctions communicatives de l’émotion dans la visioconférence
Premièrement, comme le note Watzlawick (1972), les émotions concernent principalement le système neurovégétatif. En effet, dans le corps humain, les noyaux végétatifs communiquent en envoyant dans la circulation sanguine des quantités discrètes de substances spécifiques, comme des hormones, qui modulent l’expression des émotions. En voici les différents centres et leurs rôles dans la modulation des émotions schématisés dans ce tableau de David et Meyer (2004) :
Par exemple, telle personne transpirera par crainte, telle autre aura ses pupilles dilatées par amour, ou une autre aura un cœur qui bat rapidement par colère. Ces fonctions ne sont pas prises en charge par les régions corticales, qui sont entre autres le siège de la raison, du calcul et du langage verbal. Les influx nerveux s’y propagent par quantas d’information déclenchés par des potentiels d’action, selon le principe du tout ou rien. La transmission de l’information biologique dans le corps se fait donc analogiquement (ex les hormones), selon un principe d'intensité qualitative ou digitalement (les influx neuronaux) selon un principe binaire du tout ou rien.
Par analogie, dans la communication, tout comme dans les médias informatiques, on peut désigner des objets de deux façons différentes : soit par quelque chose qui ressemble à un dessin ou une image (l’analogique), soit par un nom (le digital). Les émotions étant de l’ordre neurovégétatif se transmettent par le canal visuel et par l’intonation de la voix. Elles concernent donc la communication analogique ou non-verbale, comme le dénote Watzlawick (1972). C'est leur intensité qui compte et elles peuvent aussi être véhiculées par la visioconférence.
D’autre part, tout comme le système neurovégétatif est en interaction avec le système cortical, ou tout comme les émotions le sont aussi avec la cognition, la communication non-verbale l’est également avec ce qui est dit par la parole et ceci peut avoir lieu dans des situations de visioconférence. Dans ce contexte, elle rempli les fonctions suivantes de complémentarité avec la communication verbale, comme l’illustre ci-dessous Knapp (1978) :
Mais les émotions sont plus que cela, comme le dénotent Clark, H.C. & Brennan, S. (1991) dans leur théorie du grounding, ou du "common ground". Elles sont un outil de compréhension mutuelle et de construction de sens commun dans les interactions sociales, c’est-à-dire des signes ou des indices d’incompréhension ou de compréhension mutuels. Dans une situation pédagogique, qui se déroule par l’intermédiaire de la visioconférence, Guichon (2009) a d’ailleurs observé que les émotions servent communément à clarifier les énoncés, marquer la désapprobation ou l’approbation entre apprenants ou tuteur, négocier des apprentissages ou des sens partagés à travers le discours, tout comme transmettre les sourires et des marques de salutation liés aux phases d'ouvertures et de clôture des différentes séances pédagogiques.
Eu outre, de part leur nature spontanée, les émotions marquent la présence sociale des utilisateurs dans la communication par visioconférence et contribuent donc à maintenir le contact social, tout comme la poursuite des objectifs communs, comme l’argumentent Yamada et Akahori (2007). Cela motive l’apprenant et c’est d’ailleurs un facteur pertinent de satisfaction subjective. Toujours au niveau motivationnel, comme l’observent Hauck et Youngs (2008), les signes émotionnels servent aussi à renforcer positivement ou négativement l’interlocuteur et lui transmettre des feedback. C’est fort utile dans des situations pédagogiques. Par exemple, par la visioconférence, le tuteur peut congratuler les apprenants pour leurs efforts ou leur progression. Mais le renforcement peut-être également négatif et donc alerter les apprenants sur des impasses d’apprentissage, tout comme exprimer leurs mécontentements vis-à-vis du tuteur. Les signes émotionnels peuvent en résumé venir contredire, remplacer, compléter ou accentuer les renforcements et les feedback.
Troisièmement, la situation de visioconférence peut déclencher par elle-même des émotions chez l’utilisateur. Develotte, Guichon et Kern (2008) ont constaté par exemple que la synchronie et la multimodalité étaient conjointement à la nouveauté du dispositif et à l’inexpérience des utilisateurs à l’origine d’anxiété chez ces derniers, d’autant plus que la stabilité de la connexion à distance n’était pas toujours continuellement assurée. Cette charge émotionnelle anxieuse vient cependant s’apaiser, tout en perdurant au fil des séances pédagogiques. Les auteurs font l’hypothèse qu’elle va de pair à cette situation particulière de communication et que c’est son apprivoisement qui permet d’atténuer les émotions négatives qui en émergent. Ce qui implique le développement de compétences en gestion du stress et une certaine décontraction conjointe à plus de confiance en soi chez les apprenants.
Enfin, au niveau du tutorat,Develotte, Guichon et Kern (2008) constatent également que les tuteurs surjouent la dynamique de la communication en souriant beaucoup plus que normalement afin de renforcer et encourager les apprenants. Ceci est lié aussi au fait, que de par les limites technologiques de la visioconférence, l’on voit principalement leur visage dans l’écran. La visioconférence a donc des limites comparée à la communication face à face. Il peut aussi manquer des détails ou des évènements importants dans les champs de vision respectifs. Ainsi par exemple, un tuteur peut paraître tout-à-fait souriant à l’écran alors qu’il tremble avec ses jambes, que l’on ne voit pas.
Enjeux
L’enjeu est donc à l’avenir d’offrir aux apprenants des environnements technologiques, mais aussi une ingénierie pédagogique qui se rapprochent au plus près des situations d’interactions et de communications face à face, pour les tâches d’apprentissage qui le nécessitent, tout en gardant les avantages de l’outil et du traitement informatique, la flexibilité, ainsi que la distance entre les acteurs.
Au niveau technique, l’enjeu est notamment d’ajouter à la visioconférence d’autres sens comme le toucher, l’odorat, mais aussi l’orientation, la perception et l’audition dans l’espace. Enfin, comme on le voit sur le schéma de la communication par visioconférence, il faudrait que la technologie puisse immerger complètement les acteurs dans une réalité commune, afin que la prise de sens puisse pleinement avoir lieu. On pourrait imaginer ainsi dans le futur, une sorte de réalité virtuelle partagée multimodalement, synchroniquement, se rapprochant au plus près des situations réelles de la vie.
EXEMPLES
Develotte, Guichon, Kern (2008) nous présentent dans tous les témoignages personnels qui suivent d'apprenant en visioconférence, une série d’exemples tirés de leur recherche de terrain. Ci-dessous, le passage suivant illustre bien l’angoisse des premiers temps décrite auparavant.
" T 7 : le premier cours, […] c'était un peu du n'importe quoi. On a parlé tous les deux en même temps, on écrivait plus ou moins en même temps. […]. Et puis y a eu un blocage et on a eu… et puis y a eu un p'tit, euh, un p'tit, un p'tit, un p'tit creux au niveau de l'activité pédagogique donc sur le premier cours. […] Moi j'ai eu la montée du stress tout de suite avant et j'ai dit vas y commence !
T 1 : j'avais à chaque fois une sorte de stress et puis je n’avais pas envie, c'était c'est terrible, et dès que j'y étais, il y avait une énergie qui fait que les séances, elles passent très vite en général, ça se passe bien, enfin on ressort, c'est bien quoi."
Voici d’autres témoignages qui illustrent la détente des acteurs au fil des séances d’apprentissage par visioconférence :
"T 6 : au début, c'était plus, on va dire formel la façon de parler ou la façon de taper, d'être même devant la caméra et, au fur et à mesure, on se détendait ou on faisait un peu les fous fous devant la caméra ou on envoyait plus de smileys plus interactifs au fur et à mesure et, à la fin, c'est elles-mêmes qui ont demandé les adresses Internet".
Cette décontraction menant à un sentiment de présence sociale des acteurs :
" E 6 : they were our tutors and they were here to help us get our French better. "
On voit également dans ce passage la décontraction des apprenants au fur et à mesure de leur apprentissage :
" E 3 : what I really got from it [the videoconference] was that I always forget that when I'm speaking I don't need to be so concerned about being accurate, that when you speak and just kind of get in the mindset of the language, that the words are intended to just come up because that's, those are the words you're supposed to use, like the way I'm speaking right now. So when I'm in a classroom I find myself preparing a sentence ahead of time, but with that [videoconference] I was reacting on the spot, so I think it just developed an immediacy in terms of the way I spoke."
Progressivement on s’approche ainsi d’une situation réelle de communication face à face. Develotte, Guichon, Kern(2008) observent que les apprenants se lâchent à exprimer leurs émotions étant moins anxieux :
"E 3 : it seemed very level, like we were all on even footing, and it seemed like they [the tutors] were interested in what we were saying."
Le texte, c’est-à-dire la communication verbale vient également compléter leurs émotions positives. Par exemple, des apprenants n’étaient pas satisfaits de tout simplement « dire au revoir ». Ils tenaient également parfois à ce qu'on écrive une confirmation par écrit :
"T10 : à la fin d'une conversation, on est obligé de passer par l'écrit c'est bizarre parce qu'on est quand même encore en face […] mais… pour que ce soit vraiment au revoir […] on est obligé de l'écrire pour leur dire […] en fait c'est une transition ça veut dire […] on s'parle plus on l'écrit et après on se casse […] on fait coucou au revoir mais en fait au bout d'un moment il faut s'arrêter de parler et on écrit la même chose que ce qu'on dit finalement."
La vidéo sert également aussi bien aux apprenants qu’au tuteur à vérifier la compréhension commune des messages transmis :
" E 8 : I could tell when they understood that I was kidding by their faces and so on. So that would have been hard without the video."
Les étudiants étaient contents et curieux de pouvoir enfin observer les interactions physiques (gestes, expressions faciales) :
"E 6 : and like when they spoke they were really close to one another. I don't know if that's just a cultural thing but when E5 and I were talking to them we were approximately the space that we are right now [±50 centimetres], but they were like shoulder to shoulder. And they also laughed and giggled a lot with each other and said things like "Nous sommes fous!"
Un autre étudiant avertit ici des limites de la visioconférence comparée aux communications face à face :
"E 8 : I think the choppiness of the video… there was no real sense of the fluid motion—it was a slideshow. And so if you pay too much attention to gestures then it actually gets, I think you get an incorrect impression about how people are moving."
Cet étudiant a joué les limites de la technologie en surjouant lui-même parfois des grimaces ou en lançant des provocations. Par exemple, il proclamait être pour le réchauffement climatique en adoptant une attitude sérieuse, ce qui était absolument faux, ceci pour tester la capacité régulatrice de la tutrice. Ainsi des gestes peuvent être cachés par l’émetteur, alors qu’ils viennent contredire ses communications à l’écran.
BIBLIOGRAPHIE
- Birrien, J.-Y. (1992). Histoire de l'informatique. Collection Que sais-je, no2510, Paris : Éd. PUF
- Birrien, J.-Y. (1992). Histoire de l'informatique. Collection Que sais-je, no2510, Paris : Éd. PUF