Aspects émotionnels de la visioconférence

De EduTech Wiki
Aller à la navigation Aller à la recherche
Resumé - Abstract


Quels sont les aspects émotionnels liés à la vision visioconférence ? Tel est le thème de ce rapport. Dans un premier temps, dans une optique d'étude des émotions, la visioconférence sera décrite et comparée à la situation d'interaction face à face. Puis on se centrera particulièrement sur les émotions toujours abordées en relation avec la visioconférence. Enfin en dernier lieu seront décrites les modalités des communications émotionnelles par le biais de ce média, ainsi que des exemples illustrant.

Mots-clés : émotions, visioconférence, communication face à face, théorie du groundin, communication verbale et non verbale, analogique, digital.

HISTOIRE ET CONTEXTE

Comme le remarque Birrien (1992) dans son ouvrage moderne d'histoire, à partir des années quatre-vingt, l’outil informatique est devenu plus accessible aux profanes avec l'arrivée des micro-processeurs. Dans les années nonante un tournant arrive avec la convergence de l'informatique, de l'Internet et des télécommunications d'où émergent les technologies de l'information et de la communication. Aujourd’hui, grâce à la miniaturisation poussée des microprocesseurs, certains moyens de communication à distance se rapprochent de plus en plus de la communication face à face. La visioconférence est par exemple un moyen médiatique qui se caractérise par la transmission à distance, interactive et synchronique, d’informations visuelles et auditives (les images et le son) d'un site vers un ou plusieurs autres.

Elle permet donc aux utilisateurs d’exprimer leurs émotions par le biais du multimédia. C’est un plus. L’utilisateur prend en effet mieux conscience par ce biais de la présence sociale de l’autre, que s'il communiquait seulement par la voix ou l'écriture. C’est pourquoi, il est pertinent de se pencher plus en détails sur l’aspect émotionnel de la visioconférence, d’en définir les concepts principaux et d’en mettre en évidence les enjeux, notamment ceux pédagogiques.


DEFINITIONS ET CONCEPTS

La visioconférence, les communications face à face et les émotions

La visionconférence est une situation de communication médiatisée essentiellement par des moyens informatiques ou technologiques regroupant la vidéo et l’audio, ceci synchroniquement et par le multimédia. On peut la différencier ainsi de la communication face à face, comme schématisé ci-dessous.


Fichier-schema.jpg


En comparant ces deux schémas et en réfléchissant sur l'article de Wang et Chen (2009), on observe que la situation de communication médiatisée par visioconférence s’approche de plus en plus de la situation naturelle en face en face, avec toutefois des différences notoires, même au niveau de l'expression des émotions, comme explicité ci-dessous :


VISIOCONFERENCE

  • Le grand avantage est que les communications (même l'expression des émotions) peuvent avoir lieu à distance selon la flexibilité de chacun.
  • L’émetteur et le récepteur ne sont pas tout deux immergés dans un environnement physique commun, ce qui d'une certaine façon limite la construction de sens dans les communications. Or les émotions ont souvent une signification dans un contexte donné, qui dans cette situation peut-être relativement tronquée. L’émetteur et le récepteur peuvent par contre partager un même contexte de type verbal (contextes des mots) ou gestuel (ex. mimiques faciales exprimant des émotions), toujours à travers le champ étroit de l'écran.
  • La syncrhonicité des échanges dépend des possibilités technologiques.
  • La vision de l’autre est limitée par la taille de l’écran.
  • La perception de l’autre a lieu par le biais d’un écran plat. De ce fait, la perception dans l’espace en 3D impliquant des mécanismes d’orientation et de localisation est fortement limitée. Les émotions sont perçues moins en "profondeur" ou en intensité.
  • La netteté et les détails perçus dans l’écran dépendent de la technologie. Ils sont normalement moins clairs et détaillés qu’en situation face à face. De petites nuances émotives peuvent donc passer inaperçues lors des communications.
  • Le sentiment de présence de l’autre est moins prégnant, même s’il existe vraiment. Or ce sentiment a un côté émotionnel ou affectif.
  • La communication est multimodale et synchronique, on peut y adjoindre des processus assynchrones.
  • Les échanges verbaux peuvent être plus formels et fréquents de part la formalisation informatique.
  • Les apprenants sont condamnés à ne pas pouvoir se toucher.


FACE A FACE

  • Le contexte et l’environnement physique sont communs à l’émetteur et au desintaire. Ils sont tous deux immergés complètement dedans. Les émotions y prennent pleinement sens.
  • Les interactions se font naturellement en temps réel.
  • La vision de l’autre est limitée à la perception physiologique de chacun, mais est toujours plus large qu'en visioconférence.
  • La perception de l’autre se fait dans un espace en trois dimensions, impliquant des mécanismes d’orientation et de localisation dans l’espace. Les sons perçus, les gestes et les mimiques, tout comme les émotions ont ainsi plus de profondeur dans tous les sens du terme.
  • En situation face à face, la vision des choses et des êtres vivants est habituellement claire, détaillée et poignante. Les petits détails émotionnels passent de ce fait moins innaperçus.
  • Le sentiment de présence de l’autre est très prégnant.
  • La communication est multimodale et synchronique.
  • Les échanges verbaux sont moins formels et fréquents. Souvent les émotions peuvent prendre le dessus sur la cognition.
  • Les communiquants peuvent avoir un contact rapproché et même charnel, ce qui peut émouvoir.


Une définition des émotions en rapport avec la visioconférence

Après nous être centrés sur la visioconférence, il est pertinent maintenant de se centrer sur les émmotions en tant que telles, afin d'appréhender comment elles s'expriment, notamment par l'intermédiaire du canal visuel, donc aussi par l'intermédiaire de ce média de communication.


Pour David et Myers (2004) l’émotion est pertinemment une "réponse de l’ensemble de l’organisme qui met en jeu :

  • une activation physiologique
  • des comportements expressifs et
  • des expériences conscientes."


Les émotions ont donc une dimension physiologique (ex. sueurs, larmes, grimaces, battements du cœurs, respirations courtes, rires, pupilles dilatées, etc.), mais aussi une dimention cognitive dans biens des cas. De plus, elles impliquent souvent des interprétations subjectives liées à la situation et au contexte. Par exemple, si quelqu’un entend un dimanche soir des bruits anormaux dans sa maison, cela peut l’effrayer. Cependant, une autre personne pourrait avoir une tout autre réaction, même pas d’émotions en fait, sachant que c’est habituellement son chat qui entre à la maison à ce moment précis de la journée. L’émotion dépend donc souvent du cadre d’interprétation du sujet et de la situation dans laquelle il se trouve. Elles ont également une dimention comportementale puisqu'elles peuvent s'associer à l'attaque (colère) ou à la défense personnelle (peur). Trancher qui vient avant, l’émotion ou la cognition, n’est pas l’objet du présent développement. Il est pertinent par contre d’avancer, comme le notent Polkar et Kistler (2002), que les émotions sont reconnaissables et communicables universellement par l’intermédiaire des expressions faciales. Matsumoto et Ekman (1989) en dénotent six essentielles et universellement reconnaissables, soit positives, soit négatives,d'intensités variables et graduelles, c’est-à-dire le dégoût, la colère, la peur, le bohneur, la tristesse et la surprise :


Fichier-photo emotion.jpg


Il y a tout de même une part de subjectivité dans la perception des émotions, puisque Pollak et Kistler (2003) ont observé que les enfants ayant subis des sévices corporels perçoivent plus intensément la colère sur des photos d’hommes. On peut donc déduire que puisqu’il est possible de percevoir des émotions sur des photos, ceci l’est également par l’intermédiaire de la visioconférence et ce moyen audiovisuel le permet mieux, que tout autre moyen uniquement basé sur l'audio ou l'écriture et même les images statiques.

Pour conclure, des activations physiologiques, des comportements expressifs ou même d'attaque (ex. colère, pointer du doigt) peuvent se percevoir en situation de visoconférence. Mais cela reste limité à l'écran et souvent à la vision du visage de l'interlocuteur. En outre, au niveau des expériences conscientes, il faut noter que les interlocuteurs ne sont pas tout deux immergés dans un environnement physique commun. La construction de sens, y compris relativement aux émotions, se trouve de ce fait limitée. Elle peut tout de même avoir lieu dans un cadre formel, c'est-à-dire avoir conscience de suivre un cours, du propre rôle d'apprenant par rapport à celui du tuteur et des objectifs pédagogiques; ou alors dans un contexte verbal (contexte des mots).

Guichon (2009) s’est aussi penché sur les émotions et leur expression dans des séquences pédagogiques utilisant justement la visioconférence. Il observe des phénomènes communicationnels qui dépassent l'expressivité faciale basique des émotions. Il est donc pertinent également d’appréhender plus en détails dans ce qui suit comment les émotions se communiquent par ce biais.


Les fonctions communicatives de l’émotion dans la visioconférence

Notons tout d'abord que tous les phénomènes expressifs qui seront présentés ci-dessous peuvent avoir lieu dans une situation de visioconférence, peut-être moins intensément qu'en face à face, d'autres étant également cachés à l'écran.

Premièrement, comme le note Watzlawick (1972), les émotions concernent principalement le système neurovégétatif. En effet, dans le corps humain, les noyaux végétatifs communiquent en envoyant dans la circulation sanguine des quantités discrètes de substances spécifiques, comme des hormones, qui modulent à divers degrés l’expression des émotions et leur intensité. En voici les différents centres et leurs rôles dans la modulation des émotions schématisés dans ce tableau de David et Meyer (2004) :


Fichier-fonction physiologique.jpg


Par exemple, telle personne transpirera par crainte, telle autre aura ses pupilles dilatées par amour, ou une autre aura un cœur qui bat rapidement par colère. Certaines de ces manifestations physiques peuvent se voir et même s'entendre (ex. respirations haletantes) en visioconférence, mais avec moins de netteté qu'en communication face à face et étant souvent limitées aux visages des interlocuteurs. De plus, ces fonctions liées aux émotions ne sont pas prises en charge par les régions corticales, qui sont entre autres le siège de la raison, du calcul et du langage verbal. Les influx nerveux s’y propagent par quantas d’information déclenchés par des potentiels d’action, selon le principe du tout ou rien. La transmission de l’information biologique (notamment cognitive et émotionnelle) dans le corps se fait donc analogiquement (ex les hormones liées aux émotions), selon un principe d'intensité qualitative ou digitalement (les influx neuronaux liés notamment à la cognition) selon un principe binaire du tout ou rien.

Par analogie, dans la communication, tout comme dans les médias informatiques (y compris la visioconférence), on peut désigner des objets de deux façons différentes : soit par quelque chose qui ressemble à un dessin ou une image (l’analogique), soit par un nom (le digital). Les émotions étant de l’ordre neurovégétatif se transmettent par le canal visuel et par l’intonation de la voix. Elles concernent donc la communication analogique ou non-verbale, comme le dénote Watzlawick (1972). C'est leur intensité qui compte et elles peuvent aussi être véhiculées par la visioconférence.

D’autre part, tout comme le système neurovégétatif est en interaction avec le système cortical, ou tout comme les émotions le sont aussi avec la cognition, et l'analogique l'est avec le digital, la communication non-verbale l’est également avec ce qui est dit par la parole et ceci peut avoir lieu dans des situations de visioconférence. Dans ce contexte, elle rempli les fonctions suivantes de complémentarité avec la communication verbale, comme l’illustre ci-dessous Knapp (1978) :


Fichier-communication emotion.jpg


Mais les émotions sont plus que cela, comme le dénotent Clark, H.C. & Brennan, S. (1991) dans leur théorie du grounding, ou du "common ground". Elles sont un outil de compréhension mutuelle et de construction de sens commun dans les interactions sociales, c’est-à-dire des signes ou des indices d’incompréhension ou de compréhension mutuels. Dans une situation pédagogique, qui se déroule par l’intermédiaire de la visioconférence, Guichon (2009) a d’ailleurs observé que les émotions servent communément à clarifier les énoncés, marquer la désapprobation ou l’approbation entre apprenants ou tuteur, négocier des apprentissages ou des sens partagés à travers le discours, tout comme transmettre les sourires et des marques de salutation liés aux phases d'ouvertures et de clôture des différentes séances pédagogiques.

Eu outre, de part leur nature spontanée, les émotions marquent la présence sociale des utilisateurs dans la communication par visioconférence et contribuent donc à maintenir le contact social, tout comme la poursuite des objectifs communs, comme l’argumentent Yamada et Akahori (2007). Cela motive l’apprenant et c’est d’ailleurs un facteur pertinent de satisfaction subjective. Toujours au niveau motivationnel, comme l’observent Hauck et Youngs (2008), les signes émotionnels servent aussi à renforcer positivement ou négativement l’interlocuteur et lui transmettre des feedback. C’est fort utile dans des situations pédagogiques. Par exemple, par la visioconférence, le tuteur peut congratuler les apprenants pour leurs efforts ou leur progression. Mais le renforcement peut-être également négatif et donc alerter les apprenants sur des impasses d’apprentissage, tout comme exprimer leurs mécontentements vis-à-vis du tuteur. Les signes émotionnels peuvent en résumé venir contredire, remplacer, compléter ou accentuer les renforcements et les feedback.

Troisièmement, la situation de visioconférence peut déclencher par elle-même des émotions chez l’utilisateur. Develotte, Guichon et Kern (2008) ont constaté par exemple que la synchronie et la multimodalité étaient conjointement à la nouveauté du dispositif et à l’inexpérience des utilisateurs à l’origine d’anxiété chez ces derniers, d’autant plus que la stabilité de la connexion à distance n’était pas toujours continuellement assurée. Cette charge émotionnelle anxieuse vient cependant s’apaiser, tout en perdurant au fil des séances pédagogiques. Les auteurs font l’hypothèse qu’elle va de pair à cette situation particulière de communication et que c’est son apprivoisement qui permet d’atténuer les émotions négatives qui en émergent. Ce qui implique le développement de compétences en gestion du stress et une certaine décontraction conjointe à plus de confiance en soi chez les apprenants.

Enfin, au niveau du tutorat,Develotte, Guichon et Kern (2008) constatent également que les tuteurs surjouent la dynamique de la communication en souriant beaucoup plus que normalement afin de renforcer et encourager les apprenants. Ceci est lié aussi au fait, que de par les limites technologiques de la visioconférence, l’on voit principalement leur visage dans l’écran. La visioconférence a donc des limites comparée à la communication face à face. Il peut aussi manquer des détails ou des évènements importants dans les champs de vision respectifs. Ainsi par exemple, un tuteur peut paraître tout-à-fait souriant à l’écran alors qu’il tremble avec ses jambes, que l’on ne voit pas.


Enjeux


L’enjeu est donc à l’avenir d’offrir aux apprenants des environnements technologiques, mais aussi une ingénierie pédagogique qui se rapprochent au plus près des situations d’interactions et de communications face à face, pour les tâches d’apprentissage qui le nécessitent, tout en gardant les avantages de l’outil et du traitement informatique, la flexibilité, ainsi que la distance entre les acteurs. La visioconférence répond bien à ces objectifs. A l'avenir il faudra en tenir compte, notamment au niveau pédagogique, comme l'explique si bien Guichon (2009).

Au niveau technique, l’enjeu est notamment d’ajouter à la visioconférence d’autres sens comme le toucher, l’odorat, mais aussi l’orientation, la perception et l’audition dans l’espace. Enfin, comme on le voit sur le schéma de la communication par visioconférence, il faudrait que la technologie puisse immerger complètement les acteurs dans une réalité commune, afin que la prise de sens (y compris les émotions) puisse pleinement avoir lieu. On pourrait imaginer ainsi dans le futur, une sorte de réalité virtuelle partagée à distance, multimodalement, synchroniquement, se rapprochant au plus près des situations réelles de la vie.


EXEMPLES

Develotte, Guichon, Kern (2008) nous présentent dans tous les témoignages personnels d'apprenants qui suivent, une série d’exemples tirés de leur recherche de terrain à propos d'une situation particulière d'apprentissage des langues par visioconférence. Ci-dessous, le passage suivant illustre bien l’angoisse des premiers temps décrite auparavant.


" T 7 : le premier cours, […] c'était un peu du n'importe quoi. On a parlé tous les deux en même temps, on écrivait plus ou moins en même temps. […]. Et puis y a eu un blocage et on a eu… et puis y a eu un p'tit, euh, un p'tit, un p'tit, un p'tit creux au niveau de l'activité pédagogique donc sur le premier cours. […] Moi j'ai eu la montée du stress tout de suite avant et j'ai dit vas y commence !

T 1 : j'avais à chaque fois une sorte de stress et puis je n’avais pas envie, c'était c'est terrible, et dès que j'y étais, il y avait une énergie qui fait que les séances, elles passent très vite en général, ça se passe bien, enfin on ressort, c'est bien quoi."

Voici d’autres témoignages qui illustrent la détente des acteurs au fil des séances d’apprentissage par visioconférence :

"T 6 : au début, c'était plus, on va dire formel la façon de parler ou la façon de taper, d'être même devant la caméra et, au fur et à mesure, on se détendait ou on faisait un peu les fous fous devant la caméra ou on envoyait plus de smileys plus interactifs au fur et à mesure et, à la fin, c'est elles-mêmes qui ont demandé les adresses Internet".

Cette décontraction menant à un sentiment de présence sociale des acteurs :

" E 6 : they were our tutors and they were here to help us get our French better. "

On voit également dans ce passage la décontraction des apprenants au fur et à mesure de leur apprentissage :

" E 3 : what I really got from it [the videoconference] was that I always forget that when I'm speaking I don't need to be so concerned about being accurate, that when you speak and just kind of get in the mindset of the language, that the words are intended to just come up because that's, those are the words you're supposed to use, like the way I'm speaking right now. So when I'm in a classroom I find myself preparing a sentence ahead of time, but with that [videoconference] I was reacting on the spot, so I think it just developed an immediacy in terms of the way I spoke."

Progressivement on s’approche ainsi d’une situation réelle de communication face à face. Develotte, Guichon, Kern(2008) observent que les apprenants se lâchent à exprimer leurs émotions étant moins anxieux :

"E 3 : it seemed very level, like we were all on even footing, and it seemed like they [the tutors] were interested in what we were saying."

Le texte, c’est-à-dire la communication verbale vient également compléter leurs émotions positives. Par exemple, des apprenants n’étaient pas satisfaits de tout simplement « dire au revoir ». Ils tenaient également parfois à ce qu'on écrive une confirmation par écrit :

"T10 : à la fin d'une conversation, on est obligé de passer par l'écrit c'est bizarre parce qu'on est quand même encore en face […] mais… pour que ce soit vraiment au revoir […] on est obligé de l'écrire pour leur dire […] en fait c'est une transition ça veut dire […] on s'parle plus on l'écrit et après on se casse […] on fait coucou au revoir mais en fait au bout d'un moment il faut s'arrêter de parler et on écrit la même chose que ce qu'on dit finalement."

La vidéo sert également aussi bien aux apprenants qu’au tuteur à vérifier la compréhension commune des messages transmis :

" E 8 : I could tell when they understood that I was kidding by their faces and so on. So that would have been hard without the video."

Les étudiants étaient contents et curieux de pouvoir enfin observer les interactions physiques (gestes, expressions faciales) :

"E 6 : and like when they spoke they were really close to one another. I don't know if that's just a cultural thing but when E5 and I were talking to them we were approximately the space that we are right now [±50 centimetres], but they were like shoulder to shoulder. And they also laughed and giggled a lot with each other and said things like "Nous sommes fous!"

Un autre étudiant avertit ici des limites de la visioconférence comparée aux communications face à face :

"E 8 : I think the choppiness of the video… there was no real sense of the fluid motion—it was a slideshow. And so if you pay too much attention to gestures then it actually gets, I think you get an incorrect impression about how people are moving."

Cet étudiant a joué les limites de la technologie en surjouant lui-même parfois des grimaces ou en lançant des provocations. Par exemple, il proclamait être pour le réchauffement climatique en adoptant une attitude sérieuse, ce qui était absolument faux, ceci pour tester la capacité régulatrice de la tutrice. Ainsi des gestes peuvent être cachés par l’émetteur, alors qu’ils viennent contredire ses communications à l’écran.

BIBLIOGRAPHIE

  • Birrien, J.-Y. (1992). "Histoire de l'informatique". Collection Que sais-je, no2510, Paris : Éd. PUF
  • Clark, H.C. & Brennan, S. (1991). Grounding in Communication. . In L. B. Resnick, J. Levine & S. D. Teasley (Eds), Perspectives on Socially Shared Cognition. APA, 1991
  • David G. et Meyer (2004). "Manuel de psychologie". Paris : Éd. Flammarion
  • Develotte, C., Guichon, N. & Kern, R. (2008). Allo Berkeley? Ici Lyon… Vous nous voyez bien? Etude d'un dispositif de formation en ligne synchrone franco-américain à travers les discours de ses usagers. Alsic. Vol. 11, n° 2, pp. 129-156.
  • Guichon, N. (2009). Training future language teachers to develop online tutors'competence through reflective analysis. ReCALL 21(2): 166-185 .
  • Hauck, Mirjam and Youngs, Bonnie L.(2008). Telecollaboration in multimodal environments : the impact on task design and learner interaction,Computer Assisted Language Learning,21:2,87 — 124
  • Knapp, M. L. (1978). Nonverbal communication in human interaction. NY: Holt, Rinehart & Winston. Editions with Hall, J. A. in 1992, 1997, 2002, 2006, & 20
  • Matsumoto, D., & Ekman, P. (1989). American-Japanese cultural differences in intensity ratings of facial expressions of emotion. Motivation and Emotion, 13, 143-157. (p. 515)
  • Pollak, S. D., & Kistler, D.J. (2002). Early experience is associated with the development of categorical representations for facial expressions of emotion. Proceedings of the National Academy of Sciences, 99, 9072-9076. (p. 511)
  • Wang, Y. and Chen, N. -S.(2009).Criteria for evaluating synchronous learning management systems: arguments from the distance language classroom,Computer Assisted Language Learning,22:1,1 - 18
  • Watzlawick, P. (1972). "Une logique de la communication". Paris : édition Seuil.
  • Yamada, Masanori and Akahori, Kanji (2007). 'Social presence in synchronous CMC-based language learning: How does it affect the productive performance and consciousness of learning objectives?', Computer Assisted Language Learning, 20:1, 37 – 65