Aspects émotionnels de la visioconférence

De EduTech Wiki
Aller à la navigation Aller à la recherche
Resumé - Abstract


Quels sont les aspects émotionnels liés à la vision visioconférence ? Tel est le thème de ce rapport. Dans un premier temps, dans une optique d'étude des émotions, la visioconférence sera décrite et comparée à la situation d'interaction face à face. Puis on se centrera particulièrement sur les émotions toujours abordées en relation avec la visioconférence. Enfin en dernier lieu seront décrites les modalités des communications émotionnelles par le biais de ce média, ainsi que des exemples illustrant.

Mots-clés : émotions, visioconférence, communication face à face, théorie du groundin, communication verbale et non verbale, analogique, digital.

HISTOIRE ET CONTEXTE

Comme le remarque Birrien (1992) dans son ouvrage moderne d'histoire, à partir des années quatre-vingt, l’outil informatique est devenu plus accessible aux profanes avec l'arrivée des micro-processeurs. Dans les années nonante un tournant arrive avec la convergence de l'informatique, de l'Internet et des télécommunications d'où émergent les technologies de l'information et de la communication. Aujourd’hui, grâce à la miniaturisation poussée des microprocesseurs, certains moyens de communication à distance se rapprochent de plus en plus de la communication face à face. La visioconférence est par exemple un moyen médiatique qui se caractérise par la transmission à distance, interactive et synchronique, d’informations visuelles et auditives (les images et le son) d'un site vers un ou plusieurs autres.

Elle permet donc aux utilisateurs d’exprimer leurs émotions par le biais du multimédia. C’est un plus. L’utilisateur prend en effet mieux conscience par ce biais de la présence sociale de l’autre, que s'il communiquait seulement par la voix ou l'écriture. C’est pourquoi, il est pertinent de se pencher plus en détails sur l’aspect émotionnel de la visioconférence, d’en définir les concepts principaux et d’en mettre en évidence les enjeux, notamment ceux pédagogiques.


DEFINITIONS ET CONCEPTS

La visioconférence, les communications face à face et les émotions

La visionconférence est une situation de communication médiatisée essentiellement par des moyens informatiques ou technologiques regroupant la vidéo et l’audio, ceci de façon synchrone et par le multimédia. On peut la différencier ainsi de la communication face à face : [1], comme schématisé ci-dessous.


Fichier-schema.jpg


En comparant ces deux schémas et en réfléchissant sur l'article de Wang et Chen (2009), on observe que la situation de communication médiatisée par visioconférence s’approche de plus en plus de la situation naturelle en face en face. Toutefois, il y a entre elles des différences notoires, même au niveau de l'expression des émotions, comme explicité ci-dessous :


Différences entre la visioconférence et les communications face à face au niveau de l'expression des émotions
VISIOCONFERENCE COMMUNICATION FACE A FACE


  • Le grand avantage est que les communications (même l'expression des émotions) peuvent avoir lieu à distance selon la flexibilité de chacun.
  • L’émetteur et le récepteur ne sont pas tout deux immergés dans un environnement physique commun. Ce qui d'une certaine façon limite la construction de sens dans les communications. Or les émotions ont souvent une signification dans un contexte donné, qui dans cette situation peut-être relativement tronquée. L’émetteur et le récepteur peuvent par contre partager un même contexte de type verbal (contextes des mots) ou gestuel (ex. mimiques faciales exprimant des émotions). Ces échanges ont cependant toujours lieu à travers le champ étroit de l'écran.
  • La synchronisation des échanges dépend des possibilités technologiques.
  • La vision de l’autre est limitée par la taille de l’écran.
  • La perception face à face :[2] de l’autre a lieu par le biais d’un écran plat. De ce fait, la perception dans l’espace en 3D impliquant des mécanismes d’orientation et de localisation dans l'espace est fortement limitée. De par cette limitation, les émotions sont perçues moins en "profondeur" ou en intensité.
  • La netteté et les détails perçus dans l’écran dépendent de la technologie. Ils sont normalement moins clairs et détaillés qu’en situation face à face. De petites nuances émotives peuvent donc passer inaperçues lors des communications.
  • Le sentiment de présence de l’autre est moins prégnant, même s’il existe vraiment. Or ce sentiment a un côté émotionnel ou affectif.
  • La communication est multimodale et synchronique, on peut y adjoindre des processus asynchrones.
  • Les échanges verbaux peuvent être plus formels et fréquents de part la formalisation informatique.
  • Les apprenants sont condamnés à ne pas pouvoir se toucher.


  • Les communications (même l'expression des émotions) ne peuvent pas avoir lieu à grande distance. Elles impliquent une présence sociales des acteurs sur place.
  • L’émetteur et le récepteur sont tout deux immergés dans un environnement physique commun. Ce qui donne une certaine profondeur à leurs émotions.
  • La synchronisation des échanges se fait naturellement en temps réel sans limitation technologique.
  • La vision de l’autre est limitée par le champ perceptif des acteurs, mais est plus large qu'en visioconférence.
  • La perception dans l’espace en 3D impliquant des mécanismes d’orientation et de localisation a lieu pleinement. Les émotions y sont donc perçues plus en "profondeur" dans tous les sens du terme.
  • La netteté et les détails perçus sont à leur maximum. De petites nuances émotives peuvent donc être perçues lors des communications.
  • Le sentiment de présence de l’autre s'observe pleinement.
  • La communication est multimodale et synchronique, on peut difficilement y adjoindre des processus asynchrones pour structurer les échanges.
  • Les échanges verbaux sont moins formels en situation face à face. Des fois les émotions peuvent prendre le dessus sur la raison.
  • Les communiquants peuvent se toucher et même avoir un contact charnel émouvant.



Une définition des émotions en rapport avec la visioconférence

Il est pertinent maintenant de se centrer sur les émotions en tant que telles. Le but est d'appréhender comment elles s'expriment, notamment par l'intermédiaire du canal visuel, donc aussi par l'intermédiaire de la visioconférence.


Pour David et Myers (2004) l’émotion est pertinemment une "réponse de l’ensemble de l’organisme qui met en jeu :


  • une activation physiologique
  • des comportements expressifs et
  • des expériences conscientes : [3]."


Comme l'avancent ces auteurs, les émotions ont une dimension physiologique : sueurs, larmes, grimaces, battements du cœurs, respirations courtes, rires, pupilles dilatées, etc.. Elles sont aussi liées à la cognition. En effet, dans bien des cas, elles sont modulées par des interprétations mentales, elles-mêmes influencées par une situation et un contexte déterminés. Par exemple, si quelqu’un entend un dimanche soir des bruits anormaux dans sa maison, cela peut l’effrayer. Cependant, une autre personne pourrait avoir une toute autre réaction, même pas d’émotions en fait. Cela parce qu'elle sait que c’est habituellement son chat qui entre à la maison à ce moment précis de la journée. Enfin, comme le définissent ces auteurs, les émotions ont également une dimension comportementale. En effet, elles peuvent par exemple servir à exprimer l'attaque (ex. colère) ou la défense et la fuite personnelles (ex. peur); ainsi que toute une série de sous-catégories de comportements relatifs à cette dichotomie comportementale.

Polkar et Kistler (2002) : six catégories universelles d'émotions

Au niveau expressif, il est pertinent d’avancer, comme le notent Polkar et Kistler (2002), que les émotions sont reconnaissables et communicables par l’intermédiaire des expressions faciales. Matsumoto et Ekman (1989) en dénotent six essentielles et universellement reconnaissables. Elles sont soit positives, soit négatives. Elles ont des intensités variables et graduelles. Leur représentation photographique est donnée à droite.

Nous pouvons également déduire ici, qu'il y a une part de subjectivité dans ce type de perception des émotions faciales. Par exemple, Pollak et Kistler (2003) ont observé que les enfants ayant subis des sévices corporels perçoivent plus intensément la colère sur des photos d’hommes. Et comme nous le voyons, puisqu'il est possible de percevoir des émotions sur des photos par le biais d'un écran d'ordinateur. Ceci l'est donc également par l’intermédiaire de la visioconférence. Ce moyen audiovisuel le permet d'ailleurs mieux, que tout autre moyen uniquement basé sur l'audio ou l'écriture et même les images statiques.

Pour conclure avec déductions, des activations physiologiques, des comportements expressifs ou même d'attaque (ex. colère, pointer du doigt) peuvent se percevoir, se communiquer ou se produire en situation de visoconférence. Mais cela reste limité à l'écran et souvent à la vision du visage de l'interlocuteur. D'autant plus, que cette perception des émotions s'avère moins claire et moins détaillée qu'en situation face à face. En outre, au niveau des expériences conscientes, il faut noter que les interlocuteurs ne sont pas tous immergés dans un environnement ou un contexte physique commun. La construction de sens, y compris celle relative aux émotions, se trouve de ce fait limitée. Cependant des contextes plus formels partagés conjointement par les apprenants peuvent influencer leurs émotions. Comme par exemple le cadre formel d'un cours, c'est-à-dire avoir conscience de suivre un cours déterminé, avoir conscience du propre rôle d'apprenant par rapport à celui du tuteur et des objectifs pédagogiques, etc.. Les émotions peuvent de même se moduler au travers d'un contexte langagier partagé par tous. En situation de visioconférence, les apprenants sont donc tout de même immergés dans des contextes communs. Mais ceux-ci auront plutôt une nature digitale ou verbale (ex. contexte des mots, contexte langagier, cadre formel), qu'une nature analogique ou imagée (ex. environnement physique perçu conjointement par tout le monde).

Guichon (2009) s’est aussi penché sur les émotions et leur expression dans des séquences pédagogiques utilisant justement la visioconférence. Il observe des phénomènes communicationnels qui dépassent l'expressivité faciale basique des émotions. Il est donc pertinent maintenant d’appréhender plus en détails, quelles sont les fonctions communicatives des émotions, qui s'expriment au travers de la visioconférence.


Les fonctions communicatives de l’émotion dans la visioconférence

Notons tout d'abord que tous les phénomènes expressifs qui seront présentés ci-dessous peuvent avoir lieu dans une situation de visioconférence; peut-être moins intensément qu'en face à face, d'autres étant également cachés à l'écran. Dans un premier temps, une distinction entre l'information de nature analogique et digitale sera introduite, pour expliquer ensuite quelle est la dynamique des communications émotionnelles, au travers de la visioconférence.

Les émotions ont essentiellement une fonction régulative au niveau du système végétatif : [4]. En effet, dans le corps humain, les noyaux végétatifs communiquent en envoyant dans la circulation sanguine des quantités discrètes de substances spécifiques, comme des hormones. Ces dernières modulent à divers degrés l’expression des émotions et leur intensité. En voici les différents centres et leurs rôles dans la modulation des émotions dans ce tableau à droite de David et Meyer (2004).

David et Meyer (2004) : le système végétatif et les émotions


Par exemple, telle personne transpirera par crainte. Telle autre aura ses pupilles dilatées par amour. Une autre aura un cœur qui bat rapidement par colère. Souvent ces manifestations physiques impliquent une régulation végétative ou même inconsciente. Elles peuvent se voir et même s'entendre (ex. respirations haletantes) et se ressentir avec empathie par les interlocuteurs, dans une situation de visioconférence. Toutefois, comme dans le cas précédent, cela a lieu avec moins de netteté qu'en communication face à face. De plus, elles sont souvent limitées aux visages des interlocuteurs. Il faut aussi noter, que ces fonctions liées aux émotions ne sont pas prises en charge par les régions corticales. Ces dernières sont entre autres le siège de la raison, du calcul et du langage verbal. Les influx nerveux s’y propagent par quantas d’information déclenchés par des potentiels d’action, selon le principe du tout ou rien. La transmission de l’information biologique (notamment cognitive et émotionnelle) dans le corps se fait donc :


  • analogiquement (ex les hormones liées aux émotions), selon un principe d'intensité qualitative,
  • ou digitalement (les influx neuronaux liés notamment à la cognition), selon un principe binaire du tout ou rien.


Knapp (1978) : complémentarités entre langage verbal et non verbal

Or comme le note Watzlawick (1972) par analogie, dans la communication humaine, tout comme dans les médias informatiques (y compris la visioconférence), on peut désigner des objets de deux façons différentes :


  • soit par quelque chose qui ressemble à un dessin ou une image (l’analogique),
  • soit par un nom (le digital).



Les émotions étant de l’ordre neurovégétatif se transmettent par le canal visuel et par l’intonation de la voix. Elles concernent donc la communication analogique ou non-verbale. C'est leur intensité qui compte et elles peuvent aussi être véhiculées par la visioconférence. En fin de compte, tout comme le système neurovégétatif est en interaction avec le système cortical. Tout comme les émotions le sont aussi avec la cognition. Tout comme l'analogique l'est avec le digital. La communication non-verbale l’est également avec ce qui est dit par la parole. Et ces interactions peuvent avoir lieu en situation de visioconférence, puisque ce moyen audiovisuel permet de transmettre du digital et de l'analogique. Dans ce contexte, la communication non-verbale, donc y compris les émotions, en visioconférence, peuvent remplir les fonctions suivantes de complémentarité avec la communication verbale, comme l’illustre dans le schéma de droite Knapp (1978).

Mais les émotions sont plus que cela, comme le dénotent Clark, H.C. & Brennan, S. (1991) dans leur théorie du grounding, ou du "common ground". Elles sont un outil de compréhension mutuelle et de construction de sens commun dans les interactions sociales; par exemple des signes ou des indices d’incompréhension ou de compréhension mutuels. Dans une situation pédagogique, qui se déroule par l’intermédiaire de la visioconférence, Guichon (2009) a d’ailleurs observé que les émotions servent communément à clarifier les énoncés; marquer la désapprobation ou l’approbation entre apprenants ou tuteur; négocier des apprentissages ou des sens partagés à travers le discours. Elles permettent aussi de transmettre les sourires et des marques de salutation liés aux phases d'ouvertures et de clôture des différentes séances pédagogiques.

Eu outre, de part leur nature spontanée, les émotions marquent la présence sociale des utilisateurs dans la communication par visioconférence. Elles contribuent donc à maintenir le contact social, tout comme la poursuite des objectifs communs; comme l’argumentent Yamada et Akahori (2007). Cela motive l’apprenant et c’est d’ailleurs un facteur pertinent de satisfaction subjective. Toujours au niveau motivationnel, comme l’observent Hauck et Youngs (2008); les signes émotionnels servent aussi à renforcer positivement ou négativement l’interlocuteur. Elles permettent aussi de lui transmettre des feedback. C’est fort utile dans des situations pédagogiques. Par exemple, par la visioconférence, le tuteur peut congratuler, avec sourire, les apprenants pour leurs efforts ou leur progression. Mais le renforcement peut-être également négatif et donc alerter les apprenants sur des impasses d’apprentissage, tout comme exprimer leurs mécontentements vis-à-vis du tuteur. Les signes émotionnels peuvent en résumé venir contredire, remplacer, compléter ou accentuer les renforcements et les feedback.

Troisièmement, la situation de visioconférence peut déclencher par elle-même des émotions chez l’utilisateur. Develotte, Guichon et Kern (2008) ont constaté par exemple que la synchronie et la multimodalité étaient conjointement à la nouveauté du dispositif et à l’inexpérience des utilisateurs, à l’origine d’anxiété chez ces derniers. D’autant plus que la stabilité de la connexion à distance n’était pas toujours continuellement assurée. Cette charge émotionnelle anxieuse vient cependant s’apaiser, tout en perdurant au fil des séances pédagogiques. Les auteurs font l’hypothèse qu’elle va de pair à cette situation particulière de communication et que c’est son apprivoisement qui permet d’atténuer les émotions négatives qui en émergent. Ce qui implique le développement de compétences en gestion du stress et une certaine décontraction conjointe à plus de confiance en soi chez les apprenants.

Enfin, au niveau du tutorat,Develotte, Guichon et Kern (2008) constatent également que les tuteurs surjouent la dynamique de la communication. Par exemple, ils sourient beaucoup plus que normalement afin de renforcer et encourager les apprenants. Ceci est lié aussi au fait, que de par les limites technologiques de la visioconférence, l’on voit principalement leur visage dans l’écran. La visioconférence a donc des limites comparée à la communication face à face. En effet, il peut manquer des détails ou des évènements importants dans les champs de vision respectifs. Ainsi par exemple, un tuteur peut paraître tout-à-fait souriant à l’écran alors qu’il tremble avec ses jambes, que l’on ne voit pas.


Enjeux


L’enjeu est donc à l’avenir d’offrir aux apprenants des environnements technologiques qui permettent de se rapprocher au plus près des communications face à face. Ceci, pour les tâches d’apprentissage qui le nécessitent; et tout en gardant les avantages de l’outil et du traitement informatique, la flexibilité, ainsi que la distance entre les acteurs. Le but est en ce qui concerne notre thème de permettre une expression suffisamment intense des émotions. La visioconférence répond à ces objectifs, mais on pourrait l'améliorer technologiquement. A l'avenir il faudra en tenir compte, notamment au niveau pédagogique, comme l'explique si bien Guichon (2009).

Au niveau technique, l’enjeu est justement d’ajouter à la visioconférence d’autres sens comme le toucher, l’odorat, mais aussi l’orientation, la perception et l’audition dans l’espace. Ceci pour permettre une expression encore plus intense des émotions et motiver l'utilisateur. Enfin, comme on le voit sur le schéma de la communication par visioconférence, il faudrait que la technologie puisse immerger complètement les acteurs dans une réalité commune. Le but est que la prise de sens (y compris les émotions) puisse avoir lieu plus profondemment. On pourrait imaginer ainsi dans le futur, une sorte de réalité virtuelle partagée à distance, multimodalement, synchroniquement; se rapprochant au plus près des situations réelles de la vie.


EXEMPLES

Develotte, Guichon, Kern (2008) nous présentent dans tous les témoignages personnels d'apprenants qui suivent, une série d’exemples tirés de leur recherche de terrain à propos d'une situation particulière d'apprentissage des langues par visioconférence. Ci-dessous, le passage suivant illustre bien l’angoisse des premiers temps décrite auparavant :


" T 7 : le premier cours, […] c'était un peu du n'importe quoi. On a parlé tous les deux en même temps, on écrivait plus ou moins en même temps. […]. Et puis y a eu un blocage et on a eu… et puis y a eu un p'tit, euh, un p'tit, un p'tit, un p'tit creux au niveau de l'activité pédagogique donc sur le premier cours. […] Moi j'ai eu la montée du stress tout de suite avant et j'ai dit vas y commence !

T 1 : j'avais à chaque fois une sorte de stress et puis je n’avais pas envie, c'était c'est terrible, et dès que j'y étais, il y avait une énergie qui fait que les séances, elles passent très vite en général, ça se passe bien, enfin on ressort, c'est bien quoi."

Voici d’autres témoignages qui illustrent la détente des acteurs au fil des séances d’apprentissage par visioconférence :

"T 6 : au début, c'était plus, on va dire formel la façon de parler ou la façon de taper, d'être même devant la caméra et, au fur et à mesure, on se détendait ou on faisait un peu les fous fous devant la caméra ou on envoyait plus de smileys plus interactifs au fur et à mesure et, à la fin, c'est elles-mêmes qui ont demandé les adresses Internet".

Cette décontraction menant à un sentiment de présence sociale des acteurs :

" E 6 : they were our tutors and they were here to help us get our French better. "

On voit également dans ce passage la décontraction des apprenants au fur et à mesure de leur apprentissage :

" E 3 : what I really got from it [the videoconference] was that I always forget that when I'm speaking I don't need to be so concerned about being accurate, that when you speak and just kind of get in the mindset of the language, that the words are intended to just come up because that's, those are the words you're supposed to use, like the way I'm speaking right now. So when I'm in a classroom I find myself preparing a sentence ahead of time, but with that [videoconference] I was reacting on the spot, so I think it just developed an immediacy in terms of the way I spoke."

Progressivement on s’approche ainsi d’une situation réelle de communication face à face. Develotte, Guichon, Kern(2008) observent que les apprenants se lâchent à exprimer leurs émotions étant moins anxieux :

"E 3 : it seemed very level, like we were all on even footing, and it seemed like they [the tutors] were interested in what we were saying."

Le texte, c’est-à-dire la communication verbale vient également compléter leurs émotions positives. Par exemple, des apprenants n’étaient pas satisfaits de tout simplement « dire au revoir ». Ils tenaient également parfois à ce qu'on écrive une confirmation par écrit :

"T10 : à la fin d'une conversation, on est obligé de passer par l'écrit c'est bizarre parce qu'on est quand même encore en face […] mais… pour que ce soit vraiment au revoir […] on est obligé de l'écrire pour leur dire […] en fait c'est une transition ça veut dire […] on s'parle plus on l'écrit et après on se casse […] on fait coucou au revoir mais en fait au bout d'un moment il faut s'arrêter de parler et on écrit la même chose que ce qu'on dit finalement."

La vidéo sert également aussi bien aux apprenants qu’au tuteur à vérifier la compréhension commune des messages transmis :

" E 8 : I could tell when they understood that I was kidding by their faces and so on. So that would have been hard without the video."

Les étudiants étaient contents et curieux de pouvoir enfin observer les interactions physiques (gestes, expressions faciales) :

"E 6 : and like when they spoke they were really close to one another. I don't know if that's just a cultural thing but when E5 and I were talking to them we were approximately the space that we are right now [±50 centimetres], but they were like shoulder to shoulder. And they also laughed and giggled a lot with each other and said things like "Nous sommes fous!"

Un autre étudiant avertit ici des limites de la visioconférence comparée aux communications face à face :

"E 8 : I think the choppiness of the video… there was no real sense of the fluid motion—it was a slideshow. And so if you pay too much attention to gestures then it actually gets, I think you get an incorrect impression about how people are moving."

Cet autre étudiant a joué les limites de la technologie en surjouant lui-même parfois des grimaces ou en lançant des provocations. Par exemple, il proclamait être pour le réchauffement climatique en adoptant une attitude sérieuse, ce qui était absolument faux, ceci pour tester la capacité régulatrice de la tutrice. Ainsi des gestes peuvent être cachés par l’émetteur, alors qu’ils viennent contredire ses communications à l’écran.

BIBLIOGRAPHIE

  • Birrien, J.-Y. (1992). "Histoire de l'informatique". Collection Que sais-je, no2510, Paris : Éd. PUF
  • Clark, H.C. & Brennan, S. (1991). Grounding in Communication. . In L. B. Resnick, J. Levine & S. D. Teasley (Eds), Perspectives on Socially Shared Cognition. APA, 1991
  • David G. et Meyer (2004). "Manuel de psychologie". Paris : Éd. Flammarion
  • Develotte, C., Guichon, N. & Kern, R. (2008). Allo Berkeley? Ici Lyon… Vous nous voyez bien? Etude d'un dispositif de formation en ligne synchrone franco-américain à travers les discours de ses usagers. Alsic. Vol. 11, n° 2, pp. 129-156.
  • Guichon, N. (2009). Training future language teachers to develop online tutors'competence through reflective analysis. ReCALL 21(2): 166-185 .
  • Hauck, Mirjam and Youngs, Bonnie L.(2008). Telecollaboration in multimodal environments : the impact on task design and learner interaction,Computer Assisted Language Learning,21:2,87 — 124
  • Knapp, M. L. (1978). Nonverbal communication in human interaction. NY: Holt, Rinehart & Winston. Editions with Hall, J. A. in 1992, 1997, 2002, 2006, & 20
  • Matsumoto, D., & Ekman, P. (1989). American-Japanese cultural differences in intensity ratings of facial expressions of emotion. Motivation and Emotion, 13, 143-157. (p. 515)
  • Pollak, S. D., & Kistler, D.J. (2002). Early experience is associated with the development of categorical representations for facial expressions of emotion. Proceedings of the National Academy of Sciences, 99, 9072-9076. (p. 511)
  • Wang, Y. and Chen, N. -S.(2009).Criteria for evaluating synchronous learning management systems: arguments from the distance language classroom,Computer Assisted Language Learning,22:1,1 - 18
  • Watzlawick, P. (1972). "Une logique de la communication". Paris : édition Seuil.
  • Yamada, Masanori and Akahori, Kanji (2007). 'Social presence in synchronous CMC-based language learning: How does it affect the productive performance and consciousness of learning objectives?', Computer Assisted Language Learning, 20:1, 37 – 65