Le classement des données
[[Catégorie:]]
Cet article est en construction: un auteur est en train de le modifier.
En principe, le ou les auteurs en question devraient bientôt présenter une meilleure version.
Resumé - Abstract
ici résumé français et anglais mots clé : ... |
Historique et contexte
L’utilisateur lambda est confronté à une quantité de données personnelles de plus en plus conséquente et les pratiques autour de la gestion de ces données se sont modifiées. Plusieurs raisons expliquent cela. La première tient au fait que la capacité des disques durs est de plus en plus importante et a, de fait, occasionné un changement des habitudes : là où auparavant nous faisions un effort pour trier en amont ce qu’il était vraiment pertinent de garder, nous pouvons maintenant « stocker d’abord et voir plus tard ». La capacité augmentant et le coût des supports de stockage diminuant, le contenant n'agit plus comme limitateur du stockage des contenus. Nous ne sommes plus obligés de régulièrement « faire de la place », ce qui fait que nous connaissons moins en détail le contenu de nos ordinateurs qu'auparavant car nous n’ouvrons plus certains répertoires ou fichiers. Nous pouvons maintenant rajouter des disques à notre configuration initiale, de même nous pouvons prendre des dizaines de photos d’une même scène en vue d’un choix ultérieur.
Le second changement important est la multiplication des espaces de stockage. Si l’on prend le cas des photos, il n’est pas rare de les trouver stockées sur différents supports physiques : disque dur interne ou externe, téléphone, Ipod, cartes, mais aussi espaces virtuels en ligne : Flikr, Picasa, blogs, sites, webmail, réseaux sociaux etc. L’observation des pratiques montre que l’original d’une photo ne se trouve pas forcément sur le disque dur « parent », ce qui complique les procédures de classement mais paradoxalement simplifie parfois les procédures de recouvrement et nous verrons pourquoi. Pour autant, certaines applications sur Internet ne permettent pas de récupérer des données contextualisées. C’est le cas de Facebook par exemple, on ne peut pas récupérer un fil de discussion ou son propre mur. D’autres applications offrent au contraire des possibilités de synchronisation entre espace de stockage sur son disque dur et stockage sur internet. C’est le cas de la plupart des webmail que l’on peut synchroniser avec son courrieleur. C’est le cas aussi des outils de partage de signets (social bookmarks).
Cette remarque nous amène au troisième grand changement : avec l’avènement du Web 2.0 et l’explosion des réseaux sociaux, on stocke pour soi-même mais on stocke aussi pour partager. Les outils et applications devenant de plus en plus interopérables, ceci tend maintenant à nous faire évoluer vers un partage direct, sans avoir préalablement stocké l'objet à partager. Reprenons pour exemple le cas des photos : on peut maintenant envoyer une photo directement de son téléphone portable sur un réseau social, là où auparavant il eût fallu d’abord la transférer sur son ordinateur pour la rendre compatible en taille, en poids avec le site receveur.
Définition et enjeux
Dans cet article nous observerons le classement et la récupération des données personnelles sous deux angles qui nous semblent essentiels : l’ergonomie des systèmes et les mécanismes cognitifs convoqués, mais nous n’ignorons pas qu’il y a d’autres facteurs importants –notamment sociologiques- qui influencent les pratiques, par exemple si les personnes sont ou ne sont pas des « digitales natives », le métier exercé (les méthodes de classement peuvent être inspirées des pratiques professionnelles), le statut de l’ordinateur dans la famille (est-il partagé ou non) etc. D’autre part nous ferons essentiellement référence à Windows qui reste le système d’exploitation le plus usité.
Deux exemples de classement de données personnelles
Aspects cognitifs
Connaissances déclaratives et procédurales
Le classement des données fait appel à divers types de connaissances :
- Des connaissances déclaratives : l’utilisateur doit avoir des notions de ce qu’est un fichier, un répertoire, une arborescence, un format. Il doit en outre savoir renommer, catégoriser, hiérarchiser et trier.
- Des connaissances procédurales : il doit savoir couper, coller, créer un nouveau répertoire, déplacer des éléments, en supprimer. (compléter)
Processus mnésiques
compléter ttes les références et revoir mise en page
- Fonctionnement général
Tiberghien définit ainsi la mémoire : « Capacité des organismes vivants et de certains artefacts à encoder, stocker et retrouver l’information ». (dictionnaire des sciences cognitives) La mémoire est donc caractérisée par une phase d’encodage et de stockage, une phase de réactivation et une phase de rétention (entre les deux phases précédentes) (Xavier Seron, Jean-Claude Baron, Marc Jeannerod, Neurologie humaine). Chez les chercheurs on trouve deux conceptions principales de la mémoire : pour les uns c’est un système unitaire (approche structuraliste), pour les autres c’est un système composé de sous systèmes (approche fonctionnaliste).
Le psychologue torontois Endel Tulving (2nde conception) proposa en 1995 un modèle d’organisation de la mémoire en cinq systèmes, organisés hiérarchiquement et collaborant ensembles pour assurer les 3 fonctions essentielles de la mémoire : encodage (enregistrer les informations nouvelles), stockage (les conserver) et recouvrement (les récupérer). Ce modèle, bien que discuté, est le plus couramment admis.
insérer shéma
La mémoire procédurale permet d’apprendre des actions, des procédures. Elle ne se développe pas par accumulation mais par ajustement progressif de l’action à un objectif. Elle permet notamment l’acquisition de compétences motrices. Par exemple manipuler la souris relève de la mémoire procédurale. C’est la mémoire des automatismes appris et elle s’exprime dans l’action. Elle est anoétique car aucun état de conscience ne la caractérise.
La mémoire perceptive permet de reconnaître des formes et des structures. Reconnaître les icônes fait appel à la mémoire perceptive.
La mémoire sémantique permet de stocker des connaissances. Cette mémoire est nécessaire à la compréhension et à la production de sens et elle est dite « noétique » car la conscience de l’existence du monde est indépendante de soi. Elle est sensible aux variations contextuelles entre le stockage et la récupération ainsi qu’aux facteurs affectifs. Classer des données nécessite d’en avoir compris le contenu et de savoir à quoi sont reliées ces données.
La mémoire de travail est une mémoire à court terme. Elle permet de retenir les informations nécessaires à une autre activité. Sa capacité est limitée. On la mesure par des tests d’empan. Elle permet par exemple de retenir les répertoires déjà explorés lorsqu’on recherche un fichier. Généralement on la compare à la mémoire vive de nos ordinateurs.
La mémoire épisodique permet de se souvenir d’évènements personnels. L’accès à cette mémoire s’accompagne d’un éveil spécifique de conscience mnémonique appelé « recollection ». Tulving parlera de conscience autonoetique, car elle permet la reviviscence consciente de l’événement et l’individu prend alors conscience de son identité et de son existence dans un temps chronologique qu’il parcourt mentalement. C’est grâce à cette mémoire que Marcel Proust pu se remémorer ses souvenirs à partir du simple goût d'une madeleine. De la même manière, lorsqu’un utilisateur recherchera sur son ordinateur une photo de ses dernières vacances, il se remémorera les circonstances de la prise de vue ou des éléments liés à ses vacances. Cette mémoire est particulièrement étudiée par les chercheurs car d’une part elle peut générer des faux souvenirs (on parle alors d’amnésie de source ) et d’autre part c’est le système de mémoire qui se détériore le plus rapidement avec le vieillissement.
Les deux mémoires à long terme sémantiques et épisodiques font partie de la classe des mémoires déclaratives appelées mémoires explicites ou encore mémoires objet car elles stockent des faits qui peuvent être discutés consciemment et facilement, tandis que la mémoire procédurale est une mémoire implicite, ou mémoire outil qui n’enregistre que des automatismes et que l’individu restitue « sans réfléchir ». (Schacter, 1987; Roediger, 1990)
Dans ce modèle appelé SPI (Seriel, Parallèle, Indépendant), l’encodage est sériel car les informations entrent dans la mémoire perceptive, puis accèdent ensuite éventuellement aux autres types de mémoire. Le stockage se fait en parallèle dans les différents systèmes et l’information est récupérée de façon indépendante, dans chaque système concerné (Guegen et al, 2005) (Neurophysiologie des mémoires, 2005). Une des conséquences de l’encodage seriel est la possibilité d’élaborer des connaissances sans former de souvenirs et donc sans laisser traces en mémoire sémantique. D’autres recherches montrent que les patients ayant une mémoire épisodique très faible peuvent néanmoins élaborer des connaissances. Il est donc possible d’acquérir de nouveaux savoirs sans que le sujet ait le moindre souvenir conscient des circonstances de l’acquisition.
Pour illustrer l’interaction de ces différentes mémoires avec le thème qui nous intéresse, on peut dire que percevoir une différence visuelle entre une photo et un texte relève de la mémoire perceptive, par contre faire la différence entre un .jpeg et .doc relève de la mémoire sémantique car on a alors appris/acquis la notion de format. Créer un nouveau dossier pour classer ses données relève de la mémoire procédurale : on a appris à faire bouton droit / nouveau / dossier et on le fait sans y réfléchir mais nommer ce dossier fait appel à la mémoire sémantique. Retrouver ses données fait intervenir à la fois la mémoire perceptive : on reconnaît un type fichier par son icône ; la mémoire épisodique : on se souvient d’avoir écrit ou rangé ce fichier dans tel ou tel contexte, à telle occasion ; la mémoire sémantique : on se souvient du thème du fichier que l’on cherche ; et bien sûr la mémoire de travail.
- Encodage, consolidation et rappel
Tulving a montré qu’il existe une forte corrélation entre le contexte d’encodage et le contexte de récupération des informations. (Tulving & Thompson, 1973). (p55 mémoire et représentation livre) Le processus de rappel est bien plus efficace si les deux contextes sont similaires. A contrario le rappel est plus difficile si le contexte est très différent. Nous expérimentons cela lorsque nous sommes dans une pièce et devons aller chercher quelque chose dans une autre pièce, arrivé dans celle-ci nous ne savons plus ce que nous venions chercher et nous devons revenir dans la première pièce pour en retrouver la trace mnesique. Nous n’avons pas toujours besoin de retourner sur les lieux, nous pouvons simplement imaginer le contexte dans lequel cette information a été codée pour la première fois (Smith, 1988). De nombreuses études ont montré que l’encodage et la récupération du contexte sont essentiels au bon fonctionnement de la mémoire : le contexte permet de discriminer l’information et sert donc d’indice de récupération.
Dans le classement des données, plusieurs éléments sont mémorisés pour un même fichier : -le contenu du fichier : son thème, de quoi parle-t-il ? -le contexte de création du fichier, lorsqu’il y a création d’un document : à quelle occasion j’ai créé ce document ? -le contexte d’enregistrement du fichier : pourquoi j’ai enregistré tel fichier ? j’étais en train de travailler sur quel thème ? je l’ai fait à partir de quel logiciel ?
En étudiant la recherche d’informations sur Internet, des auteurs comme Craik et Tulving ont mis en évidence que « les informations issues de pages Web étaient mieux appelées/reconnues lorsque la recherche était orientée sur le traitement de contenu que lorsqu’elle consistait à localiser l’information » (cité par Etcheverry p14). De la même manière dans la recherche des données personnelles sur son ordinateur, on peut observer que les données produites par l’utilisateur sont plus rapidement retrouvées que les données récupérées sur le Web (exemple observé : un cv écrit par la personne vs un modèle de cv récupéré sur le Web). De la même manière, stocker des photos sur son ordinateur lorsqu’on les a soi-même prises, nécessite un ensemble de manipulations techniques (brancher l’appareil photo, transférer, vider l’appareil, trouver où ces photos ont été transférées, les visionner, éventuellement les classer immédiatement) qui posent un contexte d’action. Il n’est pas rare que lorsque ces manipulations se font en présence de quelqu’un, l’utilisateur se souvienne de la personne présente, des difficultés éventuelles de transfert, des mots échangés etc. Lorsque l’utilisateur reçoit des photos par email et les stocke dans un répertoire, le contexte se résume en général à la personne qui lui les a envoyé et le logiciel (« je les ai reçues par mail »). Ce peu d’éléments contextuels rend la récupération des fichiers plus difficile.
D’autre part plus la procédure est automatique, plus le contexte est faible et plus le rappel est fastidieux (mémoire procédurale, anoétique : absence de conscience). Par exemple si le système propose « enregistrer sous » et que la personne enregistre dans un dossier « par défaut » (c'est-à-dire prédéterminé par le système), le manque d’actions « conscientisées » rend la récupération là aussi plus difficile dès que le répertoire atteint un nombre important de fichiers. L’observation sur le terrain montre que l’utilisateur débutant ne se rend pas compte que les répertoires sont classés par ordre alphabétique. Il ne s’en aperçoit que lorsqu’on lui montre les fonctions de tri des colonnes (dans Poste de Travail). Mais la mémoire procédurale est importante car l’encodage d’une information ne doit pour autant pas être « pollué » par des difficultés de maniement des outils.
En résumé, on peut donc supposer que les actions impliquant plusieurs types de mémoire, mémoire sémantique lorsque l’utilisateur nomme un fichier, mémoire épisodique lorsqu’il enregistre mentalement le contexte, et mémoire procédurale lorsqu’il peut faire des actions de base sans réfléchir (ouvrir, fermer, etc) participent à un meilleur encodage de l’information et donc à une meilleure localisation ultérieure grâce à l’action de la mémoire épisodique.
Ergonomie des systèmes
revoir ttes les références
Le poète grec Simonide de Céos (556-468 ? avant J.C.) avait mis au point une méthode lui permettant de mémoriser une grande quantité de données. Lors d’un banquet, l’édifice dans lequel mangeaient les convives s’écroula. Simonide, seul survivant, peut aider à la reconstitution des dépouilles en se remémorant la place de chacun. C’est la méthode dite des lieux de mémoire, améliorée par la suite par Quintilien (35-95 ? après J.C.). De l’histoire de Simonide, les rhéteurs avaient conclu que la condition nécessaire à une bonne mémoire était d’en organiser les images. Ils associèrent donc mentalement une image à l’entité à mémoriser puis à la déposèrent dans la pièce d’un bâtiment fictif. Pour l’anecdote, Pierre de Ravenne, grâce à cette méthode, se disait apte à réciter deux cents discours de Cicéron, l’ensemble du droit canon et vingt mille points du droit civil. L’esprit devenait un véritable palais architectural qu’il fallait visiter régulièrement pour en faire en quelque sorte l’inventaire. Cette histoire nous amène à réfléchir à l’utilisation de la métaphore et des images dans les systèmes d’exploitation en tant qu’aide au recouvrement de nos données personnelles.
En observant que les sujets retiennent mieux les images que les mots, Paivio a postulé que celles-ci étaient doublement encodées : sous forme d’image et sous forme verbale. La théorie du double codage agit dans les deux sens : verbalisation interne des dessins et « imagerie » des mots. D’autre part la mémorisation des images résiste mieux aux effet de l’âge, bien que en cas de double codage, le rappel verbal soit un peu plus long chez des populations âgées.
Dans ce contexte la mise en place de métaphores nous paraît tout à fait indiquée pour aider à la production d’images mentales et in fine à une meilleure mémorisation par double encodage. Revenons sur qu’est une métaphore : c’est un processus qui permet de comprendre quelque chose (et d’en faire l’expérience) en termes de quelque chose d’autre » (lakoff et Johnson, 1985, cité par Collard p34). « Nous conceptualisons en général le non physique en terme de physique, l’abstrait en terme de concret, le moins distinct en terme de plus distinct » (Collard p35).
à suivre