Apprentissage par essai / erreur

De EduTech Wiki
Aller à : navigation, rechercher

1 La psychologie en quête de l’objectivité

1.1 Acteurs et tendances de la psychologie 1885-1930

Plan

  1. Ebbinghaus[1] et l'étude de la mémoire 1885-1932
  2. Thorndike[2] et l'apprentissage 1898-1922
  3. Watson[3][4] et le béhaviorisme[5][6][7][8] 1913-1950
  4. Une réaction: la Gestalt[9][10][11] 1910-1930

Après la période allemande après 1880 (expérimental): il y a un décalage de la psychologie vers les Universités américaines. Certains des acteurs clés ont été formés chez les allemands, mais d'autres viennent avec des théories entièrement formées aux États-Unis.


1.2 Thorndike

1.2.1 L’apprentissage chez le chat

(suite de l’expérience)

Thorndike’s Puzzle-Box. Le graphique montre la tendance générale à la baisse du temps de réponse du chat à chaque tentative fructueuse
  • Matériel :
    La Boîte de Thorndike[12], qui contient :
    • Un grillage pour l'observation
    • Un système d’ouverture interne (loquet)
 pour que le chat puisse sortir
  • Analyse de la tâche :
    Compétence méthodologique des psychologues qui est perdue aujourd’hui, on réfléchit à quelles étaient les idées à tirées des observations de la tâche :
    • Confinement[13][14][15] de l’animal (l’enfermement est ce qui fait l’expérience)
    • Le chat doit remplir un besoin : celui de manger
    • L'animal a un certaine distance à franchir entre cible et besoin → ceci est de l’ordre de la Psychologie de la motivation
  • L'expérience à proprement parler:
    • Chat affamé – enfermé
    • Comportement exploratoire :
      l’exploration est très importante dans la théorie de l’apprentissage, il n’y a pas d’apprentissage sans phase d’exploration
    • Loquet d'ouverture manœuvré par hasard
    • Sortie – récompense (nourriture)
  • Mesure du temps
  • Répétition avec le même chat
    • Le temps pris par le chat pour sortir diminue
  • Plus le nombre d’essais augmente, plus le temps que met le chat à sortir diminue
  • Sortie presque directe (env. 10 s.) au bout d’un certain nombre d’essais (entre 5 et 10)
  • Le résultat de cette expérience donne lieu à une loi :
    la courbe d’apprentissage


Elle permet de montrer la différence entre un comportement exploratoire et un comportement appris, intentionnel.


Loi : « la diminution de temps pris pour sortir de la boite est fonction du nombre d’essai ».


Cette loi est toujours réplicable. Ce paradigme[16][17] est susceptible de variations:

  • variations du matériel expérimental
  • isolation non plus dans une boîte, mais dans une pièce avec de la nourriture cachée dans une boîte fermées. Cette expérience a été réalisée avec des singes et la boîte était appelée « boîte à singe ».
    • Ici le comportement exploratoire est sur l’objet, il est causal :
      le but est de voir quels sont les gestes qui vont permettre l’ouverture de la boîte
    • la deuxième manière est de faire comme des enfants de 5-6 ans qui ouvrent plus vite que des enfants de 7-8 ans :
      ces derniers commencent à réfléchir à la causalité et ça prend plus de temps
  • Il existe beaucoup de « boîtes à ouvrir », certaines laissent entrevoir la nourriture placée à l’intérieur, d'autres pas. Pour les ouvrir, il faut bouger plusieurs loquets dans un ordre précis. Ces boîtes peuvent être utilisées avec des singes et des humains. C’était utilisé pour résoudre des problèmes pratiques qui font appelle à l’intelligence pratique.


On peut remarquer qu’avec Thorndike on est vraiment dans une psychologie pragmatique et plus du tout dans une psychologie théorique.


1.2.2 Lois de l’apprentissage

Variation sur la boîte de Thorndike
  • Loi de l’exercice
    • Les associations entre situation et réponse sont :
      (le chat mis dans la situation d’ouvrir la cage - attention on ne parle pas de stimulus, c’est beaucoup plus global que cela)
      • Soit renforcées par l'exercice
      • Soit affaiblies par l’arrêt de l'exercice (extinction)
    • L'association ne se fait pas entre stimulus et réponse, mais situation ➙ réponse (chat mis dans la boîte manipule loquet par hasard)
    • La notion de stimulus est locale et physiologique
    • La notion de situation, quand à elle, est plus globale
  • Loi de l’effet concernant la motivation
    • Une association est renforcée ou affaiblie selon l'effet de ses conséquences


Première loi: de l'exercice

Sit(E+)R

ou

Sit(E-)R


Sit = (chat mis en) situation

E = Exploration

R = Réponse


Exemple : le chat est mis dans plusieurs situations :

  1. La première situation est l’exploration qui abouti, au bout d’un temps X, à une première réponse qui est la sortie de la cage et une récompense (nourriture).
  2. Dans la deuxième situation, l’exploration abouti, au bout d’un temps Y, à une deuxième réponse qui est la sortie de la cage et une récompense.
    • Au bout de plusieurs situations, le chat va les associer avec les réponses.
    • Ces associations sont d’ailleurs évolutives.
    • La répétition de ces situations est l’exercice.
    • L’effet c’est l’intervention de l’expérimentateur qui donne de la nourriture au chat.


Ceci peut être formulé (mathématiquement comme suit):

Sit1 → R = 150s Ass → récompense
(Sit2 → R = 60s) = Ass1 → récompense
(Sit2 → R = 10s) = Ass2 → récompense
etc.

Sit correspondent à des effets (R) différents.


Donc le comportement (sortir de la cage), suivi d'une récompense, est associé à la situation. Étant donné que la conséquence de son comportement est positive, le chat va refaire le même comportement.


Seconde loi: de l'effet

l'effet est la récompense donnée au chat et le feedback que cela amène

Attention: le feedback peut être positif OU négatif


On est en pleine « motivation ».


1.2.3 Définir l’apprentissage

  • Le meilleur apprentissage combine les deux lois
    • L’exercice répété seul ne permet pas d’améliorer la réponse
    • Il faut donc un retour d’information :
      renforcement -récompense ou punition- (loi de l'effet)


Exemple avec le labyrinthe à fil de Thorndike: tracer une ligne les yeux fermés, apprentissage d’un mouvement, d’un chemin, sur un labyrinthe. Ce labyrinthe est un instrument scientifique. Il sert à tester les théories de l’apprentissage et matérialise les lois d’exercice et d’effet. (Ne sert donc pas à développer l'imagination, mais tester l'apprentissage.)

1.2.4 Modèle des phases d’apprentissage

  • Dans une situation donnée
  • On procède par
    • Exploration (essais) mode de résolution « bottom-up »
    • Élimination des comportements inutiles (erreurs) (par ex. si le chat essaie de s’échapper par le grillage ou s'il essaie de passer les pattes par les grilles pour attraper la nourriture qui est trop loin)
    • Sélection des comportements adéquats (pour le chat : appuyer sur le loquet permet la solution : sortir)
    • Grâce aux renforcements (positif, comme la nourriture, ou négatif) du milieu permet d’acquérir de nouveaux comportements (influence de Darwin[18] [19] [20] [21] :
      on va sélectionner les comportements les plus adéquats, ce qui donne aujourd'hui l'apprentissage d'essais-erreurs (trial and error)
➙ apprentissage par essai et erreur (trial & error)


On passe de l’animal à l’humain (Darwin). On va sélectionner les meilleurs comportements, les plus adéquats.


1.2.5 Apport et limites du modèle

  • Pouvoir heuristique[22] : ce modèle explique :
    • les connaissances acquises, avec la prétention de dire que tout est acquis (on peut ramener tous nos comportements à de l’apprentissage et à ce modèle (universalité)
    • les comportements (habitudes, aptitudes)
      modèle strictement psychologique pas de prétention neurologique
  • Application
  • À tout le comportement
    • À l’éducation (1922) modèle dirigiste :
      pour un comportement donné un renforcement positif ou négatif, et pas d’autre motivation. Cela pose néanmoins un problème au niveau de la relation professeur-élève, un problème didactique.
  • Les limites du modèle dans l’apprentissage. Il ne tient pas compte de :
    • la compréhension (on n’a pas affaire à un sujet intelligent, qui comprend)
    • la spécificité du matériel
      illusion d’optique, perception : quelle est la composante de ce qui est ou non appris ?


1.3 Le béhaviorisme de Watson

(Watson n'a pas eu affaire à l'enseignement venu d'Allemagne.)

  • John B. Watson[23] [24] (1878-1956)
    • Influencé par le réductionnisme[25][26] :
      ramener tous les comportements à l’instinct (pour les animaux), Watson va inventer la psychologie la plus réductionniste, minimaliste qui soit : le behaviorisme
  • Définition du behaviorisme
    • étude du comportement observable d’un sujet dans son milieu
    • l’observation devient une revendication
    • sa thèse en 1903 a comme thème le rat, il ramène ses comportements à la neurologie
  • En 1913 “Psychology as the Behaviorist Views It”
    • Aspect négatif :
      • il élimine toute étude basée sur la méthode d’introspection (le fait demander à un sujet de donner une réponse). Il élimine ce que le sujet pourrait dire de lui-même parce que ce n'est pas objectif.
    • Aspect positif :
      • il propose un nouvel objet pour la psychologie, le comportement (il est observable, objectif, remplace en fait la parole du sujet) (2 composantes: faire et dire : le behaviorisme élimine le dire au profit du faire (faire est le signe du comportement (behavior)))
      • Continuité entre animal et homme (influence de Darwin)


1.3.1 Objectifs du behaviorisme

  • Rendre la psychologie scientifique (pour Watson ce qu’il y avait avant n’était pas scientifique, aujourd’hui on pense que sans le béhaviorisme on serait arrivé plus vite à la psychologie cognitive !)
  • Utilisation de procédures expérimentales objectives :
    • emploi des statistiques
  • Réponse au débat d’interprétation entre le fonctionnalisme et le structuralisme


1.3.2 Le manifeste de 1913

  • Les états de conscience ne sont pas observables.
    • Pour Watson, c’est l’intériorité : émotions, sentiments, conscience, cognition, volonté, etc,
    • Tous ces états de conscience sont éliminés, tout comme l’introspection parce qu'ils ne sont pas observables.
      (Pour Wundt, le but était de faire le pont entre les sensations et la conscience)
  • Le comportement
    • manifesté par l’individu
    • l’individu n’est pas le sujet (le sujet est conscient de lui-même)
    • Observable, mesurable
    • Soumis à l’expérimentation


1.3.3 Influences sur Watson

  • La psychologie animale
    • Thorndike et l’apprentissage (Watson va reprendre les loi d’apprentissage et va encore plus les généraliser)
  • Les physiologistes russes
    • Yvan Pavlov[27] (1849-1936)
      Réflexe conditionné chez le chien (en 1904 Pavlov obtient le Prix Nobel pour cette recherche) : association SN[28] et RI[29], à la fin SC[30]-RC[31], ce qui donne la création d’un comportement. On est dans la physiologie pure, des réactions glandulaires interprétées comme des comportements par l’association (avec Thorndike, par contre, on est dans la psychologie).
  • Darwin :
    rôle de l’adaptation au milieu


1.3.4 Modèle psychologique

  • Stimulus – Réponse
    avec la notion de situation, c’était trop flou pour pouvoir mettre beaucoup de comportements, avec stimulus c’est plus focal, précis). Association entre stimulus et réponse, élimination de la boîte noire.
  • Élimination du sujet : pas de “je” conscient
  • Comportement complexe
    • habitude, émotion, mémoire
    • composé d’éléments physiologiques (moteur, sensoriel, glandulaires) :
      • observables, mesurables
    • pour ce qui est du langage et de la mémoire :
      le béhaviorisme ne travaille pas dessus. Du coup Ebbinghaus pour les béhavioristes n’est pas scientifique, ils ne l’étudient pas. Comme c’est non observables ils les ramènent à quelque chose d’observables donc aux éléments physiologiques
  • Tout comportement est issu d’apprentissage, tout est acquis.

Watson a été très important lors de l’Institutionnalisation du mouvement car :

(Le béhaviorisme se veut une science naturelle)

  • Très nombreuses recherches:
    • L'apprentissage humain
      Enfant / adulte
    • L'apprentissage animal (rats)
  • Entre 1913 et 1960, le béhaviorisme domine la psychologie américaine (il y a bien quelques béhavioristes en Europe, mais peu de radicaux, en Europe on est plutôt dans psychanalyse[34] [35] [36] [37] [Allemagne] et psychologie de l’enfant [Genève])
  • vers 1950, il y a différentes théories behavioristes:
  • En 1956, c'est la fin du béhaviorisme :
    Il y a une confrontation télévisée entre Chomsky (1928- ) et Skinner. Chomsky réussi à prouver que le langage est inné, donc que tout le monde a le potentiel d'apprendre n'importe quelle langue.

1.4 Une réponse au behaviorisme : la Gestalt Theorie (dès 1913)

Il y a une « résistance » face au béhaviorisme.

  • Les acteurs
  • Les trois passent par Berlin, effectuent différentes études dans la psychologie du droit, psychologie de la musique, etc. En 1911 a lieu la rencontre des trois acteurs à Francfort et veulent valider une nouvelle théorie de l’apprentissage :
    Une critique du behaviorisme, des théories de l’apprentissage et de la psychologie animale standard « à la » Watson et Thorndike


1.4.1 Objectifs

  • Identifier différents types d’apprentissage (ils ne vont pas dire que les lois de l’apprentissage sont fausses mais ils critiquent le fait que le modèle, pour les béhavioristes, est universelle. Ils critiquent donc le dogmatisme du béhaviorisme.
    → Pour la Gestalt il y a donc plusieurs sortes d’apprentissage :
  • Apprentissage par association (Thorndike, Watson)
  • Apprentissage par restructuration
    Les sciences se forment par dialogues, oppositions, ajouts, etc.
  • Il doivent définir leurs différences
  • nouveaux concepts
    • Insight = restructuration (le fait de tout à coup comprendre)
    • Gestalt = bonne forme
    • une partie de la Gestalt s'opère sur les perceptions


1.4.2 Principes de la Gestalt-Theorie

  • La perception n'est pas objective (l’esprit a un rôle)
  • Elle dépend :
    • des caractéristiques de l'environnement de l’objet
      par exemple, la manière dont fonctionne l’œil → les illusions d’optique, on voit des lignes qui sont droites, courbes ceci par rapport à ce qu’il y a autour, etc.
    • des attentes du sujet
    • de la nature des stimuli
  • Les stimuli sont perçus globalement (perception globale d’une situation puis on analyse)


1.4.3 Expériences sur la perception globale

  • Variations du temps de lecture donc de compréhension
Figure ??.

Dans l'exemple ci-dessus, si on prend un mot familier avec une présentation familière, sa lecture sera rapide (faite d'un seul coup). Par contre, si on prend le second exemple, le mot reste le même mais il est montré d'une manière inhabituelle, sa lecture sera plus lente (ici on ne sait pas ce qui est global, lettres ou mot ?)

  • Rajouts sémantiques

Le mot apparaît très vite (???tachiscopie???[38]) on complète les lettres qui manquent « ordnateur » on rajoute i. On donne de la signification (sémantique) en ajoutant la lettre.

Il y a une compréhension sémantique du mot (toutes les lettres n'ont pas besoin d'être là pour que sa signification soit comprise).

Sémantique vs ???[39]

2 Notes & Références

  1. Ebbinghaus sur Wikipédia
  2. Edward Thorndike
  3. Watson dans le cours d'Introduction à la psychologie clinique
  4. Watson sur Wikipédia
  5. Béhaviorisme cité dans le cours de Méthode expérimentale en psychologie
  6. Béhaviorisme cité dans le cours d'Introduction à la psychologie clinique (cité plusieurs fois)
  7. Définiiton de béhaviorisme
  8. Béhaviorisme sur Wikipédia
  9. Cours d'Introduction à la psychologie clinique
  10. Gestalt: définition
  11. Gestalt sur Wikipédia
  12. http://en.wikipedia.org/wiki/Law_of_effect
  13. Cours_74112_du_mercredi_2010.11.17#L.E2.80.99apprentissage_chez_le_chat
  14. Cours_74112_du_mercredi_2010.10.13#Condillac:_le_sensualisme
  15. confinement
  16. Le terme « paradigme » est retrouvé dans quasiment tous les cours de « Méthode expérimentale en psychologie »
  17. : définition
  18. Cours de Méthode expérimentale en psychologie du 30.09.2010
  19. Cours d'Histoire de la psychologie du 20.10.2010
  20. Cours d'Histoire de la psychologie du 27.10.2010
  21. Cours d'Histoire de la psychologie du 17.11.2010
  22. Le pouvoir heuristique est la capacité d'engendrer de la nouveauté, notamment scientifique
  23. Cours_71118_du_lundi_2010.10.18
  24. Cours d'Histoire de la psychologie du 17.11.2010
  25. Cours d'Histoire de la psychologie du 06.10.2010
  26. Cours_74112_du_mercredi_2010.11.17#Cadre_.C3.A9pist.C3.A9mologique.2C_influences
  27. Cité dans le cours d'Introduction à la psychologie clinique du 18.10.2010
  28. Stimulus Neutre
  29. Réaction Inconditionnelle
  30. Stimulus Conditionné
  31. Réaction Conditionnelle
  32. Terme retrouvé dans le cours d'Histoire de la psychologie du 03.11.2010 sous Wilhelm Wundt
  33. Terme retrouvé plusieurs fois dans le cours d'Histoire de la psychologie du 10.11.2010
  34. Cours_71118_du_lundi_2010.10.04
  35. Cours_71118_du_lundi_2010.10.11
  36. Cours_71118_du_lundi_2010.10.18
  37. Cours_71118_du_lundi_2010.12.20
  38. Nous ne savons pas ce que le Prof. Ratcliff a dit ici. Si quelqu'un pouvait compléter…
  39. Nous ne savons pas ce que le Prof. Ratcliff a dit ici. Si quelqu'un pouvait compléter…