« Analyse typologique » : différence entre les versions
mAucun résumé des modifications |
|||
Ligne 13 : | Ligne 13 : | ||
Il existe différents types d’analyse typologique. Les types les plus courants sont l’analyse de cluster hiérarchique et l’analyse de cluster des nuées dynamiques. | Il existe différents types d’analyse typologique. Les types les plus courants sont l’analyse de cluster hiérarchique et l’analyse de cluster des nuées dynamiques. | ||
L'analyse de cluster hiérarchique tente d'identifier les groupes d'observations (ou de variables) relativement homogènes basées sur des caractéristiques sélectionnées, en utilisant un algorithme qui débute avec chaque observation (ou variable) dans un type (cluster) séparée et qui combine les clusters jusqu'à ce qu'il n'en reste qu'une. Plus simplement dit, | [[Fichier:Dendrogramme-exemple.png|vignette|droite|120px]] | ||
L'analyse de cluster hiérarchique tente d'identifier les groupes d'observations (ou de variables) relativement homogènes basées sur des caractéristiques sélectionnées, en utilisant un algorithme qui débute avec chaque observation (ou variable) dans un type (cluster) séparée et qui combine les clusters jusqu'à ce qu'il n'en reste qu'une. Plus simplement dit, l’analyse de cluster hiérarchique cherche à identifier des cas similaires par étapes progressives, et permet de produire un dendrogramme (trois diagrammes de la population). Un dendrogramme montre la proximité (distance) des cas (exemple dans la vignette ci-contre). | |||
Vous pouvez analyser des variables non normées ou vous pouvez choisir parmi un assortiment de transformations standardisées. Les mesures de distance ou de similarité sont générées par la procédure Proximities (Proximités). Certaines statistiques vous aident à choisir la meilleure solution.<ref>[http://www-01.ibm.com/support/knowledgecenter/api/content/SSLVMB_23.0.0/spss/base/idh_clus.dita?locale=fr" Manuel SPSS en ligne]</ref> | Vous pouvez analyser des variables non normées ou vous pouvez choisir parmi un assortiment de transformations standardisées. Les mesures de distance ou de similarité sont générées par la procédure Proximities (Proximités). Certaines statistiques vous aident à choisir la meilleure solution.<ref>[http://www-01.ibm.com/support/knowledgecenter/api/content/SSLVMB_23.0.0/spss/base/idh_clus.dita?locale=fr" Manuel SPSS en ligne]</ref> |
Dernière version du 2 février 2024 à 11:18
Manuel de recherche en technologie éducative | |
---|---|
Module: Analyse exploratoire et réduction de données | |
◀▬▬▶ | |
⚐ brouillon | ☸ débutant |
⚒ 2024/02/02 |
Analyse typologique
L’analyse, ou classification, typologique correspond à un ensemble de méthodes multidimensionnelles visant à prendre des éléments (sujets ou variables) provenant de certains ensembles de données pour les regrouper dans des clusters (types) d’éléments similaires (sujets ou variables). Un exemple type serait la classification d’enseignants en 4 ou 6 différents groupes en fonction de leur utilisation des TIC en classe.
Il existe différents types d’analyse typologique. Les types les plus courants sont l’analyse de cluster hiérarchique et l’analyse de cluster des nuées dynamiques.
L'analyse de cluster hiérarchique tente d'identifier les groupes d'observations (ou de variables) relativement homogènes basées sur des caractéristiques sélectionnées, en utilisant un algorithme qui débute avec chaque observation (ou variable) dans un type (cluster) séparée et qui combine les clusters jusqu'à ce qu'il n'en reste qu'une. Plus simplement dit, l’analyse de cluster hiérarchique cherche à identifier des cas similaires par étapes progressives, et permet de produire un dendrogramme (trois diagrammes de la population). Un dendrogramme montre la proximité (distance) des cas (exemple dans la vignette ci-contre).
Vous pouvez analyser des variables non normées ou vous pouvez choisir parmi un assortiment de transformations standardisées. Les mesures de distance ou de similarité sont générées par la procédure Proximities (Proximités). Certaines statistiques vous aident à choisir la meilleure solution.[1]
L’analyse de cluster des nuées dynamiques cherche à identifier des groupes d'observations relativement homogènes d'après des caractéristiques sélectionnées, au moyen d'un algorithme qui peut traiter de grands nombres d'observations. L'algorithme vous demande toutefois d'indiquer le nombre de clusters. Vous pouvez indiquer les centres de cluster initiaux si vous connaissez cette information. Vous pouvez choisir entre deux méthodes de classement des observations, soit la mise à jour des centres de cluster de façon itérative, soit la classification seule. Vous pouvez enregistrer l'appartenance à un cluster, les informations de distance et les centres de clusters finaux. Vous pouvez éventuellement indiquer une variable dont les valeurs servent à libeller les sorties par observations. Vous pouvez également demander des statistiques F d'analyse de variance. Bien que ces statistiques soient opportunistes (la procédure cherche à former des groupes qui diffèrent), la taille relative des statistiques fournit des informations sur la contribution de chaque variable à la séparation des groupes. [2]
Exemple - Classification des enseignants en fonction de leur utilisation des TIC
Une analyse hiérarchique de 36 variables de sondage ont permis d’identifier 6 principaux types d’enseignants en fonction de leur utilisation des TIC:
- Type 1: L’enseignant «convaincu»
- Type 2: L’enseignant «actif»
- Type 3: L’enseignant «motivé travaillant dans un mauvais environnement»
- Type 4: L’enseignant «qui souhaite utiliser les TIC mais qui ne possède pas les compétences nécessaires dans ce domaine»
- Type 5: L’enseignant «compétent dans le domaine des TIC mais qui ne souhaite pas les utiliser en classe»
- Type 6: L’enseignant «qui souhaite utiliser les TIC mais ne les maîtrise pas très bien»
La plupart des enseignants correspondent aux types 2 et 3. Les types 1, 5 et 6 comptent uniquement un enseignant. Afin d’obtenir des catégories telles que l’«enseignant convaincu», vous devrez lister les moyennes de toutes les variables de groupes pour chaque type puis faire preuve d’imagination. Le tableau ci-dessous présente les statistiques descriptives d’une partie des 36 variables utilisées pour l’analyse. Les nombres représentent les moyennes pour chaque type.
| Types [nombres d’enseignants] | |||||
| 1 [1] | 2 [15] | 3 [14] | 4 [6] | 5 [1] | 6 [1] |
Importance attribuée à la collaboration des étudiants et aux outils d’aide | 4.7 | 2.1 | 1.5 | 2.9 | .0 | 5.0 |
Importance attribuée aux outils de communication des étudiants | 4.0 | 2.4 | 1.7 | 2.7 | 1.0 | 4.3 |
Effets de l’utilisation d’ordinateurs pour préparer et gérer l’enseignement | 3.0 | 2.9 | 2.2 | 2.8 | 2.3 | 2.3 |
Importance de l’utilisation des TIC en classe | .0 | 2.7 | 1.9 | 2.3 | 1.0 | 3.0 |
Matériel informatique avancé dont les enseignants se servent à la maison | .5 | .8 | .4 | .3 | 1.0 | .0 |
Degré de compétences TIC en documentation et en outils de communication | 2.3 | 2.6 | 2.3 | 1.7 | 3.0 | 1.8 |
Variété des activités d’apprentissage | 1.3 | 1.8 | 1.9 | 1.7 | 2.0 | 1.0 |
Satisfaction avec l’environnement TIC à l’école | 2.0 | .8 | .6 | .0 | .5 | .0 |
Consultation et production de documents | .4 | .9 | .6 | 1.0 | .6 | 1.2 |
Utilisation de logiciels d’apprentissage en classe | 2.0 | 1.7 | .9 | 1.5 | 1.0 | 2.0 |
Exemple: Utilisation d’outils dans un portail d’enseignement à distance
Dans sa thèse de doctorat évoquée précédemment, Barbara Class a utilisé l’analyse typologique pour déterminer des profils d’apprenants par rapport à leur utilisation des outils. A partir de la base de données du logiciel Portalware, elle a pu extraire des données relatives à l’utilisation effective du forum, de la shoutbox, des messages personnels et du journal. Les différentes utilisations de ces quatre outils révèlent trois profils différents. Le premier groupe (14 apprenants) se sert de tous les outils, mais relativement peu. Le deuxième groupe (14 apprenants) utilise tous les outils à une valeur moyenne, le journal en particulier, même plus que le groupe «beaucoup ». Le troisième groupe (17 apprenants) utilise beaucoup tous les outils, en particulier la shoutbox:
Fréquence d’utilisation | Type | ||
Peu | Moyenne | Beaucoup | |
Forum | 1.14 | 2.21 | 2.59 |
Shoutbox | 1.43 | 1.43 | 2.71 |
Messages personnels | 1.50 | 2.36 | 2.41 |
Journal | 1.21 | 2.50 | 1.82 |
D’après les données recueillies au moyen d’un questionnaire – l’utilisation en fonction de la perception – il existe trois profils: un premier groupe de personnes (19 apprenants) qui estiment utiliser tous les outils mais peu; un deuxième groupe de personnes (13 apprenants) qui estiment avoir une utilisation moyenne de tous les outils, mais qui estiment utiliser beaucoup le journal; et un troisième groupe de personnes (18 apprenants) qui estiment utiliser beaucoup tous les outils, à l’exception du journal.
Fréquence d’utilisation | Type | ||
Peu | Moyenne | Beaucoup | |
Forum | 3.95 | 4.00 | 3.89 |
Shoutbox | 1.74 | 2.15 | 3.17 |
Messages personnels | 2.74 | 2.69 | 3.39 |
Journal | 1.84 | 3.15 | 2.11 |
Comme vous pouvez le constater à partir des exemples, l’analyse typologique est un outil puissant pour identifier les groupes de personnes qui partagent des caractéristiques communes. L’analyse typologique peut également être menée sur des variables pour trouver des variables proches les unes des autres. Nous présenterons un exemple lorsque nous aborderons l’analyse par grilles-répertoires.
Pour aller plus loin
- Manuel SPSS en ligne (IBM)
- Clustering et classification hiérarchique en text mining Cet article EduTechWiki, explique quelques fondements mathématique de l'analyse typologique.