« Principes de base d'analyse statistique » : différence entre les versions

De EduTech Wiki
Aller à la navigation Aller à la recherche
Ligne 103 : Ligne 103 :
Les méthodes d’analyse de données statistiques peuvent être catégorisées en fonction des types de données. Le tableau ci-dessous présente des méthodes d’analyse bivariée courantes pour une variable X (explicative) indépendante et pour une variable Y (à expliquer) dépendante.
Les méthodes d’analyse de données statistiques peuvent être catégorisées en fonction des types de données. Le tableau ci-dessous présente des méthodes d’analyse bivariée courantes pour une variable X (explicative) indépendante et pour une variable Y (à expliquer) dépendante.


<table class="wikitable"><tr><td colspan="2" rowspan="2" ><p</p></td><td colspan="2" ><p>Variable Y dépendante </p></td></tr><tr><td ><p>Quantitative (à intervalles) </p></td><td ><p>Qualitative (nominale ou ordinale) </p></td></tr><tr><td rowspan="2" ><p>Variable X indépendante (explicative) <br/></p></td><td ><p>Quantitative</p></td><td ><p>Corrélation et régression </p></td><td ><p>Régression logistique, ou transformez X<a name="_Toc227903113"/> en une variable qualitative et reportez-vous ci-dessous</p></td></tr><tr><td ><p>Qualitative</p></td><td ><p>Analyse de variance </p></td><td ><p>Tableaux croisés</p></td></tr></table>
<table class="wikitable"><tr><td colspan="2" rowspan="2" > </td><th colspan="2" >Variable Y dépendante </th></tr><tr><th>Quantitative (à intervalles) </th><th>Qualitative (nominale ou ordinale) </th></tr><tr><th rowspan="2" >Variable X indépendante (explicative)</th><th>Quantitative</th><td>Corrélation et régression </td><td>Régression logistique, ou transformez X<a name="_Toc227903113"/> en une variable qualitative et reportez-vous ci-dessous</td></tr><tr><th>Qualitative</th><td>Analyse de variance </td><td>Tableaux croisés</td></tr></table>


Un tableau similaire peut être créé pour une analyse multivariée, mais nous n’allons pas présenter ce sujet.
Un tableau similaire peut être créé pour une analyse multivariée, mais nous n’allons pas présenter ce sujet.


<table class="wikitable"> <tr><td colspan="2" rowspan="2" ><p> </p></td><td colspan="2" ><p>Variable Y dépendante</p></td></tr><tr><td ><p>Quantitative (à intervalles)</p></td><td ><p>Qualitative (nominale ou ordinale)</p></td></tr><tr><td rowspan="2" ><p>Variable X indépendante (explicative)</p></td><td ><p>Quantitative </p></td><td ><p>Analyse de facteurs, régression multiple, SEM, analyse typologique </p></td><td ><p>Logit, ou transformez X en variables qualitatives et reportez-vous ci-dessous ou séparez une variable <a name="_Toc227903114"/>en plusieurs variables dichotomiques (oui/non) et reportez-vous à gauche. </p></td></tr><tr><td ><p>Qualitative </p></td><td ><p>Anova<a name="_Toc227902752"/><a name="Crosstabulation"/> </p></td><td ><p>Positionnement multidimensionnel, etc. </p></td></tr></table>
<table class="wikitable"> <tr><th colspan="2" rowspan="2" > </th><th colspan="2" >Variable Y dépendante</th></tr><tr><th>Quantitative (à intervalles)</th><th>Qualitative (nominale ou ordinale)</th></tr><tr><th rowspan="2" >Variable X indépendante (explicative)</th><th>Quantitative </th><td>Analyse de facteurs, régression multiple, SEM, analyse typologique </td><td>Logit, ou transformez X en variables qualitatives et reportez-vous ci-dessous ou séparez une variable <a name="_Toc227903114"/>en plusieurs variables dichotomiques (oui/non) et reportez-vous à gauche. </td></tr><tr><th>Qualitative </th><td>Anova<a name="_Toc227902752"/><a name="Crosstabulation"/> </td><td>Positionnement multidimensionnel, etc. </td></tr></table>


'''Tableau 4: Analyse multivariée courante'''
'''Tableau 4: Analyse multivariée courante'''

Version du 28 août 2015 à 18:37

Principes de base d'analyse statistique
2015/08/28


ATTENTION: Tableaux mal importés - à refaire Daniel K. Schneider (discussion) 27 août 2015 à 20:27 (CEST)

Introduction

Ce petit chapitre vise à faire deux choses:

  • Expliquer ce qu'est - au fond - un modèle statistique
  • Présenter une simple typologie d'analyses.

....

Trouver la structure

Le but de l’analyse statistique est relativement simple: trouver/révéler une structure dans les données. Ce principe peut être exprimé par deux formules synonymes:

DONNEES = STRUCTURE + NON-STRUCTURE

DONNEES = VARIANCE EXPLIQUEE + VARIANCE NON EXPLIQUEE

DONNEES = RELATION + VARIANCE NON EXPLIQUEE

Exemple: analyse de régression simple

DONNEES = droite de régression prédite + résidus (données non expliquées)

L’analyse de régression cherche à établir une droite qui permettra de maximiser la prédiction et de minimiser les résidus comme l'illustre la figure suivante:

Structure d'une régression linéaire (la droite)

Attention: La structure est différente pour chaque type d'analyse statistique: Pour la corrélation, il s'agit d'un simple nombre, pour la régression il s'agit d'une formule pour une droite, etc.

Etapes de l’analyse statistique

Voyons à présent ce que nous entendons par analyse statistique et ce que vous devez faire dans ce cas. Dans ce chapitre, nous allons nous intéresser aux étapes qui suivent les premiers points de l’analyse:

(1) Nettoyez vos données

  • Assurez-vous que vos données soient correctes (e.g. vérifiez la transcription des données)
  • Assurez-vous que les valeurs manquantes (e.g. les questions d’un questionnaire sans réponse) soient clairement identifiées comme des données manquantes

(2) Faites en sorte d’en connaître davantage sur vos données

  • Dressez des listes de données (uniquement pour les petits ensembles de données!)
  • Etablissez des statistiques descriptives, e.g. des moyennes, des écarts-types, des valeurs minimales et maximales pour chaque variable
  • Etablissez des graphiques, e.g. des histogrammes ou des boîtes à moustaches qui montrent la distribution

(3) Produisez des échelles composées

  • E.g. créez une seule variable indice en calculant la moyenne à partir d’un ensemble de questions

(4) Etablissez des graphiques ou des tableaux qui présentent les relations

  • E.g. créez des graphiques pour les données à intervalles (comme dans notre exemple précédent) ou créez des tableaux croisés

(5) Calculez des coefficients qui mesurent la force et la structure d’une relation

  • Exemples de force: le V de Cramer pour les tableaux croisés, ou le R de Pearson pour les données à intervalles
  • Exemples de structure: coefficient de régression, tableaux des moyennes dans l’analyse de variance.

(6) Calculez des coefficients qui décrivent le pourcentage de la variance expliquée

  • E.g. R2 dans une analyse de régression ou Eta2 dans l’analyse de variance

(7) Calculez le seuil de signification, i.e. déterminez si vous êtes en droit d’interpréter la relation

  • E.g. Chi2 pour les tableaux croisés, le F de Fischer dans l’analyse de régression

Tableau: Principales étapes de l’analyse statistique

Remarque: avec un bon programme d’analyse de données statistiques, il est facile d’effectuer plusieurs étapes en une opération.

Types de coefficients statistiques

Chaque analyse statistique produit différents types de coefficients, i.e. des chiffres qui résument certains types d’information. Assurez-vous toujours d’utiliser uniquement des coefficients appropriés pour vos données. Il y a quatre types principaux de coefficients, que vous trouverez dans la plupart des méthodes d’analyse:

Type de coefficient
1. Force d’une relation Les coefficients vont généralement de -1 (relation négative totale) à +1 (relation positive totale). 0 signifie aucune relation.
2. Structure (tendance) d’une relation Résume une tendance
3. Pourcentage de variance expliquée Indique le degré de structure de votre modèle
4. Seuil de signification de votre modèle Calcule la probabilité que votre relation soit une distribution hasardeuse, i.e. qu’il n’y ait pas de relation entre les variables.

Typiquement, en sciences sociales, un seuil de signification inférieur à 5% (0,05) est acceptable. N’interprétez pas de données qui se situent au-dessus!

Tableau 2: Types de coefficients statistiques

Ces quatre types sont mathématiquement liés: e.g., le seuil de signification ne dépend pas uniquement de la taille de votre échantillon, mais également de la force d’une relation.

Aperçu des méthodes statistiques

Les méthodes d’analyse de données statistiques peuvent être catégorisées en fonction des types de données. Le tableau ci-dessous présente des méthodes d’analyse bivariée courantes pour une variable X (explicative) indépendante et pour une variable Y (à expliquer) dépendante.

 Variable Y dépendante
Quantitative (à intervalles) Qualitative (nominale ou ordinale)
Variable X indépendante (explicative)QuantitativeCorrélation et régression Régression logistique, ou transformez X<a name="_Toc227903113"/> en une variable qualitative et reportez-vous ci-dessous
QualitativeAnalyse de variance Tableaux croisés

Un tableau similaire peut être créé pour une analyse multivariée, mais nous n’allons pas présenter ce sujet.

Variable Y dépendante
Quantitative (à intervalles)Qualitative (nominale ou ordinale)
Variable X indépendante (explicative)Quantitative Analyse de facteurs, régression multiple, SEM, analyse typologique Logit, ou transformez X en variables qualitatives et reportez-vous ci-dessous ou séparez une variable <a name="_Toc227903114"/>en plusieurs variables dichotomiques (oui/non) et reportez-vous à gauche.
Qualitative Anova<a name="_Toc227902752"/><a name="Crosstabulation"/> Positionnement multidimensionnel, etc.

Tableau 4: Analyse multivariée courante