Comment choisir la mesure d'association adaptée au type de variable
Pearson, Spearman ou Kendall : le bon coefficient selon le type de variables et la forme de la relation.
Présentation — choisir la mesure d'association adaptée
Le choix d'une mesure d'association dépend du type de variables en présence et de la forme de la relation entre elles. Pour des variables quantitatives à relation linéaire, Pearson est adapté. Pour des données ordinales ou une relation monotone non linéaire, Spearman ou Kendall prennent le relais. Lorsque l'une des variables est dichotomique, la bisériale de point ou phi sont utilisés. L'analyse commence par un diagramme de dispersion, qui oriente ce choix avant tout calcul.
Pourquoi savoir choisir la bonne mesure d'association
Appliquer Pearson à des données ordinales, ou ignorer la non-linéarité d'une relation, produit une mesure invalide — numériquement calculable, mais interprétée à tort. Les questions de recherche en psychologie exigent de répondre d'abord à deux questions : quels types de variables ai-je ? La relation est-elle linéaire ou seulement monotone ? Ces deux décisions déterminent le coefficient adapté. Une erreur à ce stade invalide l'ensemble de la conclusion, même si le calcul est impeccable.
A qui s'adresse ce document
Ce contenu s'adresse aux étudiants du Bachelor en Psychologie d'UniDistance FernUni Schweiz. La psychologie scientifique formule des hypothèses sur des liens entre variables — comportement, émotion, cognition, santé — et chaque hypothèse de ce type requiert un coefficient d'association adapté pour être testée. Le choix du bon coefficient est une compétence d'examen explicitement évaluée, avec des résultats à rapporter selon les normes APA 7e édition. Les modules de méthodes en font un prérequis à toute analyse bivariée.
Prérequis
Ce sujet est abordé au niveau Bachelor 1. Aucune exposition préalable aux mesures d'association n'est supposée. Les prérequis sont : la connaissance des statistiques descriptives de base (moyenne, écart-type), la capacité à lire un tableau de données et à distinguer une variable quantitative d'une variable ordinale. La notion de distribution normale est utile pour comprendre les conditions d'application de Pearson, mais elle est rappelée dans le contenu. Aucune maîtrise préalable de JASP n'est requise.
Questions courantes FAQ
Comment choisir entre Pearson, Spearman et Kendall ?
Le choix dépend de deux critères. Premier critère : le type de variables. Si les deux sont quantitatives, Pearson est candidat. Si l'une est ordinale, Spearman ou Kendall s'imposent. Deuxième critère : la forme de la relation, lue sur le diagramme de dispersion. Si la relation est linéaire et les conditions d'application respectées, Pearson est retenu. Si elle est monotone mais non linéaire, Spearman ou Kendall remplacent Pearson.
Quelle est la différence entre covariance et corrélation de Pearson ?
La covariance mesure comment deux variables varient ensemble, mais sa valeur dépend des unités de mesure et n'est pas directement interprétable. La corrélation de Pearson r standardise la covariance en la divisant par le produit des écarts-types des deux variables. Le résultat est toujours compris entre −1 et +1, interprétable quelle que soit l'unité : −1 indique une relation linéaire négative parfaite, +1 une relation positive parfaite, 0 l'absence de relation linéaire.
Pourquoi faut-il toujours commencer par un diagramme de dispersion ?
Le diagramme de dispersion révèle la forme de la relation avant tout calcul. Si la relation est curvilinéaire (en U, par exemple), un coefficient de Pearson proche de 0 n'indique pas l'absence de lien, mais simplement que le lien n'est pas linéaire. Lire le graphique en premier évite d'appliquer un coefficient inadapté à la structure des données, ce qui produirait une conclusion invalide. C'est l'étape de décision non négociable de l'analyse bivariée.
Quand utilise-t-on Kendall plutôt que Spearman ?
Les deux coefficients s'appliquent dans les mêmes situations (données ordinales ou relation monotone non linéaire). Kendall repose sur le décompte de paires concordantes et discordantes, ce qui le rend plus robuste avec les petits échantillons et les données comportant des ex aequo. Spearman calcule r de Pearson sur les rangs et est plus répandu dans la littérature. En pratique, les deux sont souvent calculés en parallèle pour vérifier la convergence des conclusions.
Une corrélation forte prouve-t-elle une causalité ?
Non. Une corrélation forte indique que deux variables covarient, pas que l'une cause l'autre. Une troisième variable non mesurée (variable confondante) peut expliquer la covariation observée. Établir la causalité requiert un plan expérimental avec manipulation de la variable indépendante et contrôle des variables parasites. Cette confusion entre corrélation et causalité est l'une des erreurs épistémiques les plus fréquentes en psychologie et une cible explicite des examens d'UniDistance.