Illustration pédagogique PrivateTeacher de la distribution du Chi2.

Introduction au test d'Indépendance et à la statistique du Chi-Carré

Apprends comment calculer le Chi2 à partir d'un tableau de contingence et à interpréter le résultats d'un test d'indépendance.

Présentation

Le Chi2 est une statistique de test conçue pour mesurer l'écart entre des effectifs observés et des effectifs théoriques. Il s'applique à des variables catégorielles organisées dans une table de contingence. Les modalités de la première variable se trouve sur une ligne alors que les modalité se trouve sur la seconde. Chaque cellule se trouve donc au croisement de deux modalité, pour cette raison, on appel aussi ces tables des tableau croisé. Le Chi2 quantifie à quel point les valeurs observée s'éloignent des valeurs que l'on observerai si les deux variables étaient indépendante. Plus cet écart est grand, plus la valeur du Chi2 est élevée.

Pourquoi utiliser le Chi2 et le Test d'Indépendance

Le test d'indépendance répond à la question suivante: deux variables catégorielles sont-elles liées ? Autrement dit: l'observation de la première variable me permet-elle de déduire la valeur de la deuxième ? Il s'agit là d'une question fréquente dans le domaine des sciences sociales, de la biologie et de la gestion: le genre influence-t-il le choix d'une filière ? Un traitement modifie-t-il le taux de réponse ? Le Chi2 fournit une mesure objective de cet écart et permet donc si l'association entre deux variables catégorielles est statistiquement significative.

Questions courantes FAQ

Qu'est-ce qu'un tableau de contingence ?

Un tableau de contingence est une manière d'organiser les observation simultanée de deux variables catégorielles. Chaque ligne correspond aux modalités de la première variable, chaque colonne aux modalité de la seconde. Chaque cellule du tableau se trouve au croisement de deux modalité. Elle contient donc effectif observés pour la combinaison de ces deux modalité. Le tableau de contingence est le point de départ pour le calcul du Chi2.

Comment calculer les effectifs théoriques ?

L'effectif théorique est l'effectif que l'on observerait si les deux variables étaient totallement indépendantes. Il se calcule en multipliant le total marginal de la ligne par le total marginal de la colonne correspondante, puis en divisant par l'effectif total de l'échantillon. Ces valeurs théoriques servent de référence : le Chi2 mesure l'écart entre ces valeurs et les effectifs réellement observés.

Que mesure exactement le Chi2 ?

Le Chi2 mesure l'écart totale entre les effectifs observés et les effectifs théoriques dans le tableau. Pour chaque cellule, il calcule (observé − théorique)² puis le divise par la valeur théorique. La somme de ces termes sur toutes les cellules donne le Chi2 total. Une valeur proche de zéro indique que les données s'écartent peu de l'indépendance. Une valeur élevée signale un écart important.

Qu'est-ce que l'hypothèse nulle dans un test d'indépendance ?

Dans un test d'indépendance par le Chi2, l'hypothèse nulle H₀ est l'hypothèse selon laquelle les deux variables catégorielles sont indépendantes: la distribution d'une variable ne dépend pas des modalités de l'autre. Dit autrement, sous l'hypothèse nulle, connaitre la valeur d'une variable ne nous permet pas de déduire la valeur de la second. L'hypothèse alternative H₁ postule au contraire qu'une association existe. Comme tout test d'hypothèse cependant, le test ne prouve pas H₀ : il évalue si les données fournissent une preuve suffisante pour la rejeter.

Comment utilise-t-on la table du Chi2 pour prendre une décision ?

La table du Chi2 donne la valeur critique pour un seuil α et un nombre de degrés de liberté. Les degrés de liberté valent (lignes − 1) × (colonnes − 1). Si le Chi2 calculé dépasse cette valeur critique, cela signifie que l'écart observé est significatif.

Qu'est-ce que le V de Cramer et pourquoi en a-t-on besoin ?

Le V de Cramer est un Chi2 normalisé. Le Chi2 en effet est sensible à la taille de l'échantillon : il croît mécaniquement avec n. Le V de Cramer normalise cette valeur pour obtenir un indice compris entre 0 et 1. On l'interprète de la manière suivante: 0 signifie absence d'association, 1 signifie association parfaite. C'est la mesure de taille d'effet associée au test du Chi2.