{
 "meta": {
   "fichier": "context_degre_ba1.json",
   "projet": "PrivateTeacher",
   "version": "1.0",
   "date": "2026-02-26",
   "perimetre": "Niveau de maturité conceptuelle attendu en Bachelor 1. Ne couvre pas le ton général, la logique disciplinaire, ni les attentes facultaires."
 },

 "niveau": {
   "label": "Bachelor 1 — Découverte",
   "description": "L'étudiant rencontre le concept pour la première fois dans un cadre universitaire. Il ne dispose pas encore de cadre conceptuel structuré pour l'accueillir. L'objectif est de construire une première représentation mentale correcte et stable."
 },

 "maturite_conceptuelle": {
   "acquis_presupposes": "Connaissances de niveau gymnase ou équivalent. Aucune exposition préalable au concept traité n'est supposée.",
   "capacite_attendue": "Reconnaître le concept, comprendre à quel problème il répond, appliquer la procédure de base sur un exemple guidé.",
   "capacite_non_attendue": "Dériver le concept, le relier à d'autres cadres théoriques, l'adapter à des situations non standard."
 },

 "directives_de_contenu": {
   "entree_obligatoire": "Chaque concept est introduit par le problème concret qu'il résout. L'étudiant doit comprendre pourquoi ce concept existe avant d'apprendre ce qu'il est.",
   "profondeur": "Un seul angle d'attaque par concept. Les cas limites, les généralisations et les variantes sont exclus à ce niveau.",
   "formalisme": "Minimal. Les formules sont introduites après l'intuition, jamais avant. Chaque symbole est défini explicitement.",
   "exemples": "Entièrement guidés. L'exemple résolu pas à pas précède tout exercice demandé à l'étudiant.",
   "exercices": "Format simple et unique. Une seule compétence testée par exercice. Les données sont propres et le contexte sans ambiguïté."
 },

 "signaux_d_alarme_editoriaux": [
   "Introduire plusieurs variantes d'un même concept dans le même article",
   "Supposer que l'étudiant connaît un prérequis non universitaire sans le rappeler",
   "Utiliser une notation non définie même si elle est courante dans la discipline",
   "Proposer un exercice dont la résolution requiert une compétence non couverte dans l'article"
 ]
}

Introduction Chi2 et Test d'Indépendance

Illustration pédagogique PrivateTeacher de la distribution du Chi2.

Introduction au test d'Indépendance et à la statistique du Chi-Carré

Apprends comment calculer le Chi2 à partir d'un tableau de contingence et à interpréter le résultats d'un test d'indépendance.

Présentation

Le Chi2 est une statistique de test conçue pour mesurer l'écart entre des effectifs observés et des effectifs théoriques. Il s'applique à des variables catégorielles organisées dans une table de contingence. Les modalités de la première variable se trouve sur une ligne alors que les modalité se trouve sur la seconde. Chaque cellule se trouve donc au croisement de deux modalité, pour cette raison, on appel aussi ces tables des tableau croisé. Le Chi2 quantifie à quel point les valeurs observée s'éloignent des valeurs que l'on observerai si les deux variables étaient indépendante. Plus cet écart est grand, plus la valeur du Chi2 est élevée.

Pourquoi utiliser le Chi2 et le Test d'Indépendance

Le test d'indépendance répond à la question suivante: deux variables catégorielles sont-elles liées ? Autrement dit: l'observation de la première variable me permet-elle de déduire la valeur de la deuxième ? Il s'agit là d'une question fréquente dans le domaine des sciences sociales, de la biologie et de la gestion: le genre influence-t-il le choix d'une filière ? Un traitement modifie-t-il le taux de réponse ? Le Chi2 fournit une mesure objective de cet écart et permet donc si l'association entre deux variables catégorielles est statistiquement significative.

A qui s'adresse ce document

Ce document s'adresse aux étudiants de Bachelor 1 qui rencontre le test du Chi2 pour la première fois, quelle que soit sa filière. Le test d'indépendance est utilisé dans de nombreux cursus : sciences sociales, psychologie, gestion, économie, biologie. . C'est souvent le premier test d'hypothèse qu'un étudiant applique à des données de type catégoriel.

Ce que contient ce document

Dans ce document, tu apprendras comment calculer les effectifs théoriques à partir d'une table de contingence. Ce document présente la formule du Chi2 à l'aide d'un exemple complet et démontre tous le détail des calculs étape par étape. Il explique comment déterminer les degrés de liberté et comment lire la table des quantiles du Chi2. Ce document introduit enfin le V de Cramer comme mesure de la taille d'effet.

Prérequis nécessaire

Le niveau requis pour lire ce document est celui du gymnase ou équivalent. Aucune connaissance préalable en statistiques n'est nécessaire. Ce document nécessite donc des connaissances d'algèbre élémentaire telle que savoir effectuer des opérations sur des fraction ou lire une table numérique. Les notions d'hypothèse statistique, d'effectif observé et d'effectif théorique sont définies dans le document avant d'être utilisées. Aucun logiciel n'est requis pour suivre le raisonnement : tous les calculs sont conduits à la main.

Questions courantes FAQ

Qu'est-ce qu'un tableau de contingence ?

Un tableau de contingence est une manière d'organiser les observation simultanée de deux variables catégorielles. Chaque ligne correspond aux modalités de la première variable, chaque colonne aux modalité de la seconde. Chaque cellule du tableau se trouve au croisement de deux modalité. Elle contient donc effectif observés pour la combinaison de ces deux modalité. Le tableau de contingence est le point de départ pour le calcul du Chi2.

Comment calculer les effectifs théoriques ?

L'effectif théorique est l'effectif que l'on observerait si les deux variables étaient totallement indépendantes. Il se calcule en multipliant le total marginal de la ligne par le total marginal de la colonne correspondante, puis en divisant par l'effectif total de l'échantillon. Ces valeurs théoriques servent de référence : le Chi2 mesure l'écart entre ces valeurs et les effectifs réellement observés.

Que mesure exactement le Chi2 ?

Le Chi2 mesure l'écart totale entre les effectifs observés et les effectifs théoriques dans le tableau. Pour chaque cellule, il calcule (observé − théorique)² puis le divise par la valeur théorique. La somme de ces termes sur toutes les cellules donne le Chi2 total. Une valeur proche de zéro indique que les données s'écartent peu de l'indépendance. Une valeur élevée signale un écart important.

Qu'est-ce que l'hypothèse nulle dans un test d'indépendance ?

Dans un test d'indépendance par le Chi2, l'hypothèse nulle H₀ est l'hypothèse selon laquelle les deux variables catégorielles sont indépendantes: la distribution d'une variable ne dépend pas des modalités de l'autre. Dit autrement, sous l'hypothèse nulle, connaitre la valeur d'une variable ne nous permet pas de déduire la valeur de la second. L'hypothèse alternative H₁ postule au contraire qu'une association existe. Comme tout test d'hypothèse cependant, le test ne prouve pas H₀ : il évalue si les données fournissent une preuve suffisante pour la rejeter.

Comment utilise-t-on la table du Chi2 pour prendre une décision ?

La table du Chi2 donne la valeur critique pour un seuil α et un nombre de degrés de liberté. Les degrés de liberté valent (lignes − 1) × (colonnes − 1). Si le Chi2 calculé dépasse cette valeur critique, cela signifie que l'écart observé est significatif.

Qu'est-ce que le V de Cramer et pourquoi en a-t-on besoin ?

Le V de Cramer est un Chi2 normalisé. Le Chi2 en effet est sensible à la taille de l'échantillon : il croît mécaniquement avec n. Le V de Cramer normalise cette valeur pour obtenir un indice compris entre 0 et 1. On l'interprète de la manière suivante: 0 signifie absence d'association, 1 signifie association parfaite. C'est la mesure de taille d'effet associée au test du Chi2.

Introduction Loi Normale et Table des Quantiles Cours PDF

Illustration pédagogique PrivateTeacher représentant la symétrie de la distribution normale

Introduction à la Loi Normale et à la Table des Quantiles

Comprendre comment lire la table des quantile pour calculer les probabilités suivant une loi normale.

Présentation

La loi normale, dite aussi distribution de Laplace-Gauss, est un modèle mathématique qui décrit la répartition de valeurs aléatoire autour d'une valeur centrale. On la rencontre dans de nombreuses situations en biologie, physiologie, psychologie ou encore en économie. La loi normale apparaît lorsque le phénomène observé résulte de la somme de nombreuses contributions indépendantes. Cette additivité se traduit par une propriété mathématique intéressante: la somme de deux distributions normales est toujours une distribution normale.

Pourquoi utiliser la Loi Normale

La loi normale permet de répondre à la question suivante: quelle est la probabilité de faire une certaine observation? On peut se demander par exemple, quelle est la probabilité de rencontrer une personne de moins de 35 ans en suisse. Quelle est la probabilité de rencontrer une personne de plus de 80 kg au Japon etc. Calculer cette probabilité revient à calculer l'aire sous la courbe de la distribution. La table des quantiles permet de faire cela justement. Elle contient toute les probabilités précalculées de la distribution normale standard. On peut rapporter toutes les distribution normale à la distribution centrée réduite par transformation de la variable x à la variable z.

A qui s'adresse ce document

Ce document s'adresse à tous les étudiants de Bachelor 1 qui rencontre la loi normale pour la première fois, quelle que soit sa filière. La loi normale est un outil général : elle apparaît dans les cursus de psychologie, de gestion, d'économie, de biologie et de sciences sociales. L'intuition qu'elle développe est une compétence fondamentale pour tout raisonnement quantitatif à l'université. Ce document constitue donc un point de départ pour toute personne souhaitant développer une intuition sur ce sujet.

Ce que contient ce document

Le document présente les propriétés fondamentales de la loi normale et le rôle que joue ses deux paramètres, μ et σ. Il explique comment ramener toutes distribution normale à la distribution standard N(0,1) (comment centrer-réduire). Dans ce document, la démarche qui consiste à lire la table des quantiles est expliquée pas à pas. Des exemples numériques résolus dans les détails accompagnent l'explication afin de permettre à l'étudiant.e de se familiariser avec l'utilisation de la table des quantiles.

Prérequis nécessaire pour comprendre ce document

Le niveau requis pour lire ce document est celui du gymnase ou équivalent. Aucune connaissance préalable en statistiques n'est nécessaire. Il suffit de savoir manipuler des fractions, comprendre la notion de moyenne arithmétique et lire un tableau numérique. La notion de variable aléatoire est introduite dans le document avant d'être utilisée. Aucun logiciel n'est requis : tous les calculs sont conduits à la main, avec la table des quantiles comme seul outil.

Questions courantes FAQ

Qu'est-ce qu'une distribution de probabilité ?

Une distribution de probabilité est un modèle mathématique qui décrit l'ensemble des valeurs que peut prendre une variable aléatoire et la probabilité qui leur est associée. La loi normale est une distribution continue : elle attribue une probabilité à tout intervalle de valeurs, non à une valeur isolée. La probabilité totale sous la courbe est toujours égale à 1.

Que sont les paramètres μ et σ de la loi normale ?

Le paramètre μ (mu) donne la position de la distribution. elle indique où se situe le centre de la courbe. Il s'agit de la moyenne. Le paramètre σ (sigma) est l'écart-type : il mesure la dispersion des valeurs autour de la moyenne. Un σ petit produit une courbe étroite alors qu' un grand σ produit une courbe large. Ces deux paramètres suffisent à définir une distribution normale complètement.

Qu'est-ce que centrer-réduire et pourquoi en a-t-on besoin ?

Le processus de centrer-réduire transforme une variable X de distribution N(μ, σ²) en une variable Z de distribution N(0,1), par la formule Z = (X − μ) / σ. Cette transformation est nécessaire pour pouvoir utiliser la table des quantile unique. Sans cette transformation, (centrer puis réduire) il faudrait une table des quantiles pour chaque variable X possible, ce qui est infaisable en pratique.

Comment lire la table des quantiles ?

La table des quantiles donne la probabilité P(Z ≤ z) sous la distribution normale standard. On repère la partie entière et le premier chiffre décimal de z dans la colonne de gauche, puis le deuxième chiffre décimal en ligne d'en-tête. La cellule à l'intersection donne la probabilité cherchée. Les valeur de z se lisent donc sur les ligne puis les colonne, la table elle contient des probabilités. Pour des probabilités à droite d'une valeur de z ou pour des valeur négative de z, on utilise les propriété de symétrie de la courbe.

La loi normale s'applique-t-elle à toutes les variables ?

Non. La loi normale n'est pas un modèle universel. Elle suppose que la distribution des données est symétrique et que les valeurs extrêmes sont rares. Des variables comme le revenu ou le temps de réaction sont souvent asymétriques et ne suivent donc pas une distribution normale. Il existe d'autres distributions. Avant d'appliquer la loi normale, il faut donc vérifier que la distribution observée est compatible avec ses hypothèses.

Quelle est la différence entre probabilité et fréquence ?

La fréquence représente le rapport entre un nombre d'événement particulier et le nombre d'événement total: elle décrit ce qui a été observé dans un échantillon. La probabilité quant à elle est une prédiction théorique: elle décrit ce que le modèle prédit pour une population. Utiliser la loi normale pour calculer une probabilité, c'est faire usage du modèle. Utiliser une fréquence c'est faire usage des observations. Cette distinction entre statistique descriptive et inférentielle est fondamentale.

Introduction Regression Lineaire Simple Cours PDF

 Illustration pédagogique PrivateTeacher représentant un nuage de points avec une droite de régression.

Introduction à la Régression Linéaire Simple

Comprendre la relation entre deux variables, construire un modèle de prédiction et l'interpréter correctement.

Présentation de la Régression Linéaire Simple

La régression linéaire simple est une méthode statistique qui modélise la relation entre deux variables : une variable dépendante, notée Y, et une variable indépendante, notée X. Le modèle suppose que cette relation est linéaire et la représente par une droite d'équation Y = a + bX. Le coefficient b mesure de combien Y varie en moyenne quand X augmente d'une unité. Ce modèle est une représentation probabiliste de la réalité, non une description exacte des données.

Pourquoi utiliser la Régression Linéaire Simple

La régression linéaire simple répond à deux questions distinctes. La première : existe-t-il une relation statistique entre X et Y ? La seconde : si cette relation existe, quelle valeur de Y peut-on prédire pour une valeur donnée de X ? Ces questions apparaissent dans des contextes variés — estimer un coût à partir d'une quantité, expliquer un score à partir d'heures de travail. La régression simple est également le point d'entrée vers des modèles plus complexes : régression multiple, régression logistique.

A qui s'adresse ce document

Ce document s'adresse à tout étudiant en Bachelor 1 qui rencontre la régression linéaire pour la première fois, quelle que soit sa filière. La régression linéaire simple est enseignée dans les cursus de gestion, d'économie, de psychologie, de biologie et de sciences sociales. Comprendre comment une variable en explique une autre est une compétence transversale à toutes les disciplines qui mobilisent des données quantitatives, indépendamment du format d'examen de l'institution concernée.

Ce que contient ce document

Le document présente les principes fondamentaux de la régression linéaire simple : la distinction entre variable dépendante et indépendante, l'équation de la droite de régression et la signification de ses coefficients. Un exercice résolu à la main illustre chaque étape du raisonnement, du calcul des coefficients à l'interprétation du résultat. Le document se conclut sur les limites du modèle : pourquoi une droite de régression n'établit pas de causalité, et dans quelles conditions son usage est valide.

Degré de formation nécessaire pour comprendre pour lire ce document

Le niveau requis est celui du gymnase ou équivalent. Une connaissance de base en algèbre est nécessaire : savoir lire une équation de la forme Y = a + bX et comprendre la notion de pente. Aucune connaissance préalable en statistiques n'est supposée. Les notions de moyenne, variance et covariance sont utilisées dans le document et définies avant d'être mobilisées. Aucun logiciel n'est requis : l'exercice proposé est conduit entièrement à la main.

Questions courantes FAQ

Qu'est-ce qu'une variable dépendante et une variable indépendante ?

La variable dépendante (Y) est celle qu'on cherche à expliquer ou prédire. La variable indépendante (X) est celle qu'on utilise pour produire cette explication. Dans un modèle qui prédit le score d'un étudiant à partir de ses heures de travail, le score est Y et les heures sont X. Cette distinction détermine la structure du modèle et ne peut pas être inversée arbitrairement.

Que signifient les coefficients a et b dans l'équation de régression ?

Le coefficient b, appelé pente, indique de combien Y varie en moyenne quand X augmente d'une unité. Le coefficient a, appelé ordonnée à l'origine, indique la valeur prédite de Y quand X est égal à zéro. Ces deux coefficients définissent entièrement la droite de régression. Leur interprétation doit toujours être formulée dans les unités des variables concernées, pas en termes abstraits.

Comment vérifie-t-on que la relation entre deux variables est bien linéaire ?

On vérifie la linéarité en traçant un nuage de points, avec X en abscisse et Y en ordonnée. Si les points se distribuent autour d'une droite, la relation est compatible avec un modèle linéaire. Si la distribution forme une courbe, un modèle linéaire est inadapté. Cette vérification graphique précède toujours le calcul des coefficients — appliquer une régression sans elle produit un modèle invalide.

Quelle est la différence entre corrélation et régression linéaire ?

La corrélation mesure la force et la direction d'une relation linéaire entre deux variables, via un coefficient entre -1 et 1. La régression va plus loin : elle produit une équation qui permet de prédire Y à partir de X. La corrélation est symétrique — r(X,Y) est identique à r(Y,X). La régression ne l'est pas : le choix de la variable dépendante change l'équation obtenue.

Qu'est-ce que le coefficient de détermination R² ?

Le R² mesure la proportion de la variance de Y expliquée par le modèle. Il varie entre 0 et 1 : un R² de 0.80 signifie que le modèle explique 80 % de la variabilité de Y. Un R² élevé ne garantit pas que le modèle est correct — il faut aussi vérifier que les hypothèses du modèle sont respectées. Un R² seul ne suffit pas à valider une régression.

Quelles sont les conditions d'application de la régression linéaire simple ?

La régression linéaire simple repose sur quatre hypothèses : la relation entre X et Y est linéaire, les résidus sont indépendants, leur variance est constante (homoscédasticité) et ils suivent une loi normale. Si ces hypothèses sont violées, les coefficients restent calculables mais les tests statistiques associés — intervalles de confiance, p-values — ne sont plus valides. La vérification des hypothèses fait partie intégrante de l'analyse.