{
 "meta": {
   "fichier": "context_faculte_agnostic.json",
   "projet": "PrivateTeacher",
   "version": "1.0",
   "date": "2026-02-26",
   "perimetre": "Contexte faculté pour les documents sans ancrage institutionnel spécifique. Se substitue à un contexte faculté particulier. Compatible avec tous les degrés. Ne couvre pas le ton général, les disciplines, ni les niveaux de maturité conceptuelle."
 },

 "profil_lecteur": {
   "description": "Le lecteur n'est pas défini par son institution. Il est défini par sa volonté de comprendre un concept dans sa logique propre, indépendamment des attentes d'examen d'une faculté particulière. Ce document lui est utile quelle que soit sa filière.",
   "point_de_depart": "Le lecteur a identifié un concept qu'il ne comprend pas intuitivement. Il cherche à saisir pourquoi ce concept existe et dans quelle situation il devient un outil pertinent — avant d'en maîtriser la mécanique formelle."
 },

 "approche_narrative": {
   "principe": "Le contenu développe le sujet par un récit historique ou logique qui reconstitue le cheminement ayant conduit à l'invention ou à la formalisation du concept. Ce récit n'est pas décoratif — il est le vecteur principal de la compréhension.",
   "objectif_du_recit": "Permettre au lecteur de développer une intuition sur la logique fondamentale du concept : pourquoi il a été nécessaire de l'inventer, quel problème concret il résout, et dans quelle classe de situations il devient l'outil approprié.",
   "ancrage_examen": "Le récit reste orienté vers l'utilisation opérationnelle du concept. L'intuition développée doit permettre au lecteur d'identifier la situation d'examen dans laquelle cet outil est pertinent — quelle que soit la faculté dans laquelle il étudie.",
   "identification_de_la_situation": "Un objectif explicite du document est d'aider le lecteur à reconnaître les conditions qui appellent l'usage de cet outil : quelles sont les caractéristiques du problème, quels sont les signaux qui indiquent que cette méthode est la bonne."
 },

 "culture_d_examen": {
   "posture": "Transversale. Le document ne calibre pas son contenu sur le format d'examen d'une institution particulière. Il vise à développer une compréhension du concept suffisamment solide pour être mobilisée dans n'importe quel format d'examen.",
   "valeur_transfert": "L'intuition construite par le récit doit être transférable : le lecteur doit pouvoir l'activer face à un énoncé HEC, HEG, UNIL ou UNIGE sans que le document ait eu besoin de les mentionner explicitement."
 },

 "vocabulaire_et_outils": {
   "vocabulaire": "Vocabulaire disciplinaire rigoureux, sans terminologie propre à une institution. Les termes utilisés sont ceux de la discipline, pas ceux d'un curriculum particulier.",
   "outils": "Aucun outil logiciel ou institutionnel spécifique n'est mentionné. Les exemples numériques sont construits à partir de données fictives ou génériques, non rattachées à un contexte organisationnel particulier."
 }
}

Introduction Chi2 et Test d'Indépendance

Illustration pédagogique PrivateTeacher de la distribution du Chi2.

Introduction au test d'Indépendance et à la statistique du Chi-Carré

Apprends comment calculer le Chi2 à partir d'un tableau de contingence et à interpréter le résultats d'un test d'indépendance.

Présentation

Le Chi2 est une statistique de test conçue pour mesurer l'écart entre des effectifs observés et des effectifs théoriques. Il s'applique à des variables catégorielles organisées dans une table de contingence. Les modalités de la première variable se trouve sur une ligne alors que les modalité se trouve sur la seconde. Chaque cellule se trouve donc au croisement de deux modalité, pour cette raison, on appel aussi ces tables des tableau croisé. Le Chi2 quantifie à quel point les valeurs observée s'éloignent des valeurs que l'on observerai si les deux variables étaient indépendante. Plus cet écart est grand, plus la valeur du Chi2 est élevée.

Pourquoi utiliser le Chi2 et le Test d'Indépendance

Le test d'indépendance répond à la question suivante: deux variables catégorielles sont-elles liées ? Autrement dit: l'observation de la première variable me permet-elle de déduire la valeur de la deuxième ? Il s'agit là d'une question fréquente dans le domaine des sciences sociales, de la biologie et de la gestion: le genre influence-t-il le choix d'une filière ? Un traitement modifie-t-il le taux de réponse ? Le Chi2 fournit une mesure objective de cet écart et permet donc si l'association entre deux variables catégorielles est statistiquement significative.

A qui s'adresse ce document

Ce document s'adresse aux étudiants de Bachelor 1 qui rencontre le test du Chi2 pour la première fois, quelle que soit sa filière. Le test d'indépendance est utilisé dans de nombreux cursus : sciences sociales, psychologie, gestion, économie, biologie. . C'est souvent le premier test d'hypothèse qu'un étudiant applique à des données de type catégoriel.

Ce que contient ce document

Dans ce document, tu apprendras comment calculer les effectifs théoriques à partir d'une table de contingence. Ce document présente la formule du Chi2 à l'aide d'un exemple complet et démontre tous le détail des calculs étape par étape. Il explique comment déterminer les degrés de liberté et comment lire la table des quantiles du Chi2. Ce document introduit enfin le V de Cramer comme mesure de la taille d'effet.

Prérequis nécessaire

Le niveau requis pour lire ce document est celui du gymnase ou équivalent. Aucune connaissance préalable en statistiques n'est nécessaire. Ce document nécessite donc des connaissances d'algèbre élémentaire telle que savoir effectuer des opérations sur des fraction ou lire une table numérique. Les notions d'hypothèse statistique, d'effectif observé et d'effectif théorique sont définies dans le document avant d'être utilisées. Aucun logiciel n'est requis pour suivre le raisonnement : tous les calculs sont conduits à la main.

Questions courantes FAQ

Qu'est-ce qu'un tableau de contingence ?

Un tableau de contingence est une manière d'organiser les observation simultanée de deux variables catégorielles. Chaque ligne correspond aux modalités de la première variable, chaque colonne aux modalité de la seconde. Chaque cellule du tableau se trouve au croisement de deux modalité. Elle contient donc effectif observés pour la combinaison de ces deux modalité. Le tableau de contingence est le point de départ pour le calcul du Chi2.

Comment calculer les effectifs théoriques ?

L'effectif théorique est l'effectif que l'on observerait si les deux variables étaient totallement indépendantes. Il se calcule en multipliant le total marginal de la ligne par le total marginal de la colonne correspondante, puis en divisant par l'effectif total de l'échantillon. Ces valeurs théoriques servent de référence : le Chi2 mesure l'écart entre ces valeurs et les effectifs réellement observés.

Que mesure exactement le Chi2 ?

Le Chi2 mesure l'écart totale entre les effectifs observés et les effectifs théoriques dans le tableau. Pour chaque cellule, il calcule (observé − théorique)² puis le divise par la valeur théorique. La somme de ces termes sur toutes les cellules donne le Chi2 total. Une valeur proche de zéro indique que les données s'écartent peu de l'indépendance. Une valeur élevée signale un écart important.

Qu'est-ce que l'hypothèse nulle dans un test d'indépendance ?

Dans un test d'indépendance par le Chi2, l'hypothèse nulle H₀ est l'hypothèse selon laquelle les deux variables catégorielles sont indépendantes: la distribution d'une variable ne dépend pas des modalités de l'autre. Dit autrement, sous l'hypothèse nulle, connaitre la valeur d'une variable ne nous permet pas de déduire la valeur de la second. L'hypothèse alternative H₁ postule au contraire qu'une association existe. Comme tout test d'hypothèse cependant, le test ne prouve pas H₀ : il évalue si les données fournissent une preuve suffisante pour la rejeter.

Comment utilise-t-on la table du Chi2 pour prendre une décision ?

La table du Chi2 donne la valeur critique pour un seuil α et un nombre de degrés de liberté. Les degrés de liberté valent (lignes − 1) × (colonnes − 1). Si le Chi2 calculé dépasse cette valeur critique, cela signifie que l'écart observé est significatif.

Qu'est-ce que le V de Cramer et pourquoi en a-t-on besoin ?

Le V de Cramer est un Chi2 normalisé. Le Chi2 en effet est sensible à la taille de l'échantillon : il croît mécaniquement avec n. Le V de Cramer normalise cette valeur pour obtenir un indice compris entre 0 et 1. On l'interprète de la manière suivante: 0 signifie absence d'association, 1 signifie association parfaite. C'est la mesure de taille d'effet associée au test du Chi2.

Introduction Loi Normale et Table des Quantiles Cours PDF

Illustration pédagogique PrivateTeacher représentant la symétrie de la distribution normale

Introduction à la Loi Normale et à la Table des Quantiles

Comprendre comment lire la table des quantile pour calculer les probabilités suivant une loi normale.

Présentation

La loi normale, dite aussi distribution de Laplace-Gauss, est un modèle mathématique qui décrit la répartition de valeurs aléatoire autour d'une valeur centrale. On la rencontre dans de nombreuses situations en biologie, physiologie, psychologie ou encore en économie. La loi normale apparaît lorsque le phénomène observé résulte de la somme de nombreuses contributions indépendantes. Cette additivité se traduit par une propriété mathématique intéressante: la somme de deux distributions normales est toujours une distribution normale.

Pourquoi utiliser la Loi Normale

La loi normale permet de répondre à la question suivante: quelle est la probabilité de faire une certaine observation? On peut se demander par exemple, quelle est la probabilité de rencontrer une personne de moins de 35 ans en suisse. Quelle est la probabilité de rencontrer une personne de plus de 80 kg au Japon etc. Calculer cette probabilité revient à calculer l'aire sous la courbe de la distribution. La table des quantiles permet de faire cela justement. Elle contient toute les probabilités précalculées de la distribution normale standard. On peut rapporter toutes les distribution normale à la distribution centrée réduite par transformation de la variable x à la variable z.

A qui s'adresse ce document

Ce document s'adresse à tous les étudiants de Bachelor 1 qui rencontre la loi normale pour la première fois, quelle que soit sa filière. La loi normale est un outil général : elle apparaît dans les cursus de psychologie, de gestion, d'économie, de biologie et de sciences sociales. L'intuition qu'elle développe est une compétence fondamentale pour tout raisonnement quantitatif à l'université. Ce document constitue donc un point de départ pour toute personne souhaitant développer une intuition sur ce sujet.

Ce que contient ce document

Le document présente les propriétés fondamentales de la loi normale et le rôle que joue ses deux paramètres, μ et σ. Il explique comment ramener toutes distribution normale à la distribution standard N(0,1) (comment centrer-réduire). Dans ce document, la démarche qui consiste à lire la table des quantiles est expliquée pas à pas. Des exemples numériques résolus dans les détails accompagnent l'explication afin de permettre à l'étudiant.e de se familiariser avec l'utilisation de la table des quantiles.

Prérequis nécessaire pour comprendre ce document

Le niveau requis pour lire ce document est celui du gymnase ou équivalent. Aucune connaissance préalable en statistiques n'est nécessaire. Il suffit de savoir manipuler des fractions, comprendre la notion de moyenne arithmétique et lire un tableau numérique. La notion de variable aléatoire est introduite dans le document avant d'être utilisée. Aucun logiciel n'est requis : tous les calculs sont conduits à la main, avec la table des quantiles comme seul outil.

Questions courantes FAQ

Qu'est-ce qu'une distribution de probabilité ?

Une distribution de probabilité est un modèle mathématique qui décrit l'ensemble des valeurs que peut prendre une variable aléatoire et la probabilité qui leur est associée. La loi normale est une distribution continue : elle attribue une probabilité à tout intervalle de valeurs, non à une valeur isolée. La probabilité totale sous la courbe est toujours égale à 1.

Que sont les paramètres μ et σ de la loi normale ?

Le paramètre μ (mu) donne la position de la distribution. elle indique où se situe le centre de la courbe. Il s'agit de la moyenne. Le paramètre σ (sigma) est l'écart-type : il mesure la dispersion des valeurs autour de la moyenne. Un σ petit produit une courbe étroite alors qu' un grand σ produit une courbe large. Ces deux paramètres suffisent à définir une distribution normale complètement.

Qu'est-ce que centrer-réduire et pourquoi en a-t-on besoin ?

Le processus de centrer-réduire transforme une variable X de distribution N(μ, σ²) en une variable Z de distribution N(0,1), par la formule Z = (X − μ) / σ. Cette transformation est nécessaire pour pouvoir utiliser la table des quantile unique. Sans cette transformation, (centrer puis réduire) il faudrait une table des quantiles pour chaque variable X possible, ce qui est infaisable en pratique.

Comment lire la table des quantiles ?

La table des quantiles donne la probabilité P(Z ≤ z) sous la distribution normale standard. On repère la partie entière et le premier chiffre décimal de z dans la colonne de gauche, puis le deuxième chiffre décimal en ligne d'en-tête. La cellule à l'intersection donne la probabilité cherchée. Les valeur de z se lisent donc sur les ligne puis les colonne, la table elle contient des probabilités. Pour des probabilités à droite d'une valeur de z ou pour des valeur négative de z, on utilise les propriété de symétrie de la courbe.

La loi normale s'applique-t-elle à toutes les variables ?

Non. La loi normale n'est pas un modèle universel. Elle suppose que la distribution des données est symétrique et que les valeurs extrêmes sont rares. Des variables comme le revenu ou le temps de réaction sont souvent asymétriques et ne suivent donc pas une distribution normale. Il existe d'autres distributions. Avant d'appliquer la loi normale, il faut donc vérifier que la distribution observée est compatible avec ses hypothèses.

Quelle est la différence entre probabilité et fréquence ?

La fréquence représente le rapport entre un nombre d'événement particulier et le nombre d'événement total: elle décrit ce qui a été observé dans un échantillon. La probabilité quant à elle est une prédiction théorique: elle décrit ce que le modèle prédit pour une population. Utiliser la loi normale pour calculer une probabilité, c'est faire usage du modèle. Utiliser une fréquence c'est faire usage des observations. Cette distinction entre statistique descriptive et inférentielle est fondamentale.

Introduction Regression Lineaire Simple Cours PDF

 Illustration pédagogique PrivateTeacher représentant un nuage de points avec une droite de régression.

Introduction à la Régression Linéaire Simple

Comprendre la relation entre deux variables, construire un modèle de prédiction et l'interpréter correctement.

Présentation de la Régression Linéaire Simple

La régression linéaire simple est une méthode statistique qui modélise la relation entre deux variables : une variable dépendante, notée Y, et une variable indépendante, notée X. Le modèle suppose que cette relation est linéaire et la représente par une droite d'équation Y = a + bX. Le coefficient b mesure de combien Y varie en moyenne quand X augmente d'une unité. Ce modèle est une représentation probabiliste de la réalité, non une description exacte des données.

Pourquoi utiliser la Régression Linéaire Simple

La régression linéaire simple répond à deux questions distinctes. La première : existe-t-il une relation statistique entre X et Y ? La seconde : si cette relation existe, quelle valeur de Y peut-on prédire pour une valeur donnée de X ? Ces questions apparaissent dans des contextes variés — estimer un coût à partir d'une quantité, expliquer un score à partir d'heures de travail. La régression simple est également le point d'entrée vers des modèles plus complexes : régression multiple, régression logistique.

A qui s'adresse ce document

Ce document s'adresse à tout étudiant en Bachelor 1 qui rencontre la régression linéaire pour la première fois, quelle que soit sa filière. La régression linéaire simple est enseignée dans les cursus de gestion, d'économie, de psychologie, de biologie et de sciences sociales. Comprendre comment une variable en explique une autre est une compétence transversale à toutes les disciplines qui mobilisent des données quantitatives, indépendamment du format d'examen de l'institution concernée.

Ce que contient ce document

Le document présente les principes fondamentaux de la régression linéaire simple : la distinction entre variable dépendante et indépendante, l'équation de la droite de régression et la signification de ses coefficients. Un exercice résolu à la main illustre chaque étape du raisonnement, du calcul des coefficients à l'interprétation du résultat. Le document se conclut sur les limites du modèle : pourquoi une droite de régression n'établit pas de causalité, et dans quelles conditions son usage est valide.

Degré de formation nécessaire pour comprendre pour lire ce document

Le niveau requis est celui du gymnase ou équivalent. Une connaissance de base en algèbre est nécessaire : savoir lire une équation de la forme Y = a + bX et comprendre la notion de pente. Aucune connaissance préalable en statistiques n'est supposée. Les notions de moyenne, variance et covariance sont utilisées dans le document et définies avant d'être mobilisées. Aucun logiciel n'est requis : l'exercice proposé est conduit entièrement à la main.

Questions courantes FAQ

Qu'est-ce qu'une variable dépendante et une variable indépendante ?

La variable dépendante (Y) est celle qu'on cherche à expliquer ou prédire. La variable indépendante (X) est celle qu'on utilise pour produire cette explication. Dans un modèle qui prédit le score d'un étudiant à partir de ses heures de travail, le score est Y et les heures sont X. Cette distinction détermine la structure du modèle et ne peut pas être inversée arbitrairement.

Que signifient les coefficients a et b dans l'équation de régression ?

Le coefficient b, appelé pente, indique de combien Y varie en moyenne quand X augmente d'une unité. Le coefficient a, appelé ordonnée à l'origine, indique la valeur prédite de Y quand X est égal à zéro. Ces deux coefficients définissent entièrement la droite de régression. Leur interprétation doit toujours être formulée dans les unités des variables concernées, pas en termes abstraits.

Comment vérifie-t-on que la relation entre deux variables est bien linéaire ?

On vérifie la linéarité en traçant un nuage de points, avec X en abscisse et Y en ordonnée. Si les points se distribuent autour d'une droite, la relation est compatible avec un modèle linéaire. Si la distribution forme une courbe, un modèle linéaire est inadapté. Cette vérification graphique précède toujours le calcul des coefficients — appliquer une régression sans elle produit un modèle invalide.

Quelle est la différence entre corrélation et régression linéaire ?

La corrélation mesure la force et la direction d'une relation linéaire entre deux variables, via un coefficient entre -1 et 1. La régression va plus loin : elle produit une équation qui permet de prédire Y à partir de X. La corrélation est symétrique — r(X,Y) est identique à r(Y,X). La régression ne l'est pas : le choix de la variable dépendante change l'équation obtenue.

Qu'est-ce que le coefficient de détermination R² ?

Le R² mesure la proportion de la variance de Y expliquée par le modèle. Il varie entre 0 et 1 : un R² de 0.80 signifie que le modèle explique 80 % de la variabilité de Y. Un R² élevé ne garantit pas que le modèle est correct — il faut aussi vérifier que les hypothèses du modèle sont respectées. Un R² seul ne suffit pas à valider une régression.

Quelles sont les conditions d'application de la régression linéaire simple ?

La régression linéaire simple repose sur quatre hypothèses : la relation entre X et Y est linéaire, les résidus sont indépendants, leur variance est constante (homoscédasticité) et ils suivent une loi normale. Si ces hypothèses sont violées, les coefficients restent calculables mais les tests statistiques associés — intervalles de confiance, p-values — ne sont plus valides. La vérification des hypothèses fait partie intégrante de l'analyse.