Régression linéaire simple - Cours PDF
Une introduction à l’utilisation des droites de régression linéaire expliquée à l’aide d’exemples simples pour te permettre de comprendre le sujet rapidement. Cours au format PDF à télécharger.
Présentation
La régression linéaire simple est une méthode statistique permettant d'étudier la relation entre une variable dépendante et une variable indépendante. On utilise la régression linéaire pour déterminer s'il existe une relation de proportionnalité entre ces deux variables. Lorsqu'une relation existe, on l'exprimer sous la forme d'une équation mathématique. Une équation permet de calculer la valeur d'une variable à partir d'une autre. C'est ce qu'on appel un modèle. La régression linéaire permet donc de produire un modèle mathématique dont on se sert pour expliquer une variable dépendante à partire d'une variable indépendante.
Pourquoi utiliser la régression linéaire simple
Les régressions linéaires constituent le point de départ pour de nombreux modèles mathématiques: La régression logistique ou les régressions linéaires multiples par exemple. Comprendre les régressions linéaires simples, c’est donc se donner les moyens de comprendre toute une gamme de modèle mathématique en statistiques et d’améliorer ainsi son expertise sur le sujet.
A qui s'adresse ce cours au format PDF
Ce document s'adresse aux étudiants de toutes les facultés qui découvrent la régression linéaire pour la première fois. Il sera donc utile à toute personne cherchant à comprendre ce type d'instrument et se familiariser avec d'autre modèles plus complexe tels que les régressions linéaire multiples l’analyse factorielle ou encore l'inférence causale.
Ce que contient ce document
Ce document couvre les principes fondamentaux de la régression linéaire. Il est construit de manière à te permettre de reprendre le cours sur la régression linéaire comme si tu ne l’avais jamais vu. Tu y trouveras toutes les explications nécessaire pour te permettre de comprendre le sujet depuis le début. Un exercice simple à faire à la main te sera présenté pour te permettre de comprendre tous les aspects essentiels du sujet. À la fin du document, tu trouveras enfin une conclusion importante au sujet de l’utilisation des modèles dans la vraie vie.
Degré de formation nécessaire
Ce document est conçu pour des étudiants de niveau bachelor 1, n'ayant pas de connaissances préalables en statistique au-delà du niveau lycée. L'accent est mis sur la compréhension intuitive des concepts plutôt que sur les aspects techniques.
Questions courantes FAQ
Qu'est-ce que la régression linéaire simple ?
La régression linéaire simple est une méthode statistique qui permet d'estimer la relation linéaire entre une variable dépendante et une variable indépendante. Elle produit une équation de la forme Y = a + bX où a et b sont les paramètres du modèle.
Que signifie la pente de la droite ?
La pente de la droite est précisément le coefficient de proportionnalité entre deux variables. Si par exemple on écrit Y = 4X on dira que Y est 4 fois plus grand que X. On l'interprète ainsi: Pour une augmentation de une unité sur X, j'augmente de 4 unités sur Y.
Qu'est ce que l'ordonnée à l'origine ?
L'ordonnée à l'origine, ou coefficient b, représente la valeur de la variable Y lorsque X vaut zéro. C'est la valeur de départ de Y. Cette valeur cependant, ne peut pas toujours etre interprétée de manière tangible. Si X est l'age d'une personne et Y son salaire par exemple, on pourra dire que le salaire d'une personne augmente avec son age. On ne s'occupera pas cependant de la valeur du salaire pour des individu de 0 ans. L'ordonnée à l'origine n'as pas toujours de sens concret. Lorsque c'est le cas, on dira que b est simplement une variable d'ajustement.
Qu'est-ce que le coefficient de détermination R² ?
Le R² indique la proportion de la variance de Y qui est expliquée par le modèle de régression. Il varie entre 0 et 1, plus il est élevé, meilleure est l'ajustement du modèle aux données. On se sert de cette valeur pour évaluer la qualité du modèle
Quand la régression linéaire simple n'est-elle pas adaptée ?
Toutes les variables ne se trouvent pas dans une relation de dépendance linéaires. La relation peut prendre d'autre forme mathématique. On peut avoir des relation quadratique, sinusoidal ou logistique. Dans ce cas on utilisera des régression du meme nom pour ajuster le modèle aux valeurs observée.