logo

 

 


 

Régression linéaire simple

  • Théorie
  • Exemples
  • Exercices


Test t de student pour la régression linéaire simple

Objectif du test

Tester l'existence d'une relation linéaire entre 2 variables quantitatives continues X et Y. Si une relation linéaire existe, nous avons β1 ≠ 0.

Type de variable du test

Variables quantitatives continues.

Données du test

β1: pente de la droite de régression de la population de référence
b1 : pente de la droite de régression calculée à partir de l'échantillon
Sy.x : erreur standard de l'estimation ou erreur résiduelle
est σb1 : erreur standard de la distribution d'échantillonnage de la pente b1
n : nombre de couples dans l'échantillon
ddl : nombre de degré de liberté

Hypothèses testées

H0 : β1 = 0 absence de liaison entre X et Y
H1 bilatérale : β1 ≠ 0 liaison entre X et Y

Conditions d'application du test

Variable X et Y doivent être aléatoires.

Les observations de chaque variable doivent être indépendantes les unes des autres. Cette condition n'est pas remplie lorsqu'on compare des données Y en fonction du temps X (données de la veille ne sont pas indépendantes de celles du lendemain). Il y a une autocorrélation, il faut alors faire appel à des techniques d'analyse de séries chronologiques.

Association entre X et Y linéaire.

Dans la population d'où est issu l'échantillon, les distributions conditionnelles de Y liées à chaque valeur de X doivent normales et de variances égales. Et symétriquement, les distributions conditionnelles de X liées à chaque valeur de Y doivent normales et de variances égales. Cette condition est impossible à vérifier en pratique mais est souvent vraie.

Test

Après avoir calculé b1, la pente de la droite de régression estimée à partir de l'échantillon, au moyen de la formule suivante :

regression-droite-pente

L'espérance mathématique : E(b1) = β1

et l'erreur standard de sa distribution d'échantillonnage : test-regression-ecart-type-b1

Vu que nous ne connaissons pas σ, nous estimons σb1 en remplaçant σ par Sy.x , l'erreur standard de l'estimation :

test-regression-ecart-type-estime-b1

Il faut ensuite calculer la statistique du test :

test-regression

car sous H0 le rapport de la différence (b1 - β1) sur son erreur standard suit une loi t de Student à n-2 degrés de liberté.
Si H0 est vraie, alors β1 = 0 et t = b1 / Sb1

Règles de décision et conclusion du test

Si H1 bilatérale : valeur théorique critique t(ddl ; α = 5%) à lire dans la table t de Student

  • tobs < tddl ; α = 5% : NRH0 d'où absence de liaison significative entre X et Y
  • tobs ≥ tddl ; α = 5% : RH0 d'où liaison significative entre X et Y

Test de F de F-Snedecor pour la régression linéaire simple

Objectif du test

Tester l'existence d'une relation linéaire entre 2 variables quantitatives continues X et Y. Si une relation linéaire existe, nous avons CMreg ≈ CMres.

Ce test sert également à tester l'existence d'une relation linéaire entre 1 variable dépendante Y et plus d'une variable indépendante.

Type de variable du test

Variables quantitatives continues.

Données du test

β1: pente de la droite de régression de la population de référence
b1 : pente de la droite de régression calculée à partir de l'échantillon
Sy.x : erreur standard de l'estimation ou erreur résiduelle
est σb1 : erreur standard de la distribution d'échantillonnage de la pente b1
n : nombre de couples dans l'échantillon
ddl : nombre de degré de liberté

Hypothèses testées

H0 : β1 = 0 absence de liaison entre X et Y
H1 unilatérale : β1 ≠ 0 liaison entre X et Y

Conditions d'application du test

Variable X et Y doivent être aléatoires.

Les observations de chaque variable doivent être indépendantes les unes des autres. Cette condition n'est pas remplie lorsqu'on compare des données Y en fonction du temps X (données de la veille ne sont pas indépendantes de celles du lendemain). Il y a une autocorrélation, il faut alors faire appel à des techniques d'analyse de séries chronologiques.

Association entre X et Y linéaire.

Dans la population d'où est issu l'échantillon, les distributions conditionnelles de Y liées à chaque valeur de X doivent normales et de variances égales. Et symétriquement, les distributions conditionnelles de X liées à chaque valeur de Y doivent normales et de variances égales. Cette condition est impossible à vérifier en pratique mais est souvent vraie.

Test

Il faut calculer la statistique du test :

/test-regression-test-F

Le test repose sur 2 estimations indépendantes σ2 :

    1. CMres fournit une estimation de σ2
    2. Si H0 est vraie, CMreg fournit une autre estimation de σ2

Sous H0 le rapport CMreg / CMres suit une loi F avec :

  • pour le numérateur un degré de liberté égal au nombre de variables indépendantes, dans le cas d'une régression linéaire simple, il est égal à 1
  • pour le dénominateur, n-2 degrés de liberté

Si H0 : β1 = 0 est vraie : CMres et CMreg sont des estimateurs sans biais de σ2 et F est proche de 1
Si H0 est rejetée : β1 ≠ 0 : CMres reste un estimateur sans biais de σ2 et CMreg surestime σ2

Anova dans le cadre d'une régression linéaire
SC
ddl
CM
F
Niveau de Signification
Régression
SCreg
1
CMreg
test-anova-inter1fact11
p =
Résidu
SCres
n - 2
CMres
-
-
Total
SCT
n - 1
-
-
-

Règles de décision et conclusion du test

Si H1 bilatérale : valeur théorique critique F(ddl1,ddl2) α = 2,5% à lire dans la table F de Fisher-Snedecor

  • Fobs < F(ddl1,ddl2) α = 2,5% : NRH0 d'où CMreg ne diffère pas significativement de CMres
  • Fobs ≥ F(ddl1,ddl2) α = 2,5% : RH0 d'où CMreg diffère significativement de CMres

contenu


Ex 1 : Enoncé1
Solution1

Ex 2 : Ennoncé2
Solution2

Ex 3 : Ennoncé3
Solution3

Ex 4 : Ennoncé4
Solution4

Ex 5 : Ennoncé5
Solution5

Ex 6 : Ennoncé6
Solution6

Ex 7 : Ennoncé7
Solution7

Ex 8 : Ennoncé8
Solution8

Ex 9 : Ennoncé9
Solution9

Ex 10 : Ennoncé10
Solution10