logo

 

 


 

Tests de corrélation

  • Théorie
  • Exemples
  • Exercices


Coefficient de corrélation de Pearson

Objectif du test

Tester l'existence d'une relation entre 2 variables quantitatives continues X et Y.

Type de variable du test

Variables quantitatives continues.

Données du test

ρ : coefficient de corrélation entre les 2 variables dans la population d'où est issu l'échantillon
r : coefficient de corrélation de Pearson estimé de l'échantillon
xi et yi : valeurs x et y d'un couple de données
n : nombre de couples dans l'échantillon
ddl : degré de liberté

Hypothèses testées

H0 : ρ = 0 absence de liaison entre X et Y
H1 bilatérale : ρ ≠ 0 liaison entre X et Y
H1 unilatérale : ρ > 0 liaison positive entre X et Y ou ρ < 0 liaison négative entre X et Y

Conditions d'application du test

Variable X et Y doivent être aléatoires.

Les observations de chaque variable doivent être indépendantes les unes des autres. Cette condition n'est pas remplie lorsqu'on compare des données Y en fonction du temps X (données de la veille ne sont pas indépendantes de celles du lendemain). Il y a une autocorrélation, il faut alors faire appel à des techniques d'analyse de séries chronologiques.

Association entre X et Y linéaire.

Dans la population d'où est issu l'échantillon, les distributions conditionnelles de Y liées à chaque valeur de X doivent normales et de variances égales. Et symétriquement, les distributions conditionnelles de X liées à chaque valeur de Y doivent normales et de variances égales. Cette condition est impossible à vérifier en pratique mais est souvent vraie.

Statistique du test

Après avoir calculé le coefficient de corrélation estimé de l'échantillon au moyen de la formule suivante :

coefficient-correlation-r

et l'erreur standard de sa distribution d'échantillonnage : coefficient-correlation-r2

Il faut calculer la statistique du test :

coefficient-correlation-r3

car sous H0 le rapport de la différence (r - 0) sur son erreur standard suit une loi t de Student.

Règles de décision et conclusion du test

Si H1 bilatérale : valeur théorique critique t(ddl ; α = 5%) à lire dans la table t de Student

  • tobs < tddl ; α = 5% : NRH0 d'où absence de liaison significative entre X et Y
  • tobs ≥ tddl ; α = 5% : RH0 d'où liaison significative entre X et Y

Si H1 unilatérale : valeur théorique critique tddl ; α = 10% à lire dans la table t de Student

  • tobs < tddl ; α = 10% : NRH0 d'où absence de liaison significative entre X et Y
  • tobs ≥ tddl ; α = 10% : RH0 d'où liaison positive ou négative significative entre X et Y

Coefficient de corrélation de rangs de Spearman

Objectif du test

Tester l'existence d'une relation entre 2 variables quantitatives X et Y mais contrairement au test de coefficient de corrélation de Pearson, il ne s'intéresse pas aux valeurs des variables mais à leurs rangs.

Type de variable du test

Variables quantitatives continues.

Données du test

rS : coefficient de corrélation de Spearman de l'échantillon
xi' et yi': rangs des valeurs observées de x et y. On appelle rang, le numéro d'ordre d'une valeur après classement de la variable par ordre croissant
n : nombre de couples dans l'échantillon
ddl : degré de liberté

Hypothèses testées

H0 : rS = 0 absence de liaison entre X et Y
H1 bilatérale : rS ≠ 0 liaison entre X et Y
H1 unilatérale : rS > 0 liaison positive entre X et Y ou rS < 0 liaison négative entre X et Y

Conditions d'application du test

Nombre de couples testé doit être supérieur à 10 et ne pas comporter trop de valeurs ex-aequo.

Dans la population d'où est issu l'échantillon, les distributions de Y liées à chaque valeur de X doivent normales et de variances égales. Et symétriquement, les distributions de X liées à chaque valeur de Y doivent normales et de variances égales. Cette condition est impossible à vérifier en pratique mais est souvent vraie.

Les observations de chaque variable doivent être indépendantes les unes des autres.

Il n'y a pas de conditions de normalité des distributions X et Y, ni de relation linéaire entre elles.

Statistique du test

Après avoir classé chacune des 2 séries de données par ordre croissant, on note pour chaque unité statistique le numéro de rang xi' et yi' de chacune des valeurs x et y. S'il existe des ex-aequo, on tire au sort les rangs respectifs de chaque ex-aequo ou on leur attribue un rang moyen.

Il faut calculer ensuite le coefficient de corrélation de Spearman de l'échantillon au moyen de la formule suivante :

coefficient-correlation-spearman

et l'erreur standard de sa distribution d'échantillonnage : coefficient-correlation-spearman2

Il faut calculer la statistique du test :

coefficient-correlation-spearman3

Règles de décision et conclusion du test

Si H1 bilatérale : valeur théorique critique t(ddl ; α = 5%) à lire dans la table t de Student

  • tobs < tddl ; α = 5% : NRH0 d'où absence de liaison significative entre X et Y
  • tobs ≥ tddl ; α = 5% : RH0 d'où liaison significative entre X et Y

Si H1 unilatérale : valeur théorique critique tddl ; α = 10% à lire dans la table t de Student

  • tobs < tddl ; α = 10% : NRH0 d'où absence de liaison significative entre X et Y
  • tobs ≥ tddl ; α = 10% : RH0 d'où liaison positive ou négative significative entre X et Y

contenu


Ex 1 : Enoncé1
Solution1

Ex 2 : Ennoncé2
Solution2

Ex 3 : Ennoncé3
Solution3

Ex 4 : Ennoncé4
Solution4

Ex 5 : Ennoncé5
Solution5

Ex 6 : Ennoncé6
Solution6

Ex 7 : Ennoncé7
Solution7

Ex 8 : Ennoncé8
Solution8

Ex 9 : Ennoncé9
Solution9

Ex 10 : Ennoncé10
Solution10