logo

 

 


 

Tableaux bivariés

  • Théorie
  • Exemples
  • Exercices


Série statistique double (données non groupées)

Lorsque les données brutes sont peu nombreuses, la forme la plus élémentaire de présenter 2 variables X et Y consiste à simplement énumérer toutes les paires de scores observés de la population ou de l'échantillon sous forme d'une série statistique double en les triant par ordre croissant sur une 1ère variable et ensuite éventuellement sur l'autre.

X
x1
x2
...
xi
...
xn
Y
y1
y2
...
yi
...
yn

Certains scores pouvant dans ce cas apparaître plusieurs fois, il est donc intéressant de les présenter autrement.

Distributions statistiques ou de fréquences

Lorque les données brutes sont nombreuses, il est intéressant condenser la série statistique double en une distribution de fréquences à double entrée.

C'est un tableau à double entrée, appelé aussi tableau de contingence :

    • les lignes sont réservées aux p modalités observées de la variable X
    • les colonnes sont réservées aux q modalités observées de la variable Y
    • Au centre, les fréquences absolues nij représentent pour chaque cellule du tableau le nombre de couples d'observations (xi, yj), c-à-d le nombre d'unités statistiques ayant excatement les scores observés xi et yj
Distribution bivariée non groupée
de fréquences absolues

Y

y1

y2 ... yj ... yq Totaux
X
x1
n11
n12
...
n1j
...
n1q
n1.
x2
n21
n22
...
n2j
...
n2q
n2.
...
...
...
...
...
...
...
...
xi
ni1
ni2
...
nij
ni1
niq
ni.
...
...
...
...
...
...
...
...
xp
np1
np2
...
npj
...
npq
np.
Totaux
n.1
n.2
...
n.j
...
n.q
n


On appelle donc distribution de fréquences bivariée ou à 2 dimensions l'ensemble des modalités xi et yj d'une part, et les fréquences absolues nij avec i ∈ [1;p] et j ∈ [1;q] d'autre part.

Lorsque le nombre de lignes ou colonnes du tableau est encore trop grand, notamment lorsqu'il s'agit de variables continues, il est possible de condenser encore les observations en les regroupant en classes. Il s'agit alors de distribution de fréquences bivariée groupée avec les xi et yj comme points centraux des classes, et Δx et Δy les intervalles de classes constants, respectivement pour les variables X et Y. En général, le nombre de classes ne dépasse pas 10 ou 15 pour chacune des variables.

Les fréquences absolues marginales (ni. et n.j) :

Ce sont les fréquences absolues de la colonne et de la ligne "totaux" du tableau à double entrée :

bivariee-frequence-marginale-x et bivariee-frequence-marginale-y

Conventionnellement, un point remplace l'indice suivant lequel on a sommé.

Les fréquences absolues marginales sont liées par les relations suivantes :

bivariee-frequences-marginales-relations

Les fréquences marginales ni. et n.j associées respectivement aux modalités xi de X et yj de Y constituent 2 distributions univariées, appelées distributions marginales.

Les fréquences absolues conditionnelles (ni|j et nj|i ) :

    • En considérant une colonne particulière du tableau à double entrée, on définit une distribution univariée, appelée distribution conditionnelle de X sous la condition Y = yj, notée X|yj. Il existe autant de distributions conditionnelles de X qu'il n'y a de modalités ou classes de Y
    • En considérant une ligne particulière du tableau à double entrée, on définit une distribution univariée, appelée distribution conditionnelle de Y sous la condition X = xi, notée Y|xi. Il existe autant de distributions conditionnelles de Y qu'il n'y a de modalités ou classes de X

Fréquences relatives (fij) et fréquences marginales relatives (fi. et f.j)

Ce sont les rapports entre l’effectif de chaque cellule ou chacune des 2 distributions marginales et l’effectif total. Il s’agit d'un nombre fractionnaire positif pouvant varier entre 0 et 1.

Fréquence relative d'une cellule du tableau à double entrée : bivariee-frequences-relatives

Fréquences relatives marginales : bivariee-frequences-relatives-marginalex et bivariee-frequences-relatives-marginaley


Les fréquences relatives marginales sont liées par les relations suivantes :

bivariee-frequences-relatives-propriete

Fréquences conditionnelles relatives (fi|j et fj|i)

Elles se calculent par rapport aux fréquences absolues marginales.

Fréquence de X sous la condition Y = yj : bivariee-frequences-relatives-conditionnelle-xsousy

Fréquence de Y sous la condition X = xi : bivariee-frequences-relatives-conditionnelle-ysousx

Attention dans ce cas, on constate que :

pour toute modalité j de Y bivariee-frequences-relatives-conditionnelle-propriete1

et pour toute modalité i de X que : bivariee-frequences-relatives-conditionnelle-propriete2

Fréquences cumulées

Comme pour la descriptive univariée, il est possible d'additionner de proche en proche les fréquences absolues ou relatives et obtenir ainsi une distribution de fréquences cumulées absolues ou relatives.


Série statistique double

Longueur du corps (X en cm) et profondeur de poitrine (Y en cm) de 22 vaches laitères.

bivariee-serie-statistique-double

Distribution de fréquences à double entrée

Sur base de la série statistique double, voici :

Tableau de fréquences absolues

bivariee-serie-tableau-frequences-absolues

Tableau de fréquences relatives

bivariee-serie-tableau-frequences-relatives

Tableau de fréquences absolues cumulées

bivariee-serie-tableau-frequences-absolues-cumulees


Ex 1 :

Ennoncé1

Solution1


Ex 2 :

Ennoncé2

Solution2


Ex 3 :

Ennoncé3

Solution3


Ex 4 : Ennoncé4
Solution4

Ex 5 : Ennoncé5
Solution5

Ex 6 : Ennoncé6
Solution6

Ex 7 : Ennoncé7
Solution7

Ex 8 : Ennoncé8
Solution8

Ex 9 : Ennoncé9
Solution9

Ex 10 : Ennoncé10
Solution10