logo

 

 


 

Glossaire, formulaire et FAQ

  • Glossaire
  • Formulaire
  • FAQ

Abscisse : axe des X (axe horizontal)

Aplatissement (indice) ou voussure (kurtosis): paramètre mesurant le caractère plus ou moins aplati d'une distribution par rapport à une distribution de référence. Il s'agit du coefficient G2 de Fisher

Asymétrie (indice) (skewness) : paramètre mesurant le caractère d'asymétrie d'une distribution autour de sa valeur centrale. Il s'agit du coefficient G1 de Fisher

Biais (bias) : erreur systématique engendrée par un mauvais échantillonnage

Boîte à moustache (boxplot) :

Caractère : valeur (observation quantitative) ou modalité (observation qualitative) prise par un individu pour une variable étudiée d'une population donnée

Classe : catégorie d'une variable continue regroupant plusieurs valeurs entre 2 bornes, inférieure et supérieure. Ex : classe de taille des 160 à 169 cm

Coefficient de variation: paramètre de dispersion d'une distribution égale au rapport de l'écart-type à la moyenne multiplié par 100. Il mesure la dispersion indépendamment de l'unité de mesure de la variable

Déciles : valeurs qui partage une distribution en 10 groupes d'effectifs égaux

Dénombrement : comptage exhaustif des individus composant une population donnée. Le recensement de la population est un dénombrement

Données agrégées (agregated data) : données regroupées afin de les présenter de façon synthétique, facile à analyser >< données brutes individuelles

Données aberrantes :

Diagramme en barres: graphe représentant un tableau de distribution de fréquences utilisé lorsque les données se mesurent sur une échelle nominale ou ordinale. La hauteur de chaque barre correspond à la fréquence (absolue ou relative, exprimée en % ou pas). Il y a un espace entre chaque barre

Distribution (distribution) : ensemble des effectifs d'une série statistique classées selon les valeurs ou modalités d'une variable. Façon dont les individus d'une population se répartissent en fonction ces valeurs ou modalités

Distribution de fréquences : répartition organisée du nombre d’individus appartenant à chacune des modalités de l’échelle de mesure

Distribution de fréquences groupées : lorsque la variable compte un nombre important de valeurs, il peut être plus approprié pour plus de clarté de grouper certaines valeurs entre elles et de créer ainsi des classes

Ecart moyen absolu : paramètre de dispersion d'une distribution égal à la moyenne des valeurs absolues des écarts par rapport à la moyenne. Il s'exprime dans la même unité que la variable

Ecart-type (standard deviation) : paramètre de dispersion d'une distribution égal à la racine carrée de la variance. Il s'exprime dans la même unité que la variable

Échantillon (sample) : sous-ensemble construit et représentatif d'une population donnée appelée population mère. Il est noté s

Echantillon aléatoire (random sample) : échantillon pris au hasard. Chaque élément de la population a une chance égale d’être pris dans l’échantillon

Echelle nominale : étiquette qui catégorise les observations (féminin-masculin ; blond- brun-roux; ...)

Echelle ordinale : range les personnes, objets ou événements le long d’un continuum

Echelle d’intervalles : des différences ou intervalles égaux entre les nombres sur l’échelle reflètent des différences égales en termes de magnitude mais pas en terme de rapport

Echelle de rapport : les rapports entre les nombres sur l’échelle reflètent les rapports en magnitude. Echelle possédant un vrai zéro (zéro absolu), qui correspond à l’absence de la chose mesurée

Echelle absolue : échelle basée sur des nombres entiers réels positifs, possédant un vrai zéro, dont la fonction est le dénombrement (comptage)

Espace interquartile : paramètre de dispersion égal à la différence entre le 3ème quartile et le 1er quartile. Il s'exprime dans la même unité que la variable

Etendue (range) : paramètre de dispersion égal à la différence entre les valeurs extrêmes d'une distribution. Elle s'exprime dans la même unité que la variable

Fréquence absolues (absolute frequency) : ni effectif, c’est à dire le nombre d’observations dans chaque modalité ou classe d'un caractère d'une population ou d'un échantillon

Fréquence relative (relative frequency) : fi rapport entre l’effectif ni d’une modalité ou classe d'un caractère d'une population ou d'un échantillon et l’effectif total n de cette population ou échantillon. Si on multiplie la fréquence relative par 100, on obtient la fréquence relative exprimée en %

Fréquence cumulée : le nombre ou pourcentage cumulé pour une certaine modalité de la variable est égal à la somme des nombres ou pourcentages des unités satistiques de cette modalités et ceux des unités satistiques des modalités inférieures . La notion de distribution cumulée s’applique aux cas des fréquences absolues et relatives, et de la probabilité

Histogramme : graphe représentant un tableau de distribution de fréquences utilisé lorsque les données se mesurent sur une échelle d’intervalle ou de rapport. La hauteur de chaque barre correspond à la fréquence (absolue ou relative, exprimée en % ou pas). Les barres sont « collées »; il n’y a d’espace vide que pour les valeurs non représentées dans l’échantillon

Hypothèse : prédiction par rapport aux résultats de d’une étude (qui pourrait à l’issue de l’étude s’avérer vraie ou fausse voire être nuancée)

Médiane (median) : paramètre de position centrale indiquant la valeur qui partage la distribution en deux effectifs égaux. Elle s'exprime dans la même unité que la variable

Modalité : valeur qualitative ou quantitative que peut prendre le caractère précédemment défini. Attention, les modalités sont exhaustives et mutuellement exclusives. Chaque individu doit pouvoir être classé dans une et une seule modalite

Mode (mode) : paramètre de position indiquant la valeur la plus fréquemment observée dans une distribution. Il s'exprime dans la même unité que la variable

Moyenne (mean) : paramètre de tendance centrale d'une distribution. Pour une variable donnée, elle correspond au rapport de la somme des valeurs d'une population (échantillon) ∑ xi et l'effectif N de la population (échantillon). Elle s'exprime dans la même unité que la variable

Ordonnée : axe des Y (axe vertical)

Percentiles : valeurs qui partage une distribution en 100 groupes d'effectifs égaux

Population (population) : ensemble des unités statistiques d'une étude présentant un ou plusieurs caractères communs. Pour une thématique donnée, la population regroupe toujours la totalité des individus relatif à cette thématique (notion d'exhaustivité). Elle est notée : Ω

Population mère : population dont est issu l'échantillon.

Quartiles : valeurs qui partage une distribution en 4 groupes d'effectifs égaux. Il existe 3 quartiles, le 2ème quartile est la médiane. Elles s'expriment dans la même unité que la variable

Rang percentile : rang exprimé en % occupé par le score observé d'un individu

Score Z :

Unité statistique (statistical unit) : élément de base ou individu constitutif de la population à laquelle il appartient. Il est indivisible et peut être un animal, un végétal, un humain ou tout autre objet sur lequel une mesure ou une observation peut être faite. Elle est notée ωi

Représentativité (representativeness) : se dit d'un échantillon choisi de telle façon qu'il représente la population dont il est issu. Seul un sondage aléatoire garantit la représentativité d'un échantillon

Valeur (value) : expression chiffrée, codée ou nommées d'une donnée. Elle est notée xi

Valeur ou donnée aberrante : observation qui se trouve « loin » des autres observations. Sa présence peut signifier une unité statistique qui ne fait pas partie de la population que l’on étudie (un adulte parmi un jeu de données concernant des enfants), ou bien une erreur de saisie ou de mesure. Certaines données aberrantes peuvent être aisément identifiées mais l'appellation « donnée aberrante » reste très subjective et il n’en existe pas de définition mathématique ou statistique

Variable (variable) : caractéristique pouvant prendre plusieurs des valeurs d'un ensemble d'observations possibles auquel une mesure ou une qualité peut être appliquée. Elle est notée X

Variable aléatoire (random variable) : Variable qui peut prendre toute valeur produite par le hasard

Variable qualitative = catégorielle = nominale : variable dont les valeurs sont des noms, des étiquettes

Variable quantitative : variable dont les valeurs sont le résultat d’une mesure ou d’un dénombrement

Variable indépendante : variable manipulée ou contrôlée par l’expérimentateur

Variable dépendante : variable dont on observe les changements (= les données)

Variance : paramètre de dispersion d'une distribution égal à la moyenne des carrés des écarts par rapport à la moyenne. Elle est mesurée dans la même unité que la variable mais élevée au carré, ce qui n'a qu'un sens mathématique

Sondage aléatoire (random sampling) : processus de sélection des unités statistiques dans lequel n'intervient que le hasard et où chacune d'entre elles a la même probabilité d'être tirée

Statistique : ensemble de méthodes et outils mathématiques visant à collecter, décrire et analyser des données afin d’obtenir de l’information permettant de prendre des décisions malgré la pré́sence d’incertitude (erreur, bruit)


Mediane :

Si variable discrète

Si n impair : mediane-n-impair

Si n pair : mediane-n-pair

Si variable continue groupée en classe

mediane-distribution-groupee

Moyenne :

Si série statistique : moyenne-serie

Si distribution de fréquence absolue : moyenne-frequence-absolue

Si distribution de fréquence relative : moyenne-frequence-relative

Indice d'asymétrie ou coefficient G1 de Fisher : coefficient-G1

Indice d'aplatissement ou coefficient G2 de Fisher : coefficient-G2

 


Ex 1 : Enoncé1
Solution1

Ex 2 : Ennoncé2
Solution2

Ex 3 : Ennoncé3
Solution3

Ex 4 : Ennoncé4
Solution4

Ex 5 : Ennoncé5
Solution5

Ex 6 : Ennoncé6
Solution6

Ex 7 : Ennoncé7
Solution7

Ex 8 : Ennoncé8
Solution8

Ex 9 : Ennoncé9
Solution9

Ex 10 : Ennoncé10
Solution10