logo

 

 


 

Analyse factorielle intra-sujet

  • Théorie
  • Exemples
  • Exercices


Un plan d’expérience intra-sujet à un critère de classification est une expérience dans laquelle les mêmes sujets sont soumis aux différentes modalités ou conditions (niveaux fixes) de la variable explicative A : il s’agit donc de mesures répétées ou d’échantillons dépendants.

On peut également rencontrer des plans intra-sujets à 2, 3, ... critères de classification : il s'agira d’un seul échantillon à qui s’appliquera toutes les combinaisons des modalités de 2, 3, ... variables explicatives; il s’agira de mesures répétées sur un unique échantillon.

ANOVA inter-sujet à 1 critère de classification

Objectif de l'ANOVA

L'ANOVA généralise le test t de Student pour 2 échantillons dépendants à plus de 2 échantillons. Mais au lieu de comparer 2 à 2 les différentes moyennes, ce qui entraînerait une perte de puissance, nous allons décomposer la variance de la variable dépendante étudiée. C'est pourquoi nous parlons d'analyse de la variance ou ANOVA en anglais (ANalysis Of VAriance).

Types de variable du test

Une variable continue à expliquer, appelée variable dépendante et une variable explicative A mesurée sur une échelle nominale (catégorielle) à plus de 2 modalités, appelée variable indépendante ou critère de classification ou facteur (ce dernier terme étant plutôt réservé à l'analyse factorielle).

Conditions d'application de l'ANOVA

  • Normalité : la variable X se distribue normalement dans chacune des J sous-populations. Néanmoins, lorsque l’effectif par modalité de la variable indépendante est égal ou supérieur à 30, nous avons tendance à être moins exigent quant à la satisfaction de cette condition d’application
  • Sphéricité : dans le cas du test t pour deux échantillons pairés (variable explicative à 2 modalités), on calcule la variable différence (D). Lorsqu’il y a plus de 2 modalités, on peut également calculer les différences pour toutes les paires de modalités de la variable. La condition de sphéricité impose que les variances de ces différences soient identiques. Cette condition est remplie si les variances des différentes modalités de la variable sont égales et si les covariances entre les différents modalités sont égales. L’homogénéité des variances et des covariances est vérifiée à l’aide du test de Mauchly.

Hypothèses testées

H0 : Il n'y a pas d'effet principal du traitement
H1 bilatérale : Il y a un effet principal du traitement

Ce qui revient à tester :

H0 : μ1 = μ2 = ... = μJ
H1 bilatérale : il existe au moins une paire (i,j) telle que μi ≠ μj où μj est la moyenne de X pour le niveau j.

Décomposition de la variance totale

Dans l'ANOVA inter-sujet à 1 critère de classification pour échantillons indépendants, la variabilité totale de la variable dépendante était décomposée en variabilité entre les échantillons due à la variable explicative (inter-groupe ou between group) et en variabilité au sein de chaque échantillon résultant de tous les autres facteurs non contrôlés (intra-groupe ou within group).

Dans un plan d’expérience à un facteur intra-sujet, la variabilité within peut être scindée en :

    1. variabilité inter-sujets due aux différences entre les individus
    2. variabilité intra-sujets, dans les mêmes conditions, un même sujet ne reproduit que rarement le même résultat; ces variations sont dues à d’autres facteurs (que celui étudié) comme la concentration, la présence de distracteurs

Les sujets qui obtiennent les scores les plus élevés la première fois qu’on les évalue ont tendance à également obtenir les scores les plus élevés lors des autres évaluations (idem pour les sujets qui ont les scores les moins élevés).

Il y a donc une corrélation entre les différentes cellules. Le principe de l’analyse de variance à mesures répétées ou à échantillons dépendants consiste à éliminer cette variabilité due aux différences entre sujets et donc à soustraire la variabilité inter-sujets de la variabilité « within ».

On teste ensuite le CMtraitement en le comparant au CMerreur résiduelle c-à-d la variabilité within résiduelle.

La statistique de test F est plus importante dans les plans intra-sujets que dans les plans inter-sujets car divisée par CMerreur résiduelle plus petite que CMwithin.

Par conséquent, les plans intra-sujets sont plus puissants que les plans inter-sujets. En effet, étant donné que la variabilité erreur par rapport à laquelle on teste l’effet du traitement est réduite, il est plus facile d’identifier les effets du traitement. Attention, cette remarque ne doit pas sous-entendre que l’on a le choix entre les 2 méthodes : c’est le plan d’expérience qui définit le test à effectuer.

Une ANOVA à mesures répétées à 1 critère de classification revient à effectuer une anova à 2 critères de classification dans laquelle le second critère serait le critère sujet avec une observation par cellule. Etant donné que ce plan ne contient qu’une seule donnée par cellule, il n’y a pas de terme erreur (pas de variabilité aléatoire à l’intérieur des cellules, donc SCwithin = 0 et CMwithin = 0). Ceci empêche d’étudier l’effet sujet (qui serait de toute façon trivialement significatif) ou l’interaction Sujet x Condition.

En revanche, l’effet Condition peut être étudié parce que les données du croisement Sujet x Condition varient aléatoirement. Le carré moyen de cette interaction peut donc être utilisé comme terme erreur (= dénominateur) dans le calcul du rapport F correspondant à l’effet condition.

Test ANOVA

anova-intra-1

Pour calculer ces différentes variances, nous utilisons les Sommes des Carrés ou SC (en anglais Sum of Square ou SS), les degrés de liberté ou ddl (en anglais Degree of Freedom ou DF) et les Carrés Moyens ou CM (en anglais Mean Square ou MS).

Données du test

xij : ième individu pour la modalité j de la variable explicative
M : moyenne générale de X sur l'ensemble des observations
Mj : moyenne de X pour la modalité J
N : nombre d'observations
n : nombre de sujets dans chaque modalité
J : nombre de modalités
X-barre-i : moyenne de X pour le ième individu sur l'ensemble des modalités

Calcul des Sommes des Carrés (SC)

Si chaque échantillon a un effectif de même taille n, on démontre que :

SCtotal = SCinter-sujets + SCtraitement + SCerreur résiduelle avec :

  • Somme des carrés des écarts entre chaque score observé et la moyenne générale = mesure de la variabilité totale indépendamment du traitement :

    test-anova-intra1fact1

  • Somme des carrés des écarts entre chaque scores observés et sa moyenne intra-groupe = mesure de la variabilité au sein de chaque groupe :

    test-anova-intra1fact3

  • Somme des carrés des écarts entre la moyenne de chaque groupe et la moyenne générale = mesure de la variabilité due au traitement :

    test-anova-intra1fact2

  • Somme des carrés des écarts entre la moyenne de chaque groupe et la moyenne générale = mesure de la variabilité résiduelle :

Calcul des Degrés de liberté (ddl)

N = effectif total de tous les groupes
a = nombre de modalités

  • ddltotal = N - 1
  • ddlbetween-subjects = a - 1
  • ddltraitement = n - 1
  • ddlresidual = (a - 1)(n - 1)

Calcul des Carrés Moyens (CM)

  • test-anova-intra1fact4
  • test-anova-intra1fact7
  • test-anova-intra1fact5
  • test-anova-intra1fact6

Remarque : Si SCtotal = SCbetween subjects + SCtraitement + SCresidual

Il n'en est pas de même pour la variance : S2total ≠ CMbetween subjects+ CMtraitement+ CMresidual

Calcul de la statistique de test

On montre que sous H0, les carrés moyens between et within sont des estimations de la variance de la variable aléatoire X et que leur rapport se distribue selon une loi F de Fisher-Snedecor :

test-anova-inter1fact9

S’il n’y a pas d’effet du traitement, ces deux estimations seront égales.

Dans le cas contraire, F sera supérieur à 1 et le test statistique précisera alors en fonction du niveau de signification α = 5%, jusqu’où un dépassement de 1 est acceptable.

Au-delà de celui-ci, H0 sera rejetée au profit de H1 qui pose qu'au moins une des moyennes diffère des autres.

Tableau de synthèse de l'ANOVA

Anova inter-sujet à 1 variable explicative
SC
ddl
CM
F
degré de Signification
S
SCsubjects
n - 1
CMsubjects
-
-
T
SCtraitement
a - 1
CMtraitement
test-anova-intra1fact8
p =
S * T
SCs * t
(n-1)(a-1)
CMs * t
-
-
Erreur
SCe
-
-
-
-
Total
SCtotal
N-1
-
-
-


Comparaison des moyennes en cas de différence significative

Lorsque l’ANOVA rejette H0, elle ne fait qu’indiquer que les moyennes ne sont pas toutes égales entre elles mais sans préciser lesquelles sont différentes. Il faut poursuivre l’étude pour isoler les différences entre des sous-ensembles de moyennes. Il y a 2 méthodes possibles à postériori ou à priori.

Méthode à postériori

Les chercheurs utilisent fréquemment cette méthode qui consiste à ne pas poser d’hypothèse précise sur la manière dont ces trois (ou plus) moyennes se distinguent.

Les comparaisons à posteriori (post-hoc) sont effectuées après l’analyse de l’ANOVA. Elles porteront sur la comparaison de toutes les moyennes deux à deux. Celles-ci sont basées sur la statistique d’écart studentisée et dépendent du nombre de modalités de la variable indépendante (le nombre total de moyennes). Le test à posteriori utilisé pour comparer les moyennes deux à deux et savoir quelles sont les moyennes qui diffèrent les unes des autres sont le test de Bonferroni.

Méthode à priori

Cette méthode, moins utilisée dans la littérature, a un grand avantage : elle permet au chercheur de tester une prédiction, une hypothèse particulière, sans devoir tester toutes les comparaisons de moyennes.

L'ANOVA à priori permet de comparer une relation particulière entre moyennes.


Contenu 2


Ex 1 : Enoncé1
Solution1

Ex 2 : Ennoncé2
Solution2

Ex 3 : Ennoncé3
Solution3

Ex 4 : Ennoncé4
Solution4

Ex 5 : Ennoncé5
Solution5

Ex 6 : Ennoncé6
Solution6

Ex 7 : Ennoncé7
Solution7

Ex 8 : Ennoncé8
Solution8

Ex 9 : Ennoncé9
Solution9

Ex 10 : Ennoncé10
Solution10