Terminologie
De quoi parlons-nous ?
Dernière mise à jour
De quoi parlons-nous ?
Dernière mise à jour
Les modèles linéaires mixtes (MLM ; ou encore modèles multi-niveaux) sont des modèles statistiques qui permettent de tenir compte d'effets d'intérêts (effets fixes) et d'effets aléatoires propres à l'échantillon (effets aléatoires) dans la prédiction de la variable dépendante.
L'adjectif linéaire fait référence à la combinaison linéaire des différents facteurs :
Où Y est le comportement ou résultat à prédire. X est un facteur fixe, Z un facteur aléatoire et ε le résidu.
β est l'équivalent du coefficient de régression dans les régressions linéaires et correspond aux effets fixes dans les modèles linéaires mixtes.
u correspond à l'effet aléatoire.
Leur caractère mixte fait référence au fait qu'ils sont en mesure de modéliser à la fois des effets fixes et des effets aléatoires.
X peut également faire référence à des covariables. Cette dénomination est mathématiquement similaire à "facteur fixe" puisqu'il n'y a aucune différence ni dans sa notation mathématique, ni dans son implémentation dans les logiciels. Toutefois, en psychologie, une covariable est souvent considérée comme une variable ayant un effet sur le comportement (Y) mais qui n'est pas toujours une variable expérimentale. Nous y ferons référence en ce sens lorsque ce sera nécessaire.
Les effets fixes sont associés à des variables (i.e. facteurs fixes) qui peuvent être continues (e.g. : âge, poids) ou catégorielles (e.g. genre, niveau socio-culturel).
Ils sont l'équivalent des coefficients de régression des modèles de régression linéaire et constituent bien souvent les variables d'intérêt pour lesquelles nous cherchons à estimer les paramètres (e.g. β) et sur lesquelles nous posons nos hypothèses. Autrement dit, ils décrivent la relation entre les prédicteurs (X) et le comportement (Y).
Dans un MLM, tous les niveaux de tous les facteurs fixes peuvent (et doivent) être représentés. C'est à partir de ces niveaux que les contrastes d'intérêts sont réalisés.
Notre échantillon d'observations utilisé pour notre étude comporte souvent des paramètres dont nous connaissons la valeur et qui est propre à cet échantillon et non à la population à laquelle nous voulons généraliser les résultats (e.g. le facteur sujet ou la classe à laquelle appartiennent des enfants). Ce sont donc des paramètres sur lesquels nous ne posons pas d'hypothèse. Ces paramètres relèvent de facteurs et d'effets aléatoires.
Les effets aléatoires peuvent agir sur deux paramètres de la prédiction du comportement par les effets fixes : une déviation de l'intercept ou une déviation de la pente.
Imaginons que nous réalisions une étude chez des enfants sur l'effet de la menace du stéréotype. Dans notre étude, nous présentons un exercice de mathématiques qui est présenté comme soit distinguant les garçons et les filles (condition d'effet de menace du stéréotype), soit comme ne montrant aucune différence entre les garçons et les filles (condition contrôle). Il s'agit de notre première VI (ou facteur expérimental). Notre seconde VI est le genre : nous nous attendons à ce que les filles soient soumises à l'effet de la menace du stéréotype, contrairement aux garçons. Une analyse classique en ANOVA prendrait uniquement ces deux facteurs. Dans un modèle linéaire mixte, ces variables constitueraient des variables fixes pour lesquels nous aimerions tester les effets fixes et généraliser à la population dont est extraite l'échantillon.
Toutefois, imaginons que les enfants soient issus de différentes classes au sein d'une école. Le fait qu'ils appartiennent à différentes classes peut avoir son importance : il y a peut-être un ratio garçons/filles différent en fonction des classes ou en moyenne, certaines classes ont de meilleurs résultats en mathématiques que d'autres. Cette information peut certes avoir son importance, mais elle appartient à l'échantillon et non à la population dont est extrait l'échantillon et ne constitue pas une variable dont nous aimerions tester expérimentalement l'effet. Ce type de variable serait intégrée en tant que variable aléatoire dans un MLM. Plus simplement encore, certaines filles pourraient ne pas être soumises à l'effet de menace du stéréotype ou en tout cas, pas très fortement. Prendre en compte cette variabilité individuelle est aussi possible en tant que variable aléatoire.
Notez qu'un facteur aléatoire peut l'être pour une étude mais pas une autre. Par exemple, le fait que des enfants appartiennent à une classe en particulier peut ne pas faire partie des hypothèses que nous testons et donc, faire partie des variables aléatoires. Par contre, si nous voulons tester l'effet de l'appartenance à une classe (effet d'une pédagogie ou d'un enseignant), cette variable peut devenir une variable fixe.
Alors que les effets fixes représentent des tendances moyennes, les effets aléatoires représentent les déviations de ces tendances en fonction de facteurs catégoriels.
L'un des avantages de cette modélisation est de résoudre le problème de non-indépendance des données. En effet et contrairement aux régressions multiples, l'intercept et la pente de la droite de régression sont adaptés aux valeurs des facteurs aléatoires (e.g. adaptées aux participants et/ou aux items). Ceci peut par exemple permettre de prendre en compte le fait qu'un individu réponde particulièrement rapidement ou qu'un item produise très fréquemment des mauvaises réponses (modulation de l'intercept). Dans la même veine, il est ainsi possible de rendre compte qu'un participant peut subir plus fortement l'effet d'une condition expérimentale qu'un autre (modulation de la pente).
À noter que ces déviations d'intercept et de pente sont supposées suivre une distribution normale.
Caractéristiques | Facteurs fixes | Facteurs aléatoires |
---|---|---|
Nature
Continue ou catégorielle
Catégorielle
Intérêt expérimental
Oui
Non (mais cela peut changer en fonction de l'étude & des hypothèses)
Question posée
Les effets des différents traitements
La variabilité entre les niveaux
Représentation de tous les niveaux possibles
Oui (propre à l'étude)
Non (l'échantillon est extrait d'une population)
Effets fixes
Effets aléatoires
Paramètre
À estimer
Connu
Intérêt dans le modèle
Caractériser la relation comportement/prédicteur
Caractériser les déviations aléatoires propres aux observations
Niveau de représentation
Population
Échantillon