La base de données
À propos de la base de données
Puisque les MLM sont très bons pour représenter statistiquement la réalité des données, il faut leur fournir une base de données la plus proche possible de la réalité.
Quelques règles de base :
La base de données doit être en format long et non en format large. C'est à dire que chaque colonne représente une variable et chaque ligne, une observation pour la modalité de la variable
La base de données ne doit pas être moyennée. Chaque modalité de chaque variable doit être représentée.
Pour une ANOVA, nous moyennons les valeurs de la VD par modalité de la VI. Pour un MLM, nous représentons la valeur de la VD pour CHAQUE item de CHAQUE modalité de la VI pour CHAQUE participant.
Prenons par exemple un cas générique ou des participants doivent produire une réponse (recueillie ici sous forme de temps de réaction) pour des items appartenant soit à une modalité 1, soit à une modalité 2 d'une VI. Il s'agit d'un plan à mesures répétées. Pour une ANOVA, le tableau ressemblerait à ceci :
301
1027.41
1002.06
302
1047.34
1042.53
303
882.67
938.43
Les MLM vont manquer d'informations pour être réellement pertinents. Comme ils sont capables de modéliser la variance pour chaque sujet, chaque réponse, chaque item, autant leur donner l'information détaillée. Elle sera présentée sous cette forme :
301
modalité1
cube
822
301
modalité1
chien
654
301
modalité1
clavier
1223
301
modalité1
clé
486
301
modalité1
poisson
822
301
modalité1
télévision
103
301
modalité1
lettre
1206
301
modalité1
pendule
684
301
modalité2
armoire
321
301
modalité2
jeu
1478
301
modalité2
cinq
148
301
modalité2
clown
500
302
modalité1
viande
1304
Cette modélisation de la base de données permettra de stipuler dans le modèle, les effets aléatoires pour les sujets et pour les items, ce que ne permettait pas la base de données moyennées.
Dernière mise à jour