Modèles linéaires mixtes
  • Modèles linéaires mixtes
  • Considération théoriques
    • Terminologie
    • Avantages et inconvénients des modèles linéaires mixtes
    • Modéliser les facteurs aléatoires
    • Conditions d'application des modèles linéaires mixtes
    • Typologie et modélisations
  • Considérations techniques
    • La base de données
    • Le logiciel
  • Stipuler le modèle, le tester
    • L'estimation du modèle
    • Tester des modèles
    • Tester les effets[En construction]
  • Les MLM sous R[En construction]
    • Deux packages
    • Respiration avant de plonger
    • Application au pacakge lme4
  • Bibliographie
Propulsé par GitBook
Sur cette page
  1. Considérations techniques

La base de données

À propos de la base de données

Puisque les MLM sont très bons pour représenter statistiquement la réalité des données, il faut leur fournir une base de données la plus proche possible de la réalité.

Quelques règles de base :

  1. La base de données doit être en format long et non en format large. C'est à dire que chaque colonne représente une variable et chaque ligne, une observation pour la modalité de la variable

  2. La base de données ne doit pas être moyennée. Chaque modalité de chaque variable doit être représentée.

Pour une ANOVA, nous moyennons les valeurs de la VD par modalité de la VI. Pour un MLM, nous représentons la valeur de la VD pour CHAQUE item de CHAQUE modalité de la VI pour CHAQUE participant.

Prenons par exemple un cas générique ou des participants doivent produire une réponse (recueillie ici sous forme de temps de réaction) pour des items appartenant soit à une modalité 1, soit à une modalité 2 d'une VI. Il s'agit d'un plan à mesures répétées. Pour une ANOVA, le tableau ressemblerait à ceci :

Sbj
VI1_Modalité1
VI1_Modalité2

301

1027.41

1002.06

302

1047.34

1042.53

303

882.67

938.43

Les MLM vont manquer d'informations pour être réellement pertinents. Comme ils sont capables de modéliser la variance pour chaque sujet, chaque réponse, chaque item, autant leur donner l'information détaillée. Elle sera présentée sous cette forme :

Sbj
VI
stimulus
VD

301

modalité1

cube

822

301

modalité1

chien

654

301

modalité1

clavier

1223

301

modalité1

clé

486

301

modalité1

poisson

822

301

modalité1

télévision

103

301

modalité1

lettre

1206

301

modalité1

pendule

684

301

modalité2

armoire

321

301

modalité2

jeu

1478

301

modalité2

cinq

148

301

modalité2

clown

500

302

modalité1

viande

1304

Cette modélisation de la base de données permettra de stipuler dans le modèle, les effets aléatoires pour les sujets et pour les items, ce que ne permettait pas la base de données moyennées.

PrécédentConsidérations techniquesSuivantLe logiciel

Dernière mise à jour il y a 2 mois

Les MLM ont fortement intéressés les psycholinguistes par leur capacité à modéliser en une seule fois, les effets au niveau des sujets et les effets au niveau des items. En effet, si on réfléchit bien, une ANOVA vise à généraliser les résultats à une population d'où est tirée l'échantillon. Une ANOVA faite sur la base des temps de réactions des sujets en fonction des conditions expérimentales sont généralisables à la population. Certes, mais qu'en est-il des items ? Qu'est-ce qui nous dit que, par exemple, les effets d'énoncés ironiques sont généralisables à l'ensemble de la "population" des énoncés ironiques ? Pour répondre à cette question, les psycholinguistes étaient fréquemment obligés de réaliser (c-à-d 2 ANOVA). Fastidieux. Les MLM permettent le même travail en un seul modèle et en plus, sans devoir faire les moyennes par sujet et par item. Autrement dit, en travaillant avec une bdd plus proche d'une bdd brute que pour une ANOVA.

une analyse par sujet et une analyse par item