Modèles linéaires mixtes
  • Modèles linéaires mixtes
  • Considération théoriques
    • Terminologie
    • Avantages et inconvénients des modèles linéaires mixtes
    • Modéliser les facteurs aléatoires
    • Conditions d'application des modèles linéaires mixtes
    • Typologie et modélisations
  • Considérations techniques
    • La base de données
    • Le logiciel
  • Stipuler le modèle, le tester
    • L'estimation du modèle
    • Tester des modèles
    • Tester les effets[En construction]
  • Les MLM sous R[En construction]
    • Deux packages
    • Respiration avant de plonger
    • Application au pacakge lme4
  • Bibliographie
Propulsé par GitBook
Sur cette page
  • La base de données
  • L'étude
  • La base de données
  • Démarche
  • Prérequis
  1. Les MLM sous R[En construction]

Respiration avant de plonger

Je pense que c'est le bon moment pour commencer à manipuler concrètement un jeu de données. Pour cela, nous allons traiter la même bdd en utilisant d'abord, le package lme4 puis, le package nlme.

Il y aura pas mal de redondance. Aussi, si vous savez déjà quel package vous voulez utiliser, vous pouvez aller directement à la section correspondante.

La base de données

L'étude

La base de données que nous utiliserons est très largement utilisée dans les tutoriels. Dans cette étude, nous cherchons à prédire la réussite en mathématiques en fonction de différentes variables : le genre, l'âge, la taille de la classe, l'expérience de l'enseignant, etc. L'intérêt de cette étude est qu'elle se base sur un échantillonnage d'écoles puis de classes au sein des différentes écoles puis d'élèves au sein des classes : c'est là tout l'intérêt de la modélisation des facteur aléatoires.

La base de données

Vous avez ici les premières lignes de la bdd :

childid
classid
schoolid
sex
minority
mathgs
mathgain
ses
yearstea
mathknow
housepov
mathprep

1

160

1

1

1

448

32

0.46

1

0.082

2

2

160

1

0

1

460

109

-0.27

1

0.082

2

3

160

1

1

1

511

56

-0.03

1

0.082

2

4

217

1

0

1

449

83

-0.38

2

-0.11

0.082

3.25

5

217

1

0

1

425

53

-0.03

2

-0.11

0.082

3.25

6

217

1

1

1

450

65

0.76

2

-0.11

0.082

3.25

  • childid : identifiants des enfants

  • classid : identifiants des classes

  • schoolid : identifiants des écoles

  • sex : 0 = garçon ; 1 = fille

  • : 0 = élève non issu d'une minorité ethnique ; 1 = élève issu d'une minorité ethnique

  • mathgs : score de l'élève en maths en grande section

  • mathgain : gain sur le score en maths entre la grande section et CP (la VD principale)

  • ses : statut socio-économique de l'élève

  • yearstea : années d'expérience de l'enseignant

  • mathknow : niveau de connaissance en maths de l'enseignant

  • housepov : proportion de foyers dans le quartier de l'école en dessous du seuil de pauvreté

  • mathprep : préparation en mathématiques des enseignants du premier degré : nombre de cours sur le contenu et les méthodes des mathématiques

Démarche

Nous n'utiliserons pas toutes les variables. Ce qui nous intéresse ici n'est pas tant l'hypothèse à tester que la manière de la tester. Au maximum, nous nous efforcerons de prendre des trajectoires similaires avec les deux packages. Ce ne sera pas toujours possible mais les différences seront relativement minimes

Prérequis

Pour mener les analyses dans les sections suivantes, il vous faudra nécessairement :

  • Un ordinateur (windows ou mac mais il faudra adapter vous-même la syntaxe pour ces derniers)

  • La bdd

PrécédentDeux packagesSuivantApplication au pacakge lme4

Dernière mise à jour il y a 2 mois

R