Respiration avant de plonger
Je pense que c'est le bon moment pour commencer à manipuler concrètement un jeu de données. Pour cela, nous allons traiter la même bdd en utilisant d'abord, le package lme4 puis, le package nlme.
Il y aura pas mal de redondance. Aussi, si vous savez déjà quel package vous voulez utiliser, vous pouvez aller directement à la section correspondante.
La base de données
L'étude
La base de données que nous utiliserons est très largement utilisée dans les tutoriels. Dans cette étude, nous cherchons à prédire la réussite en mathématiques en fonction de différentes variables : le genre, l'âge, la taille de la classe, l'expérience de l'enseignant, etc. L'intérêt de cette étude est qu'elle se base sur un échantillonnage d'écoles puis de classes au sein des différentes écoles puis d'élèves au sein des classes : c'est là tout l'intérêt de la modélisation des facteur aléatoires.
La base de données
Vous avez ici les premières lignes de la bdd :
1
160
1
1
1
448
32
0.46
1
0.082
2
2
160
1
0
1
460
109
-0.27
1
0.082
2
3
160
1
1
1
511
56
-0.03
1
0.082
2
4
217
1
0
1
449
83
-0.38
2
-0.11
0.082
3.25
5
217
1
0
1
425
53
-0.03
2
-0.11
0.082
3.25
6
217
1
1
1
450
65
0.76
2
-0.11
0.082
3.25
childid : identifiants des enfants
classid : identifiants des classes
schoolid : identifiants des écoles
sex : 0 = garçon ; 1 = fille
: 0 = élève non issu d'une minorité ethnique ; 1 = élève issu d'une minorité ethnique
mathgs : score de l'élève en maths en grande section
mathgain : gain sur le score en maths entre la grande section et CP (la VD principale)
ses : statut socio-économique de l'élève
yearstea : années d'expérience de l'enseignant
mathknow : niveau de connaissance en maths de l'enseignant
housepov : proportion de foyers dans le quartier de l'école en dessous du seuil de pauvreté
mathprep : préparation en mathématiques des enseignants du premier degré : nombre de cours sur le contenu et les méthodes des mathématiques
Démarche
Nous n'utiliserons pas toutes les variables. Ce qui nous intéresse ici n'est pas tant l'hypothèse à tester que la manière de la tester. Au maximum, nous nous efforcerons de prendre des trajectoires similaires avec les deux packages. Ce ne sera pas toujours possible mais les différences seront relativement minimes
Prérequis
Pour mener les analyses dans les sections suivantes, il vous faudra nécessairement :
Un ordinateur (windows ou mac mais il faudra adapter vous-même la syntaxe pour ces derniers)
La bdd
Dernière mise à jour