Respiration avant de plonger

Je pense que c'est le bon moment pour commencer à manipuler concrètement un jeu de données. Pour cela, nous allons traiter la même bdd en utilisant d'abord, le package lme4 puis, le package nlme.

Il y aura pas mal de redondance. Aussi, si vous savez déjà quel package vous voulez utiliser, vous pouvez aller directement à la section correspondante.

La base de données

L'étude

La base de données que nous utiliserons est très largement utilisée dans les tutoriels. Dans cette étude, nous cherchons à prédire la réussite en mathématiques en fonction de différentes variables : le genre, l'âge, la taille de la classe, l'expérience de l'enseignant, etc. L'intérêt de cette étude est qu'elle se base sur un échantillonnage d'écoles puis de classes au sein des différentes écoles puis d'élèves au sein des classes : c'est là tout l'intérêt de la modélisation des facteur aléatoires.

La base de données

Vous avez ici les premières lignes de la bdd :

childid

classid

schoolid

sex

minority

mathgs

mathgain

ses

yearstea

mathknow

housepov

mathprep

160

448

0.46

0.082

160

460

109

-0.27

0.082

160

511

-0.03

0.082

217

449

-0.38

-0.11

0.082

3.25

217

425

-0.03

-0.11

0.082

3.25

217

450

0.76

-0.11

0.082

3.25

childid : identifiants des enfants
classid : identifiants des classes
schoolid : identifiants des écoles
sex : 0 = garçon ; 1 = fille
minority : 0 = élève non issu d'une minorité ethnique ; 1 = élève issu d'une minorité ethnique
mathgs : score de l'élève en maths en grande section
mathgain : gain sur le score en maths entre la grande section et CP (la VD principale)
ses : statut socio-économique de l'élève
yearstea : années d'expérience de l'enseignant
mathknow : niveau de connaissance en maths de l'enseignant
housepov : proportion de foyers dans le quartier de l'école en dessous du seuil de pauvreté
mathprep : préparation en mathématiques des enseignants du premier degré : nombre de cours sur le contenu et les méthodes des mathématiques

Démarche

Nous n'utiliserons pas toutes les variables. Ce qui nous intéresse ici n'est pas tant l'hypothèse à tester que la manière de la tester. Au maximum, nous nous efforcerons de prendre des trajectoires similaires avec les deux packages. Ce ne sera pas toujours possible mais les différences seront relativement minimes

Prérequis

Pour mener les analyses dans les sections suivantes, il vous faudra nécessairement :

Un ordinateur (windows ou mac mais il faudra adapter vous-même la syntaxe pour ces derniers)
R
La bdd

PrécédentDeux packages SuivantApplication au pacakge lme4

Mis à jour il y a 11 mois

hashtagLa base de données

hashtagL'étude

hashtagLa base de données

hashtagDémarche

hashtagPrérequis

La base de données

L'étude

La base de données

Démarche

Prérequis