Nouveautés en modélisation non paramétrique - Apports du Super Learner - 07/08/14

Doi : 10.1016/j.respe.2014.06.004

R. Pirracchio ^a,^b
^a SAR HEGP, Inserm 1153, Paris, France
^b Division of Biostatistics, UC Berkeley, États-Unis

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

pages	2
Iconographies	0
Vidéos	0
Autres	0

Résumé

Dans nombres de situations, en particulier cliniques, les hypothèses sous-jacentes à l’utilisation de modèles paramétriques paraissent inacceptables. Dans ce contexte, de tels modèles convergent en dépit de l’augmentation de la taille des effectifs vers des estimations ou des prédictions intrinsèquement biaisées. Les modèles non-paramétriques peuvent constituer une alternative intéressante dans ce contexte. Néanmoins, il existe certaines limites à l’approche non-paramétrique. Premièrement, ces modèles sont associés à des taux de convergence plus lent, ce qui limite leurs performances sur échantillons finis. Deuxièmement, si les données à modéliser suivent en réalité une loi paramétrique, alors toute tentative de modélisation basée sur des algorithmes non paramétriques sera associée à un taux de convergence plus lent que la modèle paramétrique adapté. Enfin, il existe à ce jour de nombreux modèles non paramétriques, de telle sorte que la décision de choisir l’un plus que l’autre remet l’utilisateur dans la situation de faire une hypothèse sur la meilleure façon de modéliser ses données.

Le principe du Super Learner est de ne faire aucune hypothèse en fournissant une libraire la plus riche possible en modèles paramétriques et non paramétriques. L’algorithme détermine ensuite à partir des données en utilisant la validation croisée et une fonction de perte appropriée quel est, au sein de la librairie, le modèle le plus adapté pour modéliser les données. Les modèles sont classés en fonction de leur performance et un nouvel algorithme hybride et orignal est construit sous la forme d’une combinaison pondérée des meilleurs modèles inclus dans la librairie. Les performances théoriques et empiriques du Super Learner ont fait l’objet de validations préalables.

Nous montrons dans le présent travail que l’utilisation du Super Learner pour diverses questions pratiques épidémiologie clinique est associée à des résultats intéressants. Nous montrons par exemple l’intérêt d’une telle approche pour modéliser la mortalité en réanimation ou pour estimer le score de propension dans le cadre de l’estimation d’un paramètre causal en présence de données observationnelle.

Le texte complet de cet article est disponible en PDF.

Mot clé : Modélisation

Plan

Déclaration d’intérêts

Export

Vol 62 - N° S5

P. S171-S172 - septembre 2014 Retour au numéro

Article précédent

Y a-t-il une place pour le raisonnement par l’absurde dans l’Evidence Based Medicine ?
F. Naudet

| Article suivant

Contrôle du taux de faux positifs de biomarqueurs prédictifs dans un essai de phase III
F. Rotolo, S. Michiels

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.

Déjà abonné à cette revue ?

connectez-vous ou créez un compte

Nouveautés en modélisation non paramétrique - Apports du Super Learner - 07/08/14

Résumé

Plan

Export citations

Fichier

Contenu

Accès rapides

Mon compte

Aide & support

Plateformes Elsevier Masson

Déclaration CNIL