Nouveautés en modélisation non paramétrique - Apports du Super Learner - 07/08/14
pages | 2 |
Iconographies | 0 |
Vidéos | 0 |
Autres | 0 |
Résumé |
Dans nombres de situations, en particulier cliniques, les hypothèses sous-jacentes à l’utilisation de modèles paramétriques paraissent inacceptables. Dans ce contexte, de tels modèles convergent en dépit de l’augmentation de la taille des effectifs vers des estimations ou des prédictions intrinsèquement biaisées. Les modèles non-paramétriques peuvent constituer une alternative intéressante dans ce contexte. Néanmoins, il existe certaines limites à l’approche non-paramétrique. Premièrement, ces modèles sont associés à des taux de convergence plus lent, ce qui limite leurs performances sur échantillons finis. Deuxièmement, si les données à modéliser suivent en réalité une loi paramétrique, alors toute tentative de modélisation basée sur des algorithmes non paramétriques sera associée à un taux de convergence plus lent que la modèle paramétrique adapté. Enfin, il existe à ce jour de nombreux modèles non paramétriques, de telle sorte que la décision de choisir l’un plus que l’autre remet l’utilisateur dans la situation de faire une hypothèse sur la meilleure façon de modéliser ses données.
Le principe du Super Learner est de ne faire aucune hypothèse en fournissant une libraire la plus riche possible en modèles paramétriques et non paramétriques. L’algorithme détermine ensuite à partir des données en utilisant la validation croisée et une fonction de perte appropriée quel est, au sein de la librairie, le modèle le plus adapté pour modéliser les données. Les modèles sont classés en fonction de leur performance et un nouvel algorithme hybride et orignal est construit sous la forme d’une combinaison pondérée des meilleurs modèles inclus dans la librairie. Les performances théoriques et empiriques du Super Learner ont fait l’objet de validations préalables.
Nous montrons dans le présent travail que l’utilisation du Super Learner pour diverses questions pratiques épidémiologie clinique est associée à des résultats intéressants. Nous montrons par exemple l’intérêt d’une telle approche pour modéliser la mortalité en réanimation ou pour estimer le score de propension dans le cadre de l’estimation d’un paramètre causal en présence de données observationnelle.
Le texte complet de cet article est disponible en PDF.Mot clé : Modélisation
Plan
Vol 62 - N° S5
P. S171-S172 - septembre 2014 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.
Déjà abonné à cette revue ?