Médecine

Paramédical

Autres domaines


S'abonner

Nouveautés en modélisation non paramétrique - Apports du Super Learner - 07/08/14

Doi : 10.1016/j.respe.2014.06.004 
R. Pirracchio a, b
a SAR HEGP, Inserm 1153, Paris, France 
b Division of Biostatistics, UC Berkeley, États-Unis 

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement ou un achat à l’unité.

pages 2
Iconographies 0
Vidéos 0
Autres 0

Résumé

Dans nombres de situations, en particulier cliniques, les hypothèses sous-jacentes à l’utilisation de modèles paramétriques paraissent inacceptables. Dans ce contexte, de tels modèles convergent en dépit de l’augmentation de la taille des effectifs vers des estimations ou des prédictions intrinsèquement biaisées. Les modèles non-paramétriques peuvent constituer une alternative intéressante dans ce contexte. Néanmoins, il existe certaines limites à l’approche non-paramétrique. Premièrement, ces modèles sont associés à des taux de convergence plus lent, ce qui limite leurs performances sur échantillons finis. Deuxièmement, si les données à modéliser suivent en réalité une loi paramétrique, alors toute tentative de modélisation basée sur des algorithmes non paramétriques sera associée à un taux de convergence plus lent que la modèle paramétrique adapté. Enfin, il existe à ce jour de nombreux modèles non paramétriques, de telle sorte que la décision de choisir l’un plus que l’autre remet l’utilisateur dans la situation de faire une hypothèse sur la meilleure façon de modéliser ses données.

Le principe du Super Learner est de ne faire aucune hypothèse en fournissant une libraire la plus riche possible en modèles paramétriques et non paramétriques. L’algorithme détermine ensuite à partir des données en utilisant la validation croisée et une fonction de perte appropriée quel est, au sein de la librairie, le modèle le plus adapté pour modéliser les données. Les modèles sont classés en fonction de leur performance et un nouvel algorithme hybride et orignal est construit sous la forme d’une combinaison pondérée des meilleurs modèles inclus dans la librairie. Les performances théoriques et empiriques du Super Learner ont fait l’objet de validations préalables.

Nous montrons dans le présent travail que l’utilisation du Super Learner pour diverses questions pratiques épidémiologie clinique est associée à des résultats intéressants. Nous montrons par exemple l’intérêt d’une telle approche pour modéliser la mortalité en réanimation ou pour estimer le score de propension dans le cadre de l’estimation d’un paramètre causal en présence de données observationnelle.

Le texte complet de cet article est disponible en PDF.

Mot clé : Modélisation


Plan


© 2014  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 62 - N° S5

P. S171-S172 - septembre 2014 Retour au numéro
Article précédent Article précédent
  • Y a-t-il une place pour le raisonnement par l’absurde dans l’Evidence Based Medicine ?
  • F. Naudet
| Article suivant Article suivant
  • Contrôle du taux de faux positifs de biomarqueurs prédictifs dans un essai de phase III
  • F. Rotolo, S. Michiels

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement ou un achat à l’unité.

L'accès au texte intégral de cet article nécessite un abonnement ou un achat à l'unité.

Déjà abonné à cette revue ?

;

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.