S'abonner

Données fantômes et régression optimisée (ROP) - 21/08/16

Doi : 10.1016/j.respe.2016.06.255 
J.-M. Nguyen a, , A. Gaultier a, D. Antonioli b
a CHU de Nantes, Nantes, France 
b Atlanpole, Nantes, France 

Auteur correspondant.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

pages 2
Iconographies 0
Vidéos 0
Autres 0

Résumé

Introduction

Nous définissons une donnée fantôme comme étant une variable non colligée et dont la nature et l’identité sont inconnues. Il semble impossible d’imputer une information totalement inconnue. Notre hypothèse est que dans un système biologique, toutes les variables sont reliées entre-elles. Notre objectif est de démontrer qu’un modèle non linéaire tel que la régression optimisée (ROP) permet de construire une information inconnue à partir des autres variables existantes.

Matériel et méthodes

Comme il semble impossible de trouver quelque chose qui n’existe pas, la démonstration nécessite de retirer une variable pertinente pour simuler cette donnée fantôme, de modéliser ce trou d’information, d’évaluer la pertinence de la nouvelle information. Les données publiques ICU.dat seront utilisées. La variable « TYP » sera supprimée et simulera la donnée fantôme qui sera modélisée par le modèle ROP.

Résultats

La régression logistique incluant toutes les variables et l’interaction PO2« * » « TYP » montre un effet significatif de la variable PO2 (p=0,0189), alors que le modèle excluant la variable « TYP » montre que la variable PO2 n’est plus significative (p=0,168). Le modèle ROP a identifié 117/200 patients ayant un coefficient de régression négatif pour la variable PO2, contrairement à son effet moyen. Une nouvelle information est créée pour extraire l’information portée par le cluster des 117 patients et introduite dans le modèle de régression logistique. La nouvelle variable créée ainsi que la variable « PO2 » présentent alors une valeur pronostique (p<0,001, p=0,020).

Conclusion

La nouvelle information créée par le modèle ROP a mimé l’effet de la variable « TYP ».

Tout se passe comme si ROP était capable de créer une nouvelle information pertinente en lien avec la variable « TYP », initialement supprimée. La possibilité d’identifier des« trous » d’informations constitue une innovation méthodologique intéressante pour identifier de nouveaux facteurs de pronostics.

Le texte complet de cet article est disponible en PDF.

Mots clés : Régression optimisée, Régression logistique, Données fantômes, Données complètement manquantes


Plan


© 2016  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 64 - N° S4

P. S236-S237 - septembre 2016 Retour au numéro
Article précédent Article précédent
  • Courbes de croissance ajustées et non ajustées développées sur les naissances en Wallonie et en région bruxelloise, Belgique
  • C. Leroy, C. Senterre, V. Van Leeuw, W.-H. Zhang, Y. Englert
| Article suivant Article suivant
  • Comparaison de deux méthodes statistiques explorant la relation entre régimes alimentaires et risques cardiovasculaires
  • N. Sauvageot, S. Leite, A.-F. Donneau, A. Albert, Z. Faiez, M. Guillaume

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2024 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.