S'abonner

Données fantômes et régression optimisée (ROP) - 09/05/16

Doi : 10.1016/j.respe.2016.03.097 
J.-M. Nguyen a, , A. Gaultier b, D. Antonioli c
a CRCNA, Inserm U892, unité CNRS 6299, Nantes, France 
b SEME, CHU de Nantes, hôpital Saint-Jacques, Nantes, France 
c Centre hospitalier Daumézon, Nantes, France 

Auteur correspondant.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

pages 2
Iconographies 0
Vidéos 0
Autres 0

Résumé

Introduction

Nous définissons une donnée fantôme comme étant une variable non colligée et dont la nature et l’identité sont inconnues. Il n’existe pas de méthode permettant d’imputer une information totalement inconnue. Notre hypothèse est que dans un système biologique, toutes les variables sont reliées entre-elles, mais cette relation n’est pas forcément linéaire. Notre objectif est de démontrer qu’un modèle non linéaire comme le modèle régression optimisée (ROP) est capable de reconstruire une information inconnue à partir des autres variables existantes, sans utiliser des variables de confusion.

Méthodes

Comme il semble impossible de trouver une information qui n’existe pas, la démonstration nécessite de retirer une variable pertinente pour simuler cette donnée fantôme, de modéliser ce trou d’information par le modèle ROP, d’évaluer la pertinence de cette nouvelle information par la régression logistique. Les données publiques ICU.dat seront utilisées. La variable « TYP » sera supprimée et simulera la donnée fantôme qui sera modélisée par le modèle ROP.

Résultats

Le modèle de régression logistique incluant les variables PO2 et « TYP » ainsi que leur interaction montre un effet significatif de la variable PO2 (p=0,0189), alors que le modèle excluant la variable « TYP » confirme que la variable PO2 n’est plus significative (p=0,168). Le modèle ROP identifie un cluster de 117 patients pour lesquels le coefficient de régression du modèle ROP pour la variable PO2 est négative, alors que l’effet moyen de cette variable augment le risque de l’état Y. Ces 117 patients sont donc porteurs d’une information expliquant la variabilité de l’effet de la variable PO2 et donc en lien avec la variable « TYP » absente des données analysées. Une nouvelle information dichotomique est crée pour traduire l’information portée par le cluster des 117 patients et introduite dans le modèle de régression logistique qui montre un effet significatif de la variable « PO2 » (p=0,020). De plus, il existe une relation significative entre la nouvelle information créée par ROP et la variable « TYP » initialement ôtée des données analysées (p=0,003).

Conclusion

La nouvelle information crée par le modèle ROP a permis de retrouver l’effet significatif de la variable PO2. Cette information est corrélée à la variable ôtée. Tout se passe comme si ROP était capable de créer une nouvelle information pertinente en lien avec un facteur inconnu et non colligé.

Le texte complet de cet article est disponible en PDF.

Mots clés : Données complètement absentes et inconnues, Données fantômes, Régression optimisée


Plan


© 2016  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 64 - N° S3

P. S155-S156 - mai 2016 Retour au numéro
Article précédent Article précédent
  • Évaluation du coût de la prise en charge de la leucémie myéloïde chronique en Midi-Pyrénées
  • M. Mounié, N. Costa, M. Gauthier, A. Palmaro, C. Delpierre, F. Despas, M. Lapeyre Mestre, G. Laurent, N. Savy, L. Molinier
| Article suivant Article suivant
  • Effet de la norfloxacine sur la survie des malades atteints de cirrhose Child-Pugh C : essai contrôlé randomisé avec prise en compte des risques compétitifs
  • B. Pasquet, L. Elkrief, P.-E. Rautou, F. Tubach, R. Moreau, Y. De Rycke, N. Gault

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2024 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.