Données fantômes et régression optimisée (ROP) - 09/05/16
pages | 2 |
Iconographies | 0 |
Vidéos | 0 |
Autres | 0 |
Résumé |
Introduction |
Nous définissons une donnée fantôme comme étant une variable non colligée et dont la nature et l’identité sont inconnues. Il n’existe pas de méthode permettant d’imputer une information totalement inconnue. Notre hypothèse est que dans un système biologique, toutes les variables sont reliées entre-elles, mais cette relation n’est pas forcément linéaire. Notre objectif est de démontrer qu’un modèle non linéaire comme le modèle régression optimisée (ROP) est capable de reconstruire une information inconnue à partir des autres variables existantes, sans utiliser des variables de confusion.
Méthodes |
Comme il semble impossible de trouver une information qui n’existe pas, la démonstration nécessite de retirer une variable pertinente pour simuler cette donnée fantôme, de modéliser ce trou d’information par le modèle ROP, d’évaluer la pertinence de cette nouvelle information par la régression logistique. Les données publiques ICU.dat seront utilisées. La variable « TYP » sera supprimée et simulera la donnée fantôme qui sera modélisée par le modèle ROP.
Résultats |
Le modèle de régression logistique incluant les variables PO2 et « TYP » ainsi que leur interaction montre un effet significatif de la variable PO2 (p=0,0189), alors que le modèle excluant la variable « TYP » confirme que la variable PO2 n’est plus significative (p=0,168). Le modèle ROP identifie un cluster de 117 patients pour lesquels le coefficient de régression du modèle ROP pour la variable PO2 est négative, alors que l’effet moyen de cette variable augment le risque de l’état Y. Ces 117 patients sont donc porteurs d’une information expliquant la variabilité de l’effet de la variable PO2 et donc en lien avec la variable « TYP » absente des données analysées. Une nouvelle information dichotomique est crée pour traduire l’information portée par le cluster des 117 patients et introduite dans le modèle de régression logistique qui montre un effet significatif de la variable « PO2 » (p=0,020). De plus, il existe une relation significative entre la nouvelle information créée par ROP et la variable « TYP » initialement ôtée des données analysées (p=0,003).
Conclusion |
La nouvelle information crée par le modèle ROP a permis de retrouver l’effet significatif de la variable PO2. Cette information est corrélée à la variable ôtée. Tout se passe comme si ROP était capable de créer une nouvelle information pertinente en lien avec un facteur inconnu et non colligé.
Le texte complet de cet article est disponible en PDF.Mots clés : Données complètement absentes et inconnues, Données fantômes, Régression optimisée
Plan
Vol 64 - N° S3
P. S155-S156 - mai 2016 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.
Déjà abonné à cette revue ?