Données fantômes et régression optimisée (ROP) - 21/08/16
pages | 2 |
Iconographies | 0 |
Vidéos | 0 |
Autres | 0 |
Résumé |
Introduction |
Nous définissons une donnée fantôme comme étant une variable non colligée et dont la nature et l’identité sont inconnues. Il semble impossible d’imputer une information totalement inconnue. Notre hypothèse est que dans un système biologique, toutes les variables sont reliées entre-elles. Notre objectif est de démontrer qu’un modèle non linéaire tel que la régression optimisée (ROP) permet de construire une information inconnue à partir des autres variables existantes.
Matériel et méthodes |
Comme il semble impossible de trouver quelque chose qui n’existe pas, la démonstration nécessite de retirer une variable pertinente pour simuler cette donnée fantôme, de modéliser ce trou d’information, d’évaluer la pertinence de la nouvelle information. Les données publiques ICU.dat seront utilisées. La variable « TYP » sera supprimée et simulera la donnée fantôme qui sera modélisée par le modèle ROP.
Résultats |
La régression logistique incluant toutes les variables et l’interaction PO2« * » « TYP » montre un effet significatif de la variable PO2 (p=0,0189), alors que le modèle excluant la variable « TYP » montre que la variable PO2 n’est plus significative (p=0,168). Le modèle ROP a identifié 117/200 patients ayant un coefficient de régression négatif pour la variable PO2, contrairement à son effet moyen. Une nouvelle information est créée pour extraire l’information portée par le cluster des 117 patients et introduite dans le modèle de régression logistique. La nouvelle variable créée ainsi que la variable « PO2 » présentent alors une valeur pronostique (p<0,001, p=0,020).
Conclusion |
La nouvelle information créée par le modèle ROP a mimé l’effet de la variable « TYP ».
Tout se passe comme si ROP était capable de créer une nouvelle information pertinente en lien avec la variable « TYP », initialement supprimée. La possibilité d’identifier des« trous » d’informations constitue une innovation méthodologique intéressante pour identifier de nouveaux facteurs de pronostics.
Le texte complet de cet article est disponible en PDF.Mots clés : Régression optimisée, Régression logistique, Données fantômes, Données complètement manquantes
Plan
Vol 64 - N° S4
P. S236-S237 - septembre 2016 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.
Déjà abonné à cette revue ?