Stratégie d’imputation de données manquantes d’une variable catégorielle combinée comme facteur de risque potentiel d’évènements thromboemboliques - 09/05/16
pages | 2 |
Iconographies | 0 |
Vidéos | 0 |
Autres | 0 |
Résumé |
Introduction |
Lors de la réalisation d’analyses multivariées, les données manquantes sur de potentiels facteurs explicatifs sont une véritable problématique clinique et statistique. Plusieurs solutions sont proposées pour gérer ces valeurs manquantes. La première est de construire le modèle multivarié avec tous les facteurs potentiels, y compris ceux contenant des valeurs manquantes entraînant l’exclusion des patients de l’analyse, une perte de puissance et un biais possible si les données manquantes sont missing not at random (MNAR). La seconde approche consiste à ne pas inclure dans le modèle multivarié les facteurs potentiels entachés de données manquantes, le risque étant alors de se priver d’un facteur potentiellement pertinent. La dernière possibilité est d’imputer les données manquantes, à l’aide notamment des méthodes d’imputations multiples. Nous proposons ici une stratégie d’imputation d’un facteur de risque potentiel qui s’exprime par une variable catégorielle combinée construite à partir de deux autres variables quantitatives mesurées par l’échographie cardiaque.
Méthodes |
À partir d’une étude de 371 patients, nous souhaitions déterminer les facteurs prédictifs d’évènements thromboemboliques veineux à 42 mois. Le facteur de risque potentiel « retentissement cardiaque » était manquant chez 223 patients. L’étude de la nature des données manquantes nous a permis de distinguer deux situations : des données manquantes car l’échographie cardiaque n’avait pas été réalisée, et des données manquantes car les données de l’échographie cardiaque n’avaient pas été enregistrées. Pour la première situation, les 145 données manquantes ont été considérées comme MNAR car les cliniciens ont précisé que la prescription de l’échographie cardiaque était liée à la probabilité de déceler un retentissement cardiaque et inversement. Pour la deuxième situation, le facteur « retentissement cardiaque » était manquant pour 78 patients et ces données ont été considérées missing not at random (MAR). L’imputation de ces données a été faite selon deux méthodes d’imputation multiple par équations chaînées (MICE) : soit en imputant les deux variables quantitatives permettant la construction de la variable de retentissement cardiaque (Markov Chain Monte-Carlo [MCMC]), soit en imputant directement la variable catégorielle (fully conditional specification [FCS]).
Résultat |
Sans imputation (148 patients disponibles), le retentissement cardiaque était associé au risque d’événements thromboemboliques avec un hazard ratio (HR) de 0,93 [IC95 %, 0,36 ; 2,43]. Suite à l’imputation des données MNAR selon la démarche clinique (pas d’examen échographique signifie pas de retentissement cardiaque), l’analyse a porté sur 293 patients. L’estimation du HR pour le retentissement cardiaque était alors de 1,73 [1,00 ; 2,96]. Les variables centre, âge, sexe, indice de masse corporelle, antécédent cardiaque et maladie respiratoire chronique ont été prises en compte dans les modèles MICE pour imputer les données manquantes MAR restantes. À partir des données des 371 patients, l’estimation avec la méthode d’imputation de chacune des variables quantitatives composant le critère combiné « retentissement cardiaque » fournissait un HR de 1,56 [0,92 ; 2,63] et un HR de 1,62 [0,97 ; 2,71] en imputant le critère combiné directement de façon catégorielle.
Conclusion |
Le résultat observé lors de l’imputation des données MNAR confirme bien la nature MNAR des données manquantes. Concernant les données MAR, l’imputation du retentissement cardiaque avec les deux variables quantitatives ou avec la variable combinée catégorielle donnent un résultat identique. L’imputation selon un arbre décisionnel basé sur le flow chart pourrait recommander pour réaliser des imputations adaptées à la nature des données manquantes.
Le texte complet de cet article est disponible en PDF.Mots clés : Données manquantes, Imputation, Critère combiné, Facteur prédictif
Plan
Vol 64 - N° S3
P. S157-S158 - mai 2016 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.
Déjà abonné à cette revue ?