S'abonner

Stratégie d’imputation de données manquantes d’une variable catégorielle combinée comme facteur de risque potentiel d’évènements thromboemboliques - 09/05/16

Doi : 10.1016/j.respe.2016.03.101 
E. Presles a, , C. Chapelle b, F. Couturaud c, O. Sanchez d, L. Bertoletti e, S. Laporte f
a CIC Inserm 1408, unité de recherche clinique, innovation, pharmacologie, CHU Saint-Étienne, Inserm UMR 1059 équipe DVH, université Jean-Monnet, France 
b Unité de recherche clinique, innovation, pharmacologie, CHU Saint-Étienne, Inserm UMR 1059 équipe DVH, université Jean-Monnet, France 
c Département de médecine interne et pneumologie, CHU de Brest, université de Bretagne Occidentale, EA 3878, CIC Inserm 1412, France 
d Service de pneumologie, hôpital européen Georges-Pompidou, AP–HP, université Paris Descartes, Inserm UMR-S 970, France 
e Service de médecine vasculaire et thérapeutique, unité de pharmacologie clinique, CIC Inserm 1408, CHU de Saint-Étienne, Inserm UMR 1059 équipe DVH, université Jean-Monnet, France 
f Unité de recherche clinique, innovation, pharmacologie, CHU Saint-Étienne, Inserm UMR 1059 équipe DVH, université Jean-Monnet, CIC Inserm 1408, France 

Auteur correspondant.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

pages 2
Iconographies 0
Vidéos 0
Autres 0

Résumé

Introduction

Lors de la réalisation d’analyses multivariées, les données manquantes sur de potentiels facteurs explicatifs sont une véritable problématique clinique et statistique. Plusieurs solutions sont proposées pour gérer ces valeurs manquantes. La première est de construire le modèle multivarié avec tous les facteurs potentiels, y compris ceux contenant des valeurs manquantes entraînant l’exclusion des patients de l’analyse, une perte de puissance et un biais possible si les données manquantes sont missing not at random (MNAR). La seconde approche consiste à ne pas inclure dans le modèle multivarié les facteurs potentiels entachés de données manquantes, le risque étant alors de se priver d’un facteur potentiellement pertinent. La dernière possibilité est d’imputer les données manquantes, à l’aide notamment des méthodes d’imputations multiples. Nous proposons ici une stratégie d’imputation d’un facteur de risque potentiel qui s’exprime par une variable catégorielle combinée construite à partir de deux autres variables quantitatives mesurées par l’échographie cardiaque.

Méthodes

À partir d’une étude de 371 patients, nous souhaitions déterminer les facteurs prédictifs d’évènements thromboemboliques veineux à 42 mois. Le facteur de risque potentiel « retentissement cardiaque » était manquant chez 223 patients. L’étude de la nature des données manquantes nous a permis de distinguer deux situations : des données manquantes car l’échographie cardiaque n’avait pas été réalisée, et des données manquantes car les données de l’échographie cardiaque n’avaient pas été enregistrées. Pour la première situation, les 145 données manquantes ont été considérées comme MNAR car les cliniciens ont précisé que la prescription de l’échographie cardiaque était liée à la probabilité de déceler un retentissement cardiaque et inversement. Pour la deuxième situation, le facteur « retentissement cardiaque » était manquant pour 78 patients et ces données ont été considérées missing not at random (MAR). L’imputation de ces données a été faite selon deux méthodes d’imputation multiple par équations chaînées (MICE) : soit en imputant les deux variables quantitatives permettant la construction de la variable de retentissement cardiaque (Markov Chain Monte-Carlo [MCMC]), soit en imputant directement la variable catégorielle (fully conditional specification [FCS]).

Résultat

Sans imputation (148 patients disponibles), le retentissement cardiaque était associé au risque d’événements thromboemboliques avec un hazard ratio (HR) de 0,93 [IC95 %, 0,36 ; 2,43]. Suite à l’imputation des données MNAR selon la démarche clinique (pas d’examen échographique signifie pas de retentissement cardiaque), l’analyse a porté sur 293 patients. L’estimation du HR pour le retentissement cardiaque était alors de 1,73 [1,00 ; 2,96]. Les variables centre, âge, sexe, indice de masse corporelle, antécédent cardiaque et maladie respiratoire chronique ont été prises en compte dans les modèles MICE pour imputer les données manquantes MAR restantes. À partir des données des 371 patients, l’estimation avec la méthode d’imputation de chacune des variables quantitatives composant le critère combiné « retentissement cardiaque » fournissait un HR de 1,56 [0,92 ; 2,63] et un HR de 1,62 [0,97 ; 2,71] en imputant le critère combiné directement de façon catégorielle.

Conclusion

Le résultat observé lors de l’imputation des données MNAR confirme bien la nature MNAR des données manquantes. Concernant les données MAR, l’imputation du retentissement cardiaque avec les deux variables quantitatives ou avec la variable combinée catégorielle donnent un résultat identique. L’imputation selon un arbre décisionnel basé sur le flow chart pourrait recommander pour réaliser des imputations adaptées à la nature des données manquantes.

Le texte complet de cet article est disponible en PDF.

Mots clés : Données manquantes, Imputation, Critère combiné, Facteur prédictif


Plan


© 2016  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 64 - N° S3

P. S157-S158 - mai 2016 Retour au numéro
Article précédent Article précédent
  • Développement d’indicateurs de pertinence des prescriptions d’anticoagulants oraux en médecine adulte : revue de littérature et consensus européen de type Delphi modifié (étude PACHA)
  • A. Petit-Monéger, F. Thiessard, F. Saillour-Glénisson, P. Noize, D. Berdaï, V. Jouhet, L.-R. Salmi
| Article suivant Article suivant
  • Intérêt des méta-analyses en réseau sur données individuelles de survie en oncologie : l’exemple de l’association chimiothérapie et la radiothérapie dans le cancer du nasopharynx
  • L. Ribassin-Majed, S. Marg, C. Landais, S. Michi, J.-P. Pig, P. Blanch

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2024 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.