S'abonner

Prise en compte de la confusion non-observée dans les études de cohorte : méthode par variables instrumentales pour exposition transversale et marqueur répété - 22/05/21

Doi : 10.1016/j.respe.2021.04.048 
K. Le Bourdonnec , C. Samieri, D. Trégouët, C. Proust-Lima
 Inserm, université de Bordeaux, Bordeaux Population Health, Bordeaux, France 

Auteur correspondant.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
Article gratuit.

Connectez-vous pour en bénéficier!

Résumé

Introduction

La notion de causalité est une question majeure en épidémiologie. Pourtant, la majorité des analyses statistiques classiques s’appuient sur des associations qui ne permettent pas nécessairement d’obtenir une interprétation causale. Pour estimer l’effet causal d’une exposition X sur un évènement d’intérêt Y, différentes méthodes existent comme les analyses pondérées et les régressions ajustées. Mais une des limites de ces méthodes est qu’elles ne prennent pas en considération les facteurs de confusion non-observés. Or, dans beaucoup d’études d’observation, les facteurs de confusion ne sont pas forcément tous mesurés voire certains ne sont pas encore identifiés. Par conséquent, les associations mises en évidence restent sujettes aux biais de confusion ou plus généralement aux problèmes d’endogénéité (ex. causalité inverse). La méthode par variables instrumentales permet de pallier ce biais grâce à l’utilisation d’une variable exogène Z qui, sous certaines hypothèses, permet de recréer le cadre de la randomisation. Lorsque la variable instrumentale est une donnée génétique, on parle alors de randomisation mendélienne. La méthode par variable instrumentale ou randomisation mendélienne a déjà été développée dans de nombreux contextes, toutefois très peu traitent de la situation où la variable d’intérêt Y est répétée.

L’objectif de ce travail est d’introduire la méthode par variables instrumentales au cas d’une exposition transversale et d’une variable d’intérêt répétée dans le temps comme souvent rencontré dans l’analyse des données de cohorte.

Méthodes

Deux méthodes d’estimation sont proposées et comparées, toutes deux considérant un modèle mixte pour la variable d’intérêt Y répétée. La première utilise l’estimation classique en deux étapes (modèle pour X en fonction de Z, prédiction de X, modèle pour Y en fonction de la prédiction de X). La deuxième estime simultanément les modèles pour X et pour Y à l’aide d’une vraisemblance jointe. Au travers de simulations, les deux méthodes sont évaluées et comparées aux méthodes naïves qui ne tiennent pas compte de la confusion non observée. Les méthodes sont aussi appliquées aux données de la cohorte 3C afin d’étudier la nature de la relation entre le statut diabétique des participants à l’inclusion dans la cohorte et leur évolution cognitive, en utilisant 42 polymorphismes génétiques comme variable instrumentale.

Résultats

Les résultats de nos simulations confirment qu’en présence de facteurs de confusion omis, la méthode naïve fournit des estimations biaisées de l’effet causal au contraire des méthodes par variables instrumentales. Cependant, nous montrons aussi les limites de ces dernières méthodes lorsqu’elles sont faiblement prédictrices de l’exposition. Appliquée à l’étude de l’association entre diabète et déclin cognitif, nous constatons des résultats opposés entre l’approche par variables instrumentales et les méthodes naïves pouvant être liés à de la confusion non observée ou à des possibles problèmes de causalité inverse.

Conclusion

Les analyses par variables instrumentales sont une solution intéressante pour appréhender le problème d’endogénéité dans les études épidémiologiques. Elles doivent cependant être utilisées avec précaution car elles reposent sur des hypothèses fortes, notamment sur le caractère totalement exogène de la variable instrumentale et son pouvoir prédictif, qui ne sont pas toujours vérifiables en pratique.

Le texte complet de cet article est disponible en PDF.

Mots clés : Causalité, Variable instrumentale, Données répétées, Étude de cohorte, Modèle mixte


Plan


© 2021  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 69 - N° S1

P. S29-S30 - juin 2021 Retour au numéro
Article précédent Article précédent
  • Correction de la mortalité attendue avec une fragilité individuelle pour une meilleure estimation de la survie nette et du délai de guérison à partir d’un modèle de guérison de non-mélange
  • J. Goungounga, O. Boussari, A. Bouvier, V. Jooste
| Article suivant Article suivant
  • Le risque rénal dans les maladies inflammatoires chroniques de l’intestin (MICI), l’incidence et les causes - L’éclairage des données du Système national des données de santé
  • H. Achit, L. Peyrin-Biroulet, A. Ayav, F. Guillemin, L. Frimat

Bienvenue sur EM-consulte, la référence des professionnels de santé.

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2024 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.