Médecine

Paramédical

Autres domaines


S'abonner

Calcul du nombre de sujets nécessaire dans le contexte d’analyse du microbiome - 19/04/19

Doi : 10.1016/j.respe.2019.03.103 
R. Coueron a, , H. Savel a, B.P. Hejblum b
a CHU de Bordeaux, Pôle de santé publique, Unité de soutien méthodologique à la recherche clinique et épidémiologique (USMR) et CIC-EC 14-01, Bordeaux, France 
b University Bordeaux, ISPED, Inserm Bordeaux Population Health Research Center, UMR 1219, Inria SISTM, Bordeaux, France 

Auteur correspondant.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
Article gratuit.

Connectez-vous pour en bénéficier!

Résumé

Introduction

Le microbiote est l’ensemble des micro-organismes (bactéries, levures, champignons, virus) vivant dans un environnement spécifique (appelé microbiome) chez un hôte. Dans la majorité des essais portant sur ce sujet, l’objectif principal est d’identifier les micro-organismes dont l’abondance est modifiée selon une condition, comme par exemple la présence d’une pathologie ou la prise d’un traitement. La composition du microbiote est mesurée par le séquençage de l’expression du gène 16S, ce qui en fait des données compositionnelles de grande dimension. Ces spécificités sont à prendre en compte lors de l’analyse, ce qui nécessite l’utilisation de méthodes statistiques adaptées. Actuellement, il n’existe pas de méthode d’estimation de taille d’étude qui soit en adéquation avec les méthodes utilisées pour l’analyse de ce type de données. Notre objectif est de proposer une méthode d’estimation de taille d’étude cohérente avec la stratégie d’analyse pour l’étude du microbiote.

Méthode

La méthode proposée se décompose en deux étapes. Dans un premier temps, des jeux de données d’abondance artificiels sont générés à partir des abondances d’une étude pilote du microbiote sous forme de matrices de comptes, avec différents paramètres dont les valeurs sont fixées : la taille d’étude, l’effet minimum à mettre en évidence (différence exprimée sous la forme de « fold change »), et la proportion de micro-organismes dont l’abondance est modifiée selon la condition. Dans un second temps, la méthode ALDEx2 [1] est appliquée sur chacune des matrices de comptes simulées. Une puissance de détection d’abondance différentielle est ensuite calculée à partir des micro-organismes ayant été simulés pour avoir une abondance différente, et la moyenne des puissances obtenue sur l’ensemble des simulations estime la puissance attendue, pour les paramètres utilisés.

Résultats

Supposons que l’on souhaite mettre en évidence une sur-abondance de 10 % des micro-organismes après l’initiation d’un traitement et une multiplication des abondances relatives par 5 de ces micro-organismes avec une puissance statistique de 80 %. Sous ces hypothèses, en utilisant les données d’une étude pilote où l’on a séquencé 576 micro-organismes présents dans l’intestin il faut alors inclure 60 patients. Pour une taille d’étude fixée, les résultats obtenus montrent que plus l’effet minimum à mettre en évidence est grand, plus la puissance de détection est élevée. De même, pour un nombre de sujets fixé, plus la proportion de micro-organismes dont l’abondance est modifiée suite à un évènement est élevée, plus la puissance de détection est grande.

Conclusion

Le développement d’un package R implémentant une méthode de calcul de taille d’étude en adéquation avec les méthodes d’analyse réalisées in fine est un outil indispensable au montage des projets de microbiome. En parallèle, la constitution d’une banque de données d’étude pilote serait un atout majeur car elle permettrait à l’utilisateur de disposer de données, les plus proches possibles de sa question de recherche.

Le texte complet de cet article est disponible en PDF.

Mots clés : Taille d’étude, Microbiome, Abondance différentielle, ALDEx2


Plan


© 2019  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 67 - N° S3

P. S135-S136 - mai 2019 Retour au numéro
Article précédent Article précédent
  • Comparaison de différentes méthodes d’apprentissage non-supervisées dans le cas de données de grandes dimensions. Application dans le cancer du sein
  • J. Gal, C. Bailleux, D. Chardin, T. Pourcher, R. Schiappa, J. Gilhodes, O. Humbert, E. Chamorey
| Article suivant Article suivant
  • Modèles à classes latentes : la solution miracle en présence d’un test diagnostique de référence imparfait ?
  • J. Asselineau, J. Naredo Turrado, C. Proust-Lima

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.