Calcul du nombre de sujets nécessaire dans le contexte d’analyse du microbiome - 19/04/19
Résumé |
Introduction |
Le microbiote est l’ensemble des micro-organismes (bactéries, levures, champignons, virus) vivant dans un environnement spécifique (appelé microbiome) chez un hôte. Dans la majorité des essais portant sur ce sujet, l’objectif principal est d’identifier les micro-organismes dont l’abondance est modifiée selon une condition, comme par exemple la présence d’une pathologie ou la prise d’un traitement. La composition du microbiote est mesurée par le séquençage de l’expression du gène 16S, ce qui en fait des données compositionnelles de grande dimension. Ces spécificités sont à prendre en compte lors de l’analyse, ce qui nécessite l’utilisation de méthodes statistiques adaptées. Actuellement, il n’existe pas de méthode d’estimation de taille d’étude qui soit en adéquation avec les méthodes utilisées pour l’analyse de ce type de données. Notre objectif est de proposer une méthode d’estimation de taille d’étude cohérente avec la stratégie d’analyse pour l’étude du microbiote.
Méthode |
La méthode proposée se décompose en deux étapes. Dans un premier temps, des jeux de données d’abondance artificiels sont générés à partir des abondances d’une étude pilote du microbiote sous forme de matrices de comptes, avec différents paramètres dont les valeurs sont fixées : la taille d’étude, l’effet minimum à mettre en évidence (différence exprimée sous la forme de « fold change »), et la proportion de micro-organismes dont l’abondance est modifiée selon la condition. Dans un second temps, la méthode ALDEx2 [1 ] est appliquée sur chacune des matrices de comptes simulées. Une puissance de détection d’abondance différentielle est ensuite calculée à partir des micro-organismes ayant été simulés pour avoir une abondance différente, et la moyenne des puissances obtenue sur l’ensemble des simulations estime la puissance attendue, pour les paramètres utilisés.
Résultats |
Supposons que l’on souhaite mettre en évidence une sur-abondance de 10 % des micro-organismes après l’initiation d’un traitement et une multiplication des abondances relatives par 5 de ces micro-organismes avec une puissance statistique de 80 %. Sous ces hypothèses, en utilisant les données d’une étude pilote où l’on a séquencé 576 micro-organismes présents dans l’intestin il faut alors inclure 60 patients. Pour une taille d’étude fixée, les résultats obtenus montrent que plus l’effet minimum à mettre en évidence est grand, plus la puissance de détection est élevée. De même, pour un nombre de sujets fixé, plus la proportion de micro-organismes dont l’abondance est modifiée suite à un évènement est élevée, plus la puissance de détection est grande.
Conclusion |
Le développement d’un package R implémentant une méthode de calcul de taille d’étude en adéquation avec les méthodes d’analyse réalisées in fine est un outil indispensable au montage des projets de microbiome. En parallèle, la constitution d’une banque de données d’étude pilote serait un atout majeur car elle permettrait à l’utilisateur de disposer de données, les plus proches possibles de sa question de recherche.
Le texte complet de cet article est disponible en PDF.Mots clés : Taille d’étude, Microbiome, Abondance différentielle, ALDEx2
Plan
Vol 67 - N° S3
P. S135-S136 - mai 2019 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.