Analyse de données d’expression transcriptomiques rythmées par des gènes-horloge : approche méthodologique et optimisation - 30/10/13
Analysis of gene expression data regulated by clock-genes: Methodological approach and optimization
, F. Kwiatkowski b
, N. Uhrhammer a, Y. Bidet a, Y.-J. Bignon aRésumé |
Contexte |
Dans les données d’expression, les corrélations, nombreuses, augmentent le nombre de gènes significativement associés positivement ou négativement à une condition testée (phénotype, statut mutationnel, etc.). Plusieurs méthodes ont été développées pour réduire l’effet de telles corrélations sur le taux de faux-positifs/négatifs mais la plupart sont trop exclusives vis-à-vis des gènes d’intérêt mais ayant un impact faible ou indirect sur la condition étudiée. Nous proposons ici une méthodologie simple pour corriger l’effet délétère des corrélations tout en conservant les gènes faiblement mais réellement associés à la condition étudiée.
Résultats |
Cette méthodologie a été appliquée à un jeu de données d’expression transcriptomiques générées pour distinguer les individus porteurs de mutations hétérozygotes BRCA1 des individus sains non porteurs de mutations hétérozygotes BRCA1/BRCA2. Comme les échantillons ont été collectés à des horaires différents dans la matinée, nous avons évalué l’effet des corrélations induites par le rythme circadien. Les corrélations entre les gènes du réseau du rythme circadien sont aujourd’hui bien connues et font intervenir un petit nombre de gènes appelés « gènes de l’horloge » dont l’expression varie au cours de la journée de manière prévisible. Cependant, l’effet induit par ces variations circadiennes sur l’expression d’autres gènes dans différents tissus reste à ce jour à caractériser. Dans le cadre de nos données d’expression, nous avons utilisé deux stratégies pour corriger ce biais. Dans le cas d’une corrélation positive entre un gène lambda et le gène du rythme considéré, nous avons divisé l’expression de ce gène par celle du gène du rythme. Inversement, dans le cas d’une corrélation négative entre un gène lambda et le gène du rythme, nous avons multiplié l’expression de ce gène par l’expression du gène du rythme.
Conclusion |
Nous avons observé une relation linéaire entre le nombre de faux-positifs/négatifs parmi les gènes corrélés aux gènes du rythme et la force de corrélation du gène du rythme considéré à la condition testée (ici le statut mutationnel BRCA1). Dans nos données d’expression, le gène BRCA1 apparaît fortement corrélé au gène du rythme PER1. La ré-analyse de nos données à la lumière de cette nouvelle méthodologie a fait apparaître des gènes liés aux fonctions de BRCA1 dans les listes de gènes significativement associés au statut mutationnel BRCA1, gènes n’ayant pas été sélectionnés lors de l’analyse initiale. Cette méthodologie pourrait donc être appliquée à d’autres études transcriptomiques lorsque les réseaux de corrélations sont bien identifiés.
Le texte complet de cet article est disponible en PDF.Abstract |
Background |
In microarray data, wide-scale correlations are numerous and increase the number of genes correlated to a test condition (phenotype, mutation status, etc.) either positively or negatively. Several methods have been developed to limit the effect of such correlations on the false discovery rate, but these may reject too many genes that have a mild or indirect impact on the studied condition. We propose here a simple methodology to correct this spurious effect without eliminating weak but true correlations.
Results |
This methodology was applied to a microarray dataset designed to distinguish heterozygous BRCA1 mutation carriers from non-carriers. As our samples were collected at different times in the morning, we evaluated the effect of correlations due to circadian rhythm. The circadian system is a well-known correlation network, regulated by a small number of period genes whose expression varies throughout the day in predictable ways. The downstream effects of this variation on the expression of other genes, however, are incompletely characterized. We used two different strategies to correct this correlation bias, by either dividing or multiplying the expression of correlated genes by the expression of the considered period gene according to the sign of the correlation between the period gene and correlated gene (respectively positive or negative).
Conclusions |
We observed a linear relationship between the number of false-positive/negative genes and the strength of the correlation of the candidate gene to the test condition. BRCA1 was highly correlated to the period gene Per1; our correction methodology enabled us to recover genes coding for BRCA1-interacting proteins which were not selected in the initial direct analysis. This methodology may be valuable for other studies and can be applied very easily in case of well-known correlation networks.
Le texte complet de cet article est disponible en PDF.Mots clés : Circadien, Gène du rythme, Méthodologie, Corrélation, Transcriptome
Keywords : Circadian, Clock-gene, Methodology, Correlation, Transcriptom
Plan
| ☆ | Séminaire de chronobiologie médicale, Société francophone de chronobiologie médicale, centre Paul-Langevin, Aussois, 19–22 mars 2009. |
Vol 61 - N° 5
P. e89-e95 - octobre 2013 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à cette revue ?
