Prise en compte des groupes de biomarqueurs ou des voies biologiques dans les modèles de Cox pénalisés de haute dimension - 19/04/19

Doi : 10.1016/j.respe.2019.03.100

S. Belhechmi ^a,^b,^⁎ , R. De Bin ^c, S. Michiels ^a,^b, F. Rotolo ^d
^a Institut Gustave-Roussy, Service de biostatistique et d’épidémiologie, Villejuif, France
^b Université Paris-Saclay, Université Paris-Sud, UVSQ, CESP, Inserm U1018 Oncostat, Villejuif, France
^c University of Oslo, Department of Mathematics, Oslo, Norvège
^d Innate Pharma, Biostatistique, Marseille, France

^⁎Auteur correspondant.

connectez-vous ou créez un compte

Bienvenue sur EM-consulte, la référence des professionnels de santé.
Article gratuit.

Connectez-vous pour en bénéficier!

Résumé

Problématique

Le développement de technologies génomiques à haut débit a permis la croissance rapide et la disponibilité plus facile de très grandes données génomiques. Le modèle à risques proportionnels de Cox est couramment utilisé pour estimer l’effet d’un ou de plusieurs facteurs pronostiques pour des critères de jugement de type survie. La méthode de régression pénalisée Lasso est utilisée pour sélectionner des biomarqueurs dans des données de haute dimension, mais cette méthode ne prend pas en compte les connaissances des rôles biologiques des biomarqueurs, par exemple les voies biologiques (« pathways ») connues.

Méthodologie

Nous présentons différentes pénalisations pour que le modèle de Cox sélectionne correctement les biomarqueurs groupés afin de favoriser la sélection de biomarqueurs pronostiques (actifs) qui, en plus d’avoir un effet individuel important, appartiennent à un groupe actif. Nous avons considéré le cas des groupes pré-spécifiés et disjoints. Nous proposons la méthode Lasso Adaptatif avec des différents poids spécifiques pour chaque voie biologique. Nous avons comparé notre méthode proposée avec deux autres méthodes, le « Sparse Group Lasso » (SGL) et le « Lasso Intégratif » avec des facteurs de Pénalisation (IPF-Lasso). Pour l’approche « Lasso Adaptatif », nous avons considéré six stratégies de pondération. Nous avons évalué dans une étude de simulation la capacité de sélection (le taux de fausse découverte (FDR) et faux négatifs (FNR) ainsi que le FDR dans les groupes inactifs versus actifs) et de prédiction (l’air sous la courbe de ROC (AUC)) de ces méthodes. Nous avons illustré ces méthodes en utilisant des données d’expression de 109 gènes appartenant à trois voies (Système Immunitaire (47 gènes), Prolifération (43 gènes) et Stroma (19 gènes)) et de 614 patientes atteintes d’un cancer du sein traitées par chimiothérapie adjuvante.

Résultats

Dans l’étude de simulation, les méthodes IPF-Lasso, SGL et Lasso Adaptatif avec la pondération du maximum de la statistique de Wald (MSW) présentaient la meilleure balance globale FDR-FNR. Les méthodes IPF-Lasso et SGL avaient le FDR le plus élevé dans les groupes inactifs (c’est-à-dire qui ne contient pas de biomarqueurs actifs). Les propriétés favorables qui distinguent la méthode Lasso Adaptatif avec la pondération du MSW des autres méthodes sont le FDR le plus bas dans les groupes inactifs (entre 0,01 et 0,55 selon les scénarios) et l’AUC le plus grand par rapport à ces concurrents (entre 62 % et 80 %). Dans l’application du cancer du sein, la méthode IPF-Lasso a sélectionné 14 gènes, dont un appartenant à la voie Stroma, deux à la voie Prolifération et 11 à la voie Immunitaire. La méthode SGL a sélectionné le modèle nul. La méthode Lasso Adaptatif avec la pondération MSW a sélectionné trois gènes appartenant à la voie Prolifération.

Conclusion

Nous préconisons la méthode Lasso Adaptatif avec la pondération du maximum de la statistique de Wald dans un modèle de Cox pénalisé.

Le texte complet de cet article est disponible en PDF.

Mots clés : Médecine stratifiée, Régression pénalisée, Biomarqueurs pronostiques, Voies biologiques, Données de grande dimension

Plan

Déclaration de liens d’intérêts

Export

Vol 67 - N° S3

P. S134 - mai 2019 Retour au numéro

Article précédent

Valeur pronostique de la dynamique du CA125 sur la survie des femmes ayant un cancer des ovaires nouvellement diagnostiqué
E. Karamouza, R. Glasspool, A. Cook, X. Paoletti

| Article suivant

Pleiotropic mapping for genome-wide association studies using group variable selection
B. Liquet

Bienvenue sur EM-consulte, la référence des professionnels de santé.

connectez-vous ou créez un compte

Prise en compte des groupes de biomarqueurs ou des voies biologiques dans les modèles de Cox pénalisés de haute dimension - 19/04/19

Résumé

Problématique

Méthodologie

Résultats

Conclusion

Plan

Export citations

Fichier

Contenu

Accès rapides

Mon compte

Aide & support

Plateformes Elsevier Masson

Déclaration CNIL