Médecine

Paramédical

Autres domaines


S'abonner

Prise en compte des groupes de biomarqueurs ou des voies biologiques dans les modèles de Cox pénalisés de haute dimension - 19/04/19

Doi : 10.1016/j.respe.2019.03.100 
S. Belhechmi a, b, , R. De Bin c, S. Michiels a, b, F. Rotolo d
a Institut Gustave-Roussy, Service de biostatistique et d’épidémiologie, Villejuif, France 
b Université Paris-Saclay, Université Paris-Sud, UVSQ, CESP, Inserm U1018 Oncostat, Villejuif, France 
c University of Oslo, Department of Mathematics, Oslo, Norvège 
d Innate Pharma, Biostatistique, Marseille, France 

Auteur correspondant.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
Article gratuit.

Connectez-vous pour en bénéficier!

Résumé

Problématique

Le développement de technologies génomiques à haut débit a permis la croissance rapide et la disponibilité plus facile de très grandes données génomiques. Le modèle à risques proportionnels de Cox est couramment utilisé pour estimer l’effet d’un ou de plusieurs facteurs pronostiques pour des critères de jugement de type survie. La méthode de régression pénalisée Lasso est utilisée pour sélectionner des biomarqueurs dans des données de haute dimension, mais cette méthode ne prend pas en compte les connaissances des rôles biologiques des biomarqueurs, par exemple les voies biologiques (« pathways ») connues.

Méthodologie

Nous présentons différentes pénalisations pour que le modèle de Cox sélectionne correctement les biomarqueurs groupés afin de favoriser la sélection de biomarqueurs pronostiques (actifs) qui, en plus d’avoir un effet individuel important, appartiennent à un groupe actif. Nous avons considéré le cas des groupes pré-spécifiés et disjoints. Nous proposons la méthode Lasso Adaptatif avec des différents poids spécifiques pour chaque voie biologique. Nous avons comparé notre méthode proposée avec deux autres méthodes, le « Sparse Group Lasso » (SGL) et le « Lasso Intégratif » avec des facteurs de Pénalisation (IPF-Lasso). Pour l’approche « Lasso Adaptatif », nous avons considéré six stratégies de pondération. Nous avons évalué dans une étude de simulation la capacité de sélection (le taux de fausse découverte (FDR) et faux négatifs (FNR) ainsi que le FDR dans les groupes inactifs versus actifs) et de prédiction (l’air sous la courbe de ROC (AUC)) de ces méthodes. Nous avons illustré ces méthodes en utilisant des données d’expression de 109 gènes appartenant à trois voies (Système Immunitaire (47 gènes), Prolifération (43 gènes) et Stroma (19 gènes)) et de 614 patientes atteintes d’un cancer du sein traitées par chimiothérapie adjuvante.

Résultats

Dans l’étude de simulation, les méthodes IPF-Lasso, SGL et Lasso Adaptatif avec la pondération du maximum de la statistique de Wald (MSW) présentaient la meilleure balance globale FDR-FNR. Les méthodes IPF-Lasso et SGL avaient le FDR le plus élevé dans les groupes inactifs (c’est-à-dire qui ne contient pas de biomarqueurs actifs). Les propriétés favorables qui distinguent la méthode Lasso Adaptatif avec la pondération du MSW des autres méthodes sont le FDR le plus bas dans les groupes inactifs (entre 0,01 et 0,55 selon les scénarios) et l’AUC le plus grand par rapport à ces concurrents (entre 62 % et 80 %). Dans l’application du cancer du sein, la méthode IPF-Lasso a sélectionné 14 gènes, dont un appartenant à la voie Stroma, deux à la voie Prolifération et 11 à la voie Immunitaire. La méthode SGL a sélectionné le modèle nul. La méthode Lasso Adaptatif avec la pondération MSW a sélectionné trois gènes appartenant à la voie Prolifération.

Conclusion

Nous préconisons la méthode Lasso Adaptatif avec la pondération du maximum de la statistique de Wald dans un modèle de Cox pénalisé.

Le texte complet de cet article est disponible en PDF.

Mots clés : Médecine stratifiée, Régression pénalisée, Biomarqueurs pronostiques, Voies biologiques, Données de grande dimension


Plan


© 2019  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 67 - N° S3

P. S134 - mai 2019 Retour au numéro
Article précédent Article précédent
  • Valeur pronostique de la dynamique du CA125 sur la survie des femmes ayant un cancer des ovaires nouvellement diagnostiqué
  • E. Karamouza, R. Glasspool, A. Cook, X. Paoletti
| Article suivant Article suivant
  • Pleiotropic mapping for genome-wide association studies using group variable selection
  • B. Liquet

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.