Constitution, incrémentation et valorisation de bases de données clinico-biologiques dans un centre de lutte contre le cancer. Le projet BaseCAL - 19/04/19
Résumé |
Introduction |
À l’heure des big data, la conception et la maintenance de grandes bases de données sont devenues un enjeu majeur. Dans le cadre de leurs travaux de recherches les investigateurs collectent les données de leurs patients dans des bases de données personnelles (Excel®, Access®). Notre objectif est de doter l’établissement d’un ensemble de bases centralisées et administrées sous un même système de gestion de base de données (Ennov Clinical®), pour les principales pathologies traitées. L’intérêt pour les investigateurs est de disposer d’un réceptacle par pathologie leur permettant de réaliser l’import de leurs anciennes bases et la saisie directe des nouveaux patients. La qualité, l’accessibilité et la sécurité des données est ensuite assurée par les data managers (DM).
Méthodes |
Chaque base doit permettre de répondre aux questions posées par les investigateurs, de fait le choix des variables à recueillir est un objectif majeur. Lors de la constitution d’une base, le DM consulte chaque spécialiste de la pathologie afin de connaitre toutes les variables d’intérêt. Il conçoit ainsi le draft du cahier d’observation « papier » (CRF) de la base. Puis des réunions pluridisciplinaires sont organisées afin de valider définitivement le CRF. Le DM réalise alors le cahier d’observation « électronique » (eCRF), paramètre les contrôles de cohérences et conçoit les tables d’export. La base devenue opérationnelle permet au DM d’importer les données des investigateurs et de faire saisir des nouveaux patients. En fonction des questions posées, le DM réalisera les exports pour l’analyse statistique et la publication.
Résultats |
En 2013, la base « RECTUM » incluant 2408 variables pour un eCRF de 137 pages a suivi ce processus de réalisation. Les fichiers de l’investigateur y ont été implémentés et un article sur la préservation des organes des patients traités par radiothérapie a été publié dans Acta Oncologica (impact factor [IF] : 3,4). En 2014, de nouveaux patients ont été ajoutés permettant une nouvelle publication sur le même thème dans l’« European Journal of Cancer » (EJC) (IF : 7,19). En 2015, la base devenait multicentrique, un nouvel article sur la préservation d’organes a été publié dans l’EJC. L’année 2018 est marquée par l’intégration de nos données dans l’« International Watch and Wait Database » (IWWD), suivie d’une publication dans le Lancet (IF : 53) sur les résultats à long terme des traitements du cancer du rectum. La base a également évolué en 2018 par ajout de variables dans l’eCRF afin de répondre à une nouvelle question sur le calcul des volumes tumoraux, un article est en cours de rédaction dans « Journal of Radiation Oncology » (IF : 5,54).
Conclusion |
La base RECTUM a donc permis la publication de quatre articles en cinq ans correspondant à 96 points SIGAPS soit une valorisation de 200K€ pour le CAL. Le projet BaseCAL compte à ce jour trois bases développées selon cette méthode dans les pathologies suivantes : RECTUM, SEIN (3 articles, 56 SIGAPS en 2018), et VADS (4 articles, 56 SIGAPS en 2018). Prochainement, l’incrémentation de ces bases deviendra automatique en utilisant une méthode d’intelligence artificielle basée sur le « natural language processing » en cours de développement. Le succès de ces bases se mesure en termes de publications et de points SIGAPS. Il repose sur la motivation et l’implication des investigateurs, le choix des variables, la qualité des données ainsi que sur une étroite interaction entre biostatisticiens, DMs et investigateurs.
Le texte complet de cet article est disponible en PDF.Mots-clés : Base de données, Valorisation, Data management, Big data, Natural language processing
Plan
Vol 67 - N° S3
P. S160 - mai 2019 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.