S'abonner

P10 - Projet DEEPSARC - De l'appariement à la recherche de données dans le SNDS, exemple d'une base de données nationale sur les sarcomes : NETSARC+ - 10/05/24

Doi : 10.1016/j.jeph.2024.202450 
V. Thevenet 1, , E. Drezen 3, C. Chemin-Airiau 4, A. Happe 2, JY. Blay 4, E. Oger 2, N. Huchet 5,  Groupe collaboratif deepsarc 1, 2, 3, 4, 5, 6, 7, 8, 9
1 Inserm U1219, EPICENE, Bordeaux, France 
2 Université de Rennes 1, REPERES, UPRES-EA-7449, Rennes, France 
3 Société Cubr, Rennes, France 
4 Centre Léon Bérard, Lyon, France 
5 Institut Bergonié, Inserm CIC1401, Bordeaux, France 
6 Health Data Hub, Paris, France 
7 Centre Oscar Lambret, Lille, France 
8 Institut Gustave Roussy, Villejuif, France 
9 Réseau de référence des sarcomes Netsarc+, Lyon, France 

Auteur correspondant

Résumé

Introduction

Les sarcomes, tumeurs rares constituant 1 % des cancers, sont un groupe hétérogène en termes de sous-types histologiques et de prises en charge (PEC). DEEPSARC, projet lauréat du Health Data Hub (HDH), a pour objectif de fusionner les bases de données nationales (BCB Sarcomes : base clinique et base anatomopathologique) recensant les cas inclus via les centres experts du réseau NETSARC+ et le Système national des données de santé (SNDS) afin d’évaluer l'effet de traitements adjuvant et/ou néo adjuvant sur la survie globale des cas de sarcomes (2012-18). L'autorisation CNIL a été obtenue (20/11/2020).

Méthodes

En l'absence d'identifiants communs (pas de NIR), les bases Sarcomes et du SNDS ont été chaînées avec un appariement indirect : des variables communes aux deux bases ont été sélectionnées pour former une signature, c'est-à-dire un identifiant patient espéré unique auquel il est possible d'associer une métrique permettant d’évaluer la qualité d'appariement. L'absence d'identification de la maladie par un code CIM10 univoque a nécessité l'utilisation de tableaux de correspondance définis par un groupe de cliniciens et a conduit à solliciter une extraction SNDS étendue. Ces actions ont été menées dans un espace dédié du HDH. A partir de la base chaînée, des revues des données itératives et des avis d'experts ont permis d'orienter les choix méthodologiques.

Résultats

Pour la période considérée, les bases sarcomes comprenaient 47 055 patients dont 33 548 distincts et 13 507 communs ; l'extraction du SNDS portait sur les données de 2009 à 2020, incluant près de 3 millions de patients ayant eu un séjour de chirurgie pour un diagnostic de cancer de 2010 à 2017 (dates d'inclusions initiales) et leurs données un an avant et trois ans après. L'appariement a été réalisé en trois étapes. La première s'est basée sur 10 variables (sexe, année de naissance, date de décès, commune de résidence, chirurgie…). La deuxième à pris en compte le diagnostic lors de la chirurgie et un fichier de correspondance entre les localisations du sarcome dans les bases sarcomes et des codes CIM10. A la dernière étape, les résultats du chaînage ont été relu par un expert. Au total, 73,1 % (n=24 539) des patients de NETSARC+ ont été appariés au SNDS. Après application des critères d'inclusion, la qualité de l'appariement était bonne (score ≥4/7) pour 50,0 % (9395/18 780) des patients. Des analyses de sensibilités prendront en compte cette qualité pour les résultats finaux. Plusieurs choix ou actions importants ont été faits :

• l'utilisation préférentielle des données SNDS en cas de variables communes ;

• la correction des incohérences histologiques au sein des bases sarcomes ;

• l'identification des métastases, de la chimiothérapie et de la radiothérapie à partir de combinaisons de codes CIM10, GHM et des dates de PEC du SNDS ;

• l'exclusion des patients pris en charge avant 2012 afin d'utiliser la cartographie de la Cnam pour calculer le score de Charlson (variable de confusion majeure), réduisant le nombre de patients analysés à 14 808

• et la planification d'analyses utilisant score de propension et variable instrumentale pour prendre en compte un potentiel biais d'indication.

Conclusion

Les analyses des données de vie réelles présentent certains défis, pour les sarcomes spécifiquement l'identification dans le SNDS a ajouté une complexité. La diffusion des raisonnements et décisions prises par les équipes expertes facilitera la compréhension des résultats et guidera les futurs projets pour l'utilisation des données.

Le texte complet de cet article est disponible en PDF.

Mots-clés : Sarcome, SNDS, Méthodologie, Appariement, HDH



© 2024  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 72 - N° S2

Article 202450- mai 2024 Retour au numéro
Article précédent Article précédent
  • P09 - Comment tirer le meilleur des données cliniques et des bases médico-administratives ?
  • E. Herquelot, F. Raguideau, N. Lemaire
| Article suivant Article suivant
  • P11 - Pathologies des enfants en France métropolitaine, en 2018, à partir des données du SNDS et association avec le désavantage social
  • J. Pergeline, T. Lesuffleur, A. Rachas, P. Tuppin

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2024 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.