S'abonner

Standardisation de la base principale du Système national des données de santé (SNDS) au format OMOP - 12/03/24

Doi : 10.1016/j.jeph.2024.202249 
C. Charles a, , G. Collumeau a, L. Benda a, E. Mylonas a, A. Menu a, G. Lampe a, S. Combes a
a Health Data Hub, Paris, France 

Auteur correspondant

Résumé

Introduction

Présentant un fort intérêt pour les études en santé, la base principale du SNDS (BP SNDS), par sa complexité, expose les chercheurs au risque d'introduire des biais et des contresens dans les études. Pour faciliter son appropriation, le HDH standardise depuis 2020 la BP SNDS au format OMOP. Centré sur le patient, ce modèle de données facilite la lecture des parcours de soin et est accompagné d'outils open-source de mise en qualité et d'analyse. D'abord concentrée sur les données 2019-2020 des patients COVID (ciblés via la base fast track PMSI-MCO), la standardisation a été étendue à l'ensemble de la BP SNDS 2015-2021, apportant de nouveaux challenges liés à une importante volumétrie de données.

Méthodes

Un échantillon de trois millions de patients a été obtenu par tirage au sort, et sa cohérence statistique avec l'ensemble de la population de la BP SNDS vérifiée. Pour réaliser la transformation vers OMOP-CDM, la BP SNDS a été mise en qualité (eg. suppression des outliers) et prétraitée (eg. gestion des régularisations dans le DCIR). Après un premier alignement semi-automatique des terminologies (CCAM, CSARR, etc.) revu et validé par des internes en médecine, le HDH a développé un outil facilitant la recherche de codes candidats, en naviguant dans les terminologies. Enfin, l'industrialisation du processus a conduit à la création d'un outil de traitement de données basé sur Spark.

Résultats

La BP SNDS au format OMOP se focalise sur les données médicales. Le nettoyage et les prétraitements effectués constituent une étape clé des études sur le SNDS. Désormais industrialisé et validé par EHDEN, le processus de standardisation et les traitements effectués sont applicables à d'autres échantillons du SNDS. Les scripts et outils développés sont publiés sur la documentation du SNDS et le dépôt GitLab du HDH. La standardisation rend la BP SNDS interopérable avec d'autres bases de données au format OMOP, et est aujourd'hui exploitée pour un projet européen visant à créer un entrepôt de données de santé multicentriques.

Conclusion

La standardisation au format OMOP d'un large échantillon extrait de la base principale du SNDS constitue une nouvelle étape dans sa valorisation.

Elle ouvre la voie à des études fédérées, au niveau national et international, telles que HealthData@EU Pilot et DARWIN EU, réseau menant des études sur les données de vie réelle.

Le texte complet de cet article est disponible en PDF.

Mots-clés : Base principale du SNDS, OMOP-CDM, Standardisation



© 2024  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 72 - N° S1

Article 202249- mars 2024 Retour au numéro
Article précédent Article précédent
  • Développement d'algorithmes mesurant l'exposition médicamenteuse cumulée à partir d'un entrepôt de données de santé
  • M. Bories, A. Bannay, G. Bouzillé, P. Le Corre
| Article suivant Article suivant
  • Grandes causes de mortalité en France en 2021 et tendances récentes
  • A. Fouillet, W. Ghosn, C. Rivera, F. Clanche, E. Coudin

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

Elsevier s'engage à rendre ses eBooks accessibles et à se conformer aux lois applicables. Compte tenu de notre vaste bibliothèque de titres, il existe des cas où rendre un livre électronique entièrement accessible présente des défis uniques et l'inclusion de fonctionnalités complètes pourrait transformer sa nature au point de ne plus servir son objectif principal ou d'entraîner un fardeau disproportionné pour l'éditeur. Par conséquent, l'accessibilité de cet eBook peut être limitée. Voir plus

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2026 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.