Standardisation de la base principale du Système national des données de santé (SNDS) au format OMOP - 12/03/24
Résumé |
Introduction |
Présentant un fort intérêt pour les études en santé, la base principale du SNDS (BP SNDS), par sa complexité, expose les chercheurs au risque d'introduire des biais et des contresens dans les études. Pour faciliter son appropriation, le HDH standardise depuis 2020 la BP SNDS au format OMOP. Centré sur le patient, ce modèle de données facilite la lecture des parcours de soin et est accompagné d'outils open-source de mise en qualité et d'analyse. D'abord concentrée sur les données 2019-2020 des patients COVID (ciblés via la base fast track PMSI-MCO), la standardisation a été étendue à l'ensemble de la BP SNDS 2015-2021, apportant de nouveaux challenges liés à une importante volumétrie de données.
Méthodes |
Un échantillon de trois millions de patients a été obtenu par tirage au sort, et sa cohérence statistique avec l'ensemble de la population de la BP SNDS vérifiée. Pour réaliser la transformation vers OMOP-CDM, la BP SNDS a été mise en qualité (eg. suppression des outliers) et prétraitée (eg. gestion des régularisations dans le DCIR). Après un premier alignement semi-automatique des terminologies (CCAM, CSARR, etc.) revu et validé par des internes en médecine, le HDH a développé un outil facilitant la recherche de codes candidats, en naviguant dans les terminologies. Enfin, l'industrialisation du processus a conduit à la création d'un outil de traitement de données basé sur Spark.
Résultats |
La BP SNDS au format OMOP se focalise sur les données médicales. Le nettoyage et les prétraitements effectués constituent une étape clé des études sur le SNDS. Désormais industrialisé et validé par EHDEN, le processus de standardisation et les traitements effectués sont applicables à d'autres échantillons du SNDS. Les scripts et outils développés sont publiés sur la documentation du SNDS et le dépôt GitLab du HDH. La standardisation rend la BP SNDS interopérable avec d'autres bases de données au format OMOP, et est aujourd'hui exploitée pour un projet européen visant à créer un entrepôt de données de santé multicentriques.
Conclusion |
La standardisation au format OMOP d'un large échantillon extrait de la base principale du SNDS constitue une nouvelle étape dans sa valorisation.
Elle ouvre la voie à des études fédérées, au niveau national et international, telles que HealthData@EU Pilot et DARWIN EU, réseau menant des études sur les données de vie réelle.
Le texte complet de cet article est disponible en PDF.Mots-clés : Base principale du SNDS, OMOP-CDM, Standardisation
Vol 72 - N° S1
Article 202249- mars 2024 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à cette revue ?

