S'abonner

Optimisation de la constitution de cohortes issues de bases de données médico-administratives : mise à disposition d’un algorithme pour l’intégration et la normalisation des données adapté au Système national d’information inter-régimes de l’assurance maladie (SNIIRAM) - 16/09/16

Doi : 10.1016/j.respe.2016.02.011 
C. Ferdynus a, , b , L. Huiart a, b
a Unité de soutien méthodologique, département d’informatique médicale, CHU La-Réunion, allée des Topazes, CS11021, 97400 Saint-Denis, France 
b Inserm, CIC 1410, 97410 Saint-Pierre, France 

Auteur correspondant.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

pages 7
Iconographies 1
Vidéos 0
Autres 0

Résumé

Position du problème

Les bases médico-administratives telles que le SNIIRAM sont des sources de données incontournables pour répondre à de nombreuses questions de recherche en santé publique. L’exploitation des données contenues dans ces bases pour constituer des cohortes nécessite des traitements complexes et chronophages. L’objectif de notre travail était de développer et de mettre à disposition un outil permettant d’optimiser la constitution de cohortes issues de bases médico-administratives.

Méthodes

Nous avons développé un algorithme pour extraire, transformer et intégrer différentes sources de données hétérogènes dans un entrepôt de données normalisé. Cet entrepôt est architecturé selon un schéma en étoile correspondant au modèle i2b2. Nous avons ensuite évalué les performances de cet algorithme dans le cadre d’un projet de recherche en pharmaco-épidémiologie utilisant les bases de données du SNIIRAM.

Résultats

L’algorithme développé comprend un ensemble de fonctionnalités permettant la création de scripts SAS. Il permet d’intégrer des données dans un entrepôt normalisé. Dans le cadre de l’évaluation des performances de cet algorithme, nous avons pu intégrer plus de 900 000 000 de lignes provenant du SNIIRAM en moins de 3heures à l’aide d’un ordinateur de bureau. Nous avons ensuite pu sélectionner les patients de l’entrepôt ainsi obtenu avec des requêtes n’excédant pas quelques secondes.

Conclusion

L’algorithme présenté dans cet article permet de disposer d’un outil performant et compatible avec l’ensemble des bases de données médico-administratives, sans avoir recours à des serveurs de bases de données complexes. Cet outil permet ensuite de simplifier la constitution de cohortes issues de ces bases et, en raison de la normalisation de l’entrepôt de données, facilite le travail collaboratif entre équipes.

Le texte complet de cet article est disponible en PDF.

Abstract

Aim

Administrative health databases such as the French National Heath Insurance Database – SNIIRAM – are a major tool to answer numerous public health research questions. However the use of such data requires complex and time-consuming data management. Our objective was to develop and make available a tool to optimize cohort constitution within administrative health databases.

Methods

We developed a process to extract, transform and load (ETL) data from various heterogeneous sources in a standardized data warehouse. This data warehouse is architected as a star schema corresponding to an i2b2 star schema model. We then evaluated the performance of this ETL using data from a pharmacoepidemiology research project conducted in the SNIIRAM database.

Results

The ETL we developed comprises a set of functionalities for creating SAS scripts. Data can be integrated into a standardized data warehouse. As part of the performance assessment of this ETL, we achieved integration of a dataset from the SNIIRAM comprising more than 900 million lines in less than three hours using a desktop computer. This enables patient selection from the standardized data warehouse within seconds of the request.

Conclusion

The ETL described in this paper provides a tool which is effective and compatible with all administrative health databases, without requiring complex database servers. This tool should simplify cohort constitution in health databases; the standardization of warehouse data facilitates collaborative work between research teams.

Le texte complet de cet article est disponible en PDF.

Mots clés : Cohorte, SNIIRAM, I2b2, Pharmaco-épidémiologie, Base de données, SAS, Algorithme

Keywords : Cohort, SNIIRAM, I2b2, Pharmacoepidemiology, Database, SAS, Algorithm


Plan


© 2016  Elsevier Masson SAS. Tous droits réservés.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 64 - N° 4

P. 263-269 - septembre 2016 Retour au numéro
Article précédent Article précédent
  • Substance use capital: Social resources enhancing youth substance use
  • S. Baggio, M. Mohler-Kuo, M. Dupuis, Y. Henchoz, J. Studer, A.A. N’Goran, G. Gmel
| Article suivant Article suivant
  • Couverture vaccinale et déterminants socioéconomiques de la vaccination BCG chez l’enfant avant 3 mois : résultats de la cohorte Elfe, 2011
  • J.-P. Guthmann, M. Ragot, M. Ben Boutieb, C. Bois, M.-N. Dufourg, D. Lévy-Bruhl

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2024 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.