Conciliation des données du PMSI et de la base REA-RAISIN par correspondance approximative - 21/08/16
pages | 2 |
Iconographies | 0 |
Vidéos | 0 |
Autres | 0 |
Résumé |
Introduction |
Les études basées sur des cohortes telles que REA-RAISIN peuvent bénéficier de l’apport des données du PMSI. Cependant, la fusion de ces deux sources de données est complexe, car les mêmes variables d’un séjour saisies manuellement dans REA-RAISIN peuvent être différentes de celles retrouvées dans le PMSI. Notre objectif était de développer un algorithme permettant de faciliter la fusion d’une base de données de grand volume avec le PMSI en l’absence de clé de fusion explicite.
Méthodes |
Onze années de données du service de réanimation médicale du CHU de Strasbourg ont été extraites du PMSI et de REA-RAISIN. Nous avons implémenté dans le logiciel R un algorithme de conciliation des données basé sur la distance de Levensthein. Un score de distance pondéré était calculé en utilisant les informations communes disponibles dans les deux bases de données. Un seuil était fixé au-delà duquel les correspondances étaient validées manuellement.
Résultats |
Parmi les 7479 séjours décrits dans la base REA-RAISIN, 7465 (99,8 %) ont pu être fusionnés avec les 10 605 séjours du PMSI. La majorité (72,8 %) avait une correspondance parfaite (score de distance=0). Un quart (n=1897) des séjours avait un score compris entre 0 et le seuil de tolérance ce qui a permis de les fusionner automatiquement. Aucune erreur n’a été détectée parmi un échantillon aléatoire de 100 de ces correspondances imparfaites. Parmi les 134 correspondances de séjours avec un score supérieur au seuil qui ont été vérifiées manuellement, 14 (0,2 %) ont été exclues, car nous n’avons pas trouvé de correspondance avec le PMSI.
Discussion |
Cet algorithme nous a permis de rapprocher deux bases de données avec une intervention humaine réduite. Sans cet algorithme, 27 % des données n’auraient pas été utilisées, ce qui aurait provoqué une diminution de puissance de notre étude et un risque de biais.
Le texte complet de cet article est disponible en PDF.Mots clés : Cohortes, Conciliation de données, Distances de Levensthein, PMSI, REA, RAISIN
Plan
Vol 64 - N° S4
P. S191-S192 - septembre 2016 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.
Déjà abonné à cette revue ?