Chaînage de données hospitalières de patients produites en routine avec leurs données issues du registre national d’identification des personnes physiques : retour d’expérience - 07/05/18
Résumé |
Introduction |
Dans le cadre d’une étude évaluant un score prédictif dans la survenue d’un décès par évènement cardiovasculaire à 10 ans (SCORE) chez les patients d’une unité spécialisée d’hypertension artérielle tertiaire (UHT), nous avons chaîné les données hospitalières de ces patients avec leur statut vital et leurs causes de décès le cas échéant issus du Registre national d’identification des personnes physiques (RNIPP). Nous nous proposons de faire un retour d’expérience sur les résultats obtenus.
Méthodes |
Pour cette étude rétrospective, monocentrique, nous avons inclus tous les patients ayant eu leur première visite dans l’UHT à l’hôpital européen Georges-Pompidou entre juin 2000 et décembre 2014. Les informations concernant le genre, la date et le lieu de naissance, les noms et prénoms de ces patients ont été extraites de leur dossier administratif et de leur numéro d’inscription au répertoire de l’Insee (NIR), notamment pour la commune de naissance obtenue à partir du code commune. Pour les patients pour lesquels ces informations étaient disponibles, le statut vital et les causes de décès ont pu être demandés au Centre de recherche en épidémiologie et santé des populations (CESP) qui constitue l’intermédiaire entre le RNIPP et la base de données nationale des causes de décès (CepiDc). Le fichier provenant du CESP comprend des patients identifiés de façon exacte et des patients identifiés avec une ou plusieurs discordances par rapport aux informations que nous avions fournies. Un traitement a dû être effectué pour traiter ces discordances et établir la liste définitive des patients identifiés. Les discordances concernant les noms et prénoms ont été traitées de manière automatique : le patient a été considéré comme identifié si une seule lettre du nom ou du prénom était discordante après suppression de la casse et des séparateurs ou si pour deux lettres discordantes les deux premières étaient les mêmes. Si la date de naissance était discordante, le patient était considéré comme non identifié. Pour les patients nés à l’étranger, une discordance sur la ville de naissance (mais pas sur le pays) amenait le patient à être considéré comme identifié.
Résultats |
Sur les 17 135 patients ayant eu une première visite entre juillet 2000 et décembre 2014, 15 438 (90 %) ont été envoyés au CESP pour identification. Les données manquantes pour l’identification étaient essentiellement la ville de naissance, souvent non renseignée dans le dossier administratif et non récupérable via le NIR renseigné, qui est celui de l’ayant-droit. Parmi les patients envoyés, 1963 (12,7 %) n’ont pas été identifiés par le CESP ; 9940 (65 %) étaient identifiés avec une ou plusieurs discordances mais après le traitement automatique réalisé, seuls 811 (5,3 %) patients n’ont pas été considérés comme identifiés (date de naissance : 66 ; lieu de naissance : 23 ; nom : 724 ; prénom : 14). Les femmes étaient 61 % à être identifiées contre 80 % des hommes. Au final, 4471 (26 %) patients n’ont pas été inclus pour cause de données erronées/manquantes.
Conclusion |
L’utilisation des bases de données nationales est un outil important pour la recherche épidémiologique qui peut être limitée par la qualité des bases de données hospitalières. Notre cas d’étude avec élaboration d’un algorithme ad hoc a permis de récupérer seulement 74 % des statuts vitaux des patients, avec un fort déséquilibre en faveur des hommes.
Le texte complet de cet article est disponible en PDF.Mots clés : Cause de décès, Chaînage, Identification, Statut vital
Plan
Vol 66 - N° S3
P. S164 - mai 2018 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à cette revue ?