S'abonner

CO3.1 - Développement et validation d'algorithmes d'identification de patients atteints de lupus érythémateux et de ses sous-types systémique et cutané au sein de l'Entrepôt de données de santé de l'Assistance publique des Hôpitaux de Paris - 10/05/24

Doi : 10.1016/j.jeph.2024.202407 
A. Teboul 1, , A. Rozes 2, C. Gérardin 1, F. Tubach 1, F. Chasset 3
1 Institut Pierre Louis d'épidémiologie et de santé publique, Département de santé publique, Paris, France 
2 Centre de pharmaco-épidémiologie (Cephepi), Unité de recherche clinique, Paris, France 
3 Assistance publique des Hôpitaux de Paris, Service de dermatologie, Paris, France 

Auteur correspondant

Résumé

Introduction

L'utilisation efficace des entrepôts de données de santé (EDS) nécessite le développement d'algorithmes permettant une identification précise des patients. Le lupus érythémateux (LE) peut se présenter sous forme de lupus cutané (LEC) ou de lupus systémique (LES). Alors que des algorithmes permettant d'identifier les patients atteints de LES existent, des algorithmes capables d'identifier de manière précise à la fois les patients atteints de LE sous toutes ses formes et de LEC n'ont pas été développés. L'objectif de cette étude était de développer et valider des algorithmes d'identification des patients atteints de LE, de LES et de LEC dans l'EDS de l'Assistance publique des Hôpitaux de Paris (AP-HP), un réseau de 39 hôpitaux universitaires.

Méthodes

À partir d'une cohorte de cas possibles de LE (hospitalisés avec un code de diagnostic CIM-10 de LE ou avec mention du lupus dans leurs comptes-rendus médicaux) dans l'EDS de l'AP-HP, une cohorte d'entraînement a été échantillonnée de manière aléatoire et les dossiers ont été annotés avec des diagnostics de LE, de LEC et de LES par des cliniciens experts. Un ensemble de variable d'intérêt associées à la prise en charge du lupus a été déterminé. Celles-ci comprenaient des données structurées ainsi qu'un dictionnaire de mots-clés, composé de termes se rapportant au LEC, au LES, et leur prise en charge, qui ont été extraits au sein des données non structurées par traitement automatique du langage (NLP). Des algorithmes d'identification ont été développés par régression logistique avec pénalisation par méthode Lasso et entraînés sur cet ensemble de données annotées, en utilisant une validation croisée par méthode des k-fold. Pour chaque pathologie, trois algorithmes ont été testés, utilisant uniquement les données structurées, uniquement les données extraites par NLP, ou la combinaison des deux. Les performances de chaque algorithme ont été évaluées. L'algorithme le plus efficace en se basant sur l'AUROC et la F-mesure pour chaque pathologie a été utilisé pour prédire les diagnostics dans la cohorte de cas possibles.

Résultats

Une cohorte de 16 314 cas possibles de LE a été identifiée. Au sein de celle-ci, une cohorte d'entraînement de 298 patients a été échantillonnée et annotée. Parmi ces patients, 192 (64,4 %) avaient un diagnostic de LE, dont 81 (27,2 %) LEC et 111 (37,2 %) LES. Pour chacun des diagnostics de LE, de LES et de LEC, les algorithmes utilisant la combinaison des deux types de données ou utilisant uniquement les données extraites par NLP ont montré de meilleures performances que l'algorithme utilisant uniquement les données structurées. Pour les trois diagnostics, l'algorithme le plus efficace était celui utilisant la combinaison des deux types de données. L'AUROC était de 0,966 pour le diagnostic de LE, de 0,959 pour celui de LEC et de 0,977 pour celui de LES. La mesure F était de 93,7 % pour LE, de 83,3 % pour le LEC et de 90,0 % pour le LES. Nous avons prédit au sein de la cohorte de cas possibles 10 352 (63,5 %) cas de LE, 4 675 (28,7 %) cas de LEC et 7 318 (44,9 %) cas de LES.

Conclusion

Nous avons développé avec succès des algorithmes d'identification de patients atteints de LE, de LEC et de LES dans l'EDS de l'APHP. Les performances de l'algorithme d'identification du LES sont comparables à celles de la littérature. Nous avons développé pour la première fois des algorithmes capables d'identifier le LE sous toutes ses formes ainsi que le LEC isolé, avec de très bonnes performances, similaires à celles des algorithmes identifiant le LES.

Le texte complet de cet article est disponible en PDF.

Mots-clés : Lupus, Algorithme, Entrepôt de données de santé



© 2024  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 72 - N° S2

Article 202407- mai 2024 Retour au numéro
Article précédent Article précédent
  • CO2.5 - Impact sur la survie à long terme d'un allongement du délai global de prise en charge chez les femmes atteintes d'un cancer du sein en France
  • A. Blanc-Lapierre, S. Delacour, M. Duval, S. Ayrault-Piault, JS. Frenel, A. CowppliBony, F. Monilié
| Article suivant Article suivant
  • CO3.2 - Hétérogénéité des parcours de soins des patients atteints de la Sclérose latérale amyotrophique (SLA) à partir du registre PMSI
  • M. Dibling, J. Ortholand, S. Tezenas du Montcel

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2024 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.