CO3.1 - Développement et validation d'algorithmes d'identification de patients atteints de lupus érythémateux et de ses sous-types systémique et cutané au sein de l'Entrepôt de données de santé de l'Assistance publique des Hôpitaux de Paris - 10/05/24
, A. Rozes 2, C. Gérardin 1, F. Tubach 1, F. Chasset 3Résumé |
Introduction |
L'utilisation efficace des entrepôts de données de santé (EDS) nécessite le développement d'algorithmes permettant une identification précise des patients. Le lupus érythémateux (LE) peut se présenter sous forme de lupus cutané (LEC) ou de lupus systémique (LES). Alors que des algorithmes permettant d'identifier les patients atteints de LES existent, des algorithmes capables d'identifier de manière précise à la fois les patients atteints de LE sous toutes ses formes et de LEC n'ont pas été développés. L'objectif de cette étude était de développer et valider des algorithmes d'identification des patients atteints de LE, de LES et de LEC dans l'EDS de l'Assistance publique des Hôpitaux de Paris (AP-HP), un réseau de 39 hôpitaux universitaires.
Méthodes |
À partir d'une cohorte de cas possibles de LE (hospitalisés avec un code de diagnostic CIM-10 de LE ou avec mention du lupus dans leurs comptes-rendus médicaux) dans l'EDS de l'AP-HP, une cohorte d'entraînement a été échantillonnée de manière aléatoire et les dossiers ont été annotés avec des diagnostics de LE, de LEC et de LES par des cliniciens experts. Un ensemble de variable d'intérêt associées à la prise en charge du lupus a été déterminé. Celles-ci comprenaient des données structurées ainsi qu'un dictionnaire de mots-clés, composé de termes se rapportant au LEC, au LES, et leur prise en charge, qui ont été extraits au sein des données non structurées par traitement automatique du langage (NLP). Des algorithmes d'identification ont été développés par régression logistique avec pénalisation par méthode Lasso et entraînés sur cet ensemble de données annotées, en utilisant une validation croisée par méthode des k-fold. Pour chaque pathologie, trois algorithmes ont été testés, utilisant uniquement les données structurées, uniquement les données extraites par NLP, ou la combinaison des deux. Les performances de chaque algorithme ont été évaluées. L'algorithme le plus efficace en se basant sur l'AUROC et la F-mesure pour chaque pathologie a été utilisé pour prédire les diagnostics dans la cohorte de cas possibles.
Résultats |
Une cohorte de 16 314 cas possibles de LE a été identifiée. Au sein de celle-ci, une cohorte d'entraînement de 298 patients a été échantillonnée et annotée. Parmi ces patients, 192 (64,4 %) avaient un diagnostic de LE, dont 81 (27,2 %) LEC et 111 (37,2 %) LES. Pour chacun des diagnostics de LE, de LES et de LEC, les algorithmes utilisant la combinaison des deux types de données ou utilisant uniquement les données extraites par NLP ont montré de meilleures performances que l'algorithme utilisant uniquement les données structurées. Pour les trois diagnostics, l'algorithme le plus efficace était celui utilisant la combinaison des deux types de données. L'AUROC était de 0,966 pour le diagnostic de LE, de 0,959 pour celui de LEC et de 0,977 pour celui de LES. La mesure F était de 93,7 % pour LE, de 83,3 % pour le LEC et de 90,0 % pour le LES. Nous avons prédit au sein de la cohorte de cas possibles 10 352 (63,5 %) cas de LE, 4 675 (28,7 %) cas de LEC et 7 318 (44,9 %) cas de LES.
Conclusion |
Nous avons développé avec succès des algorithmes d'identification de patients atteints de LE, de LEC et de LES dans l'EDS de l'APHP. Les performances de l'algorithme d'identification du LES sont comparables à celles de la littérature. Nous avons développé pour la première fois des algorithmes capables d'identifier le LE sous toutes ses formes ainsi que le LEC isolé, avec de très bonnes performances, similaires à celles des algorithmes identifiant le LES.
Le texte complet de cet article est disponible en PDF.Mots-clés : Lupus, Algorithme, Entrepôt de données de santé
Vol 72 - N° S2
Article 202407- mai 2024 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à cette revue ?
