S'abonner

P30 - Structuration automatique des données des dossiers médicaux et exploration statistique interactive - 10/05/24

Doi : 10.1016/j.jeph.2024.202470 
S. Contu 1, , R. Schiappa 1, D. Culié 2, E. Seutin 1, T. Pace-Loscos 1, E. Chamorey 1
1 Centre Antoine Lacassagne, Département d’épidémiologie, de biostatistique et des données de Santé (DEBDS), Nice, France 
2 Centre Antoine Lacassagne, Université Côte d'Azur, Institut universitaire de la face et du cou, Nice, France 

Auteur correspondant

Résumé

Introduction

Les dossiers médicaux électroniques (DME) constituent une source précieuse d'information, mais ils sont principalement composés de documents textuels, non structurés par nature, rendant l'extraction de données difficile sans un examen manuel laborieux. Une fois extraites, les données sont analysées et interprétées par des statisticiens pour répondre à des questions cliniques spécifiques. Afin d'automatiser l'enregistrement des données biomédicales dans notre Entrepôt de données de santé et de faciliter leur réutilisation, nous avons développé un pipeline de traitement des DME qui permettra d'extraire et de structurer ces informations, et de fournir aux médecins et chercheurs un outil interactif et intuitif pour l'exploration statistique.

Méthodes

Dans un premier temps, le pipeline prédit, grâce à une approche mixte d'intelligence artificielle et de données structurées, le cancer primitif à partir des DME, identifie les comptes rendus des patients à structurer et applique des modèles d'apprentissage profond et des règles d'extraction de mots-clés pour extraire des données d'intérêt (entités). Ces entités sont ensuite converties en données structurées par des règles de post-traitement, et complétées par des données démographiques, de suivi et de statut de décès. Le jeu de données est accessible dans une application web pour effectuer des analyses statistiques descriptives, graphiques et inférentielles.

Résultats

Le pipeline a permis d'identifier le cancer primitif de 113 000 patients. Quarante-sept variables ont été structurées à partir des comptes-rendus de consultation, de biopsie, de pathologie et de chirurgie issus des 24 000 patients atteints du cancer du sein. Quatre-vingt-cinq variables ont été structurées à partir des comptes-rendus de consultation, d'anesthésie, de chirurgie, d'échographie et de pathologie de 13 000 patients atteints du cancer de la thyroïde. Deux médecins ont testé l'application web de statistique.

Conclusion

Le pipeline peut prédire efficacement le cancer primitif des patients, extraire les données des DME et permettre à des personnes non expertes en programmation d'effectuer des explorations statistiques. Cet outil permet d'optimiser les ressources et le temps pour la structuration et l'analyse des données et offre aux cliniciens la possibilité d'interroger des données constamment mises à jour à des fins d’évaluation des pratiques ou de recherche.

Le texte complet de cet article est disponible en PDF.

Mots-clés : Natural language processing, Dossier médical électronique, Application web, Pipeline



© 2024  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 72 - N° S2

Article 202470- mai 2024 Retour au numéro
Article précédent Article précédent
  • P28 - Over The Counter (OTC) Use and Reasons Of Self-Medication Among Pregnant And Post-Partum Women In Southern Of Morocco
  • A. Bouqoufi, L. Lahlou, F. Ait El Hadj, S. Boujraf, M. Abdessadek, Y. Khabbal
| Article suivant Article suivant
  • P 31 - AUTOMABIO : un outil pour automatiser la saisie des bilans biologiques dans les eCRF de recherche clinique
  • R. Schiappa, O. Trancart, L. Petitjean, A. Garoche, S. Contu, E. Chamorey

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2024 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.