S'abonner

Implémentation de méthodes de « machine learning » à la production des données des causes médicales de décès - 28/02/20

Doi : 10.1016/j.respe.2020.01.062 
C. Morgand , D. Martin, A. Robert, L. Falissard, G. Rey
 Centre d’épidémiologie sur les causes médicales de Décès (CépiDc, Inserm), Le Kremlin-Bicêtre, France 

Auteur correspondant.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
Article gratuit.

Connectez-vous pour en bénéficier!

Résumé

Introduction

Le codage des causes médicales de décès est centralisé et réalisé par des nosologistes aidés d’un système expert. Devant l’enjeu de santé publique, dans un contexte de manque de ressources humaines et d’amélioration de la production des données, l’utilisation de méthodes de « machine learning » est actuellement testée. Les causes médicales sont renseignées par les médecins sur les certificats de décès avec une grande variété d’expressions. La première étape, dite de traitement automatique des langues (TAL), consiste à transposer chaque terme du certificat en code CIM. La seconde étape, dite d’identification de la cause initiale (ICI), permet de déduire de ces causes multiples, la cause initiale de décès selon des règles pré-établies par l’organisation mondiale de la santé (OMS). Cet article décrit la démarche retenue pour développer ces méthodes et illustre les bénéfices et difficultés d’une mise en production efficiente.

Méthodes

Aussi bien pour l’étape de TAL et d’ICI, les méthodes faisant appel à des systèmes de règles ou d’apprentissage statistique, dont le « deep learning » ont été appliquées sur les trois millions de décès survenus entre 2011 et 2016. Les outils ont été utilisés pour les deux étapes de codage. Le « gold standard » utilisé pour prédire ou évaluer les résultats était le codage finalisé par le binôme système expert/nosologistes. Une analyse des différences a été faite pour identifier les observations qui nécessiteront une reprise humaine.

Résultats

Les meilleures performances sont obtenues avec des outils de « deep learning » : 93,5 % pour la première étape contre 82 % avec la méthode classique et 97,8 % pour la seconde. Cependant, l’analyse des erreurs montrent que sur certains chapitres les outils sont moins performants (décès périnataux, décès par causes externes, maladies du système nerveux notamment).

Discussion/Conclusion

Devant la persistance de cas complexes et l’évolution régulière des règles de codage, et malgré l’excellente performance des outils de « deep learning », l’intégration des outils de « machine learning » dans une chaîne de production nécessite l’élaboration d’une stratégie rigoureuse combinant le « deep learning », les systèmes experts et l’expertise humaine.

Le texte complet de cet article est disponible en PDF.

Mots clés : Machine learning, Production de données, Causes de décès


Plan


© 2020  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 68 - N° S1

P. S28 - mars 2020 Retour au numéro
Article précédent Article précédent
  • Reconstruction de variables structurées à partir des données textuelles d’un entrepôt de données de santé, à des fins de recherche clinique, Paris
  • S. Karunakaran, D. Van Gysel, S. Guinemer, I. Mahe, K. Sallah
| Article suivant Article suivant
  • Analyse des durées d’hospitalisation : une alternative à l’Indice de performance de la durée moyenne de séjour (IPDMS)
  • C. Laueriere, X. Lenne, B. Dervaux, D. Theis, A. Bruandet

Bienvenue sur EM-consulte, la référence des professionnels de santé.

Elsevier s'engage à rendre ses eBooks accessibles et à se conformer aux lois applicables. Compte tenu de notre vaste bibliothèque de titres, il existe des cas où rendre un livre électronique entièrement accessible présente des défis uniques et l'inclusion de fonctionnalités complètes pourrait transformer sa nature au point de ne plus servir son objectif principal ou d'entraîner un fardeau disproportionné pour l'éditeur. Par conséquent, l'accessibilité de cet eBook peut être limitée. Voir plus

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2026 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.