Élaboration d’un référentiel mettant en lien des champs textuels d’indications thérapeutiques avec des libellés diagnostiques, en vue de la détection de prescriptions hors AMM dans les dossiers médicaux - 19/04/19
Résumé |
Introduction |
La pertinence et la qualité de la prescription des médicaments est essentielle à la qualité des soins. Les prescriptions se doivent d’être conformes aux conditions d’autorisation de mise sur le marché (AMM) telles qu’elles sont énoncées dans les rubriques 4.1 des résumés des caractéristiques du produit (RCP). Aucune évaluation précise du caractère hors AMM des prescriptions hospitalières de médicaments n’est actuellement disponible. L’objectif de la recherche est d’établir une méthode de détection des prescriptions hospitalières hors AMM à partir des données de l’entrepôt de données (EDS) de l’AP–HP. La première partie de ce projet consiste donc à mettre en place et à évaluer un référentiel d’analyse des couples indication-diagnostic en intégrant des scores de probabilité d’être en situation hors AMM, référentiel qui sera ultérieurement évalué par rapport à un Gold Standard, fondé sur l’expertise humaine.
Méthodes |
Un référentiel d’indications des spécialités pharmaceutiques (DOCAMED) a été croisé au référentiel des diagnostics médicaux (CIM10). A titre expérimental, seules 100 lignes de spécialités pharmaceutiques ont été utilisées, correspondant chacune à un code ATC5, un champ textuel de rubrique RCP 4.1 et un résumé d’indication comprenant un ou plusieurs mots-clés. Pour chaque ligne du nouveau référentiel d’analyse prescription-diagnostic généré, le champ textuel décrivant l’indication du médicament (Mots-clés ou rubrique RCP 4.1) a été comparé au champ textuel du libellé CIM10 de la même ligne. Deux scores différents ont été générés pour mesurer la similitude entre ces deux champs textuels :
– le score de similitude de Jaccard (jaccard.sim) mesure la proportion de termes communs entre les deux champs rapportée à l’effectif total des termes des deux champs réunis ;
– le score ressemblance maximale bidirectionnel (prop.max) est défini comme étant le maximum de deux proportions : la proportion de termes du libellé CIM10 contenus dans l’indication d’une part et la proportion des termes de l’indication contenus dans le libellé CIM10 d’autre part.
Ces deux scores traduisent ainsi pour une ligne donnée, de deux façons différentes, la probabilité qu’une prescription soit conforme AMM si elle est faite en motif du diagnostic CIM10 de la même ligne. En vue d’optimiser la pertinence sémantique et clinique des deux scores sus-cités, les champs textuels des différents référentiels ont été préalablement traités par des techniques d’analyse d’expressions régulières et « Natural Language Processing » (NLP).
Résultats |
La similitude moyenne entre les référentiels DOCAMED et CIM 10 était significativement meilleure pour l’indicateur prop.max comparé à l’indice de similitude de Jaccard (0,169 versus 0,051) lorsque les champs de mots-clés étaient utilisés. L’utilisation des mots-clés DOCAMED renvoyait une meilleure similarité, comparé à la rubrique 4.1 RCP La variance prop.max était significativement plus élévée (test de Fisher Snedecor test, p-value<0,001), traduisant un plus fort pouvoir discriminant. Le retrait des mots vides des rubriques 4.1 RCP dégradait la similitude des textes bruts. Les champs initiaux RCP 4.1 sont riches en mots vides du langage courant qui induisent une similarité initiale non pertinente entre les deux corpus.
Conclusion |
Un « Gold Standard » définissant les prescriptions hors AMM par des experts, permettra d’évaluer les performances cliniques de ces deux métriques, ainsi que la pertinence des divers traitements NLP utilisés pour les élaborer.
Le texte complet de cet article est disponible en PDF.Mots-clés : Natural Language Processing, Prescription hors AMM, Big data, Pharmaco-épidémiologie
Plan
Vol 67 - N° S3
P. S168-S169 - mai 2019 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.