Une nouvelle méthodologie d’analyse pour trouver des profils de coûts atypiques au sein des patients vivants avec le VIH et à partir des données Sniiram - 22/05/18
Résumé |
Contexte |
L’exploitation des grandes bases de données de santé nationales nécessite l’utilisation de nouvelles méthodologies d’analyse. Cette étude est une extension à grande échelle d’une étude publiée sur le fardeau économique du VIH en France et uniquement centrée sur les coûts hospitaliers.
Objectif |
Présenter une nouvelle méthodologie d’analyse afin de trouver les profils de patients vivant avec le VIH (PVVIH) qui surexpriment le coût de prise en charge, en utilisant l’ensemble des données de remboursements (ville et hôpital) présentes dans la base Système national d’information inter-régimes de L’Assurance maladie (Sniiram).
Matériel et méthode |
Nous avons réalisé une étude de cohorte rétrospective en utilisant les bases de données nationales de santé (Sniiram). Le Sniiram contient des données individualisées sur l’ensemble des dépenses de santé remboursées par l’Assurance maladie et pour l’ensemble de la population française. Au sein du régime général, nous avons extrait les données pour les PVVIH entre le 1er janvier 2013 et le 31 décembre 2013 identifiées selon les présence d’au moins l’une des prestations suivantes en 2013 : ALD liée au VIH active, et/ou remboursement de l’une des spécialités indiquées dans le traitement du VIH selon les recommandations en vigueur, et/ou d’un des examens virologiques de charge virale VIH ou de génotype de résistance VIH et/ou hospitalisation avec l’un des codes CIM10 liés au VIH. Chaque patient a été suivi un an après la première prestation liée au VIH de 2013. Le coût annuel par patient a été estimé pour le fardeau économique. Une valorisation a été réalisée en tenant compte des tarifs officiels pour 2013 et 2014 et exprimés en euros 2018. La recherche de profils patients surexprimant ces coûts repose sur une méthodologie analytique innovante avec un algorithme de « Machine Learning ». Un modèle de régression par Arbre de décision boosté a été personnalisé pour correspondre au défi des données de santé (taille et complexité) et pour trouver des profils significatifs (un profil est une combinaison de dizaines de variables).
Résultats |
Grâce à une lecture médicale des données et à l’exhaustivité de la base Sniiram, nous avons pu définir plusieurs dizaines de variables d’intérêt pour décrire les 172 000 PVVIH inclus dans l’étude : informations sociodémographiques, antécédents médicaux (toutes admissions hospitalières, présence d’une des cinq infections opportunistes, d’une des dix comorbidités principales, fréquence de l’examen de la charge virale, des consultations, etc.), et coût de prise en charge. L’algorithme d’apprentissage automatique dédié a pu identifier plusieurs dizaines de profils pertinents. Un outil de data-visualisation interactif a permis la restitution de ces résultats complexes de façon claire.
Conclusion |
Cette étude montre que l’utilisation des grandes bases de données de santé passe par une innovation dans les méthodes d’analyse à déployer. Nous avons combiné une méthodologie d’étude épidémiologique standard (définition et suivi de cohorte, revue médicale, charge économique) et un modèle mathématique innovant (« Machine Learning ») pour obtenir des résultats plus précis en termes de profils de patients économiques. Ces profils peuvent être utilisés pour objectiver les plans d’action afin d’améliorer les politiques de soins.
Le texte complet de cet article est disponible en PDF.Plan
Vol 66 - N° S4
P. S200 - juin 2018 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.