Prédiction du coût hospitalier annuel pour des patients vivant avec le VIH : comparaison de 10 algorithmes de « Machine Learning » sur une cohorte identifiée dans les données PMSI - 07/03/18
Résumé |
Introduction |
Le PMSI regroupe l’ensemble des données d’activité hospitalières en France. Son exhaustivité permet le développement de méthodes d’analyses innovantes, notamment des modèles prédictifs. Le but de l’étude est d’utiliser ces données afin de comparer les performances de plusieurs modèles d’apprentissage statistique (« Machine Learning ») pour la prédiction de valeurs continues (régression). Cette comparaison est mise en œuvre sur une cohorte de patients vivant avec le VIH, dans le but de prédire leur coût annuel en fonction de leurs caractéristiques.
Méthodes |
L’inclusion des patients dans la cohorte est définie par une hospitalisation en lien avec le VIH en 2013. Chaque patient est suivi pendant un an pour évaluer les coûts de prise en charge de tous ses séjours. Dix groupes de comorbidités et cinq types d’infections opportunistes liées au VIH ont été sélectionnés. Avec l’âge et le sexe du patient, ces informations constituent les données d’entrées utilisées pour l’entraînement de 10 modèles prédictifs. Elles permettent de prédire le coût annuel des patients. Chaque algorithme a été optimisé pour minimiser la moyenne des erreurs absolues.
Résultats |
La cohorte rassemble 30 169 patients. Le coût total est de 180 millions d’euros, soit un coût moyen de 5981€ par patient. Après optimisation, « Gradient Boosting Descent » apparait comme l’algorithme le plus performant, avec une erreur absolue moyenne de 3506€ (soit une réduction de 45 % par rapport à une prédiction simpliste et systématique du coût moyen). En regardant ce critère, mais aussi la moyenne des erreurs au carré et le coefficient de détermination, le réseau de neurones obtient les performances les plus équilibrées.
Discussion/Conclusion |
Dans une optique de prédiction des coûts en fonction d’informations sur les patients, cette étude identifie l’algorithme le plus performant parmi les 10 modèles étudiés. Les meilleurs algorithmes identifiés dans cette étude peuvent être utilisés pour la prédiction de coûts dans d’autres aires thérapeutiques.
Le texte complet de cet article est disponible en PDF.Mots clés : Machine Learning, Comparaison, PMSI, VIH, Coûts de prise en charge
Plan
Vol 66 - N° S1
P. S27 - mars 2018 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à cette revue ?