S'abonner

CO6.1 - Patient cohort segmentation through clustering of care trajectories: a univariate-multivariate sequential approach - 12/05/25

Segmentation de cohortes de patients par clustering de trajectoires de soins: une approche séquentielle univariée-multivariée

Doi : 10.1016/j.jeph.2025.203006 
N. Grevet 1, , D. Ndiaga 1, N. Graffeo 1, R. Giorgi 2
1 Aix-Marseille Univ, Inserm, IRD, SESSTIM, ISSPAM, SESSTIM, Marseille, France 
2 Aix-Marseille Univ, AP-HM, Inserm, IRD, SESSTIM, ISSPAM, Hôpital Timone, BioSTIC, SESSTIM, Marseille, France 

Auteur correspondant

Résumé

Background and objective(s)

The analysis of patient care trajectories, which represent the sequence of healthcare states experienced by individuals over time, has gained significant importance in modern healthcare research. These trajectories provide valuable insights into disease progression and treatment effectiveness. However, analysing patient care trajectories presents several challenges. Their sequential nature, where the order of states matters, necessitates specialized analytical methods. Furthermore, the heterogeneity of patient experiences and the complexity of healthcare systems contribute to the difficulty of identifying meaningful patterns and subgroups within these trajectories. Different methods providing valuable frameworks for sequence analysis have been proposed and implemented (e.g. TraMineR, Eventflow). However, they may not fully address the complexities of patient care trajectories. Our objective is to develop an original clustering methodology combining univariate and multivariate techniques to effectively segment patients based on their care trajectories. Such hybrid approach will leverage the strengths of both methods to identify meaningful subgroups within the patient population.

Material and Methods

We used data from a publicly available longitudinal cohort of 2929 patients diagnosed with chronic HIV infection. Patient care pathways were tracked monthly from the time of diagnosis. Notably, the observation period varies across individuals due to differences in diagnosis dates. Both the univariate and the multivariate analysis employed Hierarchical Ascendant Clustering (HAC) as the primary clustering technique. For the univariate approach, HAC incorporated Optimal Matching algorithm to measure the string-based distance considering the order of states within each patient's care trajectories, thus enhancing the sensitivity of the clustering to temporal patterns. Alternatively, the distance matrix is computed using Dynamic Time Warping (DTW), a flexible metric that allows for non-linear alignment of time series, making it suitable for comparing trajectories with varying lengths and temporal patterns. For the multivariate approach, the core distance metric, DTW, was employed in conjunction with one specific variant, the Triangle Inequality and Point Clustering DTW (TC-DTW), which leverage the strengths of DTW while improving computational efficiency. The proposed methodology has been implemented in a user-friendly Python package named Trajectory Clustering Analysis (TCA).

Results

Univariate clustering identified distinct patient groups based on individual care components, such as length of stay in each state measured in months. Multivariate analysis using DTW revealed more nuanced patient trajectories, particularly for patients undergoing concurrent treatments. These clusters were associated with varying patient characteristics. The TCA package provides functions for healthcare pathway analysis, including user-friendly visualizations and effective performance measures.

Conclusion

We proposed an approach for clustering states sequences, implemented within a user-friendly Python package. Inspired by time series clustering techniques, our method leverages the advantages of timed sequences, such as handling co-occurring events, irregular time sampling, and sparse events. This research has significant potential for analyzing patient care pathways, enabling a deeper understanding of patient experiences and supporting the development of more personalized healthcare interventions.

Le texte complet de cet article est disponible en PDF.

Keywords : Clustering, Univariate, Multivariate, HAC, DTW



© 2025  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 73 - N° S2

Article 203006- mai 2025 Retour au numéro
Article précédent Article précédent
  • CO4.3 - Comparaison des parcours de soins entre patients et population générale à partir du SNDS - Application à la Maladie de Huntington
  • M. Dibling, S. Tezenas du Montcel
| Article suivant Article suivant
  • CO6.2 - Prédiction de la peur de récidive du cancer du sein à partir des données de remboursement des soins de santé en utilisant les réseaux de neurones
  • M. Koume, L. Seguin, A. Bouhnik, R. Urena

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

Elsevier s'engage à rendre ses eBooks accessibles et à se conformer aux lois applicables. Compte tenu de notre vaste bibliothèque de titres, il existe des cas où rendre un livre électronique entièrement accessible présente des défis uniques et l'inclusion de fonctionnalités complètes pourrait transformer sa nature au point de ne plus servir son objectif principal ou d'entraîner un fardeau disproportionné pour l'éditeur. Par conséquent, l'accessibilité de cet eBook peut être limitée. Voir plus

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2026 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.