S'abonner

Predicting hepatocellular carcinoma in people with hepatitis B: a comparison between Cox proportional hazard and machine learning models - 10/04/26

Doi : 10.1016/j.jeph.2026.203387 
Clémence Ramier a, Marie Guyomard a, Camelia Protopopescu a, , Fabrice Carrat b, c, Marc Bourlière a, d, Patrizia Carrieri a, Raquel Urena a

the ANRS/AFEF CO22 HEPATHER Study Group

a Aix Marseille Univ, INSERM, IRD, SESSTIM, Sciences Économiques & Sociales de la Santé & Traitement de l'Information Médicale, ISSPAM, Marseille, France 
b Institut National de la Santé et de la Recherche Médicale (INSERM), Institut Pierre Louis d'Epidémiologie et de Santé Publique, Sorbonne Université, Paris, France 
c Hôpital Saint-Antoine, Unité de Santé Publique, Assistance Publique-Hôpitaux de Paris (AP-HP), Paris, France 
d Département d’hépatologie et gastroentérologie, Hôpital Saint Joseph, Marseille, France 

Corresponding author at: SESSTIM UMR 1252 Aix-Marseille Université, Faculté de Médecine- 3e étage – Aile Bleue, 27, boulevard Jean Moulin 13385 MARSEILLE cedex 5 France. SESSTIM UMR 1252 Aix-Marseille Université Faculté de Médecine- 3e étage – Aile Bleue, 27, boulevard Jean Moulin 13385 MARSEILLE cedex 5 France

Highlights

ML/DL methods did not significantly outperform Cox models for HCC risk prediction.
Cox models offered interpretable and efficient predictions with less overfitting.
Variable selection was consistent across top-performing models.

Le texte complet de cet article est disponible en PDF.

Abstract

Background and Aim

Hepatocellular carcinoma (HCC) is a leading cause of cancer-related death worldwide, with chronic hepatitis B virus (HBV) infection being a major risk factor. To date, existing predictive scores of HCC are mainly based on traditional Cox proportional hazard (CPH) models. This study aimed to compare the variable selection process and performance of CPH models with those of machine learning (ML) and deep learning (DL) algorithms in predicting HCC among patients with chronic HBV infection.

Methods

We used data from 4,370 individuals with chronic HBV infection enrolled in the French prospective multicentre ANRS CO22 HEPATHER cohort, of which 56 (1.3%) developed an HCC. Two published CPH-based scores (ADAPTT and SADAPTT) were compared to Random Survival Forest (RSF), Survival Support Vector Machine (SVM), Survival XGBoost, and DeepSurv algorithms. Models were evaluated using Harrell’s C-index, Inverse-Probability-of-Censoring Weighting win ratio statistic, and time-dependent area under the ROC curve at 3, 5, and 8 years. The same set of covariables was used to build all the models.

Results

CPH models demonstrated similar or higher performances (C-index [95% confidence interval]: 0.84 [0.82–0.85]) for HCC prediction compared to ML and DL models, with less overfitting. Survival SVM and RSF performed similarly (0.81 [0.79–0.83] and 0.81 [0.79–0.82], respectively) without outperforming CPH models. Variable selection was consistent across top-performing models, though CPH models more effectively captured the predictive value of certain behavioural factors, such as soft drink intake.

Conclusions

In this dataset with a limited sample size and strongly imbalanced outcome, traditional CPH models provided robust, interpretable, and computationally efficient predictions for HCC risk. ML and DL methods did not outperform traditional models, reinforcing the validity of traditional statistical approaches in small to medium datasets.

Le texte complet de cet article est disponible en PDF.

Keywords : Cox models, DeepSurv, Liver cancer, Machine learning, Random Forest

Abbreviations : BMI, CPH, DL, HBV, HBsAg, HCC, HCV, HDV, IPCW, ML, RSF, SVM, t-AUC, XGBoost


Plan


© 2026  The Author(s). Publié par Elsevier Masson SAS. Tous droits réservés.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 74 - N° 4

Article 203387- août 2026 Retour au numéro
Article suivant Article suivant
  • Trends in Firearm-related Mortality in Pennsylvania, 2012–2023
  • Sana Muazzam, Geoffrey F Ernst, Suzanne Hoedemaker, A-Mac Harris, Rashad Salters, Jun Yang, Brian Wright

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

Elsevier s'engage à rendre ses eBooks accessibles et à se conformer aux lois applicables. Compte tenu de notre vaste bibliothèque de titres, il existe des cas où rendre un livre électronique entièrement accessible présente des défis uniques et l'inclusion de fonctionnalités complètes pourrait transformer sa nature au point de ne plus servir son objectif principal ou d'entraîner un fardeau disproportionné pour l'éditeur. Par conséquent, l'accessibilité de cet eBook peut être limitée. Voir plus

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2026 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.