Qualitative evaluation of automatic liver segmentation in computed tomography images for clinical use in radiation therapy - 07/08/25

Évaluation qualitative de la segmentation automatique du foie dans des images scanographiques pour un usage clinique en radiothérapie

Doi : 10.1016/j.canrad.2025.104648

Dorea Maria Khalal ^a,^⁎ , Souleyman Slimani ^b, Zine Eddine Bouraoui ^b, Hacene Azizi ^a
^a Laboratory of Dosing, Analysis and Characterization in High Resolution, Department of Physics, Faculty of Sciences, Ferhat-Abbas-Sétif 1 University, El Baz Campus, 19137 Sétif, Algeria
^b Radiotherapy Department, HCA Hospital, Algiers, Algeria

^⁎Corresponding author.

Abstract

Purpose

Segmentation of target volumes and organs at risk on computed tomography (CT) images constitutes an important step in the radiotherapy workflow. Artificial intelligence-based methods have significantly improved organ segmentation in medical images. Automatic segmentations are frequently evaluated using geometric metrics. Before a clinical implementation in the radiotherapy workflow, automatic segmentations must also be evaluated by clinicians. The aim of this study was to investigate the correlation between geometric metrics used for segmentation evaluation and the assessment performed by clinicians.

Materials and methods

In this study, we used the U-Net model to segment the liver in CT images from a publicly available dataset. The model's performance was evaluated using two geometric metrics: the Dice similarity coefficient and the Hausdorff distance. Additionally, a qualitative evaluation was performed by clinicians who reviewed the automatic segmentations to rate their clinical acceptability for use in the radiotherapy workflow. The correlation between the geometric metrics and the clinicians’ evaluations was studied.

Results

The results showed that while the Dice coefficient and Hausdorff distance are reliable indicators of segmentation accuracy, they do not always align with clinician segmentation. In some cases, segmentations with high Dice scores still required clinician corrections before clinical use in the radiotherapy workflow.

Conclusion

This study highlights the need for more comprehensive evaluation metrics beyond geometric measures to assess the clinical acceptability of artificial intelligence-based segmentation. Although the deep learning model provided promising segmentation results, the present study shows that standardized validation methodologies are crucial for ensuring the clinical viability of automatic segmentation systems.

Le texte complet de cet article est disponible en PDF.

Résumé

Objectif de l’étude

La segmentation des volumes cibles et des organes à risque sur les images tomodensitométriques constitue une étape importante de la chaîne de traitement en radiothérapie. Les méthodes basées sur l’intelligence artificielle ont considérablement amélioré la segmentation des organes dans les images médicales. Les segmentations automatiques sont souvent évaluées à l’aide de métriques géométriques. Avant une mise en œuvre clinique dans la chaîne de traitement en radiothérapie, les segmentations automatiques doivent également être évaluées par des cliniciens. L’objectif de cette étude est d’étudier la corrélation entre les métriques géométriques utilisées pour l’évaluation de la segmentation et l’évaluation effectuée par les cliniciens.

Matériel et méthodes

Dans cette étude, nous avons utilisé le modèle U-Net pour segmenter le foie sur des images de tomodensitométrie provenant d’un jeu de données publiques. La performance du modèle a été évaluée à l’aide de deux métriques géométriques : le coefficient de similarité de Dice et la distance de Hausdorff. En outre, une évaluation qualitative a été réalisée par des cliniciens qui ont examiné les segmentations automatiques afin d’évaluer leur acceptabilité clinique pour une utilisation dans la chaîne de traitement en radiothérapie. La corrélation entre les métriques géométriques et les évaluations des cliniciens a été étudiée.

Résultats

Les résultats ont montré que bien que le coefficient de Dice et la distance de Hausdorff soient des indicateurs fiables de l’exactitude de la segmentation, ils ne s’alignent pas toujours avec les évaluations cliniques. Dans certains cas, des segmentations avec des valeurs élevées du cœfficient de Dice, nécessitaient encore des corrections avant l’utilisation dans la chaîne de traitement en radiothérapie.

Conclusion

Cette étude souligne la nécessité de développer des métriques d’évaluation plus complètes, au-delà des mesures géométriques, pour évaluer l’acceptabilité clinique. Bien que le modèle d’apprentissage profond ait fourni des résultats de segmentation prometteurs, la présente étude montre que des méthodologies de validation standardisées sont cruciales pour garantir la viabilité clinique des systèmes de segmentation automatique.

Le texte complet de cet article est disponible en PDF.

Keywords : Automatic segmentation, Qualitative evaluation, Artificial intelligence, Radiotherapy, Dice similarity coefficient, Hausdorff distance

Mots clés : Segmentation automatique, Évaluation qualitative, Intelligence artificielle, Radiothérapie, Coefficient de similarité de Dice, Distance de Hausdorff

Plan

Introduction

Materials and methods

Patient data and preprocessing

Autosegmentation algorithm

Experimentation

Geometric contour assessment

Clinician contour assessment

Export

Vol 29 - N° 4

Article 104648- juillet 2025 Retour au numéro

Article précédent

Adaptive radiotherapy
Philippe Maingon, Antoine Mavrikios, Cyrus Chargari

| Article suivant

First experiences with an adaptive pelvic radiotherapy system: Analysis of treatment times and learning curve
David Benzaquen, Daniel Taussky, Vincent Fave, Jarno Bouveret, Farid Lamine, Gladys Letenneur, Amandine Halley, Yusuf Solmaz, Ambroise Champion

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

connectez-vous ou créez un compte

Qualitative evaluation of automatic liver segmentation in computed tomography images for clinical use in radiation therapy - 07/08/25

Évaluation qualitative de la segmentation automatique du foie dans des images scanographiques pour un usage clinique en radiothérapie

Abstract

Purpose

Materials and methods

Results

Conclusion

Résumé

Objectif de l’étude

Matériel et méthodes

Résultats

Conclusion

Plan

Export citations

Fichier

Contenu

Accès rapides

Mon compte

Aide & support

Plateformes Elsevier Masson

Déclaration CNIL