Utilisation de modèle de Deep Learning pour la détermination automatique du score OMERACT d’échographies de glandes salivaires dans la maladie de Sjögren - 02/12/25
, H. Pensec 1, I. Brahim 2, B. Quéré 3, S. Jousse Joulin 1, D. Cornec 1, A. Saraux 4, V. Devauchelle-Pensec 1Résumé |
Introduction |
La maladie de Sjögren entraîne très fréquemment des atteintes parenchymateuses des glandes salivaires parotidiennes et sub-mandibulaire facilement accessible en échographie. Le Deep Learning permet d’étudier automatiquement des images échographiques.
L’objectif de cette étude est la mise au point et la validation d’une méthode de classification par intelligence artificielle pour mesurer le score OMERACT des échographies de glandes salivaires.
Patients et méthodes |
Les cohortes DIApSS (suspicion Sjögren/Sjögren avéré), COUGAR (maladies auto-immunes) ont été utilisées pour entraîner et valider le modèle d’IA. Les échographies des glandes salivaires parotidiennes et sub-mandibulaires ont été standardisées (12 images par patient). Un score OMERACT (0–3) ≥ 2 est considéré comme malade.
Plusieurs architectures d’IA ont été testées, en prédiction multi-classes (score de 0 à 3) et en binaire : atteinte (OMERACT 2 et 3) vs sans atteinte (score 0 et 1) [2, 1] .
Les performances des modèles ont été évaluées en mesurant 3 métriques : la sensibilité (aussi appelé précision), la spécificité et le F1-score qui est calculé à partir de la sensibilité et de la spécificité afin de les combiner en une seule métrique.
Résultats |
Les images de 230 patients ont été analysées, filtrées et réparties en ensemble d’entraînement et de test avec respectivement 1579 et 276 images. L’ensemble de test présentait une surreprésentation de la classe 0 (classe 0 : 57 %, 1 : 12 %, 2 : 15 %, 3 : 16 %). Il a été harmonisé pour être plus équilibré au sein des différentes classes dans l’apprentissage et la classification multiclasses. 16 architectures de réseaux neuronaux ont été testées ( Fig. 1 ).
Concernant la classification en 4 classes OMERACT : Parmi les architectures testées, les deux meilleures ( Fig. 2 ) sont WideResNet (spécificité = 55,13 % ; sensibilité = 54,01 % ; f1-score = 52,91 %) ; et MaxViT (spécificité = 62,51 % ; sensibilité = 62,93 % ; f1-score = 61,61 %). La plus grande difficulté étant de différencier les scores 2 et 3.
Concernant la classification binaire, les meilleurs résultats ( Fig. 3 ) ont été obtenus par un ViT_L_32 (spécificité = 87,69 % ; sensibilité = 91,96 % ; f1-score = 89,14 %) ; et un DenseNet121 (spécificité = 88,84 % ; sensibilité = 92,75 % ; f1-score = 90,27 %).
Discussion |
Nos modèles DL ont une excellente classification en binaire et des performances encourageantes pour le multi-classes. Par contre, les modèles performants en classification binaire (normal versus anormal) sont différents de ceux utilisés en classification multiple.
Les performances de nos modèles pourraient encore s’améliorer en augmentant le nombre de données, mais également en enrichissant la base de formes rares (pré-lymphomes ou lymphomes).
Une autre approche serait d’utiliser une architecture neuronale plus profonde avec des images de hautes résolutions afin d’en extraire des caractéristiques très fines.
Conclusion |
Ce modèle d’intelligence artificielle Deep Learning permet de distinguer avec de bonnes performances les glandes salivaires saines de celles anormales dans la maladie de Sjögren. Ceci ouvre la possibilité de lecture par des médecins non experts dans le contexte de maladies rares ou d’évaluation globale dans les essais thérapeutiques.
Le texte complet de cet article est disponible en PDF.Plan
Vol 92 - N° S1
P. A31-A32 - décembre 2025 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à cette revue ?
