Impact d’un artefact fréquent sur la détection automatique du mélanome à partir d’images dermoscopiques : approche deep learning combinée à l’algorithme Support Vector Machine - 26/11/20
Résumé |
Introduction |
Grâce à l’introduction récente du deep learning (DL), l’intelligence artificielle a montré, pour la reconnaissance automatique du mélanome à partir d’images dermoscopiques (ID), des performances quasi-similaires à celles des dermatologues. Cependant, des artefacts fréquents inhérents à la prise photographique dermoscopique tel que le halo noir périphérique pourraient interférer sur la prédiction diagnostique de ces algorithmes, parfois utilisés via des applications smartphones. Cette étude évalue l’impact du halo sur un algorithme de DL développé par notre laboratoire.
Matériel et méthodes |
La base de données (BDD) publique ISIC 2019, a été utilisée pour l’entraînement de notre algorithme classifiant mélanome vs nævus, contenant 1259 mélanomes (confirmés par histologie) et 5716 nævus, puis enrichie par des ID générées pour un total de 10 000 mélanomes et 10 000 nævus. Un algorithme de type Convolutionnal Neural Network (CNN), pré-entraîné ResNet-50, a permis d’extraire les descripteurs de l’ensemble des ID qui ont été utilisés pour entraîner un algorithme Support Vector Machine. Sa performance a été évaluée sur deux BDD tests d’ID, chacune modifiée par un traitement d’images spécifique : 1re BDD, un groupe contrôle constitué d’ID sans halo (271 mélanomes et 1283 nævus) sur lequel des halos artificiels de 3 superficies différentes ont été ajoutés (semblables aux halos originels), pour évaluer l’impact du halo sans que l’aspect de la lésion n’intervienne ; 2e BDD, un groupe test, constitué d’ID avec halo originel (457 mélanomes, 597 nævus) sur lequel un traitement d’images par rognage de l’ID a été effectué pour tenter d’éliminer le halo.
Résultats |
La performance de l’algorithme de DL a été évaluée selon l’aire sous la courbe ROC (AUC), la sensibilité (S) et la spécificité (Sp), avec un seuil de probabilité supérieur à 0,5 pour la prédiction de mélanome (Annexe B). Les résultats du groupe contrôle démontrent l’impact du halo : la S pour la détection du mélanome sur les ID sans halo de 73 % diminue graduellement selon la taille du halo artificiel ajouté sur ces mêmes images jusqu’à 27 %. De plus, les résultats du groupe test démontrent que la S des ID avec halo originel de 67 % augmente à 90 % après avoir rogné automatiquement les ID.
Discussion |
Pour la première fois, nous démontrons que l’artefact halo interfère sur la prédiction diagnostique des CNN initialement correcte des mélanomes, en augmentant le nombre de faux négatifs, et diminue la performance des algorithmes de DL. Le heat map représente en rouge la zone de décision du CNN et démontre la déviation de cette zone hors de la lésion vers le halo, lorsqu’il est présent. Il est primordial de limiter la présence de cet artefact lors de la prise de photographies dermoscopiques ou de l’éliminer par traitement d’images avant son analyse par un algorithme.
Le texte complet de cet article est disponible en PDF.Mots clés : Deep learning convolutionnal neural network, Dermoscopie, Diagnostic assisté par ordinateur, Intelligence artificielle
Plan
Vol 147 - N° 12S
P. A82 - décembre 2020 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à cette revue ?