S'abonner

Chat GPT vs experts: Comment pensent les robots et les neuroradiologues face à des textes et des images ? - 20/02/25

Doi : 10.1016/j.neurad.2025.101252 
Bastien Le Guellec 1, , Cyril Bruge 2, Quentin Vannod-Michel 1, Najib Chalhoub 1, Victor Chaton 3, Matthieu Masy 4, Aghiles Hamroun 5, Gregory Kuchcinski 1
1 Service de neuroradiologie, Hôpital Roger Salengro, CHU de Lille, Lille, France 
2 Service de radiologie, Centre hospitalier de Lens, Lens, France 
3 Service de radiologie, Hôpitaux Saint-Vincent et Saint-Philibert, Lille, France 
4 Service de radiologie, Centre hospitalier de Valenciennes, Valenciennes, France 
5 Service de santé Publique, CHU de Lille, Lille, France 

Corresponding author:

Résumé

Les modèles de langage comme ChatGPT (OpenAI) et Gemini (Google) sont désormais capables de raisonner à partir d'images. En radiologie, ils semblent rivaliser avec des experts humains dans des cas complexes intégrant des images clés et un contexte clinique. Cependant, il n'est pas certain que ces modèles tirent réellement parti de l'intégration des images et des textes, comme le feraient des radiologues, ou s'ils basent principalement leurs réponses sur une analyse approfondie du contexte. Pour évaluer cette question, nous avons sélectionné 53 cas de neuroradiologie issus de la série Diagnosis Please du journal Radiology. Les images et le contexte clinique de chaque cas ont été séparés. GPT-4o et Gemini 1.5 Pro, ainsi que six neuroradiologues provenant de quatre centres différents, ont été testés individuellement sur ces cas, en leur présentant soit uniquement les images, soit uniquement le contexte, soit les deux combinés. GPT-4o et Gemini ont surpassé les radiologues lorsqu'ils disposaient uniquement du contexte clinique (34,0 % de bonnes réponses pour GPT-4o, 29,1 % pour Gemini, contre 16,3 % pour les radiologues, p < 0,01). Cependant, les radiologues ont obtenu de meilleurs résultats que les modèles face aux images seules (42 % pour les radiologues contre 3,9 % pour GPT-4o et 7,2 % pour Gemini, p < 0,01), ou face aux cas complets combinant images et contexte (48 % pour les radiologues contre 33 % pour GPT-4o et 32 % pour Gemini, p < 0,001). De plus, les radiologues ont démontré leur capacité à bénéficier de l'apport des images au contexte clinique et du contexte aux images. A l'inverse, les modèles n'ont pas montré d'amélioration significative de leurs performances lorsqu'ils passaient du contexte clinique seul au cas complet. Ces résultats soulignent la capacité spécifique des radiologues à intégrer des informations multimodales pour raisonner efficacement sur des cas complexes mêlant textes et images.

Le texte complet de cet article est disponible en PDF.

© 2025  Publié par Elsevier Masson SAS.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 52 - N° 2

Article 101252- mars 2025 Retour au numéro
Article précédent Article précédent
  • Thalamotomie par thermothérapie interstitielle par laser (Litt) guidée par IRM pour le traitement de patients avec tremblements pharmaco résistants : suivi longitudinal par IRM et SRM
  • Salem Boussida, David Layani, Mickael Aubignat, Aurélien Lambert, Adrien Panero, Romain Drailly, Cyril Broutin, Simon Bernard, Melissa Tir, Michel Lefranc, Jean-Marc Constans
| Article suivant Article suivant
  • Incidentalomes thyroïdiens découverts fortuitement en TEP – FDG : stratification multimodale du risque de malignité.
  • Léa Ghalyoun Salamon, Aurore Esquevin, Pierre Meneret, Lucas Barbot, Marine Le Feunteun, Xavier Palard-Novello, Jean Christophe Ferre

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

Elsevier s'engage à rendre ses eBooks accessibles et à se conformer aux lois applicables. Compte tenu de notre vaste bibliothèque de titres, il existe des cas où rendre un livre électronique entièrement accessible présente des défis uniques et l'inclusion de fonctionnalités complètes pourrait transformer sa nature au point de ne plus servir son objectif principal ou d'entraîner un fardeau disproportionné pour l'éditeur. Par conséquent, l'accessibilité de cet eBook peut être limitée. Voir plus

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2025 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.