Chat GPT vs experts: Comment pensent les robots et les neuroradiologues face à des textes et des images ? - 20/02/25

Doi : 10.1016/j.neurad.2025.101252

Bastien Le Guellec ^1,^⁎, Cyril Bruge ², Quentin Vannod-Michel ¹, Najib Chalhoub ¹, Victor Chaton ³, Matthieu Masy ⁴, Aghiles Hamroun ⁵, Gregory Kuchcinski ¹
¹ Service de neuroradiologie, Hôpital Roger Salengro, CHU de Lille, Lille, France
² Service de radiologie, Centre hospitalier de Lens, Lens, France
³ Service de radiologie, Hôpitaux Saint-Vincent et Saint-Philibert, Lille, France
⁴ Service de radiologie, Centre hospitalier de Valenciennes, Valenciennes, France
⁵ Service de santé Publique, CHU de Lille, Lille, France

^⁎Corresponding author:

Résumé

Les modèles de langage comme ChatGPT (OpenAI) et Gemini (Google) sont désormais capables de raisonner à partir d'images. En radiologie, ils semblent rivaliser avec des experts humains dans des cas complexes intégrant des images clés et un contexte clinique. Cependant, il n'est pas certain que ces modèles tirent réellement parti de l'intégration des images et des textes, comme le feraient des radiologues, ou s'ils basent principalement leurs réponses sur une analyse approfondie du contexte. Pour évaluer cette question, nous avons sélectionné 53 cas de neuroradiologie issus de la série Diagnosis Please du journal Radiology. Les images et le contexte clinique de chaque cas ont été séparés. GPT-4o et Gemini 1.5 Pro, ainsi que six neuroradiologues provenant de quatre centres différents, ont été testés individuellement sur ces cas, en leur présentant soit uniquement les images, soit uniquement le contexte, soit les deux combinés. GPT-4o et Gemini ont surpassé les radiologues lorsqu'ils disposaient uniquement du contexte clinique (34,0 % de bonnes réponses pour GPT-4o, 29,1 % pour Gemini, contre 16,3 % pour les radiologues, p < 0,01). Cependant, les radiologues ont obtenu de meilleurs résultats que les modèles face aux images seules (42 % pour les radiologues contre 3,9 % pour GPT-4o et 7,2 % pour Gemini, p < 0,01), ou face aux cas complets combinant images et contexte (48 % pour les radiologues contre 33 % pour GPT-4o et 32 % pour Gemini, p < 0,001). De plus, les radiologues ont démontré leur capacité à bénéficier de l'apport des images au contexte clinique et du contexte aux images. A l'inverse, les modèles n'ont pas montré d'amélioration significative de leurs performances lorsqu'ils passaient du contexte clinique seul au cas complet. Ces résultats soulignent la capacité spécifique des radiologues à intégrer des informations multimodales pour raisonner efficacement sur des cas complexes mêlant textes et images.

Le texte complet de cet article est disponible en PDF.

Export

Vol 52 - N° 2

Article 101252- mars 2025 Retour au numéro

Article précédent

Thalamotomie par thermothérapie interstitielle par laser (Litt) guidée par IRM pour le traitement de patients avec tremblements pharmaco résistants : suivi longitudinal par IRM et SRM
Salem Boussida, David Layani, Mickael Aubignat, Aurélien Lambert, Adrien Panero, Romain Drailly, Cyril Broutin, Simon Bernard, Melissa Tir, Michel Lefranc, Jean-Marc Constans

| Article suivant

Incidentalomes thyroïdiens découverts fortuitement en TEP – FDG : stratification multimodale du risque de malignité.
Léa Ghalyoun Salamon, Aurore Esquevin, Pierre Meneret, Lucas Barbot, Marine Le Feunteun, Xavier Palard-Novello, Jean Christophe Ferre

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

connectez-vous ou créez un compte

Chat GPT vs experts: Comment pensent les robots et les neuroradiologues face à des textes et des images ? - 20/02/25

Résumé

Export citations

Fichier

Contenu

Accès rapides

Mon compte

Aide & support

Plateformes Elsevier Masson

Déclaration CNIL