L’Intelligence artificielle générative dans l’évaluation de l’aptitude médicale au travail : peut-on s’y fier ? - 15/05/26

Doi : 10.1016/j.admp.2026.103274

Yasmine Tebourbi, Ghada Bahri ^⁎ , Khalil Grissa, Siwar Chemingui, Meriem Mersni, Amira Belkahla, Dorra Brahim, Mejda Bani, Nizar Ladhari

Service de pathologie professionnelle et d’aptitude au travail, hôpital Charles-Nicolle, Tunis, Tunisie

^⁎ Auteur correspondant.

Resumen

Introduction

Bien que l’IA générative ait démontré un potentiel en santé et sécurité au travail, la fiabilité est essentielle pour une utilisation clinique. En médecine du travail, les enjeux sont élevés : chaque décision d’aptitude entraîne des conséquences professionnelles et sociales pour les travailleurs. Les outils d’IA grand public ne sont pas validés pour ces évaluations où chaque mot est crucial.

Objectif

Évaluer la cohérence des recommandations relatives à l’aptitude médicale au travail générées par des outils d’IA générative (ChatGPT-5 et GEMINI 2.5 Pro) lorsqu’ils sont confrontés à plusieurs reprises à un scénario clinique identique.

Méthodes

Nous avons soumis trois fois la même requête en français à ChatGPT-5 lors de sessions indépendantes, puis effectué la même démarche avec GEMINI 2.5 Pro. La requête simulait une consultation réelle, positionnant l’IA dans le rôle du médecin du travail. Le cas présenté concernait un ouvrier hospitalier de 43 ans, suivi pour trouble bipolaire de type 1 sous traitement médical, présentant à l’examen une asthénie et un ralentissement psychomoteur. Nous avons ensuite évalué la cohérence des décisions d’aptitude entre les différentes itérations.

Résultats

ChatGPT-5 a démontré une instabilité notable dans ses réponses, oscillant entre deux décisions fondamentalement différentes : « inapte temporaire à son poste actuel » et « apte à son poste actuel avec aménagements ». GEMINI 2.5 Pro a fait preuve d’une stabilité terminologique apparente, utilisant toujours la terminologie « inapte temporaire ». Toutefois, les actions recommandées variaient d’une itération à l’autre : l’une conseillait l’arrêt immédiat du travail avec retour uniquement après stabilisation clinique confirmée par le psychiatre traitant, tandis qu’une autre préconisait paradoxalement la poursuite du travail avec aménagements tout en maintenant la même étiquette « temporairement inapte ». Les deux modèles ont généré des recommandations variables entre les itérations, malgré une requête strictement identique.

Conclusion

Les outils d’IA générative présentent une variabilité inacceptable dans les décisions d’aptitude médicale au travail, où la précision terminologique est primordiale d’un point de vue juridique et éthique. Certaines distinctions affectent la carrière et l’identité professionnelle des travailleurs. Les médecins du travail doivent exercer un jugement critique, maintenir leur autonomie décisionnelle, et éviter de se fier aux outils d’IA non validés.

El texto completo de este artículo está disponible en PDF.

Mots clés : Intelligence artificielle générative, Aptitude médicale au travail, Fiabilité d’outils

Esquema

Déclaration de liens d’intérêts

Exportación

Vol 87 - N° 3-4

Artículo 103274- juin 2026 Regresar al número

Artículo precedente

Intelligence artificielle et travail : comment accompagner les organisations ?
Linda Constans-Lesne, Karine Studnia

| Artículo siguiente

Revue systématique des algorithmes d’apprentissage automatique : prévention, applications, enjeux éthiques
Axelle Savadogo, Hervé Baudelocque

Bienvenido a EM-consulte, la referencia de los profesionales de la salud.
El acceso al texto completo de este artículo requiere una suscripción.

¿Ya suscrito a @@106933@@ revista ?

conectar o crear una cuenta

L’Intelligence artificielle générative dans l’évaluation de l’aptitude médicale au travail : peut-on s’y fier ? - 15/05/26

Resumen

Introduction

Objectif

Méthodes

Résultats

Conclusion

Esquema

Exportación citas

Fichero

Contenido

Mi cuenta

Aide & support

Declaración CNIL