L’Intelligence artificielle générative dans l’évaluation de l’aptitude médicale au travail : peut-on s’y fier ? - 15/05/26
, Khalil Grissa, Siwar Chemingui, Meriem Mersni, Amira Belkahla, Dorra Brahim, Mejda Bani, Nizar LadhariResumen |
Introduction |
Bien que l’IA générative ait démontré un potentiel en santé et sécurité au travail, la fiabilité est essentielle pour une utilisation clinique. En médecine du travail, les enjeux sont élevés : chaque décision d’aptitude entraîne des conséquences professionnelles et sociales pour les travailleurs. Les outils d’IA grand public ne sont pas validés pour ces évaluations où chaque mot est crucial.
Objectif |
Évaluer la cohérence des recommandations relatives à l’aptitude médicale au travail générées par des outils d’IA générative (ChatGPT-5 et GEMINI 2.5 Pro) lorsqu’ils sont confrontés à plusieurs reprises à un scénario clinique identique.
Méthodes |
Nous avons soumis trois fois la même requête en français à ChatGPT-5 lors de sessions indépendantes, puis effectué la même démarche avec GEMINI 2.5 Pro. La requête simulait une consultation réelle, positionnant l’IA dans le rôle du médecin du travail. Le cas présenté concernait un ouvrier hospitalier de 43 ans, suivi pour trouble bipolaire de type 1 sous traitement médical, présentant à l’examen une asthénie et un ralentissement psychomoteur. Nous avons ensuite évalué la cohérence des décisions d’aptitude entre les différentes itérations.
Résultats |
ChatGPT-5 a démontré une instabilité notable dans ses réponses, oscillant entre deux décisions fondamentalement différentes : « inapte temporaire à son poste actuel » et « apte à son poste actuel avec aménagements ». GEMINI 2.5 Pro a fait preuve d’une stabilité terminologique apparente, utilisant toujours la terminologie « inapte temporaire ». Toutefois, les actions recommandées variaient d’une itération à l’autre : l’une conseillait l’arrêt immédiat du travail avec retour uniquement après stabilisation clinique confirmée par le psychiatre traitant, tandis qu’une autre préconisait paradoxalement la poursuite du travail avec aménagements tout en maintenant la même étiquette « temporairement inapte ». Les deux modèles ont généré des recommandations variables entre les itérations, malgré une requête strictement identique.
Conclusion |
Les outils d’IA générative présentent une variabilité inacceptable dans les décisions d’aptitude médicale au travail, où la précision terminologique est primordiale d’un point de vue juridique et éthique. Certaines distinctions affectent la carrière et l’identité professionnelle des travailleurs. Les médecins du travail doivent exercer un jugement critique, maintenir leur autonomie décisionnelle, et éviter de se fier aux outils d’IA non validés.
El texto completo de este artículo está disponible en PDF.Mots clés : Intelligence artificielle générative, Aptitude médicale au travail, Fiabilité d’outils
Esquema
Vol 87 - N° 3-4
Artículo 103274- juin 2026 Regresar al númeroBienvenido a EM-consulte, la referencia de los profesionales de la salud.
El acceso al texto completo de este artículo requiere una suscripción.
¿Ya suscrito a @@106933@@ revista ?
