S'abonner

Are answers obtained from artificial intelligence models for information purposes repeatable? - 04/10/25

Doi : 10.1016/j.ortho.2025.101071 
Yasemin Tunca 1, Volkan Kaplan 2, Murat Tunca 1,
1 Department of Orthodontics, Faculty of Dentistry, Kutahya Health Sciences University, Kutahya, Turkey 
2 Department of Oral and Maxillofacial Surgery, Faculty of Dentistry, Tekirdag Namık Kemal University, Tekirdag, Turkey 

Murat Tunca, Department of Orthodontics, Faculty of Dentistry, Kutahya Health Sciences University, Kutahya, Turkey.Department of Orthodontics, Faculty of Dentistry, Kutahya Health Sciences UniversityKutahyaTurkey

Highlights

The repeatability of orthodontic responses generated by large language models (LLMs) over time is of significant importance.
While ChatGPT-3.5 demonstrated the highest level of consistency, the Gemini models exhibited moderate repeatability.
The temporal variability in model performance underscores the need for caution when utilizing AI tools in patient communication.

Le texte complet de cet article est disponible en PDF.

Summary

Introduction

The objective of this study was to assess the repeatability of orthodontic responses generated by multiple large language models across repeated time points.

Methods

This experimental study assessed the answers provided by ChatGPT-3.5, ChatGPT-4.0, Gemini, and Gemini-Advanced to 40 frequently asked orthodontic questions. Each model was prompted with the same questions at three time points (T0: day 0, T1: day 7, and T2: day 14). Two blinded orthodontic experts independently evaluated responses using a 3-point accuracy scale. Cohen's Kappa and ICC were applied to assess inter-rater agreement and repeatability, respectively. In addition, Friedman test with Bonferroni post-hoc analysis and Spearman correlation were used for temporal comparisons.

Results

Cohen's Kappa values between raters ranged from 0.624 to 0.749, indicating substantial inter-rater agreement. ICC values for repeatability ranged from 0.666 (Gemini) to 0.960 (ChatGPT-3.5). Friedman test results revealed significant differences in model accuracy at T0 and T2 (P<0.001). Post-hoc analysis showed ChatGPT-3.5 differed significantly from Gemini and Gemini Advanced. Spearman correlations between time points were positive but weak (ρ=0.284 to 0.383, P<0.001).

Conclusions

The study revealed statistically significant differences in repeatability among AI models. Despite high accuracy, some models exhibited limited consistency over time. These findings underscore the importance of evaluating both accuracy and temporal stability when integrating AI systems into clinical orthodontic communication.

Le texte complet de cet article est disponible en PDF.

Keywords : Large language models, Acquiring knowledge, Repeatable


Plan


© 2025  CEO. Publié par Elsevier Masson SAS. Tous droits réservés.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 24 - N° 1

Article 101071- mars 2026 Retour au numéro
Article précédent Article précédent
  • Comparison of mechanical properties of in-house manufactured fully customized lingual brackets versus prefabricated brackets: An in vitro study
  • Pedro Graziani Olímpio Pereira, Silvio Augusto Bellini-Pereira, Aron Aliaga-Del Castillo, Karina Maria Salvatore Freitas, Marcos Roberto de Freitas, Daniela Garib, Guilherme Janson
| Article suivant Article suivant
  • Predicting treatment pathways in Class II malocclusion patients using machine learning: A comparative study of four algorithms for classifying camouflage, growth modulation, and surgical decisions
  • Mukesh Kumar, Sumit Kumar, Malvika Agarwal, Ekta Yadav, Sougandhika Gandi

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2025 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.