Suscribirse

Using Large Language Models to Generate Educational Materials on Childhood Glaucoma - 21/08/24

Doi : 10.1016/j.ajo.2024.04.004 
Qais Dihan 1, 2, Muhammad Z. Chauhan 2, Taher K. Eleiwa 3, Amr K. Hassan 4, Ahmed B. Sallam 2, 5, Albert S. Khouri 6, Ta C. Chang 7, Abdelrahman M. Elhusseiny 2, 8,
1 Chicago Medical School (Q.D.), Rosalind Franklin University of Medicine and Science, North Chicago, Illinois, USA 
2 Department of Ophthalmology (Q.D., M.Z.C., A.B.S., A.M.E.), Harvey and Bernice Jones Eye Institute, University of Arkansas for Medical Sciences, Little Rock, Arkansas, USA 
3 Department of Ophthalmology (T.K.E.), Benha Faculty of Medicine, Benha University, Benha, Egypt 
4 Department of Ophthalmology (A.K.H.), Faculty of Medicine, South Valley University, Qena, Egypt 
5 Department of Ophthalmology (A.B.S.), Faculty of Medicine, Ain Shams University, Cairo, Egypt 
6 Institute of Ophthalmology & Visual Science (A.S.K.), Rutgers New Jersey Medical School, Newark, New Jersey, USA 
7 Department of Ophthalmology (T.C.C.), Bascom Palmer Eye Institute, University of Miami Miller School of Medicine, Miami, Florida, USA 
8 Department of Ophthalmology (A.M.E.), Boston Children's Hospital, Harvard Medical School, Boston, Massachusetts, USA 

Inquiries to Abdelrahman M. Elhusseiny, Harvey and Bernice Jones Eye Institute, The University of Arkansas for Medical Sciences, Little Rock, Arkansas, USA.Harvey and Bernice Jones Eye InstituteThe University of Arkansas for Medical SciencesLittle RockArkansasUSA

Resumen

PURPOSE

To evaluate the quality, readability, and accuracy of large language model (LLM)–generated patient education materials (PEMs) on childhood glaucoma, and their ability to improve existing the readability of online information.

DESIGN

Cross-sectional comparative study.

METHODS

We evaluated responses of ChatGPT-3.5, ChatGPT-4, and Bard to 3 separate prompts requesting that they write PEMs on “childhood glaucoma.” Prompt A required PEMs be “easily understandable by the average American.” Prompt B required that PEMs be written “at a 6th-grade level using Simple Measure of Gobbledygook (SMOG) readability formula.” We then compared responses’ quality (DISCERN questionnaire, Patient Education Materials Assessment Tool [PEMAT]), readability (SMOG, Flesch–Kincaid Grade Level [FKGL]), and accuracy (Likert Misinformation scale). To assess the improvement of readability for existing online information, Prompt C requested that LLM rewrite 20 resources from a Google search of keyword “childhood glaucoma” to the American Medical Association–recommended “6th-grade level.” Rewrites were compared on key metrics such as readability, complex words (≥3 syllables), and sentence count.

RESULTS

All 3 LLMs generated PEMs that were of high quality, understandability, and accuracy (DISCERN ≥4, ≥70% PEMAT understandability, Misinformation score = 1). Prompt B responses were more readable than Prompt A responses for all 3 LLM (P ≤ .001). ChatGPT-4 generated the most readable PEMs compared to ChatGPT-3.5 and Bard (P ≤ .001). Although Prompt C responses showed consistent reduction of mean SMOG and FKGL scores, only ChatGPT-4 achieved the specified 6th-grade reading level (4.8 ± 0.8 and 3.7 ± 1.9, respectively).

CONCLUSIONS

LLMs can serve as strong supplemental tools in generating high-quality, accurate, and novel PEMs, and improving the readability of existing PEMs on childhood glaucoma.

El texto completo de este artículo está disponible en PDF.

Esquema


 Supplemental Material available at AJO.com.


© 2024  Elsevier Inc. Reservados todos los derechos.
Añadir a mi biblioteca Eliminar de mi biblioteca Imprimir
Exportación

    Exportación citas

  • Fichero

  • Contenido

Vol 265

P. 28-38 - septembre 2024 Regresar al número
Artículo precedente Artículo precedente
  • Biomechanics Explains Variability of Response of Small Hypertropia to Graded Vertical Rectus Tenotomy
  • Chang Zoo Kim, Seongjin Lim, Joseph L. Demer
| Artículo siguiente Artículo siguiente
  • Impact of GLP-1 Agonists and SGLT-2 Inhibitors on Diabetic Retinopathy Progression: An Aggregated Electronic Health Record Data Study
  • Karen M. Wai, Kapil Mishra, Euna Koo, Cassie Ann Ludwig, Ravi Parikh, Prithvi Mruthyunjaya, Ehsan Rahimy

Bienvenido a EM-consulte, la referencia de los profesionales de la salud.
El acceso al texto completo de este artículo requiere una suscripción.

¿Ya suscrito a @@106933@@ revista ?

@@150455@@ Voir plus

Mi cuenta


Declaración CNIL

EM-CONSULTE.COM se declara a la CNIL, la declaración N º 1286925.

En virtud de la Ley N º 78-17 del 6 de enero de 1978, relativa a las computadoras, archivos y libertades, usted tiene el derecho de oposición (art.26 de la ley), el acceso (art.34 a 38 Ley), y correcta (artículo 36 de la ley) los datos que le conciernen. Por lo tanto, usted puede pedir que se corrija, complementado, clarificado, actualizado o suprimido información sobre usted que son inexactos, incompletos, engañosos, obsoletos o cuya recogida o de conservación o uso está prohibido.
La información personal sobre los visitantes de nuestro sitio, incluyendo su identidad, son confidenciales.
El jefe del sitio en el honor se compromete a respetar la confidencialidad de los requisitos legales aplicables en Francia y no de revelar dicha información a terceros.


Todo el contenido en este sitio: Copyright © 2026 Elsevier, sus licenciantes y colaboradores. Se reservan todos los derechos, incluidos los de minería de texto y datos, entrenamiento de IA y tecnologías similares. Para todo el contenido de acceso abierto, se aplican los términos de licencia de Creative Commons.