Abbonarsi

Natural language processing of Reddit data to evaluate dermatology patient experiences and therapeutics - 19/08/20

Doi : 10.1016/j.jaad.2019.07.014 
Edidiong Okon, BSE a, Vishnutheja Rachakonda, BS a, Hyo Jung Hong, BA b, Chris Callison-Burch, PhD a, Jules B. Lipoff, MD c,
a School of Engineering, University of Pennsylvania, Philadelphia, Pennsylvania 
b Perelman School of Medicine, University of Pennsylvania, Philadelphia, Pennsylvania 
c Department of Dermatology, Perelman School of Medicine, University of Pennsylvania, Philadelphia, Pennsylvania 

Correspondence to: Jules B. Lipoff, MD, Penn Medicine University City, 3737 Market St, Ste 1100, Philadelphia, PA 19104.Penn Medicine University City3737 Market StSte 1100PhiladelphiaPA19104

Abstract

Background

There is a lack of research studying patient-generated data on Reddit, one of the world's most popular forums with active users interested in dermatology. Techniques within natural language processing, a field of artificial intelligence, can analyze large amounts of text information and extract insights.

Objective

To apply natural language processing to Reddit comments about dermatology topics to assess for feasibility and potential for insights and engagement.

Methods

A software pipeline preprocessed Reddit comments from 2005 to 2017 from 7 popular dermatology-related subforums on Reddit, applied latent Dirichlet allocation, and used spectral clustering to establish cohesive themes and the frequency of word representation and grouped terms within these topics.

Results

We created a corpus of 176,000 comments and identified trends in patient engagement in spaces such as eczema and acne, among others, with a focus on homeopathic treatments and isotretinoin.

Limitations

Latent Dirichlet allocation is an unsupervised model, meaning there is no ground truth to which the model output can be compared. However, because these forums are anonymous, there seems little incentive for patients to be dishonest.

Conclusions

Reddit data has viability and utility for dermatologic research and engagement with the public, especially for common dermatology topics such as tanning, acne, and psoriasis.

Il testo completo di questo articolo è disponibile in PDF.

Key words : artificial intelligence, natural language processing, patient education, patient engagement, Reddit, social media


Mappa


 Funding sources: None.
 Conflicts of interest: None declared.
 IRB approval: Exempt by University of Pennsylvania IRB.
 Reprints not available from the authors.


© 2019  American Academy of Dermatology, Inc.. Pubblicato da Elsevier Masson SAS. Tutti i diritti riservati.
Aggiungere alla mia biblioteca Togliere dalla mia biblioteca Stampare
Esportazione

    Citazioni Export

  • File

  • Contenuto

Vol 83 - N° 3

P. 803-808 - settembre 2020 Ritorno al numero
Articolo precedente Articolo precedente
  • Inpatient teledermatology: Current state and practice gaps
  • Emily A. Weig, Rechelle Tull, Jina Chung, Karolyn A. Wanat
| Articolo seguente Articolo seguente
  • Incidence and outcomes of cutaneous angiosarcoma: A SEER population-based study
  • Rosalynn R.Z. Conic, Giovanni Damiani, Alice Frigerio, Sheena Tsai, Nicola L. Bragazzi, Thomas W. Chu, Natasha A. Mesinkovska, Shlomo A. Koyfman, Nikhil P. Joshi, G. Thomas Budd, Allison Vidimos, Brian R. Gastman

Benvenuto su EM|consulte, il riferimento dei professionisti della salute.
L'accesso al testo integrale di questo articolo richiede un abbonamento.

Già abbonato a @@106933@@ rivista ?

@@150455@@ Voir plus

Il mio account


Dichiarazione CNIL

EM-CONSULTE.COM è registrato presso la CNIL, dichiarazione n. 1286925.

Ai sensi della legge n. 78-17 del 6 gennaio 1978 sull'informatica, sui file e sulle libertà, Lei puo' esercitare i diritti di opposizione (art.26 della legge), di accesso (art.34 a 38 Legge), e di rettifica (art.36 della legge) per i dati che La riguardano. Lei puo' cosi chiedere che siano rettificati, compeltati, chiariti, aggiornati o cancellati i suoi dati personali inesati, incompleti, equivoci, obsoleti o la cui raccolta o di uso o di conservazione sono vietati.
Le informazioni relative ai visitatori del nostro sito, compresa la loro identità, sono confidenziali.
Il responsabile del sito si impegna sull'onore a rispettare le condizioni legali di confidenzialità applicabili in Francia e a non divulgare tali informazioni a terzi.


Tutto il contenuto di questo sito: Copyright © 2026 Elsevier, i suoi licenziatari e contributori. Tutti i diritti sono riservati. Inclusi diritti per estrazione di testo e di dati, addestramento dell’intelligenza artificiale, e tecnologie simili. Per tutto il contenuto ‘open access’ sono applicati i termini della licenza Creative Commons.