Beyond the numbers: App-enabled stroke prediction system for high-risk individuals in imbalanced datasets - 24/06/25

Doi : 10.1016/j.neuri.2025.100215 
Abrar Faiaz Eram a, Aliva Sadnim Mahmud a, Marwan Mostafa Khadem b, Md Amimul Ihsan c, d,
a Department of Electrical and Electronic Engineering, Bangladesh University of Engineering and Technology, Dhaka, 1000, Bangladesh 
b Department of Japanese Studies, University of Dhaka, Dhaka, 1000, Bangladesh 
c Department of Electrical and Electronic Engineering, Jamalpur Science and Technology University, Jamalpur, 2010, Bangladesh 
d Department of Biomedical Physics and Technology, University of Dhaka, Dhaka, Bangladesh 

Corresponding author at: Department of Electrical and Electronic Engineering, Jamalpur Science and Technology University, Jamalpur, 2010, Bangladesh.Department of Electrical and Electronic EngineeringJamalpur Science and Technology UniversityJamalpur2010Bangladesh

Bienvenue sur EM-consulte, la référence des professionnels de santé.
Article gratuit.

Connectez-vous pour en bénéficier!

Abstract

Background:

Brain stroke, characterized by interrupted blood flow to the brain, poses significant mortality risks and quality-of-life impacts. While machine learning approaches show promise in stroke prediction, current research often relies on synthetic data to address dataset imbalance, potentially compromising real-world model performance in clinical settings.

Method:

This research proposes an alternative approach focusing on recall as the primary evaluation metric for stroke prediction, specifically targeting the reduction of false negatives. In the context of stroke diagnosis, where missed detection can lead to severe consequences or fatality, recall is crucial for directly measuring the model's ability to identify actual stroke cases.

Results:

Three superior models were identified: Logistic Regression, an Ensemble using Soft Voting (combining Gaussian Naive Bayes and Logistic Regression), and customized Support Vector Machine. Exceptional stroke prediction was achieved with recall values of 92%, 92%, and 94%, respectively. Interpretability is enhanced through SHAP applied to the best one. While previous methods showed recall values between 5.6% and 40%, this approach outperformed these benchmarks (94%). Current research emphasizes accuracy metrics, relying on oversampling, being inappropriate for sensitive medical datasets. The pitfall is a slight increase in false positives, which is tolerable because the cost of misdiagnosing a stroke patient far outweighs the reverse scenario.

Conclusions:

The research demonstrates the effectiveness of focusing on recall as an evaluation metric for stroke prediction, minimizing false negative predictions. To facilitate practical implementation, a mobile application incorporating the best-performing model was included. A primary screening which can supplement doctors in stroke diagnosis and prediction was proposed.

Le texte complet de cet article est disponible en PDF.

Graphical abstract




Le texte complet de cet article est disponible en PDF.

Highlights

Depiction of accuracy and weighted measures as inefficient evaluation metrics for the imbalanced stroke prediction dataset.
Assessment of multiple ML models without oversampling while adopting recall as the proper evaluation metric.
Integration of XAI through the use of SHAP and a Flutter based mobile application using the best performing models.

Le texte complet de cet article est disponible en PDF.

Keywords : Brain stroke prediction, Data imbalance, Recall, SHAP


Plan


© 2025  The Author(s). Publié par Elsevier Masson SAS. Tous droits réservés.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 5 - N° 3

Article 100215- septembre 2025 Retour au numéro
Article précédent Article précédent
  • Predicting stroke with machine learning techniques in a sub-Saharan African population
  • Benjamin Segun Aribisala, Deirdre Edward, Godwin Ogbole, Onoja M. Akpa, Segun Ayilara, Fred Sarfo, Olusola Olabanjo, Adekunle Fakunle, Babafemi Oluropo Macaulay, Joseph Yaria, Joshua Akinyemi, Albert Akpalu, Kolawole Wahab, Reginald Obiako, Morenikeji Komolafe, Lukman Owolabi, Godwin Osaigbovo, Akinkunmi Paul Okekunle, Arti Singh, Philip Ibinaye, Osahon Osawata, Adeniyi Sunday, Ijezie Chukwuonye, Carolyn Jenkins, Hemant K. Tiwari, Okechukwu Ogah, Ruth Y. Laryea, Daniel T. Lackland, Oyedunni Arulogun, Omotolani Ajala, Rufus Akinyemi, Bruce Ovbiagele, Steffen Sammet, Mayowa Owolabi
| Article suivant Article suivant
  • EEG–fNIRS signal integration for motor imagery classification using deep learning and evidence theory
  • Mohammed E. Seno, Niladri Maiti, Maulik Patel, Mihirkumar M. Patel, Kalpesh B. Chaudhary, Ashish Pasaya, Babacar Toure

Bienvenue sur EM-consulte, la référence des professionnels de santé.

Elsevier s'engage à rendre ses eBooks accessibles et à se conformer aux lois applicables. Compte tenu de notre vaste bibliothèque de titres, il existe des cas où rendre un livre électronique entièrement accessible présente des défis uniques et l'inclusion de fonctionnalités complètes pourrait transformer sa nature au point de ne plus servir son objectif principal ou d'entraîner un fardeau disproportionné pour l'éditeur. Par conséquent, l'accessibilité de cet eBook peut être limitée. Voir plus

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2026 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.