An ensemble machine learning-based approach to predict cervical cancer using hybrid feature selection - 15/08/24

Doi : 10.1016/j.neuri.2024.100169 
Khandaker Mohammad Mohi Uddin a, , Abdullah Al Mamun b , Anamika Chakrabarti b , Rafid Mostafiz c , Samrat Kumar Dey d
a Department of Computer Science and Engineering, Southeast University, Bangladesh 
b Department of Computer Science and Engineering, Dhaka International University, Bangladesh 
c Institute of Information Technology, Noakhali Science and Technology University, Bangladesh 
d School of Science and Technology, Bangladesh Open University, Bangladesh 

Corresponding author.

Benvenuto su EM|consulte, il riferimento dei professionisti della salute.
Articolo gratuito.

Si connetta per beneficiarne

Abstract

Cervical cancer has recently emerged as the leading cause of premature death among women. Around 85% of cervical cancer cases occur in underdeveloped countries. There are several risk factors associated with cervical cancer. This study describes a novel predictive model that uses early screening and risk trends from individual health records to forecast cervical cancer patients' prognoses. This study uses machine learning classification techniques to investigate the risk factors for cervical cancer. Additionally, use the voting method to evaluate all models and select the most appropriate model. The dataset used in this study contains missing values and shows a significant imbalance. Thus, the Random Oversampling technique was used as a sampling method. We used Principal Component Analysis (PCA) and XGBoost feature selection techniques to determine the most important features. To predict the accuracy, we used several machine learning classifiers, including Support Vector Machines (SVM), Random Forest (RF), k-nearest Neighbors (KNN), Decision Trees (DT), Naive Bayes (NB), Logistic Regression (LR), AdaBoost (AdB), Gradient Boosting (GB), Multilayer Perceptron (MLP), and Nearest Centroid Classifier (NCC). To demonstrate the efficacy of the suggested model, a comparison of its accuracy, sensitivity, and specificity was performed. We used the Random Oversampling approach along with the Ensemble ML method, hard voting on RF and MLP, and achieved 99.19% accuracy. It is demonstrated that the ensemble ML classifier (hard voting) performs better at handling classification problems when features are decreased and the high-class imbalance problem is handled.

Il testo completo di questo articolo è disponibile in PDF.

Keywords : Cervical cancer, Machine learning, SelectKBest, XGBoost, PCA, Random forest, Multilayer perceptron, Voting classifier


Mappa


© 2024  The Author(s). Pubblicato da Elsevier Masson SAS. Tutti i diritti riservati.
Aggiungere alla mia biblioteca Togliere dalla mia biblioteca Stampare
Esportazione

    Citazioni Export

  • File

  • Contenuto

Vol 4 - N° 3

Articolo 100169- settembre 2024 Ritorno al numero
Articolo precedente Articolo precedente
  • Portability rules detection by Epilepsy Tracking META-Set Analysis
  • Christian Riccio, Roberta Siciliano, Michele Staiano, Giuseppe Longo, Luigi Pavone, Gaetano Zazzaro

Benvenuto su EM|consulte, il riferimento dei professionisti della salute.

@@150455@@ Voir plus

Il mio account


Dichiarazione CNIL

EM-CONSULTE.COM è registrato presso la CNIL, dichiarazione n. 1286925.

Ai sensi della legge n. 78-17 del 6 gennaio 1978 sull'informatica, sui file e sulle libertà, Lei puo' esercitare i diritti di opposizione (art.26 della legge), di accesso (art.34 a 38 Legge), e di rettifica (art.36 della legge) per i dati che La riguardano. Lei puo' cosi chiedere che siano rettificati, compeltati, chiariti, aggiornati o cancellati i suoi dati personali inesati, incompleti, equivoci, obsoleti o la cui raccolta o di uso o di conservazione sono vietati.
Le informazioni relative ai visitatori del nostro sito, compresa la loro identità, sono confidenziali.
Il responsabile del sito si impegna sull'onore a rispettare le condizioni legali di confidenzialità applicabili in Francia e a non divulgare tali informazioni a terzi.


Tutto il contenuto di questo sito: Copyright © 2026 Elsevier, i suoi licenziatari e contributori. Tutti i diritti sono riservati. Inclusi diritti per estrazione di testo e di dati, addestramento dell’intelligenza artificiale, e tecnologie simili. Per tutto il contenuto ‘open access’ sono applicati i termini della licenza Creative Commons.