An ensemble machine learning-based approach to predict cervical cancer using hybrid feature selection - 15/08/24

Doi : 10.1016/j.neuri.2024.100169 
Khandaker Mohammad Mohi Uddin a, , Abdullah Al Mamun b , Anamika Chakrabarti b , Rafid Mostafiz c , Samrat Kumar Dey d
a Department of Computer Science and Engineering, Southeast University, Bangladesh 
b Department of Computer Science and Engineering, Dhaka International University, Bangladesh 
c Institute of Information Technology, Noakhali Science and Technology University, Bangladesh 
d School of Science and Technology, Bangladesh Open University, Bangladesh 

Corresponding author.

Bienvenido a EM-consulte, la referencia de los profesionales de la salud.
Artículo gratuito.

Conéctese para beneficiarse!

Abstract

Cervical cancer has recently emerged as the leading cause of premature death among women. Around 85% of cervical cancer cases occur in underdeveloped countries. There are several risk factors associated with cervical cancer. This study describes a novel predictive model that uses early screening and risk trends from individual health records to forecast cervical cancer patients' prognoses. This study uses machine learning classification techniques to investigate the risk factors for cervical cancer. Additionally, use the voting method to evaluate all models and select the most appropriate model. The dataset used in this study contains missing values and shows a significant imbalance. Thus, the Random Oversampling technique was used as a sampling method. We used Principal Component Analysis (PCA) and XGBoost feature selection techniques to determine the most important features. To predict the accuracy, we used several machine learning classifiers, including Support Vector Machines (SVM), Random Forest (RF), k-nearest Neighbors (KNN), Decision Trees (DT), Naive Bayes (NB), Logistic Regression (LR), AdaBoost (AdB), Gradient Boosting (GB), Multilayer Perceptron (MLP), and Nearest Centroid Classifier (NCC). To demonstrate the efficacy of the suggested model, a comparison of its accuracy, sensitivity, and specificity was performed. We used the Random Oversampling approach along with the Ensemble ML method, hard voting on RF and MLP, and achieved 99.19% accuracy. It is demonstrated that the ensemble ML classifier (hard voting) performs better at handling classification problems when features are decreased and the high-class imbalance problem is handled.

El texto completo de este artículo está disponible en PDF.

Keywords : Cervical cancer, Machine learning, SelectKBest, XGBoost, PCA, Random forest, Multilayer perceptron, Voting classifier


Esquema


© 2024  The Author(s). Publicado por Elsevier Masson SAS. Todos los derechos reservados.
Añadir a mi biblioteca Eliminar de mi biblioteca Imprimir
Exportación

    Exportación citas

  • Fichero

  • Contenido

Vol 4 - N° 3

Artículo 100169- septembre 2024 Regresar al número
Artículo precedente Artículo precedente
  • Portability rules detection by Epilepsy Tracking META-Set Analysis
  • Christian Riccio, Roberta Siciliano, Michele Staiano, Giuseppe Longo, Luigi Pavone, Gaetano Zazzaro

Bienvenido a EM-consulte, la referencia de los profesionales de la salud.

@@150455@@ Voir plus

Mi cuenta


Declaración CNIL

EM-CONSULTE.COM se declara a la CNIL, la declaración N º 1286925.

En virtud de la Ley N º 78-17 del 6 de enero de 1978, relativa a las computadoras, archivos y libertades, usted tiene el derecho de oposición (art.26 de la ley), el acceso (art.34 a 38 Ley), y correcta (artículo 36 de la ley) los datos que le conciernen. Por lo tanto, usted puede pedir que se corrija, complementado, clarificado, actualizado o suprimido información sobre usted que son inexactos, incompletos, engañosos, obsoletos o cuya recogida o de conservación o uso está prohibido.
La información personal sobre los visitantes de nuestro sitio, incluyendo su identidad, son confidenciales.
El jefe del sitio en el honor se compromete a respetar la confidencialidad de los requisitos legales aplicables en Francia y no de revelar dicha información a terceros.


Todo el contenido en este sitio: Copyright © 2026 Elsevier, sus licenciantes y colaboradores. Se reservan todos los derechos, incluidos los de minería de texto y datos, entrenamiento de IA y tecnologías similares. Para todo el contenido de acceso abierto, se aplican los términos de licencia de Creative Commons.