Abbonarsi

New Intraclass Helitrons Classification Using DNA-Image Sequences and Machine Learning Approaches - 22/05/21

Doi : 10.1016/j.irbm.2019.12.004 
R. Touati a, d, , I. Messaoudi b, d , A.E. Oueslati c, d , Z. Lachiri d , M. Kharrat a
a University of Tunis El Manar, LR99ES10 Human Genetics Laboratory, Faculty of Medicine of Tunis (FMT), Tunisia 
b University of Carthage, Higher Institute of Information Technologies and Communications, Industrial Computing Department, Tunisia 
c University of Carthage, National School of Engineers of Cartage, Electrical Engineering Department, Tunisia 
d University Tunis El Manar, SITI Laboratory, National School of Engineers of Tunis, BP 37, le Belvédère, 1002, Tunis, Tunisia 

Corresponding author.

Benvenuto su EM|consulte, il riferimento dei professionisti della salute.
L'accesso al testo integrale di questo articolo richiede un abbonamento.

pagine 11
Iconografia 15
Video 0
Altro 0

Abstract

Helitrons, eukaryotic transposable elements (TEs) transposed by rolling-circle mechanism, have been found in various species with highly variable copy numbers and sometimes with a large portion of their genomes. The impact of helitrons sequences in the genome is to frequently capture host genes during their transposition. Since their discovery, 18 years ago, by computational analysis of whole genome sequences of Arabidopsis thaliana plant and Caenorhabditis elegans (C. elegans) nematode, the identification and classification of these mobile genetic elements remain a challenge due to the fact that the wide majority of their families are non-autonomous. In C. elegans genome, DNA helitrons sequences possess great variability in terms of length that varies between 11 and 8965 base pairs (bps) from one sequence to another. In this work, we develop a new method to predict helitrons DNA-sequences, which is particularly based on Frequency Chaos Game Representation (FCGR) DNA-images. Thus, we introduce an automatic system in order to classify helitrons families in C. elegans genome, based on a combination between machine learning approaches and features extracted from DNA-sequences. Consequently, the new set of helitrons features (the FCGR images and K-mers) are extracted from DNA sequences. These helitrons features consist of the frequency apparition number of K nucleotides pairs (Tandem Repeat) in the DNA sequences. Indeed, three different classifiers are used for the classification of all existing helitrons families. The results have shown potential global score equal to 72.7% due to FCGR images which constitute helitrons features and the pre-trained neural network as a classifier. The two other classifiers demonstrate that their efficiency reaches 68.7% for Support Vector Machine (SVM) and 91.45% for Random Forest (RF) algorithms using the K-mers features corresponding to the genomic sequences.

Il testo completo di questo articolo è disponibile in PDF.

Graphical abstract

Il testo completo di questo articolo è disponibile in PDF.

Highlights

We convert DNA sequences into numerical ones based on chaos game representation theory: (FCGR).
We characterize the helitron families based on their FCGR DNA-images and the K-mers methods.
We develop three classification systems for helitron families: RF, SVM, and PTDNN.
Evaluation is performed on ten helitron classes in C. elegans.
Results show that these systems are very efficient in terms of helitron recognition.

Il testo completo di questo articolo è disponibile in PDF.

Keywords : Helitrons, Tandem repeat, Image recognition, SVM, Random Forest, Inception V3, CNN


Mappa


© 2019  AGBM. Pubblicato da Elsevier Masson SAS. Tutti i diritti riservati.
Aggiungere alla mia biblioteca Togliere dalla mia biblioteca Stampare
Esportazione

    Citazioni Export

  • File

  • Contenuto

Vol 42 - N° 3

P. 154-164 - giugno 2021 Ritorno al numero
Articolo precedente Articolo precedente
  • ROI-Based Compression Strategy of 3D MRI Brain Datasets for Wireless Communications
  • D. Dhouib, A. Naït-Ali, C. Olivier, M.S. Naceur
| Articolo seguente Articolo seguente
  • A No-Reference Quality Metric for Parameter Tuning of Edge-Aware Filters – An Anti-Image Forensic Method
  • P. Shan, A. Kaimal, J. Shiney, J. Derwin

Benvenuto su EM|consulte, il riferimento dei professionisti della salute.
L'accesso al testo integrale di questo articolo richiede un abbonamento.

Già abbonato a @@106933@@ rivista ?

@@150455@@ Voir plus

Il mio account


Dichiarazione CNIL

EM-CONSULTE.COM è registrato presso la CNIL, dichiarazione n. 1286925.

Ai sensi della legge n. 78-17 del 6 gennaio 1978 sull'informatica, sui file e sulle libertà, Lei puo' esercitare i diritti di opposizione (art.26 della legge), di accesso (art.34 a 38 Legge), e di rettifica (art.36 della legge) per i dati che La riguardano. Lei puo' cosi chiedere che siano rettificati, compeltati, chiariti, aggiornati o cancellati i suoi dati personali inesati, incompleti, equivoci, obsoleti o la cui raccolta o di uso o di conservazione sono vietati.
Le informazioni relative ai visitatori del nostro sito, compresa la loro identità, sono confidenziali.
Il responsabile del sito si impegna sull'onore a rispettare le condizioni legali di confidenzialità applicabili in Francia e a non divulgare tali informazioni a terzi.


Tutto il contenuto di questo sito: Copyright © 2026 Elsevier, i suoi licenziatari e contributori. Tutti i diritti sono riservati. Inclusi diritti per estrazione di testo e di dati, addestramento dell’intelligenza artificiale, e tecnologie simili. Per tutto il contenuto ‘open access’ sono applicati i termini della licenza Creative Commons.