S'abonner

New Intraclass Helitrons Classification Using DNA-Image Sequences and Machine Learning Approaches - 22/05/21

Doi : 10.1016/j.irbm.2019.12.004 
R. Touati a, d, , I. Messaoudi b, d , A.E. Oueslati c, d , Z. Lachiri d , M. Kharrat a
a University of Tunis El Manar, LR99ES10 Human Genetics Laboratory, Faculty of Medicine of Tunis (FMT), Tunisia 
b University of Carthage, Higher Institute of Information Technologies and Communications, Industrial Computing Department, Tunisia 
c University of Carthage, National School of Engineers of Cartage, Electrical Engineering Department, Tunisia 
d University Tunis El Manar, SITI Laboratory, National School of Engineers of Tunis, BP 37, le Belvédère, 1002, Tunis, Tunisia 

Corresponding author.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

pages 11
Iconographies 15
Vidéos 0
Autres 0

Abstract

Helitrons, eukaryotic transposable elements (TEs) transposed by rolling-circle mechanism, have been found in various species with highly variable copy numbers and sometimes with a large portion of their genomes. The impact of helitrons sequences in the genome is to frequently capture host genes during their transposition. Since their discovery, 18 years ago, by computational analysis of whole genome sequences of Arabidopsis thaliana plant and Caenorhabditis elegans (C. elegans) nematode, the identification and classification of these mobile genetic elements remain a challenge due to the fact that the wide majority of their families are non-autonomous. In C. elegans genome, DNA helitrons sequences possess great variability in terms of length that varies between 11 and 8965 base pairs (bps) from one sequence to another. In this work, we develop a new method to predict helitrons DNA-sequences, which is particularly based on Frequency Chaos Game Representation (FCGR) DNA-images. Thus, we introduce an automatic system in order to classify helitrons families in C. elegans genome, based on a combination between machine learning approaches and features extracted from DNA-sequences. Consequently, the new set of helitrons features (the FCGR images and K-mers) are extracted from DNA sequences. These helitrons features consist of the frequency apparition number of K nucleotides pairs (Tandem Repeat) in the DNA sequences. Indeed, three different classifiers are used for the classification of all existing helitrons families. The results have shown potential global score equal to 72.7% due to FCGR images which constitute helitrons features and the pre-trained neural network as a classifier. The two other classifiers demonstrate that their efficiency reaches 68.7% for Support Vector Machine (SVM) and 91.45% for Random Forest (RF) algorithms using the K-mers features corresponding to the genomic sequences.

Le texte complet de cet article est disponible en PDF.

Graphical abstract

Le texte complet de cet article est disponible en PDF.

Highlights

We convert DNA sequences into numerical ones based on chaos game representation theory: (FCGR).
We characterize the helitron families based on their FCGR DNA-images and the K-mers methods.
We develop three classification systems for helitron families: RF, SVM, and PTDNN.
Evaluation is performed on ten helitron classes in C. elegans.
Results show that these systems are very efficient in terms of helitron recognition.

Le texte complet de cet article est disponible en PDF.

Keywords : Helitrons, Tandem repeat, Image recognition, SVM, Random Forest, Inception V3, CNN


Plan


© 2019  AGBM. Publié par Elsevier Masson SAS. Tous droits réservés.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 42 - N° 3

P. 154-164 - juin 2021 Retour au numéro
Article précédent Article précédent
  • ROI-Based Compression Strategy of 3D MRI Brain Datasets for Wireless Communications
  • D. Dhouib, A. Naït-Ali, C. Olivier, M.S. Naceur
| Article suivant Article suivant
  • A No-Reference Quality Metric for Parameter Tuning of Edge-Aware Filters – An Anti-Image Forensic Method
  • P. Shan, A. Kaimal, J. Shiney, J. Derwin

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2024 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.