S'abonner

Construction of non-symmetric substitution matrices derived from proteomes with biased amino acid distributions - 01/01/05

Doi : 10.1016/j.crvi.2005.02.002 
Olivier Bastien a, b, Sylvaine Roy c, Éric Maréchal a,
a Laboratoire de physiologie cellulaire végétale, département « Réponse et Dynamique cellulaire », UMR 5019, CNRS-CEA-INRA-université Joseph-Fourier, CEA Grenoble, 17, rue des Martyrs, 38054 Grenoble cedex 09, France 
b Gene-IT, 147, av. Paul-Doumer, 92500 Rueil-Malmaison, France 
c Laboratoire de biologie, informatique et mathématiques, département « Réponse et Dynamique cellulaire », CEA Grenoble, 17, rue des Martyrs, 38054 Grenoble cedex 09, France 

Corresponding author.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

pages 9
Iconographies 5
Vidéos 0
Autres 0

Abstract

Automatic comparison of compositionally biased genomes, such as that of the malarial causative agent Plasmodium falciparum (82% adenosine + thymidine), with genomes of average composition, is currently limited. Indeed, popular tools such as BLAST require that amino acid distributions be similar in aligned sequences. However, the P. falciparum genome is so biased that six amino acids account for more than 50% of the protein composition. One reason for the comparison methods failure lies in the compositional difference between the query and the subject proteomes, which is not taken into account in the amino acid substitution matrices. This paper introduces a method to derive substitution matrices, in particular BLOSUM 62, in the frame of the information theory. It allows the construction of non-symmetrical matrices, taking into account the non-symmetric amino acid distributions. The dirAtPf family of matrices allowing the comparison of P. falciparum and A. thaliana is given as an example. This paper further provides an analysis of the obtained matrices in the frame of the information theory, supporting the discrimination advantage they bring. To cite this article: O. Bastien et al., C. R. Biologies 328 (2005).

Le texte complet de cet article est disponible en PDF.

Résumé

La comparaison automatique de génomes biaisés, tel que celui de lʼagent du paludisme Plasmodium falciparum (82 % adénosine + thymidine), avec des génomes de composition moyenne, est limitée. En effet, les outils populaires, tels que BLAST, imposent que les distributions en amino acides des séquences comparées soient proches. Or le génome de P. falciparum est tellement biaisé que six aminoacides constituent plus de 50 % de la composition protéique. Une cause de lʼéchec des méthodes de comparaison est de ne pas tenir compte de ces différences de distributions entre protéomes « requête » et « sujet », en particulier au niveau de la matrice de substitution des aminoacides. Cette note présente une méthode pour dériver les matrices de substitution, en particulier BLOSUM 62, dans le cadre de la théorie de lʼinformation. Il est ainsi possible de construire des matrices non symétriques, tenant compte de la non-symétrie des distributions en amino acides. La famille dirAtPf de matrices permettant de comparer Arabidopsis thaliana et Plasmodium falciparum est proposée comme exemple. Cette note présente, de plus, une analyse de ces matrices dans le cadre de la théorie de lʼinformation, soutenant théoriquement le gain de discrimination quʼelles peuvent apporter. Pour citer cet article : O. Bastien et al., C. R. Biologies 328 (2005).

Le texte complet de cet article est disponible en PDF.

Keywords : Substitution matrix, BLOSUM, Biased genome, Plasmodium falciparum, Information theory, Mutual information

Mots-clés : Matrice de substitution, BLOSUM, Génome biaisé, Plasmodium falciparum, Théorie de lʼinformation, Information mutuelle


Plan


© 2005  Académie des sciences. Publié par Elsevier Masson SAS. Tous droits réservés.
Ajouter à ma bibliothèque Retirer de ma bibliothèque Imprimer
Export

    Export citations

  • Fichier

  • Contenu

Vol 328 - N° 5

P. 445-453 - mai 2005 Retour au numéro
Article précédent Article précédent
  • A simple framework to describe the regulation of gene expression in prokaryotes
  • Filipa Alves, Rui Dilão
| Article suivant Article suivant
  • AFLP analysis of the genetic diversity of Meloidogyne chitwoodi and M. fallax, major agricultural pests
  • Mireille Fargette, Virginie Lollier, Mark Phillips, Vivian Blok, Roger Frutos

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.

Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’achat d’article à l’unité est indisponible à l’heure actuelle.

Déjà abonné à cette revue ?

Mon compte


Plateformes Elsevier Masson

Déclaration CNIL

EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.

En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.


Tout le contenu de ce site: Copyright © 2024 Elsevier, ses concédants de licence et ses contributeurs. Tout les droits sont réservés, y compris ceux relatifs à l'exploration de textes et de données, a la formation en IA et aux technologies similaires. Pour tout contenu en libre accès, les conditions de licence Creative Commons s'appliquent.