P093 - Prédiction du syndrome métabolique à partir de données diététiques et génétiques, à l’aide de « random forest » - 04/12/08
F Szabo de edelenyi [1],
L Goumidi [1],
S Bertrais [2],
C Phillips [3],
R MacManus [4],
H Roche [3],
R Planells [1],
D Lairon [1]
Voir les affiliationsIntroduction et But de l’étude. – Le syndrome métabolique est caractérisé par la présence simultanée d’au moins trois des critères suivants : tour de taille élevé, hypertriglycéridémie, hyperglycémie, baisse du taux de cholestérol HDL et pression artérielle élevée. Il est certainement dû à l’interaction de facteurs environnementaux avec des prédispositions génétiques bien que leurs rôles respectifs soient difficiles à évaluer. Le but de cette étude était de déterminer quels facteurs pourraient prédire l’apparition du syndrome métabolique plusieurs années à l’avance. Pour cela nous avons appliqué une analyse de données multidimensionnelle à des variables collectées dans le cadre d’une vaste étude cas-témoins.
Matériel et Méthodes. – Nous avons utilisé pour cette étude la cohorte SUVIMAX-Lipgene comprenant 1754 individus (877 cas et 877 témoins appariés en fonction de l’âge et du sexe). Nous avons mesuré divers paramètres génétiques et diététiques à l’inclusion chez des individus ayant développé le syndrome métabolique 7 ans plus tard et chez des individus n’ayant pas développé le syndrome. Chez tous les sujets, le génotype de 181 gènes candidats a été déterminé, soit 806 polymorphismes. Parallèlement aux données génétiques, nous avons collecté des informations nutritionnelles ainsi que les taux plasmatiques de différents acides gras. Pour l’analyse de ces données et la prédiction du syndrome métabolique nous avons utilisé la technique de Random Forest qui utilise un ensemble d’arbres de décision. Nous avons tout d’abord utilisé Random Forest pour déterminer le potentiel discriminatif de chaque variable et réduire le nombre de paramètres. Nous avons ensuite utilisé Random Forest pour classer chaque individu comme cas ou témoin.
Résultats. – Nous avons obtenu une estimation du taux de bon classement égale à 71,7 % (72,1 % pour les témoins et 70,7 % pour les cas). Après sélection des variables, seulement 3 polymorphismes ont été utilisés dans l’analyse, ainsi que 2 variables liées aux lipides alimentaires (Acides gras saturés et 18,3) et 10 concentrations d’acides gras plasmatiques. Il apparaît que la concentration plasmatique d’acide palmitoléique (16,1) est la variable la plus discriminante, suivie par les concentrations plasmatiques de 18,3(n-6) et de 18,2. Nous pouvons aussi montrer que les 3 polymorphismes sélectionnés par Random Forest (APOB rs512535, LTA rs915654 and ACACB rs4766587) étaient ceux qui présentaient un haut degré de significativité dans un test de Fisher d’association entre les génotypes et le syndrome métabolique.
Conclusions. – Cette technique basée sur Random Forest est prometteuse car elle permet d’obtenir un bon taux de prédiction d’apparition du Syndrome métabolique mais également de déterminer les facteurs les plus importants.
© 2008 Elsevier Masson SAS. Tous droits réservés.
Vol 22 - N° S1
P. 99 - novembre 2008 Retour au numéroBienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à cette revue ?