revues des maladies respiratoires - Organe officiel de la Société de Pneumologie de Langue Française (SPLF)

Article gratuit !

Revue des Maladies Respiratoires
Vol 25, N° 9  - novembre 2008
pp. 1081-1086
Doi : RMR-11-2008-25-9-0761-8425-101019-200810843
Reçu le : 28 septembre 2008 ;  accepté le : 29 septembre 2008
Des niveaux de preuve aux recommandations. Rapport de la Société de Pneumologie de Langue Française
Levels of proof for Guidelines. Report of the French Language Society of Pneumology
 

S. Marchand-Adam [1 et 8], G. Thabut [2], J. Cadranel [3], P. Bonniaud [4], A. Didier [5], N. Roche [6], M. Bonay [7], É. Lemarié [1 et 8],  ; le Conseil Scientifique de la SPLF
[1] Service de Pneumologie et exploration fonctionnelle respiratoire, CHRU de Tours, Hôpital Bretonneau, Tours, France.
[2] Service de Pneumologie B, Hôpital Bichat Claude Bernard, APHP, Paris, France.
[3] Service de Pneumologie, APHP, Hôpital Tenon, Paris, France.
[4] Service de Pneumologie, CHU de Dijon, Dijon, France.
[5] Service de Pneumologie, CHU de Toulouse, Hôpital Larrey, Toulouse, France.
[6] Service de Pneumologie, APHP, Hôtel Dieu, Paris, France.
[7] Service de Physiologie, explorations fonctionnelles multidisciplinaires, APHP, Hôpital Bichat Claude Bernard, Paris, France.
[8] Inserm U 618, Faculté de médecine, Université Francois Rabelais, Tours, France.

Tirés à part : S. Marchand-Adam

[9] Service de Pneumologie et exploration fonctionnelle respiratoire, Hôpital Bretonneau, 2 boulevard Tonnellé, 37044 Tours cedex.

Introduction

La médecine fondée sur les faits (ou sur les preuves) se définit comme « l’utilisation rigoureuse et judicieuse des meilleures données disponibles lors de prise de décisions concernant les soins à prodiguer à des patients individuels ». On utilise plus couramment le terme anglais Evidence-Based Medicine (EBM), et parfois le terme de médecine factuelle. Ces preuves proviennent de l’analyse de la littérature scientifique et en particulier des études cliniques. L’intérêt est d’offrir aux patients le meilleur choix en termes de méthodes de diagnostic et de prise en charge thérapeutique, de diminuer l’impact de la publicité médicale ouverte ou cachée sur la décision clinique et de fonder la maîtrise des dépenses de santé sur des bases scientifiques.

Les recommandations pour la pratique clinique (RPC) doivent être des synthèses pratiques de cet état des connaissances à un moment donné. Malheureusement, de nombreuses RPC publiées ne remplissent pas tous les critères de qualité. Le GRADE (Grades of Recommendation Assessment, Development and Evaluation) working group a proposé une méthode d’élaboration de RPC fiable, utilisable et évolutive qui est devenue la méthode de référence [1]. Une grille dite AGREE (voir plus loin) a par ailleurs été développée pour apprécier la qualité du processus qui a conduit à une RPC.

Plusieurs sociétés savantes telles que l’American Thoracic Society (ATS) et l’American College of Chest Physicians ont adopté et adapté récemment cette méthode pour l’élaboration de leur RPC [2], [3]. En janvier 2008, la SPLF et la Haute Autorité de Santé (HAS) ont organisé une réunion de travail pour définir la méthodologie employée pour les futures RPC. Ce texte est issu de cette réunion. Il a été approuvé par le Conseil Scientifique de la SPLF.

Du niveau de preuve aux recommandations
Les niveaux de preuves

L’exercice médical nécessite d’être en contact permanent avec la recherche et de suivre l’évolution des sciences. Les preuves scientifiques sont généralement issues des résultats de la recherche clinique. Mais toutes les études cliniques n’ont pas la même puissance, et leur qualité est hétérogène. Une hiérarchisation des études cliniques a été proposée en fonction du niveau de preuve qu’elles apportent (tableau I). Le niveau de preuve se caractérise par la capacité de l’étude à répondre à la question posée et est fonction de la qualité de la méthodologie et de sa réalisation, et de ses résultats. Ces éléments doivent impérativement être analysés pour juger de la pertinence des conclusions qui peuvent en être tirées.

La force d’une recommandation

La force d’une recommandation est le niveau de confiance que l’on a sur le fait que son application apportera plus de bénéfices au patient que d’évènements indésirables. Les facteurs déterminants de la force d’une recommandation sont : la balance bénéfice/risque ; la qualité des données disponibles ; l’importance du critère de jugement ; l’applicabilité (translation de l’évidence dans une situation clinique donnée, dans un contexte donné).

Gradation selon le niveau de preuve

La Haute Autorité de Santé a proposé un tableau de gradation des recommandations selon 3 grades (tableau I) [4].

Une recommandation de grade A est fondée sur une preuve scientifique établie par au moins deux études de fort niveau de preuve (méta analyse, essais comparatifs randomisés de grande puissance aux résultats indiscutables) = niveau de preuve 1.

Une recommandation de grade B est fondée sur une présomption scientifique forte, fournie par des études de niveau de preuve intermédiaire (essais comparatifs randomisés de faible puissance) = niveau de preuve 2.

Une recommandation de grade C est fondée sur des études de faible niveau de preuve (cohortes, études cas/témoins) = niveaux de preuves 3 et 4.

En l’absence de précisions, les recommandations reposent sur un accord professionnel (AP).

GRADE

Les RPC doivent être fiables et reposer sur l’analyse de la littérature, l’avis des experts et la pratique des professionnels de santé concernés. Les RPC doivent être un outil et répondre aux bonnes questions. Le GRADE working group a proposé une méthode d’élaboration d’une RPC, appelé GRADE qui semble fiable, utilisable et évolutive pour la majorité des disciplines de la santé ( cliquez ici) [1], [2].

Les grandes étapes d’élaboration d’une RPC par GRADE

GRADE propose de suivre des grandes étapes pour l’élaboration des RPC (tableau II).

Identification des critères de jugement pertinents

Il faut différencier les critères de jugement cruciaux (résultats incontournables pour prendre une décision thérapeutique comme une amélioration significative de la survie) ou des critères importants mais non cruciaux (comme le confort, la durée d’hospitalisation…) ; les autres résultats (physiologique ou descriptif) pourront être écartés. Les critères de jugement doivent aussi intéresser les risques et les effets secondaires pour déterminer la balance bénéfice/risque.

Cotation du niveau de preuve

La cotation du niveau de preuve de chaque étude (cotation explicite et formalisée) doit être déterminée de manière méthodique : niveau haut pour les essais randomisés et les méta-analyses ; niveau bas pour les études observationnelles et niveau très bas pour les autres sources de données. Cependant, la lecture critique de la méthodologie d’une étude va montrer des forces ou des faiblesses qui vont faire bouger son niveau de preuve. Le tableau III expose cette démarche, dont un point fort réside dans la possibilité de moduler le niveau de preuve d’une étude au-delà de ce que permettent ses caractéristiques générales (essai randomisé versus étude observationnelle, etc.). Par exemple, un essai randomisé sur un grand nombre de malades suivis de façon prolongée tendrait à être classé en niveau haut ; un biais de sélection important (ou un grand nombre de données manquantes pour le critère de jugement choisi, qui n’était pas le critère principal de l’étude) ne peut toutefois être exclu, et le fera passer en niveau bas dans le système GRADE. De même, les méta- analyses sont souvent considérés a priori comme de niveau haut. Toutefois, une telle analyse sur 3 études très hétérogènes, dont une a de beaucoup plus gros effectifs et compte pour 80 % du résultat de la méta analyse, doit être « descendue » en niveau de preuve bas. À l’inverse, les épidémiologistes protestent souvent à juste titre contre le fait que, leurs études n’étant pas randomisées, elles ne pouvaient « mécaniquement » prétendre à un niveau de preuve haut. GRADE pallie à cet inconvénient des systèmes antérieurs de classification, en permettant de remonter le niveau de preuve d’une étude observationnelle de bonne qualité.

Ces exemples montrent que GRADE impose utilement de rentrer assez finement dans la méthodologie des essais, et doit donc préférentiellement être appliqué par des personnes formées et relativement expérimentées dans ce domaine.

Niveau de preuve global

L’appréciation du niveau de preuve global pour chaque critère de jugement crucial et important, doit passer par l’écriture d’un tableau de synthèse de l’ensemble des études pertinentes. La cotation du niveau global de preuve est déterminée par le plan des études, la qualité scientifique, la cohérence entre les études, le caractère direct des preuves… La preuve globale sera forte, modérée, faible ou très faible selon le niveau de confiance sur la preuve apportée.

  • Élevée : il est très improbable que des travaux de recherche futurs changent notre assurance dans l’estimation de l’effet.
  • Modérée : il est probable que des travaux de recherche futurs aient un impact sur et changent l’estimation de l’effet.
  • Faible : il est très probable que des travaux de recherche futurs aient un impact sur et changent l’estimation de l’effet.
  • Très faible : toute estimation de l’effet est très incertaine.

Évaluation de la balance bénéfice/risque

Il est difficile d’évaluer la balance bénéfice/risque. Les niveaux d’évidence sur l’évaluation du risque posent un problème majeur : une étude randomisée de petite taille ou avec une durée courte et une bonne validité interne est moins appropriée pour évaluer un événement indésirable peu fréquent, apparaissant à long terme par rapport à une bonne étude de cohorte bien conduite. D’ailleurs, les patients inclus dans ces deux types d’études peuvent être différents, ceux de l’étude de cohorte étant plus représentatifs de la population cible, c’est-à-dire les malades pris en charge au quotidien par les soignants destinataires des recommandations. Plus généralement, il faut à ce sujet rappeler la nécessité (et la fréquente difficulté) de déterminer dans quelle population précise s’applique le niveau de preuve associé à une étude : une caricature (non totalement imaginaire) pourrait en être la démonstration, dans un essai randomisé vaste et prolongé, de l’effet d’un traitement de l’insuffisance cardiaque sur la survie de patients de race noire. Le niveau de preuve est haut, mais seulement dans cette population. Enfin, l’appréciation de la balance bénéfice/risque doit prendre en compte les préférences des patients.

L’évaluation de la balance bénéfice/risque déterminera quatre classes : bénéfice certain, balance favorable, bénéfice incertain et pas de bénéfice.

Formulation des recommandations

La formulation des recommandations est simplifiée selon 2 grades.

Une recommandation forte

Il faut faire (ou ne pas faire) : « nous recommandons fortement de…, ou le jury recommande fortement de… ».

Une recommandation optionnelle

Il est possible de faire (ou il est possible qu’il ne faille pas faire) : « le jury propose d’éventuellement faire…, nous proposons d’éventuellement faire… »

Dans certains cas, aucune recommandation ne peut être proposée sur un sujet pourtant sélectionné au départ comme devant être traité, en l’absence de niveau de preuve suffisant.

Finalité

La finalité des RPC peut tendre vers la mise en place d’un algorithme de décision (qui sera à évaluer avant application).

Transparence des RPC

La synthèse des données utilisées pour élaborer les recommandations doit être accessible de manière explicite pour les professionnels qui utilisent les recommandations. Cette traçabilité doit concerner les objectifs de la recherche, la stratégie de la recherche, les critères de sélection des articles, la lecture et l’analyse, la présentation détaillée de la qualité méthodologique de chaque article retenu, la liste des articles exclus et les raisons de l’exclusion…

AGREE

De nombreuses RPC publiées ne remplissent pas tous les critères de qualité. Une RPC de qualité doit être validée scientifiquement, utilisable et fiable. La grille AGREE (Appraisal of Guidelines, Research and Evaluation Collaboration), a développé et validé un instrument générique et international permettant d’évaluer la qualité des RPC. Elle a été adoptée par la HAS. On considérera qu’une RPC est de bonne qualité si les biais associés au processus de développement ont été contrôlés, si les recommandations sont utilisables en pratique. La grille AGREE n’évalue pas le contenu clinique ni les preuves scientifiques qui étayent les recommandations.

Le questionnaire AGREE évalue une RPC selon 36 items dans 6 domaines (tableau IV). Quatre évaluateurs sont choisis pour leur expertise dans le domaine de la RCP. Chacun des évaluateurs réalise pour chaque item, une quantification selon une échelle de 1 à 4 points. Un score standardisé en pourcentage est obtenu pour chaque domaine pour l’ensemble des examinateurs Le score standardisé par domaine se calcule en additionnant les scores de tous les items constituant ce domaine et en rapportant ce total comme le pourcentage du score maximal possible pour ce domaine (exemple de grille AGREE appliquée à l’analyse de la qualité des recommandations de la SPLF sur la BPCO dans le tableau V) [5]. Ensuite il existe une évaluation globale qui se résume à la réponse à la question : « Recommanderiez-vous l’utilisation de cette RPC en pratique ? » par 4 propositions : Fortement recommandée ; Recommandée avec certaines réserves ou après modifications ; Non recommandée ; Incertain. Cette évaluation globale n’est pas l’agrégé des scores des six domaines en un score global mais prendre en compte tous les items et utiliser le sens commun.

Conclusion

Le grand nombre de domaines de la pratique clinique qui justifient l’élaboration de RPC ne permet pas que toutes ces recommandations soient élaborées exclusivement sous la responsabilité d’organismes spécialisés comme la HAS. Les Sociétés Savantes doivent elles aussi être à l’initiative de RPC et en conduire l’élaboration, en collaboration bien sûr avec la HAS et le cas échéant d’autres agences de tutelle (AFSSAPS…). La méthodologie d’élaboration d’une RPC est un facteur primordial pour son adoption et son application, par les soignants comme par les pouvoirs publics. Il est donc indispensable qu’elle soit harmonisée et explicite. L’attribution de niveaux de preuve et l’établissement de la force des propositions constituent des étapes majeures du processus, et doivent être rigoureux mais sans rigidité « aveugle ». Le système GRADE, qui allie une grande rigueur et le niveau de « souplesse contrôlée » requis, a donc été adopté par la SPLF pour ses RPC.

Il faut aussi souligner que l’essor de la médecine fondée sur les preuves et de l’évaluation médicale ont conduit à la production de multiples recommandations à l’échelle internationale et nationale. Dans nombre de cas, un thème défini par une société savante ou un organisme de tutelle comme devant faire l’objet d’une recommandation, a déjà été abordé dans le passé et/ou dans d’autres pays : il s’agit alors d’une mise à jour et/ou adaptation d’un RPC existante. La grille AGREE permet alors de déterminer si les recommandations « source » peuvent, sur un plan méthodologique, être prises en considération. Elle aussi a été adoptée par la SPLF pour ses RPC.

Références

[1]
Atkins D, Best D, Briss PA, Eccles M, Falck-Ytter Y, Flottorp S, Guyatt GH, Harbour RT, Haugh MC, Henry D, Hill S, Jaeschke R, Leng G, Liberati A, Magrini N, Mason J, Middleton P, Mrukowicz J, O’Connell D, Oxman AD, Phillips B, Schunemann HJ, Edejer TT, Varonen H, Vist GE, Williams JW, Jr., Zaza S : Grading quality of evidence and strength of recommendations. BMJ 2004 ; 328 : 1490.
[2]
Schunemann HJ, Jaeschke R, Cook DJ, Bria WF, El-Solh AA, Ernst A, Fahy BF, Gould MK, Horan KL, Krishnan JA, Manthous CA, Maurer JR, McNicholas WT, Oxman AD, Rubenfeld G, Turino GM, and Guyatt G. An official ATS statement: grading the quality of evidence and strength of recommendations in ATS guidelines and recommendations. Am J Respir Crit Care Med 2006 ; 174 : 605- 14.
[3]
Guyatt G, Gutterman D, Baumann MH, Addrizzo-Harris D, Hylek EM, Phillips B, Raskob G, Lewis SZ, and Schunemann H : Grading strength of recommendations and quality of evidence in clinical guidelines: report from an american college of chest physicians task force. Chest 2006 ; 129 : 174-81.
[4]
ANAES Andaedées. 2000. Guide d’analyse de la littérature et gradation des recommandations. Service recommandations professionnelles, Anaes, Paris : 60.
[5]
Roche N : Qualité des soins dans le domaine de la BCPO. Rev Mal Respir 2006 ; 23 : 6S44-56.




© 2008 Elsevier Masson SAS. Tous droits réservés.
Accédez directement à un numéro :
  • Résumés du 16ème Congrès de Pneumologie de Langue Française
  • Recommandations pour la pratique clinique du SAHOS de l’adulte (Texte long)
  • Mission ATS 2011 : Les thèmes forts du Congrès américain





Article

PDF
Accès au texte (PDF)
Quel est votre diagnostic ?
Voir la réponse
Opération sous l'égide de la SPLF
La revue RMR est également disponible sur iPhone et iPad grâce à l'application EM-revues. Voir l'application
Site e-commerce : www.elsevier-masson.fr | Service d'aide à la décision clinique : www.em-select.com | Suivez notre actualité sur le blog Elsevier Masson : blog.elsevier-masson.fr
Site pour réussir ses ecn : www.e-ecn.com
EM-CONSULTE.COM est déclaré à la CNIL, déclaration n° 1286925.
En application de la loi nº78-17 du 6 janvier 1978 relative à l'informatique, aux fichiers et aux libertés, vous disposez des droits d'opposition (art.26 de la loi), d'accès (art.34 à 38 de la loi), et de rectification (art.36 de la loi) des données vous concernant. Ainsi, vous pouvez exiger que soient rectifiées, complétées, clarifiées, mises à jour ou effacées les informations vous concernant qui sont inexactes, incomplètes, équivoques, périmées ou dont la collecte ou l'utilisation ou la conservation est interdite.
Les informations personnelles concernant les visiteurs de notre site, y compris leur identité, sont confidentielles.
Le responsable du site s'engage sur l'honneur à respecter les conditions légales de confidentialité applicables en France et à ne pas divulguer ces informations à des tiers.
Fermer
Plan de l'article