Adieu p < 0,05. La valeur p n’est qu’un élément parmi tant d’autres permettant d’évaluer les preuves scientifiques - 11/03/26
Goodbye P < 0.05. P-value is simply one item among many to gauge scientific evidence
, Chadli Dziri b, Bob Occean cRésumé |
Points essentiels |
• | Depuis un siècle, une valeur p < 0,05 est considérée comme « le » critère pour rejeter l’hypothèse nulle (absence de différence significative entre deux populations spécifiées, toute différence observée étant due au hasard). |
• | Le principal avantage des valeurs p ( p < 0,05) est qu’elles fournissent aux non-statisticiens une base quantitative pour aborder l’incertitude statistique. |
• | Le « seuil arbitraire de 0,05 » signifie une différence statistique avec un jugement binaire (oui–non). |
• | Dans ses déclarations de 2016, l’Association américaine de statistique a recommandé de ne pas interdire la valeur p elle-même, mais plutôt la valeur dichotomisée p < 0,05. |
• | Dans le nouveau paradigme, les valeurs p doivent être considérées comme un continuum et comme un élément parmi d’autres pour évaluer les preuves scientifiques. |
• | Il existe plusieurs alternatives à la valeur p avec un seuil de 0,05, telles que la taille de l’effet avec intervalles de confiance, le nombre de sujets à traiter ou le nombre de sujets à risque, les méthodes bayésiennes, l’utilisation de seuils plus stricts pour les valeurs p (0,005 ou 0,001), les essais pragmatiques et la différence minimale cliniquement importante. |
• | Chaque outil, qu’il s’agisse de la valeur p ou d’autres méthodes, doit être recommandé et interprété en fonction du contexte. |
• | Le nouveau paradigme exigera des statisticiens, des chercheurs, des éditeurs et des décideurs du secteur de la santé qu’ils modifient radicalement leur façon d’interpréter les données scientifiques, en abandonnant l’analyse dichotomique centenaire et la signification statistique traditionnelle. |
Résumé |
Depuis un siècle, la valeur p est utilisée de manière routinière dans presque tous les articles de recherche, avec un seuil de 0,05 pour rejeter l’hypothèse nulle. Le but de cette brève analyse est d’examiner la validité de ce seuil arbitraire, souvent considéré comme fondamental. L’histoire de la valeur p montre que très rapidement, les praticiens ont adopté une méthode simple qui leur convenait, tandis que les statisticiens ne voyaient pas l’intérêt de freiner cet enthousiasme, qui semblait faire consensus. Cependant, le recours excessif aux valeurs p est préoccupant en raison des risques d’interprétation erronée. Les principaux écueils d’un seuil de signification de p < 0,05 sont l’approche dichotomique avec un jugement binaire, la possibilité de faux positifs, le manque d’informations sur l’ampleur de l’effet, sur la pertinence clinique et l’utilisation hors contexte. Ces écueils expliquent pourquoi plusieurs statisticiens et chercheurs recommandent d’abandonner non pas la valeur p elle-même, mais le seuil de 0,05 et le terme « signification statistique ». Nous sommes ainsi confrontés à un changement de paradigme : il s’agit de séparer la valeur p de son rôle de seuil et d’utiliser des outils alternatifs tels que les méthodes bayésiennes, la taille de l’effet avec intervalles de confiance, des seuils plus stricts, des essais pragmatiques et la différence minimale cliniquement importante. Cela amènerait les statisticiens, les chercheurs, les éditeurs et les décideurs du secteur de la santé à changer radicalement leur façon d’interpréter les données scientifiques en abandonnant l’analyse dichotomique centenaire – une véritable révolution à venir.
Le texte complet de cet article est disponible en PDF.Summary |
For a century, P -value is routinely used in almost every research paper with a threshold of 0.05 to reject the null hypothesis. The aim of this short review was to discuss the validity of this arbitrary (yet sacred) threshold. The history of P -value shows that very quickly, practitioners had found a simple method that appealed to them, while statisticians saw no great need to curb this enthusiasm, which seemed consensual. However, heavy reliance on P -values is of concern because of potential misuse and misinterpretation. The main pitfalls of P < 0.05 are the dichotomized approach with a black-or-white judgement, possible false positive results, lack of information about magnitude of the effect, clinical relevance, and use out of context. These pitfalls explain why several statisticians and researcher recommend abandoning, not the P -value itself but the threshold of 0.05 and the term “statistical significance”. We are faced with a paradigm shift by demoting P -value from its threshold screening role and using alternative tools such as Bayesian methods, effect size with confidence intervals, more stringent thresholds, pragmatic trials, and the minimal clinically important difference. This will require statisticians, researchers, publishers, and health care decision makers to radically change the way they interpret scientific data by abandoning century-old dichotomous analysis – a true revolution to come.
Le texte complet de cet article est disponible en PDF.Mots clés : Statistiques, Signification statistique, P < 0,05 , Recherche clinique
Keywords : Statistics, Statistical significance, P < 0.05 , Clinical research
Plan
| ☆ | Ne pas utiliser, pour citation, la référence française de cet article, mais celle de l’article original paru dans Journal of Visceral Surgery , en utilisant le DOI ci-dessus. |
Bienvenue sur EM-consulte, la référence des professionnels de santé.
L’accès au texte intégral de cet article nécessite un abonnement.
Déjà abonné à cette revue ?
