Le choix du traitement optimal face à un type de pathologie est délicat. Plusieurs facteurs entrent en jeu. Les méthodes statistiques peuvent aider à affirmer l'efficacité d'un traitement ou à en comparer plusieurs. L'utilisation de placebos y joue un rôle important.

De nos jours, l'utilisation de tests dit en double aveugle, à l'aide d'une comparaison avec un placebo, pour juger l'efficacité d'un médicament ou d'une thérapie est courante. Les traitements médicaux, efficaces ou non, ont une longue histoire. Celle des placebos est beaucoup plus récente ; elle commence, semble-t-il, dans le Connecticut à la fin du XVIIIe siècle.  

La démarche « en double aveugle »

Vers 1795, un médecin américain, Elisha Perkins, fit usage de petites baguettes métalliques pour soulager toutes sortes de maladies simplement en les passant sur les nerfs du corps atteint d'inflammations. La renommée de ces instruments, appelés tracteurs de Perkins, perpétuée par Benjamin, le fils de l'inventeur, devint telle qu'elle parvint aux oreilles d'un médecin épidémiologiste, John Haygarth (1740-1827). Il déve­loppa l'idée d'un test statistique destiné à vérifier empiriquement l'effet réel des tracteurs. 

 

La démarche originale de Haygarth est celle dite en double aveugle dans laquelle ni le patient, ni l'expérimentateur ne connaissent la nature exacte du produit utilisé. Les tests effectués indépendamment par deux médecins dans deux hôpitaux distincts ne révélèrent aucune différence significative entre les tracteurs authentiques et factices.  

La conclusion de Haygarth fut sans appel et consti­tue la première mise en évidence scientifiquement étayée de « l'effet placebo » : Imagination can cause, as well cure, diseases of the body (en français, l'imagination peut provoquer aussi bien la guérison du corps que le rendre malade). Depuis, ces effets ont été constatés à maintes reprises. Parmi toutes ces études, citons celle de Henry K. Beecher, The Powerful Placebo, parue en 1955 dans le Journal of American Medical Association et dans laquelle il attribue environ 30 % du bénéfice thérapeutique général à l'effet placebo.

Supposons que l'on désire tester un médicament en comparant ses effets à celui d'un placebo. Des méthodes identiques peuvent être mises en place pour la comparaison de deux types de traitement mais les conclusions doivent alors êtres nuancées : un traitement moins efficace peut se révéler moins lourd pour le patient en lui évitant de graves pro­blèmes d'allergie et sera parfois préférable. 

On détermine deux groupes de patients homogènes d'effectifs n1 et n2, que l'on soumet respectivement au traitement à tester et au placebo. Pour simplifier, considérons la situation où deux constats seulement sont possibles : le malade guérit ou décède. On se retrouve dans le cas de répétition d'expé­riences identiques à deux issues possibles, ce qui donne naissance à une distribution binomiale. 

 

On observe sur chaque groupe la proportion de guérisons. Elles ne sont évidemment que rarement identiques ; l'objectif est de savoir si la différence observée entre les deux est significative, auquel cas le traitement est considéré comme réellement efficace ou si elle est due au hasard. Plusieurs tests statistiques sont disponibles pour le faire. On peut choisir un test sur la convergence d'une loi binomiale vers la loi normale (voir encadré). 

Un autre test fréquemment utilisé est celui du Khi 2. Pour chacun d'entre eux l'affirmation d'une différence significative n'est donnée qu'avec une fiabilité que l'on choisit (en général de 95 %).

Dans l'exemple donné en encadré, pour chacun des deux tests, on parvient à la même conclusion : le traitement a un effet positif en travaillant avec une fiabilité de 95 % et donc, le risque d'erreur associé est de 5 %. Il s'agit du risque de réfuter une hypothèse exacte, à savoir l'identité des deux populations de malades. 

Que se passe-t-il si l'on désire réduire ce risque et passer par exemple à 1 % ? Dans ce même exemple, le système décisionnel conduit à une acceptation de l'hypothèse d'identité et donc à une non décision. En effet, dans le contexte de la comparaison des taux de guérison, un intervalle de confiance à 99 % tolère des différences en
valeur absolue nettement plus grandes.

La conclusion est donc tout en nuance. Si on accepte de se tromper une fois sur 20, on peut affirmer que le traitement est efficace. Si on accepte de ne se tromper qu'une fois sur 100, on ne peut plus se prononcer. Là s'arrête la puissance de l'outil statistique. Il revient à présent au médecin de prendre des responsabilités et de décider malgré tout.

Lire la suite