L’irruption de la médecine fondée sur la preuve scientifique
1828
Depuis la Révolution, la saignée et la pose de sangsues (42 millions de sangsues importées en 1830) étaient les traitements de référence face aux maladies infectieuses (notamment le choléra).
Pierre Louis (1787−1872) décide d’évaluer avec ce qu’il appelle la » méthode numérique » (ancêtre de la biostatistique) l’efficacité réelle de ce traitement. Il constitue une série homogène de malades sur laquelle il collige de façon systématique la survie des malades, et chez ceux qui survivent la durée de la survie. Il effectue ensuite une analyse des résultats selon que la saignée est pratiquée au tout début de la maladie (ce qui est considéré comme la bonne attitude thérapeutique), ou plus tard, et ce en fonction des caractéristiques des malades. Il trouve ainsi que les malades traités dès le début n’ont pas du tout, comme attendu, une survie améliorée ou une durée de maladie plus courte que ceux traités tard (c’est plutôt le contraire !).
Il met ainsi en doute l’efficacité de la saignée et plaide, contre Broussais, pour en restreindre l’usage. La méthode numérique rencontrera comme adversaires aussi bien les traditionalistes, offusqués que des décisions de soins individuels soient prises sur la base de leçons apprises en étudiant des groupes, que Claude Bernard, qui était hostile à la méthode parce que celle-ci reposait sur des » moyennes « , et qui considérait que la variabilité interindividuelle ne devait pas être gommée, mais expliquée.
Aux USA, le livre de Pierre Louis fut traduit dès l’année suivant sa parution en France (1835) et, dans l’ensemble du monde académique anglo-saxon, il reste toujours considéré comme le père de la systématisation de l’emploi de la preuve scientifique en tant que fondement de la pratique de la médecine.
1999
Rapport parmi les rapports qu’elle a mission de publier, l’Agence nationale d’accréditation et d’évaluation en santé (ANAES : voir http://www.anaes.fr) publie un rapport de 108 pages sur l’évaluation clinique des stimulateurs cardiaques (désignés en général par leur nom anglais pacemaker), mis en place pour corriger les anomalies de conduction de l’influx cardiaque, à l’origine de pertes de connaissance.
La méthode de travail utilisée pour publier ce rapport est celle de la » médecine factuelle « , couramment utilisée par cette agence pour répondre aux questions qu’elle se pose, ou que lui posent les sociétés savantes médicales, les professions, les caisses d’assurance maladie, etc. : rechercher dans la littérature scientifique et médicale, de façon objective et exhaustive, l’ensemble des données et études disponibles – celles-ci étant triées en termes de qualité grâce à une grille standardisée – afin d’évaluer l’efficacité du traitement considéré, les risques thérapeutiques qui lui sont éventuellement associés, et les coûts consentis par les individus ou la société.
L’évaluation des pacemakers est un sujet exemplaire car, d’une part, l’aspect technologique d’un tel traitement donne au public un sentiment favorable sur son efficacité, menant peut-être à moins investir dans l’évaluation que dans le cas des médicaments et, d’autre part, de telles technologies peuvent aussi être accompagnées de risques thérapeutiques rendant pertinente la connaissance du rapport avantage/risque ; enfin il s’agit d’un traitement coûteux sur lequel la société peut légitimement s’interroger : en 1998, on considère que 540 000 dispositifs ont été implantés pour un total de 2,5 milliards de dollars. Pour la seule France environ 45 000 stimulateurs cardiaques sont implantés chaque année.
Les complications ne sont pas inexistantes : ainsi l’examen systématique de la littérature (1993 – 1998) fait par l’ANAES démontre un risque de perforation du myocarde compris – selon les études – entre 1 pour 10 000 à 80 pour 10 000 et un risque de perforation de la plèvre compris entre 3 pour 1 000 à 23 pour 1 000. Des infections locales, régionales ou générales sont trouvées entre 0,2 % et 4 % des implantations. Parmi celles-ci, 10 % d’endocardites infectieuses, lesquelles posent un triple problème : diagnostique, nécessité de l’ablation du matériel étranger, avec le risque de récidive de pertes de connaissance et enfin une mortalité élevée, de l’ordre de 25 %. La question de l’efficacité se pose aussi.
Le rapport de l’ANAES évalue, indication par indication, cette efficacité. En l’occurrence, le bilan de ce rapport est assez négatif puisque les auteurs ne jugent pas avoir trouvé dans la plupart des indications de preuve scientifique de » niveau élevé » en termes de bénéfice de survie chez les patients implantés par rapport à des patients comparables non implantés.
Il faut cependant remarquer que dans certains cas (le bloc auriculoventriculaire ou interruption complète de la conduction entre l’oreillette et le ventricule, qui est l’indication la plus fréquente, concernent 38 % des premières poses) on se trouve devant des attitudes thérapeutiques très anciennes pour lesquelles la conviction basée sur des observations est tellement forte qu’elle interdit maintenant – au nom de l’éthique – de monter des études d’évaluation scientifique expérimentales chez l’homme.
Faut-il remettre en question les comportements acquis si leur bien- fondé n’a pas été démontré rigoureusement ? Très souvent, en médecine, des observations de bon sens montrent que ces remises en cause sont naturelles, il suffit de comparer les énormes variations de pratiques entre pays comparables, non accompagnées de variations parallèles de résultats, en restant sur l’exemple des stimulateurs cardiaques (mais ce n’est qu’un exemple parmi beaucoup), on est frappé de constater les disparités : quand la France pose 550 pacemakers par an et par million d’habitants, le Royaume-Uni ou le Japon en posent 200, la Suède ou les Pays-Bas 300, l’Allemagne 450 et les USA et la Belgique 600 !
Inutile de dire aussi que mettre en cause, au nom de l’exigence de » preuve scientifique « , l’efficacité dans une grande proportion des indications d’une pratique aussi répandue et ancienne que le pacemaker, d’autant mieux perçue qu’elle a une aura » technologique « , n’irait pas sans grincements de dents multiples (industriels, médecins et structures libérales de soins fortement impliqués).
La notion de » niveaux de preuve »
La médecine factuelle, lorsqu’elle examine un problème, fournit à la fin de son examen des recommandations, par exemple sur les traitements utiles à employer dans une indication donnée. Ces recommandations sont » graduées » et il est d’usage de préciser le » niveau de preuve » atteint grâce à une cotation standardisée. Cette cotation varie dans le détail selon les organismes, mais suit toujours les mêmes principes.
Par exemple, en France l’ANAES utilise trois niveaux (« grades ») de preuve : les affirmations de grade A sont considérées comme » prouvées scientifiquement » ; les affirmations de grade B correspondent à une » présomption scientifique » et les recommandations de grade C sont fondées sur des études de moindre niveau de preuve.
Sackett, une des autorités historiques de la médecine factuelle, distingue quatre grades de recommandations, eux-mêmes subdivisés en catégories : au total une affirmation peut être classée dans l’un des dix » niveaux de preuve « . Ainsi, examinant un problème donné, l’utilisateur de la médecine factuelle après avoir recherché de façon exhaustive l’ensemble des sources d’information disponible pour répondre à son problème fournira une conclusion précisant le niveau de preuve atteint : » Le dépistage systématique du cancer du sein par mammographie est efficace en termes de mortalité » est une affirmation de grade A, car fondée sur des essais randomisés comparatifs de grande taille et de qualité ; cette affirmation ne pourrait être faite en ce qui concerne le dépistage du cancer des bronches, ou de celui de la prostate pour lesquels les grands essais randomisés n’ont pas démontré de différence en termes de mortalité entre les sujets dépistés.
Quel que soit le système retenu, les tenants de la médecine factuelle donnent le plus haut niveau de preuve à une affirmation relative à l’efficacité d’un traitement quand celle-ci s’appuie sur la » métaanalyse » de plusieurs grands essais thérapeutiques randomisés de qualité, et le plus bas niveau est attribué aux affirmations provenant d’un consensus professionnel ou d’experts.
Il faut remarquer qu’énormément d’actes médicaux et paramédicaux relèvent de cette dernière catégorie : leurs spécialistes sont d’accord, sur la base de leur expérience professionnelle, pour dire que tel traitement est efficace, mais les études qui étayent leur opinion sur des faits scientifiques ne sont pas réalisées.
Les essais thérapeutiques randomisés et leurs métaanalyses
Ainsi, en tout cas en ce qui concerne l’évaluation des traitements, l’essai thérapeutique randomisé est la référence en médecine factuelle : pour prétendre qu’un traitement est efficace avec un niveau élevé de preuve, il faudra que celui-ci ait été comparé au traitement précédent (ou l’absence de traitement) grâce à une expérience menée sur un groupe de patients divisés en deux par le tirage au sort ; l’essai doit porter sur un nombre suffisant de patients pour que les calculs statistiques puissent garantir a priori la possibilité de mettre en évidence une efficacité éventuelle de taille choisie à l’avance.
Rappelons que le premier essai thérapeutique date seulement de 1948, que l’invention du test statistique date seulement des années 1930, que le réel démarrage de l’essai thérapeutique se situe au début des années 1960 y compris en France avec un pionnier, polytechnicien, internationalement connu pour sa contribution méthodologique (D. Schwartz, 1937). Au total entre 1948 et maintenant, plus de 130 000 essais thérapeutiques randomisés ont été publiés (sans compter tous ceux qui ont été effectués mais n’ont pas été publiés).
Les métaanalyses d’essais randomisés sont, comme leur étymologie l’indique, destinées à tirer une conclusion globale à partir d’un ensemble d’essais thérapeutiques portant sur le même sujet.
Leur réalisation nécessite :
- de garantir un accès exhaustif à toutes les sources, pas seulement bibliographiques, d’information pertinentes existantes,
- d’avoir les moyens d’évaluer la qualité des études individuelles afin de pouvoir pondérer leur contribution dans la synthèse obtenue,
- d’exprimer les résultats d’une façon utilisable par ceux auxquels ils sont destinés,
- de prévoir la diffusion efficace de leurs résultats. Les tenants de la médecine factuelle insistent beaucoup sur l’importance de la façon d’exprimer les résultats.
Voici un exemple : dans l’évaluation de l’efficacité du pontage coronarien par rapport au traitement médicamenteux en termes de survie dix ans après traitement, on a trouvé que le pourcentage de mort dans le groupe avec pontage était de 26,4 % contre 30,5 % dans le groupe traité médicalement. Cela fait une différence d’environ 4 %. On peut aussi dire que le risque de mort des malades traités par pontage est 86,7 % de celui du sujet traité médicalement. On peut aussi écrire de façon équivalente qu’il faut traiter 25 patients (1 sur 0,04) avec un pontage afin d’obtenir une mort de moins qu’avec le traitement médicamenteux. Il a été démontré que selon la façon de présenter les résultats les décisions de ceux susceptibles de les utiliser peuvent changer.
Les malades ?
Puisque nous sommes tous des patients, il est intéressant de considérer l’apport possible de la médecine factuelle du point de vue du malade.
La médecine factuelle a été volontiers travestie en un instrument destiné à » faire faire des économies au système de santé « .
Dans cette interprétation, la médecine factuelle – qui très souvent peine à valider avec des arguments scientifiques des pratiques médicales bien installées – fournit des doutes relatifs à l’efficacité de ces procédures aux décideurs avides de couper les coûts et de rationaliser les soins. En réalité, les créateurs de la médecine factuelle ont insisté dès le début sur le fait qu’ils souhaitaient que leur démarche soit appliquée prioritairement au traitement individuel des patients et non à la prise de décision publique.
Dans cette approche individuelle (dont j’ai de nombreux exemples vécus), le médecin déclare (en caricaturant) : » Compte tenu de tel et tel antécédent de ce malade, de son âge, de sa capacité à suivre un traitement au long cours, je recommande – après la revue critique de la littérature que j’ai faite – le traitement X (qui a 30 % de succès au bout de six mois), plutôt que le traitement Y (qui a 10 % de succès). Ceci est basé sur un niveau de preuve de grade B. »
La diffusion d’une telle approche nécessite que les médecins puissent faire face à l’explosion de la diffusion des connaissances médicales qui rend impossible techniquement la mise à jour continuelle des connaissances des médecins.
Aussi a‑t-on assisté au lancement récent de nouvelles revues médicales dont le but est d’extraire les résultats utiles et validés des autres revues médicales. Un autre effort mérite d’être souligné : c’est celui de la collaboration Cochrane.
Cette collaboration mondiale réunit des centaines de spécialistes qui s’agrègent soit géographiquement, soit par pathologie, pour mettre à jour l’évaluation systématique des pratiques des nouveaux traitements (voir http://www.update.cochrane.co.uk)
Ceci ouvre un nouveau sujet : le patient va de plus en plus être un acteur de la décision médicale car il a désormais la possibilité (même s’il ne l’utilise pas encore) d’accéder aux mêmes bases d’information de médecine factuelle que les praticiens. Il peut donc se présenter chez son médecin (cela ne sera pas toujours apprécié positivement) avec des outils critiques relatifs à sa prise en charge : » Ne pourrait-on pas éviter, docteur, cette prescription qui est seulement de grade C d’après la médecine factuelle ? Pourquoi ne pourrais-je pas bénéficier de telle prise en charge dont on a montré qu’elle était efficace (grade A) ? »
Une négociation devra être trouvée pour que le dialogue entre le médecin et son patient soit positif et non pas conflictuel. L’accès aux systèmes d’information bibliographique et aux conclusions des expertises des sociétés savantes ou des organismes spécialisés, l’accès plus facile du patient à son propre dossier médical rendent inévitable cette tendance et il faut donc penser à la meilleure façon d’y préparer à la fois les patients et les médecins.
Ensuite nous avons vu qu’au sommet des » cotations » des niveaux de preuve scientifique se trouve naturellement l’expérimentation humaine, placée bien au-dessus de l’observation comparative qui est assortie d’un bas niveau de preuve. L’essai thérapeutique humain doit être accompli chez des personnes informées, consentantes et volontaires.
L’information des patients va évidemment devenir une réalité comme il vient d’être dit ; leur consentement à entrer dans un essai thérapeutique sera d’autant plus fort qu’ils auront compris que celui-ci est le pilier de la démarche scientifique qui permet précisément de fonder les meilleures décisions et qu’ils seront parfaitement conscients de l’état des connaissances nécessitant cet essai.
Il est remarquable que, dans le domaine du sida où des associations se sont constituées très tôt de façon active, le débat n’ait pas tourné au désavantage des essais thérapeutiques.
Au contraire, plus les patients ont été informés plus ils ont compris que la démarche de progrès était une démarche de progrès scientifique et que celle-ci passait par la participation volontaire à l’expérimentation, seule capable de faire avancer les connaissances sur une base solide.
On peut espérer qu’un tel état d’esprit se généralisera car le progrès de la médecine ne pourra reposer que sur le volontariat informé des patients, source active et non plus passive du progrès des connaissances.