Expertise et méthodes mathématiques

Expertise et méthodes mathématiques

Dossier : L'expertise judiciaireMagazine N°763 Mars 2021
Par Leila SCHNEPS

De l’utilité des com­pé­tences mathé­ma­tiques pour conduire des rai­son­ne­ments logiques là où le bon sens peut éga­rer l’esprit ! Lei­la Schneps a par ailleurs fait un expo­sé sur ce thème lors de la réunion du 27 sep­tembre 2017 du groupe X Exper­tise. Par­mi les exemples trai­tés, elle a évo­qué notam­ment l’affaire Drey­fus. Pour les cama­rades inté­res­sés, le rap­port Poin­ca­ré détaille avec pré­ci­sion les erreurs com­mises par Bertillon.

Si l’expertise dénote la com­pé­tence dans une matière pré­cise, il n’y a guère de sens à par­ler de l’expertise d’un mathé­maticien, celui-ci étant sup­po­sé expert dans son domaine par défi­ni­tion. Men­tion­ner l’expertise en mathéma­tiques n’a de sens que par rap­port à des cir­cons­tances dans les­quelles le mathé­ma­ti­cien se trouve confron­té à des per­sonnes ne connais­sant pas suf­fi­sam­ment de mathé­ma­tiques pour éva­luer cor­rec­te­ment une situa­tion qui cepen­dant en dépend. Il est de nom­breux domaines, comme l’ingénierie ou la finance, dans les­quels il n’est jamais besoin de faire appel à un expert mathé­ma­tique, puisque les per­sonnes char­gées du tra­vail pos­sèdent déjà les com­pé­tences pour effec­tuer les cal­culs néces­saires. Les mathé­ma­tiques sont par exemple par­tie inté­grante du cur­sus des écoles d’ingénieurs, tan­dis que les quants de Wall Street sont le plus sou­vent d’ex-étudiants en mathé­ma­tiques. Mais il existe aujourd’hui des domaines où ce n’est pas le cas, que ce soit par habi­tude, par tra­di­tion ou par igno­rance. Les deux exemples les plus frap­pants de tels domaines sont la méde­cine et la jus­tice. Dans la suite, nous décri­rons trois thèmes liés à ces deux domaines, illus­trés par des exemples tirés de vrais cas, qui ser­vi­ront à illus­trer des situa­tions typiques dans les­quelles le recours à un expert mathé­ma­ti­cien pour­rait évi­ter de graves erreurs.


Aus­si bien les méde­cins que les juges se trouvent régu­liè­re­ment confron­tés à des pro­blèmes mathé­ma­tiques tout à fait pré­cis, sans avoir jamais reçu l’entraînement qui les ren­drait capables de les éva­luer cor­rec­te­ment pour en tirer des conclu­sions fiables. Il n’y a à peu près pas de com­mu­ni­ca­tion entre mathé­ma­ti­ciens et méde­cins, ou entre mathé­ma­ti­ciens et magis­trats, et il n’existe aucune pos­si­bi­li­té offi­cielle de faire appel à un expert en mathé­ma­tiques. La plu­part du temps d’ailleurs, le concer­né, méde­cin ou magis­trat, n’est pas même conscient d’une lacune, satis­fait d’user du simple bon sens pour inter­pré­ter les résul­tats d’une étude ou éva­luer la force pro­bante d’une démons­tra­tion. Cepen­dant, à défaut de l’entraînement néces­saire, il n’est que trop facile de tom­ber dans des erreurs de logique, le rai­son­ne­ment juste étant par­fois contre-intui­tif, ou encore de se lais­ser prendre à des erreurs pro­ba­bi­listes pro­vo­quées par des confu­sions entre connec­teurs logiques, ou tout sim­ple­ment com­mettre des erreurs de cal­cul, sou­vent dues à l’idée que les mathé­ma­tiques consistent en un ensemble de recettes de cui­sine, alors que des méthodes mathé­ma­tiques par­fois plus sophis­ti­quées, mises en œuvre par des mathé­ma­ti­ciens expé­ri­men­tés, peuvent mener à des réponses fiables.


Thème 1 : information invisible ou covariables

Dans un article de 1991, D. Chad­wick et al. publient les résul­tats d’une étude menée pen­dant presque cinq ans au Children’s Hos­pi­tal de San Die­go, dans laquelle ils exa­minent tous les cas d’enfants de moins de cinq ans ame­nés à l’hôpital pour cause de chute. Des 317 enfants obser­vés au total pen­dant la durée de l’étude, Chad­wick exclut tous ceux qui sont tom­bés d’une hau­teur incon­nue et divise les autres en trois groupes : les petites chutes (moins d’1 m 50), les chutes moyennes (1 m 50 à 3 m) et les grandes chutes (plus de 3 m). Il constate la pré­sence d’un seul décès par­mi les 118 enfants vic­times d’une grande chute, aucun dans le groupe des chutes moyennes, mais sept décès par­mi les 100 enfants dans le groupe des petites chutes. Par­tant de cette consta­ta­tion alar­mante, il indique qu’il n’y a que deux pos­si­bi­li­tés : ou l’on peut croire que les his­toires de petites chutes mor­telles étaient fausses et qu’il s’agissait en réa­li­té de cas de mal­trai­tance, ou alors on peut croire que les his­toires de petites chutes mor­telles étaient véri­diques, mais alors il faut accep­ter que les chutes d’une hau­teur d’1 m 50 sont presque huit fois plus dan­ge­reuses que les chutes de plus de 3 m.

“Des centaines d’arrestations de parents
et d’accusations de maltraitance.”

Cette étude a été citée pour jus­ti­fier des cen­taines d’arrestations de parents et d’accusations de mal­trai­tance. Pour­tant cette conclu­sion (encore fré­quem­ment citée aujourd’hui) est tota­le­ment fausse. Les auteurs oublient un ren­sei­gne­ment invi­sible mais fon­da­men­tal : alors que les enfants qui tombent de plus de 3 m finissent tous à l’hôpital, pra­ti­que­ment aucun enfant n’est ame­né à l’hôpital pour avoir fait une chute de moins d’1 m 50. Le taux de mor­ta­li­té des grandes chutes est peut-être bien de 1 sur 118, mais le taux de mor­ta­li­té des petites chutes n’est nul­le­ment de 7 sur 100, mais plu­tôt de 7 sur les plu­sieurs mil­lions de petites chutes subies par les enfants de moins de 5 ans de toute la région de San Die­go sur une période d’à peu près cinq ans. Les chiffres don­nés par les auteurs ne jus­ti­fient abso­lu­ment pas la conclu­sion que les petites chutes seraient plus dan­ge­reuses que les grandes, ou que, si un décès est expli­qué par une his­toire de petite chute, l’histoire est néces­sai­re­ment fausse. Pour­tant c’est bien ce que l’article explique.

Une erreur simi­laire se trouve dans un article très récent visant à démon­trer que les petites chutes ne peuvent pas cau­ser cer­taines lésions asso­ciées au syn­drome du bébé secoué (héma­tome sous-dural, etc.). L’argument pré­sen­té affirme que, si tel était le cas, on consta­te­rait autant de cas pro­ve­nant de crèches que de domi­ciles de par­ti­cu­liers ; or à peine 1 % des cas pro­viennent de crèches. Mais les auteurs oublient qu’à l’âge concer­né par le syn­drome du bébé secoué (3−9 mois en géné­ral), très peu d’enfants (8 %) vont à la crèche, et même ceux-ci n’y passent qu’à peu près 15 de leur temps. On trouve donc que seule­ment 8 % x 20 % = 1,6 % de la tota­li­té des heures sont pas­sées dans les crèches pour des bébés dans cette tranche d’âge, ce qui infirme tota­le­ment l’argument des auteurs.

Thème 2 : le sophisme du procureur

Une erreur logique extrê­me­ment fré­quente, dont l’origine consiste en la confu­sion entre deux pro­ba­bi­li­tés rela­tives, est connue sous le nom de sophisme du pro­cu­reur. Elle se ren­contre en géné­ral dans le rai­son­ne­ment sui­vant : étant don­né que, d’après les experts, il y a une pro­ba­bi­li­té infime que l’explication du sus­pect soit la vraie, il est qua­si cer­tain que le sus­pect est en fait cou­pable. En effet, énon­cé ain­si, il est presque impos­sible de s’apercevoir qu’il y a un sophisme. Le cas bri­tan­nique très média­ti­sé de Sal­ly Clark nous offre cepen­dant un bon contre-exemple. Cette jeune mère a per­du deux nour­ris­sons en deux ans. Les deux fois, la mère était seule avec l’enfant, ce qui était nor­mal puisqu’elle était en congé de mater­ni­té alors que son mari tra­vaillait, et les deux fois elle a expli­qué que l’enfant était tom­bé subi­te­ment malade. Aucune cause de décès n’a pu être déce­lée lors des autop­sies. De ce fait le pre­mier décès a été clas­sé comme mort subite du nour­ris­son (MSDN), un mal­heur qui frappe à peu près 40 nour­ris­sons sur 100 000 (le taux varie selon le pays et la région). Mais devant un deuxième décès ana­logue l’année sui­vante, la jus­tice s’est sai­sie de l’affaire.

Le témoin expert, méde­cin spé­cia­li­sé dans la mal­trai­tance, a tenu à peu près le rai­son­ne­ment sui­vant : Il y a une chance sur 1 400 qu’un bébé meure de mort subite du nour­ris­son. Mais une étude récente a mon­tré que, dans une famille où aucun des deux parents n’est fumeur, ni chô­meur, ni très jeune, ce taux tombe à 1 sur 8 540. Comme cette famille est dans ce cas, il y a une chance de 1 sur 8 540 au car­ré, c’est-à-dire de 1 sur 73 mil­lions, que cela se pro­duise deux fois dans une même famille, ce qui est qua­si­ment impos­sible ; elle doit donc être décla­rée cou­pable de les avoir tués. Sal­ly Clark a été condam­née ; il a fal­lu plu­sieurs années et l’intervention de la Royal Sta­tis­ti­cal Socie­ty pour annu­ler le ver­dict. De fait, il n’est nul­le­ment facile de convaincre la jus­tice – et le public – que le rai­son­ne­ment tenu par ce témoin expert est défec­tueux. Pour­tant, pour un œil entraî­né, l’erreur est évi­dente, car il y a ici confu­sion entre deux pro­ba­bi­li­tés tota­le­ment dif­fé­rentes : d’une part, la pro­ba­bi­li­té que Sal­ly Clark soit inno­cente étant don­né que ses deux nour­ris­sons sont morts ; d’autre part la pro­ba­bi­li­té que ses deux nour­ris­sons soient morts étant don­né qu’elle est inno­cente. En effet, la pro­ba­bi­li­té de 18 540 est celle qu’un bébé meure de MSDN sous l’hypothèse que ses parents n’ont rien fait. Éle­ver cette pro­ba­bi­li­té au car­ré consti­tue déjà une gros­sière erreur en soi, puisque rien ne per­met de sup­po­ser que les deux morts soient indé­pen­dantes l’une de l’autre. Mais, même si elle était juste, la pro­ba­bi­li­té infime de 1 sur 73 mil­lions est celle que les deux enfants soient morts de MSDN si leur mère est inno­cente, et non celle qu’elle soit inno­cente étant don­né qu’ils sont morts. Ces deux pro­ba­bi­li­tés sont reliées par un fac­teur qui mesure en fait la pro­ba­bi­li­té qu’une maman tue ses deux enfants – ce qui est rarissime.

En fin de compte on est en train de peser le poids rela­tif de deux pro­ba­bi­li­tés : étant don­né la mort de deux bébés dans une même famille, on cherche d’une part la pro­ba­bi­li­té que ce soit leur mère qui les ait tués, d’autre part la pro­ba­bi­li­té qu’on soit en pré­sence de cas de MSDN, et cha­cune de ces deux pro­ba­bi­li­tés est mesu­rée en uti­li­sant la fré­quence de l’événement (mère meur­trière ou MSDN) dans la popu­la­tion géné­rale. De cette façon, on trouve en fait deux pro­ba­bi­li­tés à peu près égales, ce qui n’est peut-être pas très concluant, mais c’est là un argu­ment beau­coup plus juste que celui pré­sen­té par l’expert.

Thème 3 : la force probante, ou le poids des preuves

Le troi­sième type d’erreur, qui inter­vient très fré­quem­ment dans le cadre judi­ciaire, concerne la capa­ci­té à esti­mer l’information appor­tée par un nou­vel élé­ment de preuve. De nom­breuses études ont mon­tré que juges et jurés ont ten­dance à sous-esti­mer le poids de cer­tains types de preuves. La dif­fi­cul­té d’évaluer cor­rec­te­ment le poids des preuves est bien sûr exa­cer­bée quand il s’agit de consi­dé­rer tout un ensemble de preuves simul­ta­né­ment, d’autant plus que celles-ci ne sont géné­ra­le­ment abso­lu­ment pas indé­pen­dantes les unes des autres. Pour­tant, quand un nou­vel élé­ment de preuve est de type pro­ba­bi­liste, la for­mule de Bayes per­met de l’incorporer cor­rec­te­ment pour révi­ser l’estimation ini­tiale de culpa­bi­li­té. Mal­heu­reu­se­ment, les études montrent que les mises à jour effec­tuées men­ta­le­ment par les déci­deurs devant un tel apport de ren­sei­gne­ment pro­ba­bi­liste cor­res­pondent très peu aux résul­tats four­nis par une appli­ca­tion de la for­mule de Bayes.

Il n’est pas facile d’expliquer pour­quoi nos esti­ma­tions intui­tives sont sou­vent si ter­ri­ble­ment fausses, mais un élé­ment qui contri­bue à cette erreur est cer­tai­ne­ment le fait que nos cer­veaux ne sont pas à même de sai­sir la por­tée de nombres aus­si minus­cules que 0,0000001 ; nous avons ten­dance à asso­cier for­te­ment de tels nombres à la notion de jamais ou impos­sible, alors qu’en réa­li­té tout dépend de la popu­la­tion prise en consi­dé­ra­tion : si la pro­ba­bi­li­té d’un évé­ne­ment est de 1 sur 10 mil­lions, cela veut dire en réa­li­té que l’on peut s’attendre à ce qu’un tel évé­ne­ment se pro­duise une, voire plu­sieurs fois au sein d’une popu­la­tion de 100 mil­lions d’individus. La force pro­bante des preuves pré­sen­tées sous forme d’énoncés pro­ba­bi­listes sans lien direct avec l’accusé, en revanche, a sou­vent ten­dance à être for­te­ment sous-estimée.

“Juges et jurés ont tendance à sous-estimer le poids de certains types de preuves.”

Un exemple frap­pant est le cas de YL, accu­sé d’avoir tiré sur deux per­sonnes depuis sa voi­ture. Une des vic­times est décé­dée sur le coup, mais l’autre a sur­vé­cu et a pu indi­quer la cou­leur de la voi­ture de l’agresseur et émettre le soup­çon qu’il pou­vait s’agir d’YL, qui était en colère contre les vic­times pour une his­toire de regards et de manque de res­pect. La police a donc sai­si la voi­ture d’YL et y a effec­tué des tests de pré­lè­ve­ment de rési­dus de tir. Plu­sieurs par­ti­cules ont été trou­vées sur le volant, la manette de chan­ge­ment de vitesses et le siège du conduc­teur. YL a expli­qué la pré­sence de ces par­ti­cules par le fait qu’il était chas­seur et por­tait donc for­cé­ment des par­ti­cules sur ses vête­ments. La police a donc pro­cé­dé à une expé­rience : d’une part ils ont sai­si 25 voi­tures de chas­seurs pour y mesu­rer la quan­ti­té de rési­dus de tir, d’autre part ils ont recons­ti­tué le crime en tirant avec l’arme du crime depuis l’intérieur d’un véhi­cule propre. Le résul­tat, pré­sen­té lors du pro­cès, était que la voi­ture depuis laquelle on avait tiré pré­sen­tait une quan­ti­té de rési­dus de tir proche de celle de la voi­ture d’YL, qui était de quelque 200 fois plus éle­vée que la moyenne trou­vée dans les voi­tures de chas­seurs. Lors de son pre­mier pro­cès, l’avocat de YL, très connu et très habile, a jeté de toutes les façons pos­sibles un doute sur les résul­tats de la police. Entre autres, il a remis en ques­tion la nature véri­ta­ble­ment scien­ti­fique d’une étude de 25 voi­tures « emprun­tées à vos copains ». YL a été acquitté.

Le par­quet ayant fait appel, un nou­veau pro­cès a été orga­ni­sé deux ans plus tard, à l’issue duquel YL a été condam­né à vingt ans de réclu­sion cri­mi­nelle sans que les preuves aient le moins du monde chan­gé. Il est évident que, au pro­cès d’appel comme en pre­mière ins­tance, ce qui man­quait était une véri­table capa­ci­té de la part du jury d’estimer la force pro­bante des ren­sei­gne­ments numé­riques concer­nant le rési­du de tir. Un réseau bayé­sien uti­li­sé pour modé­li­ser cor­rec­te­ment la situa­tion montre que cette force pro­bante est en réa­li­té extrê­me­ment élevée. 

Ces exemples montrent que l’absence d’experts mathé­ma­tiques dans les domaines médi­cal et judi­ciaire est cause d’un grand nombre d’erreurs, les­quelles entraînent des consé­quences gra­vis­simes. Pour modi­fier cette situa­tion il convien­drait d’instaurer un dia­logue et un tra­vail com­mun des par­ties concer­nées avec des mathé­ma­ti­ciens. Mais, pour cela, il fau­drait que les méde­cins et les acteurs du monde judi­ciaire en recon­naissent la néces­si­té, ce qui implique en pre­mier lieu de recon­naître cer­taines erreurs pas­sées. Il s’agit là d’un acte dont les réper­cus­sions sont telles qu’il appa­raît comme qua­si impos­sible – d’où l’impasse dans laquelle nous nous trou­vons aujourd’hui.


La formule de BayeS

Le théo­rème de Bayes est un résul­tat de base en théo­rie des pro­ba­bi­li­tés, dont l’énoncé est :

P(A|B) = P(B|A) x P(A) / P(B)

où P(A|B) désigne la pro­ba­bi­li­té condi­tion­nelle de A sachant B. La for­mu­la­tion ini­tiale est issue des tra­vaux du révé­rend Tho­mas Bayes et est plus limi­tée, elle a été retrou­vée indé­pen­dam­ment par Laplace. Outre son uti­li­sa­tion en pro­ba­bi­li­tés, ce théo­rème est fon­da­men­tal pour l’inférence bayé­sienne qui s’est mon­trée très utile en intel­li­gence artificielle.


Poster un commentaire