Sur la philosophie du calcul des probabilités
Dans l’article incriminé, j’écrivais ceci : « Un calcul de probabilités peut toujours se ramener à un schéma d’urnes contenant des boules de diverses couleurs. Pour estimer correctement les chances que l’on a de voir sortir la boule que l’on souhaite et prendre une décision en conséquence, il va falloir tenter de deviner l’urne qu’utilisera “le hasard” et son contenu…
Ce qui compte, ce sont évidemment les renseignements que l’on peut avoir sur le contenu de ces urnes, préalablement au choix que l’on doit faire.
D’où une première loi fondamentale, bien souvent méconnue du calcul des probabilités : la probabilité dépend de la connaissance. » Citant alors l’exemple classique du sexagénaire auquel son assureur donne huit chances sur dix d’atteindre 65 ans alors que son docteur ne lui en donne qu’une sur 20, je poursuivrais : « Un événement peut avoir ainsi différentes probabilités, en fonction du niveau de connaissance du contenu de l’urne dont il constitue l’une des boules. Par ailleurs, l’exemple cité ci-dessus montre que la probabilité estimée par le docteur est meilleure que celle donnée par l’assureur.
D’où une seconde loi fondamentale : l’estimation de la probabilité est d’autant meilleure que le niveau de connaissance est élevé. Allons plus loin : l’aptitude à “changer le contenu de l’urne” en fonction des connaissances que l’on requiert est la marque de l’esprit scientifique, le refus de changer ce contenu est celle du dogmatisme. »
Quand j’ai écrit ces lignes, je ne m’attendais guère à ce qu’elles puissent choquer un monde universitaire dont j’avais pourtant pu mesurer, précisément à propos de mon déchiffrement du « Disque de Phaistos », les réticences « à changer d’urne » dès que l’on touchait à ses modes de penser habituels ! Pourtant, si j’en juge par les remarques que j’ai reçues, il faut croire que le concept d’une probabilité fonction de la connaissance heurte, curieusement, certains enseignants, et j’en vois une confirmation dans l’aventure similaire qui est arrivée, il y a quelques années, à la mathématicienne américaine Marilyn vos Savant.
Le disque de Phaistos (d’après Evans) |
Cette dernière tente avec succès, depuis plusieurs années, de « populariser » – au bon sens du terme ! – les mathématiques. C’est ainsi que, dans l’une de ses rubriques, elle avait parlé d’un jeu télévisé où le candidat doit choisir entre trois portes. Derrière l’une de ces portes se trouve le premier prix, une voiture, et derrière les deux autres, deux lots sans valeur. Quand le candidat a choisi, le présentateur désigne l’une des deux portes restantes et dit : « Il n’y a qu’un paquet de bonbons à 50 cents derrière celle-ci. » Le candidat a alors le droit de modifier son choix…
Marilyn a expliqué que les chances du candidat de gagner la voiture étaient multipliées par deux s’il changeait alors systématiquement son choix… Bien que la démonstration de ce fait soit presque évidente pour qui est habitué au concept de probabilité fonction de la connaissance, l’article a valu à la pauvre Marilyn vos Savant un courrier incendiaire de la part de lecteurs – tous universitaires ! – lui reprochant de « propager l’ignorance » (sic) et lui conseillant de lire « n’importe quel manuel élémentaire » sur le calcul des probabilités « pour éviter de dire des bêtises » !
On relèvera que le problème traité par la mathématicienne américaine illustre magnifiquement le concept mentionné ci-dessus. Si l’on appelle A la porte initialement choisie par le candidat, B celle désignée par le présentateur et C la dernière porte, on peut en effet résumer ainsi les différentes probabilités qui interviennent :p> a) Pas de connaissance préalable : la probabilité que A (ou B ou C) soit la bonne porte est de 1⁄3.
b) Avec une information préalable : si le présentateur désignait la porte B avant le choix du candidat, la probabilité que A (ou C) soit la bonne porte serait de 1⁄2.
c) Avec deux informations préalables : si le candidat a choisi A et qu’ensuite le présentateur désigne B, la probabilité que A soit la bonne porte reste de 1⁄3 (pas de changement d’urne !), mais celle que C soit la bonne porte passe à 2⁄3 (après l’élimination de B comme possible « bonne porte »)2.
N’est-il pas curieux que des considérations aussi évidentes heurtent tant d’universitaires, prisonniers d’une « pensée unique » ?
Je terminerai par une dernière remarque : le concept de probabilité fonction de la connaissance trouve aussi son application dans le problème des estimateurs : ainsi, si tout ce que l’on connaît d’une fonction aléatoire est un ensemble de valeurs expérimentales, le meilleur estimateur de la moyenne (inconnue) de cette fonction est la moyenne arithmétique des valeurs relevées (Gauss, Fischer, etc.).
Mais si l’on a d’autres renseignements sur cette fonction (par exemple si l’on sait qu’elle fait partie d’une famille de fonctions similaires à répartition gaussienne), on peut trouver de meilleurs estimateurs de la moyenne inconnue, comme l’ont montré Bayes, Stein, Pearson, etc.
_____________________________________
1. Voir Le déchiffrement du disque de Phaistos, L’Harmattan, 1999 (recension pages 68 et 69).
2. N.D.L.R. : nos camarades qui douteraient de la validité de ce raisonnement peuvent se référer au numéro d’avril 1996 de Pour la Science (page 96) ; ce problème a été évoqué pour la première fois par Joseph Bertrand dans son Calcul des probabilités (1889).