La modélisation des épidémies à l’épreuve de la Covid-19

Point de vue

Dossier : ExpressionsMagazine N°765 Mai 2021

« Complexifier pour affiner » (Cédric Villani) ou « Complexifier pour corriger discrètement des équations inexactes » ?

Conférence à distance donnée le 22 avril 2021 aux membres de Géostratégies 2000 et du Groupe « Défense et Géostratégie » de Sciences Po Alumni

Consulté il y a plus d’un an, Cédric Villani, tout à la fois député et Médaille Fields, a remis le 30 avril 2020 à l’Office parlementaire d’évaluation des choix scientifiques et technologiques une note intitulée « Covid-19 – Point sur la modélisation épidémiologique pour estimer l’ampleur et le devenir de l’épidémie de Covid-19 ».

La première partie de cette note reprend les grandes lignes de la communication fondatrice des modèles dits « compartimentaux » transmise en 1927 par les Ecossais Kermack et McKendrick à la Royal Society de Londres ; dans ses dernières pages figure un système d’équations différentielles très simples censé modéliser le développement d’une épidémie. Après avoir rappelé ces équations, Cédric Villani explique dans un chapitre de sa note intitulé intitulé : « Complexifier pour affiner » comment il est possible d’améliorer par divers procédés la précision de ce modèle datant de 1927.

Dans les universités et les écoles de médecine du monde entier, la quasi-totalité des cours de modélisation épidémiologique reposent sur les mêmes bases et reprennent les « équations de Kermack et McKendrick ». Or si on examine de près leur communication de 1927, on s’aperçoit qu’existe une divergence entre ce système d’équations différentielles et le schéma de modélisation défini dans les premières pages de leur document.

Vraisemblablement dans l’espoir (qui s’est révélé vain !) de pouvoir trouver sans l’aide d’ordinateurs, inexistants en 1927, une solution permettant de rendre compte du développement d’une épidémie sous forme de fonctions analytiques du temps, Kermack et McKendrick ont défini à la fin de leur communication ce qu’ils appellent un « special case » simplifié (dit à « constant rates ») qui leur permet de proposer le système d’équations différentielles très simples passé à la postérité.

Or l’option de simplification choisie pour ce « special case » (probabilité de guérison uniforme, ne dépendant pas du temps depuis lequel un individu est contaminé, alors que c’est la durée de la maladie qui est assez uniforme) conduit à des résultats qui peuvent être très inexacts à des moments de l’épidémie où le nombre de personnes infectées varie fortement (début d’épidémie, confinement, déconfinement, mutations entraînant une variation importante de contagiosité d’une bactérie ou d’un virus …).

Par la suite, beaucoup de mathématiciens travaillant sur la modélisation épidémiologique se sont mis à utiliser comme point de départ le système d’équations figurant dans les cours de modélisation, sans réaliser que ce système prétendait uniquement simuler un « special case », et que de plus il le faisait de façon erronée et ne pouvait pas rendre compte correctement du développement d’une épidémie réelle à évolution rapide.

Pour une raison inexplicable, les modélisateurs sérieux qui ont constaté les erreurs résultant de cette situation ne veulent pas donner l’impression qu’ils remettent en cause ce système traditionnel erroné d’équations différentielles. Ils préfèrent en compenser discrètement les défauts par des procédés de calcul pas toujours bien documentés, et refusent toute remise en cause officielle des équations de 1927, au prétexte qu’il y a dans un sujet aussi complexe tellement de raisons potentielles d’erreurs qu’il ne serait pas très utile de commencer par rectifier ouvertement celle de 1927. Ils se sont lancés dans l’élaboration de modèles d’une grande complexité dont une partie ne sert qu’à corriger le caractère erroné de ces équations, action camouflée car noyée dans d’autres développements (ceux-là légitimes, car destinés à réellement affiner le modèle).

Le résultat est une floraison de modèles, chacun établi avec des recettes mathématiques « maison », généralement invérifiables car peu documentés, leurs codes informatiques n’étant pas rendus publics.

C’est la raison pour laquelle, parallèlement à la consultation de grands organismes ayant développé des modèles complexes au fonctionnement interne réellement connu de leurs seuls développeurs, paraîtrait intéressante l’utilisation complémentaire de modèles simplifiés corrigeant le « special case » de 1927 (ce qui est très facile en utilisant un tableur). Les non‑mathématiciens professionnels, en particulier les énarques et les médecins qui co‑gèrent actuellement les actions des pouvoirs publics, pourraient ainsi explorer par eux‑mêmes différentes options de politique sanitaire, ce qui leur permettrait de mieux définir leurs demandes de vérifications et de tests de nouvelles hypothèses auprès des responsables des modèles institutionnels. Cette possibilité serait particulièrement intéressante pendant les prochaines semaines où doit en principe être mise en œuvre de façon progressive la levée des mesures de freinage actuelles de l’épidémie.

Pour voir la conférence entière : https://www.youtube.com/watch?v=gOd-MeUpK30