Covid-19 modélisation Excel

Covid-19 : une modélisation simple utilisant Excel, accessible aux non-mathématiciens et pleine d’enseignements

Dossier : Covid-19Magazine N°758 Octobre 2020
Par François Xavier MARTIN (63)

Les équa­tions dif­fé­ren­tielles éta­blies par Ker­mack et McKen­drick en 1927 per­mettent de modé­li­ser le déve­lop­pe­ment d’une épi­dé­mie. Mal­gré leur sim­pli­ci­té, elles n’ont pas de solu­tion pou­vant être expri­mée sous forme ana­ly­tique. Quant aux mul­tiples modèles déri­vés, de plus en plus com­plexes sur le plan mathé­ma­tique, leurs pré­vi­sions n’ont pas tou­jours été fiables. Or l’emploi d’Excel n’est pra­ti­que­ment jamais évo­qué dans les cours d’épidémiologie, alors qu’il per­met de rendre la modé­li­sa­tion d’une épi­dé­mie com­pré­hen­sible à des non-mathé­ma­ti­ciens, de leur de mon­trer sa per­ti­nence et de leur faire com­prendre quelles sont les futures évo­lu­tions possibles.

Pour le non-mathé­ma­ti­cien, tirer per­son­nel­le­ment des ensei­gne­ments pra­tiques du modèle épi­dé­mio­lo­gique de Ker­mack et McKen­drick, même sous sa forme la plus simple dite SIR, paraît très ardu : les spé­cia­listes lui parlent d’exponentielles, de déri­vées, d’équations dif­fé­ren­tielles non linéaires impos­sibles à résoudre sans recou­rir à des sol­veurs infor­ma­tiques. Le résul­tat est une prise de dis­tance fré­quente vis-à-vis de cette dis­ci­pline de la part de beau­coup de méde­cins, qui va pour cer­tains jusqu’à l’affirmation qu’elle n’est pas plus cré­dible que l’astrologie.

Le modèle SIR 

Rap­pe­lons que dans ce modèle la popu­la­tion com­po­sée de N indi­vi­dus est divi­sée en 3 « compartiments » :

  • S popu­la­tion saine non contaminée ;
  • I popu­la­tion infec­tée répu­tée contagieuse ;
  • R popu­la­tion « remise » c’est-à-dire gué­rie et répu­tée immu­ni­sée, ou décédée.

Expri­mées en lan­gage de non-mathé­ma­ti­ciens uti­li­sa­teurs d’Excel, les équa­tions de Ker­mack et McKen­drick signi­fient que :


  • La popu­la­tion S (au départ égale à N moins quelques indi­vi­dus infec­tés) dimi­nue quo­ti­dien­ne­ment de β.S.I indi­vi­dus (β est égal à R0 /(N.D), R0 étant le « taux de repro­duc­tion ini­tial » sou­vent évo­qué par les médias et D la durée moyenne pon­dé­rée en jours d’infection avant gué­ri­son ou décès).

Bien noter que la nota­tion tra­di­tion­nelle R0 n’a rien à voir avec R à l’instant 0.

  • La popu­la­tion R (au départ nulle) aug­mente quo­ti­dien­ne­ment de γ.I indi­vi­dus (γ étant l’inverse de D).
  • La popu­la­tion I (au départ quelques indi­vi­dus) est la dif­fé­rence entre N et (S + R).

Nota : paraî­trait plus logique une modé­li­sa­tion où, au lieu de γ.I indi­vi­dus entrant le jour J dans le com­par­ti­ment R, y bas­cu­le­raient ceux qui ont quit­té le jour (J‑D) le com­par­ti­ment S. Néan­moins les équa­tions clas­siques de Ker­mack et McKen­drick pré­sentent l’avantage d’avoir fait depuis 1927 l’objet de nom­breuses études qui ont four­ni un cer­tain nombre de conclu­sions vali­dées par l’observation de cas concrets d’épidémie. Une com­pa­rai­son entre des modé­li­sa­tions Excel fon­dées sur les deux types d’équations n’a pas mon­tré de dif­fé­rence affec­tant de façon fon­da­men­tale les résul­tats expo­sés dans cet article, qui est donc basé sur l’utilisation des équa­tions traditionnelles. 

Où Excel excelle

À par­tir de D, N et R0 il est facile de bâtir un tableau Excel don­nant l’évolution de S, I et R et de leurs varia­tions quo­ti­diennes pen­dant quelques cen­taines de jours. L’avantage sur des méthodes mathé­ma­tiques clas­siques est l’extrême sou­plesse avec laquelle ce logi­ciel per­met d’introduire des don­nées d’entrée sui­vant n’importe quelle évo­lu­tion au cours du temps, en par­ti­cu­lier pour R0 (et par voie de consé­quence β).

Le dia­gramme sui­vant montre l’évolution de I et de R au début d’une épi­dé­mie qui, dans le cadre de vie habi­tuel d’un pays de 67 mil­lions d’habitants, pré­sente un R0 de 3. Le 17 mars le nombre de nou­veaux infec­tés quo­ti­diens atteint 100 000, ce qui risque d’entraîner 20 jours plus tard un nombre de décès quo­ti­dien de 500 à 1 000, compte tenu d’une léta­li­té réelle de 0,5 à 1 % (voir plus loin). Les pou­voirs publics décrètent alors un confi­ne­ment géné­ral qui fait bais­ser immé­dia­te­ment R0 à 0,7 pen­dant 55 jours. Après le décon­fi­ne­ment du 11 mai, en par­ti­cu­lier sous l’influence de mou­ve­ments liber­taires niant la per­sis­tance de l’épidémie, R0 remonte pro­gres­si­ve­ment de façon linéaire jusqu’à 1,3 en 4 mois, puis se sta­bi­lise à ce niveau à par­tir de sep­tembre 2020.

R et I (millions d'habitants)

Le modèle SIR uti­li­sant Excel montre que le nombre d’infectés simul­ta­nés qui avait aug­men­té jusqu’au début du confi­ne­ment (mars 2020) décroît jusqu’à la fin juillet 2020. Ensuite, si le virus n’évolue pas, si R0 reste stable à 1,3 et si aucun nou­veau trai­te­ment effi­cace n’est mis en œuvre, le nombre d‘infectés simul­ta­nés croît jusqu’à un maxi­mum en juin 2021 (courbe bleu fon­cé) puis dimi­nue jusqu’à ce que l’immunité col­lec­tive cor­res­pon­dant à R0 = 1,3 soit atteinte (envi­ron 40 % de la popu­la­tion immu­ni­sée suite à gué­ri­son ou à toute autre cause, voir plus bas), ce qui ne sur­vient qu’en 2022.

À la mi-août 2020, le cumul de per­sonnes qui ont été conta­mi­nées (courbe bleu clair) est d’environ 4 mil­lions. Une léta­li­té réelle de 0,5 à 1 % conduit à 20 à 40 000 décès depuis le début de la pan­dé­mie, four­chette com­pa­tible avec les chiffres obser­vés en France.

Si les condi­tions rap­pe­lées plus haut res­tent inchan­gées, l’évolution ulté­rieure pré­vue par Excel cor­res­pond ensuite à une hausse sen­sible entre le creux de juillet 2020 et le prin­temps 2021 du nombre quo­ti­dien de nou­veaux infec­tés. Tou­te­fois cette hausse sera beau­coup moins rapide que celle de mars 2020 où le nombre de nou­veaux conta­mi­nés et de décès dou­blait chaque semaine. On assis­te­ra ensuite à une lente décrois­sance jusqu’à extinc­tion de l’épidémie début 2022 (à condi­tion que R0 reste à 1,3 !). Mais plu­sieurs élé­ments sont sus­cep­tibles de modi­fier cette pré­vi­sion : muta­tions impré­vi­sibles du virus, dis­po­ni­bi­li­té de trai­te­ments des malades rédui­sant la durée d’infection, arri­vée de vac­cins, sans oublier les réac­tions com­por­te­men­tales de la popu­la­tion, que ce soit par prise de conscience et ini­tia­tives indi­vi­duelles (sur­tout chez les plus vul­né­rables) ou par res­pect de consignes indi­ca­tives ou coer­ci­tives des pou­voirs publics.

Létalités réelle et apparente 

Le taux de léta­li­té réel, ou infec­tion faci­li­ty rate (IFR), est le rap­port entre le nombre de décès impu­tés à l’épidémie et le nombre total de per­sonnes (y com­pris les asymp­to­ma­tiques) qui ont été infec­tées par le virus cor­res­pon­dant. Pour des rai­sons pra­tiques, ce der­nier nombre ne peut être qu’estimé, car il n’est pas mesu­rable : pour un pays comme la France, à rai­son de 100 000 tests par jour, il fau­drait près de deux ans pour tes­ter une seule fois toute la population.

Cette léta­li­té dépend de carac­té­ris­tiques du virus qui, dans le cas de la Covid-19, paraissent jusqu’à main­te­nant assez stables et assez sem­blables dans l’ensemble des pays tou­chés. Des dif­fé­rences entre pays et régions peuvent appa­raître pour des rai­sons de fond (état de san­té géné­ral de la popu­la­tion, qua­li­té du sys­tème de soins) et des méthodes diver­gentes de sai­sie des motifs de décès, en par­ti­cu­lier dans les cas fré­quents de comor­bi­di­té. Au moment où cet article est écrit, l’estimation du taux de léta­li­té réel de cette infec­tion, au moins en France et dans des pays de niveau de déve­lop­pe­ment com­pa­rable, semble être une four­chette allant de 0,5 à 1 %.

Le taux de léta­li­té appa­rent, ou case faci­li­ty rate (CFR), est le rap­port entre le nombre de décès impu­tés à l’épidémie et le nombre de per­sonnes qui ont été tes­tées posi­tives. La léta­li­té appa­rente est donc tota­le­ment dépen­dante de la poli­tique de tests qui varie énor­mé­ment de pays à pays (par exemple aux États-Unis, on a long­temps tes­té beau­coup plus qu’en France). Lorsqu’ils sont fon­dés sur des « léta­li­tés » tout court qui sont en fait des léta­li­tés appa­rentes, les nom­breux articles ou ouvrages qui pré­tendent com­pa­rer à par­tir de ce chiffre l’efficacité de dif­fé­rents sys­tèmes de soins face à ce virus sont donc ineptes.

« La létalité n’a pas d’influence directe sur la propagation de l’épidémie. »

Dans un modèle épi­dé­mio­lo­gique, la léta­li­té n’a pas d’influence directe sur la pro­pa­ga­tion de l’épidémie, puisque ce qui déter­mine cette der­nière est la baisse pro­gres­sive du nombre d’individus pou­vant être conta­mi­nés, que les autres aient été immu­ni­sés par infec­tion-gué­ri­son ou vac­ci­na­tion ou qu’ils n’aient pas sur­vé­cu à l’infection.

Taux de contamination de la population apportant une immunité collective (herd immunity)

L’emploi d’Excel per­met de déter­mi­ner faci­le­ment le taux d’immunité col­lec­tive, c’est-à-dire le pour­cen­tage de la popu­la­tion qui doit avoir été conta­mi­né (ou vac­ci­né) pour que l’épidémie s’arrête d’elle-même. Il suf­fit de pro­lon­ger le tableau conte­nant S, I et R jusqu’à ce que I devienne nul. La courbe R se ter­mine par une droite hori­zon­tale don­nant le taux d’infectés mini­mal dans la popu­la­tion pour que l’épidémie s’arrête.

On remarque que ce taux est très dépen­dant de R0. Une série d’essais Excel avec des R0 allant de 1 à 4 donne la courbe suivante.

Immunité collective en fonction de R0

Les cours d’épidémiologie donnent pour cette courbe l’équation suivante :

Tauxcol­lec­tive = 1 – exp ( – R0 x Tauxcol­lec­tive )

qui confirme les résul­tats obte­nus grâce à Excel, méthode qui ne demande aucune connais­sance mathé­ma­tique particulière.

Est donc inexacte l’affirmation que l’on entend ou lit sou­vent, selon laquelle pour atteindre une immu­ni­té col­lec­tive il faut que le taux total de per­sonnes ayant été infec­tées dépasse 60 ou 70 %. La courbe montre que, si une popu­la­tion réus­sit à main­te­nir de façon durable un R0 infé­rieur à 1,5, l’immunité col­lec­tive est obte­nue pour des valeurs infé­rieures à 60 % (par exemple envi­ron 40 % pour un R0 de 1,3). La com­bi­nai­son d’un R0 et d’un taux d’infection de la popu­la­tion per­met­tant de se posi­tion­ner au-des­sus de la courbe per­met aus­si d’attendre l’arrivée d’un vac­cin, d’un remède ou d’une éven­tuelle muta­tion favo­rable du virus. Il est pos­sible que cer­taines zones à forte den­si­té de popu­la­tion soient actuel­le­ment proches de cette immu­ni­té col­lec­tive (Stock­holm ?), mais s’y main­te­nir de façon durable impose de ne pas lais­ser aug­men­ter le R0 qui aura per­mis d’en bénéficier.

9 Commentaires

Ajouter un commentaire

Hugues Sévé­racrépondre
7 octobre 2020 à 3 h 24 min

Mer­ci, c’est très inté­res­sant. Je me per­mets une remarque com­plé­men­taire : la dif­fi­cul­té c’est qu’on a des para­mètres pour l’é­pi­dé­mie que sont très dif­fé­rents selon les classes d’âge, aus­si bien en taux de léta­li­té (par exemple près de 30% des hos­pi­ta­li­sés de plus de 80 ans suc­combent, alors que l’on est net­te­ment sous 1% pour les moins de 30 ans), qu’en taux de conta­mi­na­tion (par exemple fin sep­tembre la pré­va­lence est de 200100 000 hab sur les 15–44 ans et envi­ron 50 chez les > 75 ans). En défi­ni­tive, ce qui défi­nit la courbe de mor­ta­li­té sur le long terme, c’est sur­tout la façon dont les plus âgés se seront pro­té­gés, tan­dis que d’un pays à l’autre il faut aus­si com­pa­rer les pyra­mides des âges.

francois-xavier.martin.1963répondre
7 octobre 2020 à 17 h 10 min

Pen­dant l’u­ni­té de temps un indi­vi­du infec­té (donc fai­sant par­tie du com­par­ti­ment I) a en moyenne κ contacts poten­tiel­le­ment conta­mi­nants avec un autre membre de la popu­la­tion, donc κ.S/N avec un indi­vi­du sus­cep­tible d’être conta­mi­né. Si τ est la pro­por­tion moyenne de ces contacts débou­chant sur une conta­mi­na­tion, il en conta­mine donc κ.τ. S/N. En moyenne, au bout d’un cer­tain temps (sor­tie de confi­ne­ment …) les plus âgés ont un κ.τ plus faible que les plus jeunes en rai­son d’un com­por­te­ment plus pru­dent. On peut faire des esti­ma­tions rela­tives à l’influence de l’âge sur la moyenne de κ.τ (et son évo­lu­tion dans le temps) ce qui impacte β (= κ.τ/N ) et R0 (= κ.τ.D ). Le modèle Excel à β et R0 variables pré­sen­té per­met donc la prise en compte de cette dif­fé­rence de com­por­te­ment avec l’âge (qui fait plus que com­pen­ser une éven­tuelle pro­pen­sion supé­rieure à être conta­mi­né lors d’une ren­contre en rai­son d’un sys­tème immu­ni­taire affaibli).
La dif­fé­rence de léta­li­té entre jeunes et plus âgés n’a pas d’in­fluence sur le déve­lop­pe­ment de l’é­pi­dé­mie pour lequel on peut dire cyni­que­ment qu’un décès a le même effet qu’une gué­ri­son immu­ni­sante : c’est de dimi­nuer d’une uni­té le nombre d’in­di­vi­dus sus­cep­tibles d’être contaminés.

philippe.fleury.1959répondre
10 octobre 2020 à 17 h 54 min

Bra­vo ! Ton rai­son­ne­ment est très clair.
Nul n’est cen­sé per­sé­vé­rer dans l’er­reur. Tu pré­co­nises page 7 de mieux déter­mi­ner le coef­fi­cient béta face à un nou­veau virus. Mais pour­quoi pas déjà avec le virus en cours ? L’im­pact sur l’é­co­no­mie des mesures « bar­rière », et a for­tio­ri un futur confi­ne­ment, sera catas­tro­phique. Voir à ce sujet l’ex­cellent livre de notre cama­rade Robert Boyer (X 62) sur les capi­ta­lismes à l’é­preuve de la pan­dé­mie. Il insiste lour­de­ment sur l’im­pact en fonc­tion de la durée de la pan­dé­mie. C’est effec­ti­ve­ment un des très grands risques.
Ce serait bien d’a­voir ton fichier Excel.

Jean-Bap­tisterépondre
17 octobre 2020 à 20 h 47 min

Bel article.
L’im­mu­ni­té de groupe semble tom­ber à l’eau avec des réin­fec­tions à 6 mois, ce qui laisse pla­ner des doutes sur l’ef­fi­ca­ci­té magique d’un vaccin.
De même le nombre de cas dépend du nombre de per­sonnes symp­to­ma­tiques qui sont volon­taires pour se faire tes­ter. Ce qui néces­site d’être symp­to­ma­tique (~50% ?) et volon­taire pour un test (d’ex­pé­rience quo­ti­dienne depuis 7 mois, à la louche 50%). Le virus est donc mal tra­cé et comme bien pré­ci­sé, il s’in­fil­tre­ra chez les plus fragiles.
Avec un hôpi­tal tou­jours aus­si mal géré et pour­tant pléthorique.
Des mois de dou­leur en perspective.

francois-xavier.martin.1963répondre
24 octobre 2020 à 14 h 28 min

A Jean-Bap­tiste. En fait j’ai fait une erreur de voca­bu­laire : j’ai écrit qu’on attei­gnait l’im­mu­ni­té de groupe lors­qu’il n’y avait plus du tout d’in­fec­tés, alors qu’­ha­bi­tuel­le­ment ceci veut dire qu’on a atteint ce qui s« appelle Imax (maxi­mum d’in­fec­tés simul­ta­nés), moment à par­tir duquel l’é­pi­dé­mie s’ar­rête d’elle-même.
Ceci ne veut pas dire qu’il n’y aura plus de nou­velles infec­tions pen­dant cette période de décrois­sance, mais qu’elles seront en nombre insuf­fi­sant pour que l’é­pi­dé­mie per­dure. Donc si le taux de perte de l’im­mu­ni­té après 6 mois n’est pas trop éle­vé, ceci n’empêchera pas l’é­pi­dé­mie de s’ar­rê­ter (tout au plus ça retar­de­ra la fin).
Le nombre de per­sonnes infec­tées ou ayant été infec­tées est incon­nu faute de tests dits aléa­toires (par son­dage sous la hou­lette d’or­ga­nismes spé­cia­li­sés, éven­tuel­le­ment en rétri­buant des panels de son­dés). C’est une grosse lacune dans le sui­vi de l’é­pi­dé­mie qui rend hasar­deuses toutes les prévisions.

Patrickrépondre
2 novembre 2020 à 1 h 14 min

Mer­ci, c’est très clair. Tout petit cor­rec­tif, je pense qu’on parle d” Infec­tion *Fata­li­ty* Rate (IFR) et de Case *Fata­li­ty* Rate (CFR)

francois-xavier.martin.1963répondre
7 novembre 2020 à 11 h 33 min

Mer­ci Patrick de cette correction.
J’ai rec­ti­fié un autre point dans un nou­vel article qui va figu­rer dans la J&R de novembre et qui concerne l’im­mu­ni­té col­lec­tive. J’ai inclus dans l’ar­ticle d’oc­tobre la courbe en fonc­tion de R du total cumu­lé des infec­tions depuis le début de l’é­pi­dé­mie jus­qu’à sa dis­pa­ri­tion. Or tra­di­tion­nel­le­ment la lit­té­ra­ture sur ce sujet consi­dère qu’on a atteint l’im­mu­ni­té col­lec­tive non pas lorsque l’é­pi­dé­mie se ter­mine mais dès qu’elle com­mence à dimi­nuer. Le taux cumu­lé d’in­fec­tions à ce moment ne tient donc pas compte de celles sur­ve­nant pen­dant la phase de décrois­sance de l’é­pi­dé­mie. Je donne les 2 courbes dans l’ar­ticle de novembre.

jean luc therouderépondre
11 janvier 2021 à 18 h 56 min

bon­jour,
voi­là je ne suis pas un grand uti­li­sa­teur d “excel , par contre auriez vous une idée pour inté­grer les para­mètres com­plé­men­taires ci-dessous
a) impact poten­tiel de la vac­ci­na­tion en fonc­tion de sa pro­gres­sion ( nombres de vac­ci­nés pré­vus par semaine , )
b ) durée de la vac­ci­na­tion ” impact de la durée ” sur l’é­vo­lu­tion (hypo­thèse exemple n vac­cins par semaine)
c ) inté­grer ou à modu­ler par la durée de vie de la pro­tec­tion ( en mois ou semaines estimation)
cor­dia­le­ment jean luc theroude

francois-xavier.martin.1963répondre
11 janvier 2021 à 23 h 11 min
– En réponse à: jean luc theroude

Tout d’a­bord vous avez les tableaux Excel (sans vac­ci­na­tion) dans un article du mois de novembre acces­sible à https://www.lajauneetlarouge.com/deuxieme-vague-covid-19-perspectives-2020–2021_modele_sir/ Ce tableau per­met de cal­cu­ler les flux entre 3 « com­par­ti­ments » : S (Sains), I (Infec­tés) et R (Réta­blis ou décé­dés !), les indi­vi­dus pas­sant de S à I (où ils séjournent pen­dant la durée de leur infec­tion) puis de I à R.
Si on vac­cine, dans la modé­li­sa­tion la plus simple il faut ajou­ter chaque jour aux débits pré­cé­dents un débit direct de vac­ci­nés de S vers R, que vous pou­vez modu­ler en fonc­tion de votre poli­tique de vac­ci­na­tion (en prin­cipe dans ces simu­la­tions il faut uti­li­ser des pas d’une jour­née). Après si vous vou­lez raf­fi­ner vous pou­vez ne les faire pas­ser dans R que quelques jours après la vac­ci­na­tion (temps néces­saire pour qu’ils soient immu­ni­sés), les faire remon­ter de R dans S au bout de quelques mois (perte d’im­mu­ni­té après vac­ci­na­tion), etc. Le but est de vider le plus vite pos­sible S car l’é­pi­dé­mie com­mence à s’é­teindre quand Ro x S / N passe en-des­sous de 1 (ce qui ne signi­fie pas qu’elle est ter­mi­née, l’ex­tinc­tion prend un cer­tain temps)

Répondre