Courbes S(t), I(t) et R(t) à β et γ constants

Modèles mathématiques d’épidémies les plus élaborés : pourquoi leurs prévisions initiales sont-elles souvent excessivement pessimistes ?

Dossier : Covid-19Magazine N°758 Octobre 2020
Par François Xavier MARTIN (63)

Les modèles mathé­ma­tiques des pan­dé­mies, y com­pris ceux consi­dé­rés comme les meilleurs, tel celui de l’Imperial Col­lege de Londres, ont sou­vent four­ni des pré­vi­sions ini­tiales exa­gé­ré­ment pes­si­mistes. L’article donne des rai­sons pos­sibles de ces erreurs et sug­gère quelques actions qu’il convien­drait de mener pour sor­tir de cette situation.

« Up to now, the effects of social dis­tan­cing have pre­do­mi­nant­ly been stu­died from a view­point of cen­tral­ly control­led action. We argue that it is of equal impor­tance to consi­der the self-ini­tia­ted reac­tions of indi­vi­duals in the pre­sence of a conta­gious disease. »

Sebas­tian Funk, Erez Gilad, Chris Wat­kins, and Vincent A. A. Jan­sen in Pro­cee­dings of the Natio­nal Aca­de­my of Sciences of the USA.


Repères

Le pre­mier essai de modé­li­sa­tion mathé­ma­tique du déve­lop­pe­ment d’une épi­dé­mie date de 1760 (Ber­nouilli pour la variole). Le début du XXe siècle a vu les ten­ta­tives d’Hamer pour la peste (1906) et de Ross pour la mala­ria (1911). Enfin est appa­ru en 1927 le modèle dit com­par­ti­men­tal de Ker­mack (bio­chi­miste) et McKen­drick (méde­cin mili­taire) connu par son acro­nyme SIR. La plu­part des modèles actuels en sont issus.


Le modèle SIR : un problème traditionnel de l’antique certificat d’études primaires

Un des pro­blèmes posés tra­di­tion­nel­le­ment en fin d’études pri­maires aux élèves qui n’entraient pas en 6e était celui du cal­cul de niveau d’eau dans un réser­voir ali­men­té par un robi­net et vidé simul­ta­né­ment à tra­vers une bonde. Dans le cas du modèle SIR, on a trois réser­voirs : le pre­mier, conte­nant ini­tia­le­ment tout le liquide (= la popu­la­tion saine) et rem­plis­sant pro­gres­si­ve­ment les réser­voirs de niveau infé­rieur (« Infec­tés » et « Réta­blis et décé­dés ») à tra­vers un sys­tème de bondes et de robinets.

Cepen­dant, une dif­fé­rence de taille : dans l’épreuve de feu le CEP, les débits des robi­nets et des bondes étaient constants, alors que dans le modèle SIR les débits sont variables et dépendent des niveaux dans les réservoirs.

Pour bien sai­sir les rai­sons pour les­quelles le SIR et les modèles déri­vés donnent des résul­tats sou­vent éloi­gnés de la réa­li­té du déve­lop­pe­ment d’épidémies, il convient de por­ter atten­tion à la défi­ni­tion pré­cise des para­mètres régis­sant leur fonc­tion­ne­ment, tra­di­tion­nel­le­ment nom­més β et γ.

On consi­dère une popu­la­tion N (par exemple celle d’un pays ou d’une ville) où les indi­vi­dus peuvent être infec­tés par un virus (ou une bac­té­rie, ou encore un para­site). Cette popu­la­tion est divi­sée en 3 « compartiments » :

  • S ou Sains Sus­cep­tibles d’être infec­tés (nombre pra­ti­que­ment égal à N en début d’épidémie) ;
  • I ou Infec­tés (quelques indi­vi­dus conta­mi­nés en début d’épidémie) ;
  • R ou Réta­blis (indi­vi­dus conta­mi­nés puis gué­ris – et, dans ce der­nier cas, consi­dé­rés sys­té­ma­ti­que­ment comme immu­ni­sés – ou décé­dés ; réser­voir vide en début d’épidémie).

Chaque indi­vi­du infec­té (auto­ma­ti­que­ment consi­dé­ré comme immé­dia­te­ment conta­gieux dans ce modèle très simple) a par uni­té de temps en moyenne κ contacts pou­vant théo­ri­que­ment trans­mettre l’infection à d’autres membres de la popu­la­tion, donc κ.S/N avec des indi­vi­dus sus­cep­tibles d’être infectés.

Si on appelle τ la trans­mis­si­bi­li­té du virus, les I per­sonnes infec­tées conta­minent donc I.κ.τ.S/N indi­vi­dus par uni­té de temps, qui de ce fait quittent le com­par­ti­ment S. Si on pose β = κ.τ /N on a :

dS/dt = – β S I

S’il y a I infec­tés pour une durée moyenne D, alors par uni­té de temps I/D indi­vi­dus migrent du com­par­ti­ment I vers R par gué­ri­son ou décès. On pose habi­tuel­le­ment γ = 1/D

Donc

dR/dt = γ(Nous revien­drons plus loin sur cette équa­tion « foireuse ».)

Dans ce modèle simple, si la durée de l’épidémie n’est pas trop longue, on ne tient pas compte des nou­velles nais­sances. Donc I = N – S – R et par voie de consé­quence dI/dt = – dS/dt – dR/dt.

Ce qui conduit à :

dI/dt = β S I – γ I

Point impor­tant et qui sera dis­cu­té plus loin : on sup­pose dans le modèle SIR de base que, entre évé­ne­ments chan­geant radi­ca­le­ment la pro­pa­ga­tion de l’épidémie (confi­ne­ment obli­ga­toire, appa­ri­tion d’un vac­cin ou d’un trai­te­ment effi­caces…) qui obligent à faire de nou­veaux cal­culs, β et γ sont constants pen­dant une phase d’épidémie don­née (et dif­fé­rents de ceux d’une épi­dé­mie qui serait cau­sée par un autre virus).

Le très média­ti­sé taux de repro­duc­tion ini­tial R0 (nombre moyen de cas secon­daires pro­duits pen­dant toute la durée de son infec­tion par un infec­tieux pla­cé dans une popu­la­tion entiè­re­ment saine) est égal à κτD = βN/ γ. En début d’épidémie S est très voi­sin de N et la 3e équa­tion peut alors s’écrire dI/dt = β.N.I – γ.I = γ.(R0 ‑1).I, équa­tion de forme dI/dt = K.I ayant pour solu­tion I = A.eKt.

À condi­tion que R0 soit supé­rieur à 1, l’épidémie se déve­loppe ini­tia­le­ment à la vitesse d’une expo­nen­tielle d’exposant γ.(R0-1).t

Lorsqu’on sort de cette zone de démar­rage, l’ensemble des équa­tions dif­fé­ren­tielles, même avec β et γ constants, n’a pas de solu­tion ana­ly­tique. Il faut avoir recours à un sol­veur infor­ma­tique pour tra­cer les 3 courbes S, I et R en fonc­tion du temps. On obtient pour I une courbe en cloche dis­sy­mé­trique, la mon­tée vers Imax étant plus rapide que la redes­cente vers 0. Les courbes S et R ont une forme en S dont les asymp­totes donnent pour S la popu­la­tion res­tée saine en fin d’épidémie et pour R la popu­la­tion sor­tie de l’infection (gué­rie donc immu­ni­sée, ou décédée).

Courbes S(t), I(t) et R(t) à β et γ constants
Courbes S(t), I(t) et R(t) à β et γ constants

Les modèles dérivés

Depuis 1927, les cher­cheurs ont vou­lu amé­lio­rer ce modèle. Les grandes ten­dances sont les suivantes :

  • aug­men­ta­tion du nombre de com­par­ti­ments (infec­tés récents pas encore conta­gieux, infec­tés conta­gieux avant appa­ri­tion des symp­tômes, sépa­ra­tion des gué­ris immu­ni­sés et des décé­dés, seg­men­ta­tion par tranches d’âges, prise en compte des asymp­to­ma­tiques, des nais­sances pen­dant l’épidémie, d’une éven­tuelle vac­ci­na­tion efficace…) ;
  • éta­blis­se­ment de « matrices de contacts » per­met­tant d’évaluer les consé­quences de contacts spé­ci­fiques à dif­fé­rents contextes (foyer, tra­vail, école, proxi­mi­té géo­gra­phique, ren­contres de type spor­tif, cultu­rel, confessionnel …) ;
  • rem­pla­ce­ment de don­nées fixes par des don­nées pro­ba­bi­listes afin de mettre en œuvre des modèles stochastiques ;
  • uti­li­sa­tion de « modèles agents » fon­dés sur l’analyse de la conduite d’individus.

Les lec­teurs qui s’intéressent à cette ques­tion pren­dront connais­sance avec inté­rêt de la syn­thèse conte­nue dans l’article du 2 avril 2020 de Nature : « The simu­la­tions dri­ving the world’s res­ponse to Covid-19 ».

Les critiques des modèles

Ce qui frappe quand on découvre ce domaine est le constat d’une prise de contrôle de fait des amé­lio­ra­tions pos­sibles de ces modèles par les seuls mathé­ma­ti­ciens, qui alignent sou­vent pen­dant des dizaines de pages des suites d’équations pas tou­jours très compréhensibles.

« Les mathématiciens alignent souvent pendant des dizaines de pages des suites d’équations pas toujours très compréhensibles. »

Témoignent de l’incompréhension entre modé­li­sa­teurs et méde­cins réfrac­taires aux équa­tions cer­taines décla­ra­tions de l’épidémiologiste fran­çais le plus média­tique : « La courbe en cloche (de la Covid-19) est celle typique des épi­dé­mies. […] Les épi­dé­mies com­mencent, accé­lèrent, culminent, et elles dimi­nuent sans qu’on sache pour­quoi … C’est un cycle géné­ral habi­tuel et on voit que c’est comme ça que se com­porte cette mala­die. » (Inter­view de fin avril 2020)

« Per­son­nel­le­ment, je ne crois pas que la modé­li­sa­tion mathé­ma­tique pré­dic­tive soit de nature scien­ti­fique, je pense qu’il s’a­git d’une pro­phé­tie moderne comme l’a été l’as­tro­lo­gie à un moment don­né. » (article sous sa signa­ture dans Le Point du 3 mars 2016)

« Tous les gens qui feront des modèles pré­dic­tifs sur des mala­dies qu’on ne connaît pas sont des fous. » (Audi­tion devant la com­mis­sion d’enquête par­le­men­taire, juin 2020)

Le résul­tat est que les modé­li­sa­teurs ont géné­ra­le­ment consa­cré beau­coup plus d’énergie à raf­fi­ner la par­tie mathé­ma­tique de leurs tra­vaux qu’à amé­lio­rer la recherche de l’exhaustivité et de la qua­li­té des don­nées ali­men­tant leurs modèles, atti­tude à la rigueur admis­sible si les résul­tats obte­nus avaient été brillants, mais les récentes et très impor­tantes erreurs des pré­dic­tions des orga­nismes les plus répu­tés montrent que ce n’est pas le cas.

Dans les épidémies réelles, des équations où β est constant ne tiennent pas compte du comportement réel de la population

Égal à κ.τ /N, β peut varier au cours du temps :

  • κ est le nombre moyen de contacts de chaque indi­vi­du infec­té avec un indi­vi­du sain pou­vant théo­ri­que­ment débou­cher sur la conta­mi­na­tion de ce der­nier. Il dépend uni­que­ment de fac­teurs com­por­te­men­taux (éven­tuelle réduc­tion – volon­taire ou contrainte – du nombre de contacts, par­ti­ci­pa­tion ou non à des réunions de groupes d’une cer­taine taille, etc.).
  • τ est la trans­mis­si­bi­li­té de l’infection. Il dépend à la fois de cri­tères médi­caux (conta­gio­si­té du virus) et com­por­te­men­taux (ren­contre dans un espace confi­né ou en plein air, port ou non de masque, fré­quence du lavage des mains, gestes bar­rières, etc.).

La conta­gio­si­té du virus peut dépendre de fac­teurs externes (humi­di­té, tem­pé­ra­ture, éven­tuel­le­ment selon un rythme sai­son­nier). Elle peut éga­le­ment évo­luer lors d’éventuelles muta­tions de ce virus lors de sa réplication.

Il semble tou­te­fois que ces muta­tions spon­ta­nées du virus ne peuvent avoir un effet glo­bal aus­si rapide que des chan­ge­ments com­por­te­men­taux qui inter­viennent en quelques jours, à mesure que la connais­sance de l’épidémie se répand et que les auto­ri­tés sani­taires imposent des mesures de pro­tec­tion de la population.

La plu­part des modé­li­sa­teurs effec­tuent des cal­culs avec des β dif­fé­rents avant et après adop­tion d’une déci­sion de type admi­nis­tra­tif, telle que la fer­me­ture des écoles, des salles de spec­tacle, le confi­ne­ment géné­ra­li­sé, etc. Mais ils ne prennent pas en compte la réa­li­té du com­por­te­ment de la popu­la­tion qui prend peur à mesure que les infor­ma­tions alar­mantes sur l’épidémie se répandent et qui change pro­gres­si­ve­ment ses habi­tudes, puis inver­se­ment baisse la garde quand le nombre d’infectés com­mence à dimi­nuer. De façon sur­pre­nante, il ne semble pas y avoir eu étude d’un modèle rela­ti­ve­ment simple où β varie­rait de façon conti­nue pour tenir compte de ces com­por­te­ments à mesure que le temps passe.

« La plupart des modélisateurs ne prennent pas en compte la réalité du comportement de la population. »

Notons que γ peut lui aus­si varier au cours du temps, mais uni­que­ment pour des rai­sons médi­cales : nou­veaux trai­te­ments rédui­sant la durée moyenne d’infection, éven­tuelles muta­tions du virus.

Prise en compte de β (donc également R0) variables grâce à l’utilisation d’Excel pour la modélisation

L’utilisation d’Excel pour obte­nir les résul­tats d’une modé­li­sa­tion de type SIR per­met d’introduire très faci­le­ment des para­mètres β (donc aus­si R0) variant de façon conti­nue avec le temps. Cette pos­si­bi­li­té, appa­rem­ment igno­rée des spé­cia­listes, est détaillé dans un autre article de ce même numéro.

L’hypothèse de β variant pour des raisons comportementales peut expliquer des différences surprenantes entre pays

Lorsque l’épidémie de la Covid-19 est sor­tie de Chine, on en crai­gnait un déve­lop­pe­ment par­ti­cu­liè­re­ment rapide dans les pays peu déve­lop­pés aux struc­tures médi­cales, en par­ti­cu­lier hos­pi­ta­lières, très insuf­fi­santes. Or ce sont les pays occi­den­taux qui ont été ini­tia­le­ment les plus touchés.

Bien enten­du les pays peu déve­lop­pés pré­sentent quelques avan­tages face à cette pan­dé­mie, car leur popu­la­tion est plus jeune et encore très rurale. On peut y ajou­ter qu’en rai­son de mul­tiples infec­tions anté­rieures existent peut-être vis-à-vis d’un nou­veau virus des immu­ni­sa­tions croi­sées de la popu­la­tion (rap­pe­lons qu’il ne s’agit pas d’une notion chi­mé­rique : la pre­mière « vac­ci­na­tion » de l’histoire a été l’inoculation du virus de la vac­cine de la vache pour pré­mu­nir de la variole humaine).

Mais les avan­tages de la jeu­nesse et de la rura­li­té s’estompent peu à peu : dans les der­nières décen­nies, la lon­gé­vi­té des indi­vi­dus y a aug­men­té de façon signi­fi­ca­tive et une pro­por­tion de plus en plus impor­tante de la popu­la­tion vit en ville, en par­ti­cu­lier dans des méga­poles aux infra­struc­tures très insuffisantes.

Les membres des socié­tés avan­cées, quant à eux, ont une culture de confiance exces­sive envers la méde­cine depuis l’arrivée des anti­bio­tiques et la géné­ra­li­sa­tion de nom­breux vac­cins. Ils vivent avec le sen­ti­ment qu’ils pour­ront presque tou­jours béné­fi­cier, s’ils contractent une mala­die infec­tieuse, d’un trai­te­ment effi­cace, d’un coût pour eux réduit ou même nul dans les pays où existe un bon sys­tème d’assurances sociales. Cela peut conduire à des régres­sions dans cer­taines pré­cau­tions : de nos jours, en France, avant de le rem­plir de lait, on rince sim­ple­ment à l’eau du robi­net un bibe­ron des­ti­né à un nour­ris­son, alors qu’il y quelques décen­nies on le lais­sait plu­sieurs minutes dans de l’eau en ébul­li­tion, réflexe de parents nés avant l’arrivée des antibiotiques.

Dans les pays peu déve­lop­pés, en cas d’épidémie pou­vant entraî­ner la mort ou lais­ser de graves séquelles, la peur des habi­tants est vrai­sem­bla­ble­ment décu­plée par rap­port à celle de pays déve­lop­pés : le risque de satu­ra­tion du sys­tème de san­té est grand, et y accé­der peut avoir un coût exor­bi­tant pour la grande majo­ri­té de la popu­la­tion. Il est donc pos­sible (mais à véri­fier …) que cette peur déclenche de très bru­taux réflexes de prise de dis­tance avec les malades, ce qui pour­rait plus que com­pen­ser l’hygiène médiocre accom­pa­gnant la vie cou­rante.  

Les carences dans la détermination précoce de β face à un nouveau virus

Pour être en mesure de faire des pré­vi­sions fiables, il est impor­tant de dis­po­ser dès que pos­sible d’une esti­ma­tion fiable de β à par­tir du nombre quo­ti­dien de nou­veaux infec­tés. Or, dans le cas de la Covid‑19 arri­vée en Europe fin 2019 ou début 2020, la plu­part des pays ne connaissent tou­jours pas début juillet 2020 le nombre d’individus réel­le­ment infec­tés. Il n’est bien sûr pas pos­sible de tes­ter régu­liè­re­ment l’ensemble de la popu­la­tion (à 100 000 tests par jour pour 67 mil­lions de Fran­çais, il fau­drait presque 2 ans pour un seul test par per­sonne). Mais, dès la fin de la pénu­rie de tests qui avait contraint à en faire béné­fi­cier les seules urgences médi­cales, il aurait été judi­cieux d’affecter quo­ti­dien­ne­ment une petite par­tie des res­sources à des tests sur des échan­tillons médi­ca­le­ment repré­sen­ta­tifs de la popu­la­tion. Les socié­tés de son­dage uti­lisent cette méthode pour pré­dire à quelques pour cent près le résul­tat d’élections à venir. À condi­tion de dis­po­ser de l’aide de spé­cia­listes médi­caux, ces socié­tés sont cer­tai­ne­ment capables de défi­nir la com­po­si­tion d’échantillons per­met­tant de suivre l’évolution de l’infection de l’ensemble de la popu­la­tion pen­dant plu­sieurs semaines.

Actuel­le­ment les don­nées les plus fiables sont les nombres de décès quo­ti­diens dans les hôpi­taux. À par­tir d’évaluations de la majo­ra­tion per­met­tant de tenir compte des décès hors hôpi­tal, de la léta­li­té de la mala­die et de la durée moyenne sépa­rant l’infection du décès, il est pos­sible d’établir une esti­ma­tion mal­heu­reu­se­ment assez gros­sière du nombre d’infections quo­ti­diennes et donc de β.


Le problème posé par l’équation « foireuse » dR/dt = γ I

Cette équa­tion est cen­sée tra­duire le fait très contes­table que, s’il existe à un cer­tain moment I infec­tés et si la durée de cette infec­tion avant gué­ri­son ou décès est D, alors par uni­té de temps I / D indi­vi­dus (soit γ I) migrent du com­par­ti­ment I vers R.

L’équation est une bonne approxi­ma­tion en régime qua­si éta­bli, mais cer­tai­ne­ment pas en régime tran­si­toire, en par­ti­cu­lier lors des pre­miers décès. En effet, si la durée moyenne d’infection est de 20 jours, il suf­fit qu’en début d’épidémie 20 per­sonnes entrent dans I pour qu’en sorte presque immé­dia­te­ment, selon l’équation dR/dt = γ I, une de ces 20 pour aller dans R. Dans la réa­li­té, elle ne sera pas encore guérie !

Dans une approche de modèle simple beau­coup plus natu­relle, il aurait fal­lu consi­dé­rer que sortent à l’instant t de I ceux qui y sont entrés à l’instant (t‑D), ce qui entraî­ne­rait une équa­tion : dR(t) / dt = – dS(t‑D) / dt. Mais mani­fes­te­ment Ker­mack et McKen­drick ont vou­lu don­ner à leurs équa­tions dif­fé­ren­tielles une allure clas­sique afin d’en déduire des consé­quences par des rai­son­ne­ments d’analyse mathé­ma­tique pure. Il est amu­sant de noter que, sans doute un peu gênés d’avoir endos­sé sans bron­cher une telle équa­tion (qu’à la suite d’un épi­dé­mio­lo­giste très média­tique nous pour­rions qua­li­fier de « foi­reuse »), les modé­li­sa­teurs noient le pois­son pour camou­fler leur long confor­misme en par­lant main­te­nant de « dis­cré­ti­ser le modèle de façon à pou­voir incor­po­rer un effet mémoire, car… un indi­vi­du qui vient de ren­trer dans I a une pro­ba­bi­li­té faible d’en sor­tir dans l’immédiat », admi­rable nov­langue pour recon­naître que si la durée de l’infection D est fixe, le nombre de sor­tants de I à t est le nombre de ceux qui sont entrés dans I à (t – D) !


Conclusions

Pour que les modèles épi­dé­mio­lo­giques soient utiles, ils devraient avant tout être, plus qu’une sorte de ter­rain de jeux pour mathé­ma­ti­ciens, le résul­tat d’une véri­table coopé­ra­tion mul­ti­dis­ci­pli­naire entre méde­cins, bio­lo­gistes, mathé­ma­ti­ciens, psy­cho­logues, phy­si­ciens ou ingé­nieurs, ins­ti­tuts de son­dage, tout en gar­dant un maxi­mum de sim­pli­ci­té, et, en cas de mala­die incon­nue, s’appuyer dès que pos­sible sur des éva­lua­tions quo­ti­diennes du nombre total de per­sonnes conta­mi­nées, gué­ries et décé­dées, obte­nues par des méthodes de sondage.

De cette façon pour­raient être évi­tées des mésa­ven­tures telles que celle de l’Hôpital Nigh­tin­gale de Londres (500 lits exten­sible à 4 000) qui a été ins­tal­lé en catas­trophe dans un centre de congrès, à la suite des pré­vi­sions pes­si­mistes de l’Imperial Col­lege, et qui n’a pra­ti­que­ment jamais servi.

5 Commentaires

Ajouter un commentaire

Hugues Sévé­racrépondre
7 octobre 2020 à 5 h 02 min

Mer­ci pour cet article lui aus­si très inter­es­sant. Je vous rejoins dans l’é­ton­ne­ment qu’on n’ait pas su dès le départ mieux esti­mer la popu­la­tion infec­tée. Il y avait en effet selon les esti­ma­tions de l’ins­ti­tut Pas­teur un fac­teur 20 entre les don­nées relayées quo­ti­dien­ne­ment dans les médias et la réa­li­té des infec­tions. Pour autant, cette esti­ma­tion pose de réelles dif­fi­cul­tés tech­niques : la durée de l’in­fec­tion est en réa­li­té une courbe en cloche, dépen­dant elle-même de la popu­la­tion tou­chée, et il faut un cer­tain temps et un cer­tain nombre de cas avant d’en avoir une esti­ma­tion pré­cise et représentative.
Pour fixer les idées, on a obser­vé un dou­ble­ment des infec­tions tous les 2,5 jours envi­ron au début de l’é­pi­dé­mie. Une erreur de 2,5 jours sur la durée de conta­mi­na­tion conduit à une erreur d’un fac­teur 2 sur la popu­la­tion infec­tée esti­mée. Pour com­pli­quer les choses, au début de l’é­pi­dé­mie, on a sur­tout accès aux patients hos­pi­ta­li­sés, ce qui intro­duit un délai sup­plé­men­taire de réac­tion, cor­res­pon­dant à la période avant hos­pi­ta­li­sa­tion. En défi­ni­tive, quand vous pas­sez la barre des 10 pre­miers morts (le 7 mars), vous croyez avoir envi­ron 1000 cas, que vous espé­rez tra­cer, étu­dier et confi­ner, vous en avez en réa­li­té 20 000, qui vont deve­nir 200 000 en 10 jours, quoique vous fas­siez vrai­ment. Bref, il est impos­sible de prendre des déci­sions à ce moment sur une base modé­li­sée robuste. Ce n’est qu’à peine plus facile de suivre l’é­vo­lu­tion aujourd’­hui : on peut esti­mer à vue de nez qu’a­vec 10 000 cas nou­veaux par jour on doit avoir 50 000 cas réels, soit 0,1% de la popu­la­tion. Disons 0,7% sur une semaine. Pour avoir une pré­ci­sion de 0,1 point (0,1%) sur cette esti­ma­tion afin de suivre son évo­lu­tion, il fau­drait tes­ter chaque semaine envi­ron 1 000 000 per­sonnes repré­sen­ta­tives. Ce n’est pas pos­sible. On pour­rait sans doute réduire le champ d’é­tude, géo­gra­phi­que­ment et par classe d’âge, mais il n’est pas garan­ti du tout que cela soit plus effi­cace que de suivre l’é­vo­lu­tion des tests posi­tifs décla­rés, et de les redres­ser en fonc­tion de la struc­ture de la popu­la­tion observée.
En tout état de cause, et contrai­re­ment à ce qu’on lit dans un article d’un autre contri­bu­teur de ce numé­ro, le taux de mor­ta­li­té chez les seniors est confir­mé comme très éle­vé et il est très pro­bable qu’en l’ab­sence du confi­ne­ment déci­dé, les pré­vi­sions pes­si­mistes des modé­li­sa­teurs auraient été bien plus proches de la réa­li­té que celles d’un épi­dé­mio­lo­giste média­tique très bavard.

Thier­ry Grenetrépondre
16 janvier 2021 à 0 h 34 min

Je ne suis pas plus spé­cia­lise du domaine qu’ap­pa­rem­ment l’au­teur de l’ar­ticle, mais la naï­ve­té de sa cri­tique des modé­li­sa­teurs m’é­tonne : je serais bien éton­né que per­sonne n’ait jamais joué avec un béta variant conti­nû­ment au cours du temps, les modé­li­sa­teurs uti­lisent évi­dem­ment depuis long­temps des dis­tri­bu­tions de temps (d’in­cu­ba­tion, de conta­gio­si­té etc …) plus réa­listes que celle cor­res­pon­dant à l’é­qua­tion « foi­reuse » (qui est une décrois­sance expo­nen­tielle) etc … Reje­ter les modèles plus sophis­ti­qués sous le pré­texte qu’il ne s’a­gi­rait que de dizaines de pages d’é­qua­tions incom­pré­hen­sibles, et ne gar­der que le plus simple dans sa forme la plus pri­mi­tive … pour ensuite cri­ti­quer le manque de réa­lisme des modé­li­sa­teurs : tout cela ne me semble pas très sérieux. Pas plus qu’il n’est sérieux d’in­vo­quer les décla­ra­tions tapa­geuses de D. Raoult, qui soit dit en pas­sant n’est pas épidémiologiste.

Fran­çois Xavier Mar­tin (auteur)répondre
11 février 2021 à 11 h 50 min
– En réponse à: Thierry Grenet

Réponse à Thier­ry Grenet :

Mer­ci pour vos remarques, mais j’en regrette le ton polémique.

La consul­ta­tion de https://www.researchgate.net/scientific-contributions/Thierry-Grenet-2082786602 indique qu’ef­fec­ti­ve­ment, tout comme moi, vous n’êtes pas spé­cia­liste du domaine, mais cher­cheur au CNRS en phy­sique du solide . Per­son­nel­le­ment, ayant eu dans le pas­sé une expé­rience de modé­li­sa­tion dans d’autres domaines, j’ai décou­vert les modèles épi­dé­mio­lo­giques pen­dant le long confi­ne­ment du prin­temps (après 20 jours de Covid !).

Pour aider le lec­teur à se faire une opi­nion, il faut s’abs­te­nir d’u­ti­li­ser des argu­ments d’autorité et exa­mi­ner le conte­nu de quelques docu­ments repré­sen­ta­tifs de la situa­tion de la modé­li­sa­tion épidémiologique.

Pour ce faire, on peut consul­ter ou télé­char­ger les docu­ments suivants :

1 – Com­mu­ni­ca­tion fon­da­trice (1927) de Ker­mack et McKen­drick à la Royal Socie­ty de Londres https://royalsocietypublishing.org/doi/10.1098/rspa.1927.0118 Voir plus bas au début du docu­ment n° 5 la mise en évi­dence de « l’erreur de 1927 »

2 – « Point sur la modé­li­sa­tion épi­dé­mio­lo­gique pour esti­mer l’ampleur et le deve­nir de l’épidémie de COVID-19 » pré­sen­tée le 30 avril 2020 à l’Office par­le­men­taire d’évaluation des choix scien­ti­fiques et tech­no­lo­giques par Cédric Vil­la­ni (qui, point sur­pre­nant pour un scien­ti­fique rom­pu à la modé­li­sa­tion, n’a pas rele­vé « l’erreur de 1927 ») https://www2.assemblee-nationale.fr/15/les-delegations-comite-et-office-parlementaire/office-parlementaire-d-evaluation-des-choix-scientifiques-et-technologiques/secretariat/a‑la-une/modelisation-epidemiologique-pour-estimer-l-ampleur-et-le-devenir-de-l-epidemie-de-covid-19

3 – « Modé­li­ser la pro­pa­ga­tion d’une épi­dé­mie » par Hugo Fal­co­net et Antoine Jego sous la direc­tion d’Amandine Veber (coor­di­na­trice de la plate-forme MODCOV19 du CNRS qui cen­tra­lise des contri­bu­tions rela­tives à la modé­li­sa­tion) et Vincent Cal­vez https://docplayer.fr/56627577-Modeliser-la-propagation-d-une-epidemie.html La rai­son don­née pour l’a­ban­don des modèles déter­mi­nistes décrits pen­dant la pre­mière par­tie de l’é­tude au pro­fit de modèles sto­chas­tiques est incom­pré­hen­sible (les modèles déter­mi­nistes ne fonc­tion­ne­raient pas pour des petites popu­la­tions ; or les exemples de cal­culs don­nés dans la pre­mière par­tie de l’é­tude prouvent le contraire). Voir dans la suite de la note les pages et les pages de cal­cul uti­li­sant les chaînes de Mar­kov qui n’é­li­minent pas « l’erreur de 1927 » (la pro­ba­bi­li­té de gué­ri­son à l’ins­tant t ne dépen­drait pas de la date de début de l’infection !).

4 – Modèles épi­dé­mio­lo­giques (cours d’A­gro Paris­Tech) par Suzanne Tou­zeau. La sor­tie de tous les « com­par­ti­ments » uti­li­sés dans les modèles les plus com­plexes est déter­mi­née par une équa­tion incluant « l’erreur de 1927 »

5 – « Covid-19 : « Inter­ro­ga­tions sur le modèle épi­dé­mio­lo­gique. Prise en compte de la vac­ci­na­tion et du « variant anglais » » par moi-même https://www.lajauneetlarouge.com/covid-19-interrogations-sur-le-modele-epidemiologique-prise-en-compte-de-la-vaccination-et-du-variant-anglais/

Reve­nons à l’historique.

En 1927 Ker­mack et McKen­drick pro­posent de modé­li­ser une épi­dé­mie en divi­sant à tout ins­tant une popu­la­tion de N habi­tants en 3 « com­par­ti­ments » S, I et R (voir l’ar­ticle). Le com­par­ti­ment cen­tral des infec­tés pas encore gué­ris est vu comme un réser­voir rem­pli par un robi­net et vidé à tra­vers une bonde, les débits d’en­trée et de sor­tie étant variables. Dans leur modèle, le débit d’en­trée ne pose pas de pro­blème, mais le débit de sor­tie est consi­dé­ré comme pro­por­tion­nel au nombre d’in­fec­tés I conte­nus dans ce réser­voir et donc égal à I /D, D étant la durée moyenne de conta­gio­si­té. L’é­qua­tion cor­res­pon­dante est contra­dic­toire en régime dyna­mique, crois­sant ou décrois­sant, avec l’hy­po­thèse qu’un malade gué­rit (ou décède ) en géné­ral après une durée d’in­fec­tion conta­gieuse voi­sine de D. Cette « erreur de 1927 » a pour consé­quence que le modèle de 1927 appli­qué tel quel sous-estime les varia­tions du nombre d’in­fec­tés, que ce soit à la hausse (par exemple en début d’é­pi­dé­mie ou en période de décon­fi­ne­ment) ou à la baisse (en début de confinement).

Les suc­ces­seurs de Ker­mack et McKen­drick n’ont jamais remis en cause de façon expli­cite les équa­tions de 1927, qui conti­nuent à être ensei­gnées sans que les réserves dues à leur inadap­ta­tion aux régimes dyna­miques soient men­tion­nées aux étu­diants. Ces suc­ces­seurs ont com­men­cé par mul­ti­plier les « com­par­ti­ments » (voir le cours de S. Tou­zeau où sub­siste « l’er­reur de 1927 » pour chaque com­par­ti­ment) créé des « matrices de contacts » pour tenir compte de la réa­li­té des types de conta­mi­na­tion, défi­ni des pro­fils de conta­gio­si­té variable dans le temps au cours d’une infec­tion, intro­duit des hété­ro­gé­néi­tés entre conta­gio­si­tés de sous-ensembles de la popu­la­tion, etc. Ce sont vrai­sem­bla­ble­ment des dif­fé­rences per­sis­tantes entre l’é­vo­lu­tion d’é­pi­dé­mies réelles et les pré­vi­sions de leurs modèles qui ont inci­té les suc­ces­seurs de Ker­mack et McKen­drick à aller plus loin et à don­ner à leurs modèles un carac­tère sto­chas­tique (voir plus haut la note « Modé­li­ser la pro­pa­ga­tion d’une épi­dé­mie » super­vi­sée par un membre du CNRS dont les longs déve­lop­pe­ments mathé­ma­tiques ne montrent pas clai­re­ment au lec­teur d’a­van­tage déter­mi­nant à l’u­ti­li­sa­tion de ces méthodes pro­ba­bi­listes). Cer­tains vont même jus­qu’à l’a­ban­don de la notion de com­par­ti­ment en recou­rant à des « modèles agent » peu documentés.

Ces modèles sont deve­nus extrê­me­ment com­plexes sur le plan mathé­ma­tique et très dif­fi­ci­le­ment com­pré­hen­sibles pour d’autres que leurs auteurs, d’au­tant plus que cha­cun semble avoir sa méthode de modé­li­sa­tion et que les codes infor­ma­tiques qu’il emploie ne sont géné­ra­le­ment pas ren­dus publics.

Les évé­ne­ments de 2020 (pré­vi­sion pen­dant l’é­té d’une deuxième vague d’au­tomne de mon­tée lente démen­tie par les faits, inver­se­ment sous-esti­ma­tion de l’ef­fet pré­vi­sible du couvre-feu puis du confi­ne­ment de fin octobre) montrent que les modèles uti­li­sés pour pré­pa­rer les déci­sions des pou­voirs publics souffrent du même défaut que ceux faus­sant les modèles simples en rai­son de « l’er­reur de 1927 ». Appa­rem­ment, les modé­li­sa­teurs pro­fes­sion­nels ne semblent pas avoir per­çu com­bien cette erreur pou­vait per­tur­ber la confor­mi­té d’un modèle tota­le­ment ou même par­tiel­le­ment com­par­ti­men­tal au déve­lop­pe­ment réel d’une épidémie.

Il serait donc inté­res­sant d’exa­mi­ner avec objec­ti­vi­té la per­ti­nence de modèles plus simples, mais d’où auraient été éli­mi­nées les consé­quences de « l’erreur de 1927 » (ce qui est extrê­me­ment facile).

Thier­ry Grenetrépondre
2 mars 2021 à 1 h 01 min

Bon­jour et mer­ci pour votre longue réponse à mon commentaire.
Mal­gré ce que vous sem­blez pen­ser les modé­li­sa­teurs pro­fes­sion­nels connaissent évi­dem­ment ce que vous appe­lez l’er­reur de 1927, et savent quand elle est gênante ou pas, selon ce que l’on veut faire. S’il le faut ils l’é­li­minent. On peut le faire de dif­fé­rentes façons. Par exemple en la mul­ti­pliant, si je puis dire : sup­po­sons qu’on veut décrire la ciné­tique du pas­sage I–>R d’un modèle SIR. La ver­sion basique du modèle donne dI/dt=-I/D et dR/dt=I/D, soit une décrois­sance de type expo­nen­tielle de I (avec une pro­ba­bi­li­té de gué­ri­son indé­pen­dante de la date d’in­fec­tion, comme vous le dites). Main­te­nant intro­dui­sez n stades inter­mé­diaires entre I et R, appe­lons les J1, J2 etc, et écri­vez : dI/dt=-I/D, dJ1/dt=I/D‑J1/D”, dJ2/dt=J1/D”-J2/D” etc … jus­qu’à dR/dt=Jn/D”. Ce fai­sant vous intro­dui­sez un retard à la gué­ri­son. L’ef­fec­tif total des per­sonnes infec­tées (la somme de I et de tous les Jn) ne décroit plus expo­nen­tiel­le­ment, mais selon une fonc­tion de type sig­moïde, avec une période pen­dant laquelle il ne se passe pas grand chose, sui­vie d’une décrois­sance concen­trée autour d’une durée bien déter­mi­née depuis la date de conta­mi­na­tion. De cette façon on génère très faci­le­ment une dis­tri­bu­tion de type loi gam­ma pour la pro­ba­bi­li­té de gué­ri­son en fonc­tion du temps écou­lé depuis la conta­mi­na­tion (on peut jouer sur n et D”).
Je ne suis pas l’in­ven­teur de cette astuce numé­rique, elle fait par­tie de celles cou­ram­ment uti­li­sée par les modélisateurs.
Vous m’ex­cu­se­rez je n’ai plus son nom en tête. Essayez de l’im­plé­men­ter comme je me suis amu­sé à la faire, c’est très facile et pratique.
Si vous lisez par exemple des papiers de l’é­quipe de Cau­che­mez à l’Ins­ti­tut Pas­teur, vous ver­rez qu’ils uti­lisent des dis­tri­bu­tions de temps (de gué­ri­son, décès) qui essaient d’être réa­listes et de cor­res­pondre aux don­nées médi­cales. Ils n’en res­tent évi­dem­ment pas à la ver­sion de 1927 du modèle !
Cordialement

Fran­çois Xavier MARTIN (auteur)répondre
16 mars 2021 à 15 h 59 min

L’é­qua­tion de base de la ver­sion 1927 est dI/dt =Bêta*S*I – I/D. L’i­dée de divi­ser le com­par­ti­ment I en un nombre de sous-com­par­ti­ments égal à la durée moyenne en jours de l’in­fec­tion est inté­res­sante si on veut intro­duire des niveaux d’in­fec­tio­si­té dépen­dant de l’ancienneté de l’in­fec­tion (idée très bien expli­quée, comme nous l’a signa­lé Cédric Vil­la­ni dans sa récente confé­rence à X‑Sursaut, par l’é­quipe de Samuel Ali­zon pour son modèle déve­lop­pé à l’u­ni­ver­si­té de Mont­pel­lier. Si vous connais­sez un docu­ment expli­quant aus­si clai­re­ment ce que fait l’Ins­ti­tut Pas­teur, mer­ci de me le signaler !).
Mais dans ce cas (que j’ai tes­té pour D=10 jours, et avec lequel je trouve les mêmes résul­tats que ce que je fais plus sim­ple­ment avec le tableur que j’ai décrit dans un autre article), pas besoin d’une équa­tion bien com­pli­quée : sortent à 24 h du sous-com­par­ti­ment A, celui des per­sonnes infec­tées depuis X jours, pour entrer dans celui ( B ) des per­sonnes infec­tées depuis X + 1 jours celles qui étaient entrées dans A à 0h (vive les lapa­lis­sades ! ). Si on veut raf­fi­ner, on peut faire ren­trer direc­te­ment dans R la très petite pro­por­tion des décé­dés pen­dant qu’ils étaient dans A. Pen­dant la jour­née pas­sée dans le sous-com­par­ti­ment A, les per­sonnes infec­tées ont conta­mi­né Bêta*S*I per­sonnes saines. Quand les infec­tieux sortent du der­nier sous-com­par­ti­ment I , ils entrent dans le com­par­ti­ment R. That’s all !
Que vient faire dans cette galère l’é­qua­tion « foi­reuse » dR/dt = I/N ? C’est elle qui donne cette inepte forme for­te­ment dis­sy­mé­trique à la courbe I dans tous les cours d’épidémiologie …
Quant aux courbes sig­moïdes, ce sont celle de R et de S (I est une courbe en cloche).

Répondre