La modélisation permet d’utiliser au mieux les données disponibles

Dossier : Épidémiologie : au service de la santéMagazine N°670 Décembre 2011
Par Pierre-Yves BOËLLE

REPÈRES

REPÈRES
L’épidémiologie étu­die les varia­tions de fré­quence des mala­dies et recherche les déter­mi­nants de ces varia­tions. Cer­taines de ces varia­tions ne peuvent être étu­diées expé­ri­men­ta­le­ment en pra­tique : le rôle du taba­gisme dans le can­cer des bronches, la fer­me­ture des écoles pour limi­ter une épi­dé­mie, etc. L’épidémiologie doit donc s’appuyer avant tout sur des don­nées obser­va­tion­nelles (non expé­ri­men­tales). Le recours à la modé­li­sa­tion mathé­ma­tique, sta­tis­tique et infor­ma­tique per­met l’analyse et la conclu­sion à par­tir de telles don­nées en rédui­sant les erreurs d’interprétation. Elle per­met éga­le­ment, lorsque cela est per­ti­nent, de faire des pré­dic­tions qui pour­ront être vali­dées par des obser­va­tions ultérieures.

En épi­dé­mio­lo­gie, il n’existe pas de consen­sus sur ce qui consti­tue un tra­vail de modé­li­sa­tion, ou plus exac­te­ment sur l’existence d’une fron­tière nette entre ana­lyse de don­nées et modélisation.

L’étude des épi­dé­mies a sus­ci­té de nom­breux tra­vaux de modélisation

Une ana­lyse sta­tis­tique n’est géné­ra­le­ment pas consi­dé­rée comme une modé­li­sa­tion, même si elle fait appel à des mathé­ma­tiques éla­bo­rées (par exemple la régres­sion de Cox en ana­lyse de sur­vie) ; alors qu’un arbre de déci­sion, fon­dé sur de simples règles de pro­por­tion­na­li­té, est géné­ra­le­ment qua­li­fié de modèle. Les trois exemples sui­vants illus­trent la place essen­tielle de la modé­li­sa­tion dans l’épidémiologie moderne.

Épidémies et démographie

Les équa­tions de Ross
Les bases de la modé­li­sa­tion des épi­dé­mies ont été posées par Ross, lors de ses tra­vaux sur la mala­ria au début du XXe siècle. La for­mu­la­tion repose sur la défi­ni­tion de com­par­ti­ments regrou­pant des indi­vi­dus arri­vés à la même étape dans l’histoire natu­relle de l’infection, puis du flux entre ces com­par­ti­ments. Un sys­tème d’équations dif­fé­ren­tielles ordi­naires per­met de retrou­ver la forme typique d’une épi­dé­mie, avec une crois­sance qua­si expo­nen­tielle au départ, sui­vie d’un pic et d’une dimi­nu­tion plus lente. Ce modèle per­met éga­le­ment une avan­cée concep­tuelle majeure avec la notion de seuil épi­dé­mique, qui per­met­tra de quan­ti­fier avec quelle force inter­ve­nir pour contrô­ler une épidémie.

L’étude des épi­dé­mies est un sujet qui a sus­ci­té de nom­breux tra­vaux de modé­li­sa­tion. La pré­sence d’effets non linéaires rend en effet dif­fi­cile la pré­vi­sion de l’extension d’une épi­dé­mie, et l’extrapolation simple, dans le futur ou d’un lieu à un autre, ne donne pas de bons résul­tats. La modé­li­sa­tion a alors deux ambi­tions : la pre­mière, cog­ni­tive, est de per­mettre une meilleure com­pré­hen­sion des phé­no­mènes obser­vés et de leurs déter­mi­nants, la seconde, opé­ra­tion­nelle, de per­mettre une pré­dic­tion quan­ti­ta­tive afin d’aider à la déci­sion en san­té publique.

La simulation numérique

Aujourd’hui, pour par­ve­nir à des résul­tats quan­ti­ta­ti­ve­ment valides, les modé­li­sa­tions mathé­ma­tiques uti­lisent plus la simu­la­tion numé­rique que l’approche ana­ly­tique, ce qui per­met de trai­ter des modèles plus com­plexes. Lors de l’émergence de la grippe pan­dé­mique A/H1N1 en 2009, des modèles ont été déve­lop­pés à par­tir des trans­ports aériens et des dates d’arrivée de voya­geurs infec­tés au retour du Mexique pour esti­mer ce qui se pas­sait réel­le­ment dans ce pays. En effet, en sup­po­sant que les voya­geurs soient en contact avec le reste de la popu­la­tion lors de leur séjour, le nombre de voya­geurs infec­tés et la date de leur arri­vée peuvent ren­sei­gner sur la taille de l’épidémie d’origine, et cela de manière plus fiable que les sys­tèmes de sur­veillance locaux. Ain­si, en exa­mi­nant les dates d’introduction dans plu­sieurs pays reliés au Mexique par avion, ces modèles ont per­mis d’évaluer que la taille de l’épidémie était déjà de l’ordre de 30 000 cas alors que moins de 1 000 étaient connus des auto­ri­tés mexicaines.

Varicelle et socialisation

Modèles et recommandations
Les modèles pour la vari­celle qui prennent en compte les don­nées du recen­se­ment ont des capa­ci­tés pré­dic­tives supé­rieures aux autres approches. Avec l’essor de ces modèles dont les pré­dic­tions sont quan­ti­ta­ti­ve­ment cor­rectes, il est deve­nu pos­sible de les uti­li­ser en sup­port à l’évaluation médi­co-éco­no­mique. Les résul­tats d’analyse en coût-effi­ca­ci­té ont été pris en compte dans la déci­sion de recom­man­der la vac­ci­na­tion contre le rota­vi­rus.

Ces modèles détaillés ont éga­le­ment per­mis de remettre en avant l’importance de la struc­ture de la popu­la­tion dans la cir­cu­la­tion effec­tive d’un patho­gène. Par exemple, la vari­celle, une mala­die infan­tile com­mune, pré­sente une très grande hété­ro­gé­néi­té selon les pays : bien qu’à peu près tout le monde soit infec­té durant l’enfance, l’âge moyen à l’infection se révèle très variable, 2 ans aux Pays-Bas, 4 ans en France, 6 ans en Ita­lie. Il s’agit pour­tant du même virus. Ce qui change, selon les lieux, c’est la struc­ture de la popu­la­tion et les habi­tudes de socia­li­sa­tion des enfants. On constate qu’une sco­la­ri­sa­tion plus pré­coce est asso­ciée à un âge plus pré­coce à l’infection dans les pays euro­péens. Il est donc impor­tant, pour avoir des résul­tats réa­listes, d’intégrer autant que pos­sible une des­crip­tion détaillée de la popu­la­tion et des contacts. Cela est pos­sible avec les don­nées du recen­se­ment, qui informent sur la répar­ti­tion des indi­vi­dus, leurs dépla­ce­ments de rou­tine, etc.

L’analyse causale

La modé­li­sa­tion est éga­le­ment néces­saire pour essayer d’obtenir une inter­pré­ta­tion non biai­sée des don­nées en situa­tion d’observation. Dans une « cohorte », par exemple, des per­sonnes sont sui­vies en rai­son de leur expo­si­tion à un fac­teur d’intérêt (comme le taba­gisme), et on enre­gistre des évé­ne­ments de san­té au cours du temps (un can­cer des bronches). Le pro­blème essen­tiel de l’épidémiologiste est de déter­mi­ner si une dif­fé­rence esti­mée entre expo­sés et non-expo­sés n’est qu’une asso­cia­tion, non cau­sale, ou plu­tôt un effet, causal.

Des modèles déve­lop­pés à par­tir des trans­ports aériens

En situa­tion d’observation, des asso­cia­tions peuvent en effet être la consé­quence de dif­fé­rences sys­té­ma­tiques pré­exis­tantes entre expo­sés et non-expo­sés. Ain­si, on observe que la consom­ma­tion d’alcool est plus éle­vée chez les fumeurs, ce qui pour­ra entraî­ner une plus forte inci­dence du can­cer des bronches chez les buveurs (une asso­cia­tion non cau­sale), alors même que c’est le tabac qui est res­pon­sable (effet causal).

L’existence de dif­fé­rences sys­té­ma­tiques entre expo­sés et non-expo­sés – autres que l’exposition – requiert une modé­li­sa­tion sta­tis­tique : le score de pro­pen­sion, cou­ram­ment uti­li­sé en éco­no­mé­trie, est fré­quem­ment employé. Des déve­lop­pe­ments métho­do­lo­giques moti­vés par des pro­blèmes épi­dé­mio­lo­giques sont aujourd’hui rap­por­tés dans les meilleurs jour­naux de sta­tis­tique théo­rique et appli­quée. Les scores de pro­pen­sion, les modèles cau­sals uti­li­sant les « graphes diri­gés acy­cliques », les modèles struc­tu­raux mar­gi­naux sont des exemples de ces nou­velles approches de modé­li­sa­tion statistique.

La greffe de rein

La modé­li­sa­tion est uti­li­sée aus­si à des fins très opé­ra­tion­nelles d’organisation pour résoudre des pro­blèmes de san­té publique.

Résoudre des pro­blèmes de san­té publique

Aux États-Unis, par­mi les per­sonnes qui chaque année requièrent une greffe de rein (rece­veurs), cer­taines dis­posent d’un don­neur vivant mais incom­pa­tible. Pro­po­ser des échanges entre duos don­neurs-rece­veurs per­met­trait de rem­pla­cer deux duos incom­pa­tibles par deux greffes pos­sibles. Appli­quée sur la base du « pre­mier arri­vé, pre­mier ser­vi », cette stra­té­gie conduit 40% des duos incom­pa­tibles à une greffe pos­sible par appa­rie­ment avec un autre duo.

L’algorithme d’Edmonds

La gas­tro­plas­tie per­met-elle de réduire la mor­ta­li­té chez le patient obèse ?
Un exemple récent concerne la mor­ta­li­té après gas­tro­plas­tie (réduc­tion sto­ma­cale dans le trai­te­ment de l’obésité). L’hypothèse est que l’intervention chi­rur­gi­cale peut réduire la mor­ta­li­té en évi­tant le déve­lop­pe­ment de patho­lo­gies liées à l’obésité. Les auteurs com­parent donc 850 patients ayant subi une gas­tro­plas­tie à une popu­la­tion contrôle de 41244 per­sonnes. La mor­ta­li­té obser­vée, six ans après l’intervention, est de 7% dans le groupe des opé­rés contre 15% chez les autres. Peut-on conclure qu’il s’agit de l’effet de l’intervention ? En effet, les indi­vi­dus opé­rés étaient plus sou­vent obèses, ce qui aug­men­tait leur risque ; mais aus­si plus sou­vent jeunes et de sexe fémi­nin, ce qui rédui­sait leur risque. Les auteurs cal­culent alors un « score de pro­pen­sion », c’est-à-dire la pro­ba­bi­li­té d’avoir subi l’intervention selon l’âge, le sexe, le diag­nos­tic, le poids, etc. À l’issue de ce cal­cul, il est pos­sible de sélec­tion­ner 847 patients et 847 contrôles ayant le même score de pro­pen­sion : ils sont donc com­pa­rables en tout point sauf en ce qui concerne la gas­tro­plas­tie. La com­pa­rai­son finale de ces deux groupes ne montre alors plus aucune dif­fé­rence de mor­ta­li­té (7% cha­cun) : la gas­tro­plas­tie ne semble donc pas réduire la mortalité.

Mais est-il pos­sible de faire mieux ? La meilleure stra­té­gie pour réa­li­ser ces échanges consiste à réa­li­ser le plus grand nombre pos­sible d’appariements entre des duos incom­pa­tibles. Le pro­blème se refor­mule mathé­ma­ti­que­ment : com­ment réa­li­ser le plus grand nombre d’appariements 2 à 2 dans les nœuds d’un graphe ? La réponse repose sur l’algorithme d’Edmonds, bien connu des infor­ma­ti­ciens, qui per­met de trou­ver le nombre maxi­mum d’appariements pos­sibles. L’approche per­met, de plus, d’intégrer les pré­fé­rences indi­vi­duelles, par exemple accep­ter ou non de se dépla­cer, par la sup­pres­sion d’arêtes dans le graphe. La conclu­sion est que cet appa­rie­ment opti­mal per­met un gain d’au moins 5% du nombre de greffes, tout en rédui­sant les coûts et les désa­gré­ments pour les patients participants.

Une évolution souhaitable

Cette rapide illus­tra­tion de l’utilisation des modèles en épi­dé­mio­lo­gie ne couvre qu’une petite par­tie des champs d’application pos­sibles. D’autres domaines épi­dé­mio­lo­giques ont éga­le­ment une uti­li­sa­tion impor­tante de la modé­li­sa­tion : l’épidémiologie spa­tiale, sociale, l’épidémiologie géné­tique, l’étude des inter­ac­tions gène envi­ron­ne­ment, etc. Avec la dis­po­ni­bi­li­té de bases de don­nées décri­vant fine­ment l’activité humaine et l’environnement (recen­se­ment, uti­li­sa­tion des sols, météo, qua­li­té de l’eau) et celle de don­nées indi­vi­duelles, le recours à la modé­li­sa­tion ne pour­ra que s’accentuer. L’évolution mar­quée vers une plus grande place de l’outil mathé­ma­tique et des modèles dans cette dis­ci­pline pose de façon cru­ciale la ques­tion de la for­ma­tion ini­tiale des pra­ti­ciens de l’épidémiologie, et de l’encouragement des voca­tions chez des per­sonnes ayant une bonne for­ma­tion mathé­ma­tique initiale.

BIBLIOGRAPHIE

■ Val­le­ron A.-J., L’Épidémiologie humaine : condi­tions de son déve­lop­pe­ment en France, et rôle des mathé­ma­tiques, Paris, EDP Sciences, 2006.

■ Cau­che­mez S., Boëlle P. Y., Tho­mas G. et al., « Esti­ma­ting in real time the effi­ca­cy of mea­sures to control emer­ging com­mu­ni­cable diseases », Ame­ri­can Jour­nal of Epi­de­mio­lo­gy, 2006 (164:591- 597).

■ Nar­done A., de Ory F., Car­ton M. et al., « The com­pa­ra­tive sero-epi­de­mio­lo­gy of vari­cel­la zos­ter virus in 11 coun­tries in the Euro­pean region », Vac­cine, 2007 (25:7866–7872).

2 Commentaires

Ajouter un commentaire

Ano­nymerépondre
14 décembre 2011 à 21 h 43 min

Gas­tro­plas­mie
Très éclai­rant l’exemple de la gastroplasmie.

Mais consti­tuer un échan­tillon com­pa­rable ne suf­fit pas. Parce que ceux qui ont été opé­rés étaient volon­taires pour l’o­pé­ra­tion, alors que ceux de l’é­chan­tillon com­pa­rable ne l’é­taient pas. Et peut-être le fait d’être volon­taire pour l’o­pé­ra­tion pro­vient du fait qu’on est davan­tage malade (ou qu’on sent qu’on est très malade)…
Pour pou­voir faire une ana­lyse cor­recte, il aurait fal­lu tirer au sort les per­sonnes opé­rées par­mi les volon­taires et n’o­pé­rer que la moi­tié… (voire faire sem­blant d’o­pé­rer la moi­tié : placebo).

tha­meurrépondre
4 mai 2012 à 13 h 54 min

très inté­res­sant, mais
très inté­res­sant, mais sou­vent la nature est plus com­pli­quée, dans le sens de l’é­vo­lu­tion, pour per­mettre de mettre en place des modèles de pré­vi­sion efficaces.
Merci

Répondre