La modélisation permet d’utiliser au mieux les données disponibles
REPÈRES
REPÈRES
L’épidémiologie étudie les variations de fréquence des maladies et recherche les déterminants de ces variations. Certaines de ces variations ne peuvent être étudiées expérimentalement en pratique : le rôle du tabagisme dans le cancer des bronches, la fermeture des écoles pour limiter une épidémie, etc. L’épidémiologie doit donc s’appuyer avant tout sur des données observationnelles (non expérimentales). Le recours à la modélisation mathématique, statistique et informatique permet l’analyse et la conclusion à partir de telles données en réduisant les erreurs d’interprétation. Elle permet également, lorsque cela est pertinent, de faire des prédictions qui pourront être validées par des observations ultérieures.
En épidémiologie, il n’existe pas de consensus sur ce qui constitue un travail de modélisation, ou plus exactement sur l’existence d’une frontière nette entre analyse de données et modélisation.
L’étude des épidémies a suscité de nombreux travaux de modélisation
Une analyse statistique n’est généralement pas considérée comme une modélisation, même si elle fait appel à des mathématiques élaborées (par exemple la régression de Cox en analyse de survie) ; alors qu’un arbre de décision, fondé sur de simples règles de proportionnalité, est généralement qualifié de modèle. Les trois exemples suivants illustrent la place essentielle de la modélisation dans l’épidémiologie moderne.
Épidémies et démographie
Les équations de Ross
Les bases de la modélisation des épidémies ont été posées par Ross, lors de ses travaux sur la malaria au début du XXe siècle. La formulation repose sur la définition de compartiments regroupant des individus arrivés à la même étape dans l’histoire naturelle de l’infection, puis du flux entre ces compartiments. Un système d’équations différentielles ordinaires permet de retrouver la forme typique d’une épidémie, avec une croissance quasi exponentielle au départ, suivie d’un pic et d’une diminution plus lente. Ce modèle permet également une avancée conceptuelle majeure avec la notion de seuil épidémique, qui permettra de quantifier avec quelle force intervenir pour contrôler une épidémie.
L’étude des épidémies est un sujet qui a suscité de nombreux travaux de modélisation. La présence d’effets non linéaires rend en effet difficile la prévision de l’extension d’une épidémie, et l’extrapolation simple, dans le futur ou d’un lieu à un autre, ne donne pas de bons résultats. La modélisation a alors deux ambitions : la première, cognitive, est de permettre une meilleure compréhension des phénomènes observés et de leurs déterminants, la seconde, opérationnelle, de permettre une prédiction quantitative afin d’aider à la décision en santé publique.
La simulation numérique
Aujourd’hui, pour parvenir à des résultats quantitativement valides, les modélisations mathématiques utilisent plus la simulation numérique que l’approche analytique, ce qui permet de traiter des modèles plus complexes. Lors de l’émergence de la grippe pandémique A/H1N1 en 2009, des modèles ont été développés à partir des transports aériens et des dates d’arrivée de voyageurs infectés au retour du Mexique pour estimer ce qui se passait réellement dans ce pays. En effet, en supposant que les voyageurs soient en contact avec le reste de la population lors de leur séjour, le nombre de voyageurs infectés et la date de leur arrivée peuvent renseigner sur la taille de l’épidémie d’origine, et cela de manière plus fiable que les systèmes de surveillance locaux. Ainsi, en examinant les dates d’introduction dans plusieurs pays reliés au Mexique par avion, ces modèles ont permis d’évaluer que la taille de l’épidémie était déjà de l’ordre de 30 000 cas alors que moins de 1 000 étaient connus des autorités mexicaines.
Varicelle et socialisation
Modèles et recommandations
Les modèles pour la varicelle qui prennent en compte les données du recensement ont des capacités prédictives supérieures aux autres approches. Avec l’essor de ces modèles dont les prédictions sont quantitativement correctes, il est devenu possible de les utiliser en support à l’évaluation médico-économique. Les résultats d’analyse en coût-efficacité ont été pris en compte dans la décision de recommander la vaccination contre le rotavirus.
Ces modèles détaillés ont également permis de remettre en avant l’importance de la structure de la population dans la circulation effective d’un pathogène. Par exemple, la varicelle, une maladie infantile commune, présente une très grande hétérogénéité selon les pays : bien qu’à peu près tout le monde soit infecté durant l’enfance, l’âge moyen à l’infection se révèle très variable, 2 ans aux Pays-Bas, 4 ans en France, 6 ans en Italie. Il s’agit pourtant du même virus. Ce qui change, selon les lieux, c’est la structure de la population et les habitudes de socialisation des enfants. On constate qu’une scolarisation plus précoce est associée à un âge plus précoce à l’infection dans les pays européens. Il est donc important, pour avoir des résultats réalistes, d’intégrer autant que possible une description détaillée de la population et des contacts. Cela est possible avec les données du recensement, qui informent sur la répartition des individus, leurs déplacements de routine, etc.
L’analyse causale
La modélisation est également nécessaire pour essayer d’obtenir une interprétation non biaisée des données en situation d’observation. Dans une « cohorte », par exemple, des personnes sont suivies en raison de leur exposition à un facteur d’intérêt (comme le tabagisme), et on enregistre des événements de santé au cours du temps (un cancer des bronches). Le problème essentiel de l’épidémiologiste est de déterminer si une différence estimée entre exposés et non-exposés n’est qu’une association, non causale, ou plutôt un effet, causal.
Des modèles développés à partir des transports aériens
En situation d’observation, des associations peuvent en effet être la conséquence de différences systématiques préexistantes entre exposés et non-exposés. Ainsi, on observe que la consommation d’alcool est plus élevée chez les fumeurs, ce qui pourra entraîner une plus forte incidence du cancer des bronches chez les buveurs (une association non causale), alors même que c’est le tabac qui est responsable (effet causal).
L’existence de différences systématiques entre exposés et non-exposés – autres que l’exposition – requiert une modélisation statistique : le score de propension, couramment utilisé en économétrie, est fréquemment employé. Des développements méthodologiques motivés par des problèmes épidémiologiques sont aujourd’hui rapportés dans les meilleurs journaux de statistique théorique et appliquée. Les scores de propension, les modèles causals utilisant les « graphes dirigés acycliques », les modèles structuraux marginaux sont des exemples de ces nouvelles approches de modélisation statistique.
La greffe de rein
La modélisation est utilisée aussi à des fins très opérationnelles d’organisation pour résoudre des problèmes de santé publique.
Résoudre des problèmes de santé publique
Aux États-Unis, parmi les personnes qui chaque année requièrent une greffe de rein (receveurs), certaines disposent d’un donneur vivant mais incompatible. Proposer des échanges entre duos donneurs-receveurs permettrait de remplacer deux duos incompatibles par deux greffes possibles. Appliquée sur la base du « premier arrivé, premier servi », cette stratégie conduit 40% des duos incompatibles à une greffe possible par appariement avec un autre duo.
L’algorithme d’Edmonds
La gastroplastie permet-elle de réduire la mortalité chez le patient obèse ?
Un exemple récent concerne la mortalité après gastroplastie (réduction stomacale dans le traitement de l’obésité). L’hypothèse est que l’intervention chirurgicale peut réduire la mortalité en évitant le développement de pathologies liées à l’obésité. Les auteurs comparent donc 850 patients ayant subi une gastroplastie à une population contrôle de 41244 personnes. La mortalité observée, six ans après l’intervention, est de 7% dans le groupe des opérés contre 15% chez les autres. Peut-on conclure qu’il s’agit de l’effet de l’intervention ? En effet, les individus opérés étaient plus souvent obèses, ce qui augmentait leur risque ; mais aussi plus souvent jeunes et de sexe féminin, ce qui réduisait leur risque. Les auteurs calculent alors un « score de propension », c’est-à-dire la probabilité d’avoir subi l’intervention selon l’âge, le sexe, le diagnostic, le poids, etc. À l’issue de ce calcul, il est possible de sélectionner 847 patients et 847 contrôles ayant le même score de propension : ils sont donc comparables en tout point sauf en ce qui concerne la gastroplastie. La comparaison finale de ces deux groupes ne montre alors plus aucune différence de mortalité (7% chacun) : la gastroplastie ne semble donc pas réduire la mortalité.
Mais est-il possible de faire mieux ? La meilleure stratégie pour réaliser ces échanges consiste à réaliser le plus grand nombre possible d’appariements entre des duos incompatibles. Le problème se reformule mathématiquement : comment réaliser le plus grand nombre d’appariements 2 à 2 dans les nœuds d’un graphe ? La réponse repose sur l’algorithme d’Edmonds, bien connu des informaticiens, qui permet de trouver le nombre maximum d’appariements possibles. L’approche permet, de plus, d’intégrer les préférences individuelles, par exemple accepter ou non de se déplacer, par la suppression d’arêtes dans le graphe. La conclusion est que cet appariement optimal permet un gain d’au moins 5% du nombre de greffes, tout en réduisant les coûts et les désagréments pour les patients participants.
Une évolution souhaitable
Cette rapide illustration de l’utilisation des modèles en épidémiologie ne couvre qu’une petite partie des champs d’application possibles. D’autres domaines épidémiologiques ont également une utilisation importante de la modélisation : l’épidémiologie spatiale, sociale, l’épidémiologie génétique, l’étude des interactions gène environnement, etc. Avec la disponibilité de bases de données décrivant finement l’activité humaine et l’environnement (recensement, utilisation des sols, météo, qualité de l’eau) et celle de données individuelles, le recours à la modélisation ne pourra que s’accentuer. L’évolution marquée vers une plus grande place de l’outil mathématique et des modèles dans cette discipline pose de façon cruciale la question de la formation initiale des praticiens de l’épidémiologie, et de l’encouragement des vocations chez des personnes ayant une bonne formation mathématique initiale.
BIBLIOGRAPHIE■ Valleron A.-J., L’Épidémiologie humaine : conditions de son développement en France, et rôle des mathématiques, Paris, EDP Sciences, 2006. ■ Cauchemez S., Boëlle P. Y., Thomas G. et al., « Estimating in real time the efficacy of measures to control emerging communicable diseases », American Journal of Epidemiology, 2006 (164:591- 597). ■ Nardone A., de Ory F., Carton M. et al., « The comparative sero-epidemiology of varicella zoster virus in 11 countries in the European region », Vaccine, 2007 (25:7866–7872). |
2 Commentaires
Ajouter un commentaire
Gastroplasmie
Très éclairant l’exemple de la gastroplasmie.
Mais constituer un échantillon comparable ne suffit pas. Parce que ceux qui ont été opérés étaient volontaires pour l’opération, alors que ceux de l’échantillon comparable ne l’étaient pas. Et peut-être le fait d’être volontaire pour l’opération provient du fait qu’on est davantage malade (ou qu’on sent qu’on est très malade)…
Pour pouvoir faire une analyse correcte, il aurait fallu tirer au sort les personnes opérées parmi les volontaires et n’opérer que la moitié… (voire faire semblant d’opérer la moitié : placebo).
très intéressant, mais
très intéressant, mais souvent la nature est plus compliquée, dans le sens de l’évolution, pour permettre de mettre en place des modèles de prévision efficaces.
Merci