La géobiologiste dechaînée

30 Juin 2020

Les modèles épidémiologiques

L’année 2020 a été difficile pour tout le monde. Le coronavirus, le confinement, la perte d’êtres aimés, l’incertitude sur l’avenir, tout cela crée une atmosphère de stress et d’angoisse. À cela,  il faut ajouter les prédictions sur l’évolution de la pandémie, basées sur des modèles mathématiques. Et il s’avère que la situation est loin de s’améliorer. Mais il se pourrait que le simple fait de comprendre ces modèles et de savoir pourquoi les spécialistes s’y fient autant, nous apporte un peu de tranquillité. Le document qui suit présente un exemple de modèle épidémiologique simple. Ceux parmi vous qui sont plus curieux et cherchent plus de réponses et même des modèles plus sophistiqués sont invités à suivre les liens présentés par la suite et, comme Alice au pays des merveilles, suivre le petit lapin blanc.

Prenons un groupe de personnes saines et disons que cette population a une taille N. On introduit un pathogène qui se propage rapidement au sein de notre groupe de personnes. Pour suivre le pathogène et sa multiplication, on catalogue les membres de la population pour identifier ceux qui sont infectés et ceux qui, après avoir lutté contre l’infection, en sont guéris (en supposant que la maladie qui s’ensuit n’est pas mortelle). On peut donc diviser dite population en trois groupes: les personnes susceptibles d’être infectés par le virus pathogène (S), celles qui sont infectées (I) , et celles qui sont rétablies (R). On considère que tout le monde est égal face à l’infection, et donc que chaque individu a la même chance d’attraper le pathogène, de développer une infection, et de se rétablir. Chaque individu passe par la case “susceptibles” puis “infectés”, puis “rétabli” (voir le schéma numéro 1).

UnchGeochem_SIR_1

Schéma 1 : Schéma représentant les trois groupes de la population à taille N : le groupe comprenant les individus Susceptibles (S), Infectés (I), et Rétablis (R).

Les modèles SIR – Susceptibles, Infectés, Rétablis (SIR) (voir références 1 et 2 pour plus de détails) – sont construits pour suivre les membres de ces groupes et analyser la vitesse à laquelle les individus passent d’une catégorie à l’autre.

La version la plus simple de ces modèles est connue sous le nom de modèle Kermack-McKendrick et, à l’origine, avait comme objectif d’expliquer la hausse impressionnante puis la baisse brutale du nombre de patients infectés pendant d’importantes épidémies en Europe. Par exemple, la peste (d’abord à Londres en 1665, et puis à Bombay en 1906) et le choléra (à Londres, en 1865) (voir références 1 et 2).

Le mécanisme central des modèles SIR vient d’un système d’équations interdépendantes (voir équations 1 à 4). Ici, la notation dX/dt indique la pente en X (dX, la quantité de ce que vous désirez mesurer) au cours d’un intervalle de temps (dt, et ça peut être la durée d’une journée, d’un mois, d’une année).

UnchGeochem_SIR_Eq

La première équation est particulièrement intéressante. Elle nous dit que, à tout moment t, la somme de tous les groupes (S(t), I(t), et R(t)) est égale à N, la taille totale de la population. Il s’ensuit que la taille de notre population est constante, peu importe à quel point S, I, et R changent. La supposition que notre population a une taille limitée est essentielle: si le modèle ne produit pas de résultats ou prédictions raisonnables, il s’ensuit que, peut-être, notre supposition initiale est incorrecte (par exemple, de nouveaux individus peuvent rejoindre notre population, et si cet afflux de personnes n’est pas tenu en compte dans notre modèle, on ne peut pas s’attendre que nos résultats aient beaucoup de sens). Sinon, il se peut qu’il y ait plus d’un groupe (en plus des S, I, et R) qui participe aux dynamiques en principe représentées par les équations 1 à 4. Il faut noter que les équations 2 à 4 ont une forme typique d’un système d’équations différentielles couplées ordinaires étant donné que les variables S, I, et R sont partagées par plus d’une équation à l’intérieur du système.

Comme nous l’avons indiqué par le système d’équations présenté, chaque individu passe d’un groupe à l’autre à une vitesse établie par b (la vitesse de transmission) et g (la vitesse de guérison). Plus les individus susceptibles de développer l’infection sont nombreux plus ils passeront vite de la catégorie S à la catégorie I, dont le nombre d’individus continuera d’augmenter. Ceci peut aussi se produire si b a une valeur élevée. La seule manière de faire diminuer la taille de cette catégorie est  la guérison: une fois rétablis, les personnes libres de l’infection rejoignent la catégorie R. La taille de I diminue tandis que celle de R augmente. Cet effet sera intensifié si g est élevé (voir le graphe numéro 2 pour une visualisation du changement du nombre d’individus dans chaque catégorie en fonction du temps).

UnchGeochem_SIR_2

Graphe numéro 2 : Le nombre d’individus susceptibles, infectés et rétablis sont présentés en fonction du temps. Pour la création de ce graphique, des valeurs arbitraires pour les paramètres b et g sont choisies (respectivement, 2 et 1 par unité de temps). Les conditions initiales imposées incluaient un nombre faible d’infectés et supposait l’absence de personnes rétablies.

Donc, nous avons maintenant un modèle qui nous informe sur l’évolution du nombre d’infectés au fur et à mesure que le pathogène se multiplie dans la population. Ceci nous permet de mieux comprendre les dynamiques de l’infection, de prévoir, entre autres choses, si la maladie se répandra vite ou pas, et d’estimer le nombre de personnes infectées et rétablies à tout moment pendant la pandémie. À son tour, cette information nous aide à déterminer si les services sanitaires seront capables de gérer le nombre de patients qui se présenteront à leurs portes, et s’il faut prendre des mesures particulières pour mieux protéger les personnes les plus exposées. Si on divise la vitesse d’infection b, par la vitesse de rétablissement g, on obtient la valeur de reproduction (R0) du pathogène. En termes plus simples, R0 nous indique le nombre total de personnes qu’un individu portant le pathogène infectera avant d’être complètement rétabli (voir les références 2 et 4). Cette valeur devient utile au moment de la prise de décisions: si R0 est trop élevé, il est naturel de choisir l’isolement de l’individu ou de la population entière pour éviter la dispersion du pathogène.

Cette version du modèle est simple, et étonnamment efficace, mais il en existe d’autres bien plus sophistiquées. On pourrait vouloir laisser la taille de notre population fluctuer (rendant N non-constant) en raison d’une augmentation du nombre de naissances et de décès, ou bien à cause de nombreux voyages réintroduisant le pathogène. De plus, les valeurs de b et g peuvent ne pas être égales pour tout le monde. Elles peuvent varier en fonction de l’âge ou de l’existence de maladies chroniques. Et puis, qu’arrive-t-il si le pathogène est retransmis à une personne rétablie? Comment identifier les individus qui ont plus de chances de porter et transmettre le pathogène à un nombre élevé d’individus (voir référence numéro 3)? Finalement, il arrive que certains soient asymptomatiques, et, sans le savoir, portent et transmettent le pathogène. Comment les incorporer dans nos modèles? C’est pour cela que l’on a besoin de versions plus complexes et si ce sujet est intéressant au-delà de l’information présentée ici, le/la lecteur/lectrice est invité(e) à consulter la référence numéro 4. On y trouvera une description d’un modèle qui incorpore les individus asymptomatiques, avec un exemple de codification du modèle lui-même.

Alors, pourquoi un géobiologiste s’intéresserait aux modèles épidémiques ? Déjà, en tant personne anxieuse, je trouve que les mathématiques aident à comprendre et mettre de l’ordre dans le monde qui nous entoure, ce qui en soi est déjà apaisant. Mais surtout parce que le concept de base de ces modèles appartient au domaine de la géobiologie: c’est le concept de compartiments, de boîtes connectées entre elles. Quand les géobiologistes essayent de comprendre la réaction d’un système à une perturbation (par exemple, la manière dont le cycle global du carbone est en train de réagir à un influx de dioxyde de carbone dans l’atmosphère), nous établissons d’abord nos boîtes puis la manière dont elles sont connectées. Ceci nous permet d’établir les équations qui décriront le mieux notre système, y appliquer les bons paramètres, et comprendre l’évolution de chaque boîte. Mais, il faut toujours et surtout vérifier la validité des résultats! La meilleure méthode consiste à produire des résultats théoriques, des simulations, puis de les comparer à des observations. Seront ensuite sélectionnés le modèle et les paramètres dont les simulations seront les plus proches des observations (une conclusion issue de nombreux tests statistiques). Pour finir avec une note plus légère, rappelons que les modèles épidémiologiques SIR sont des éléments protagonistes de l’épisode “Vector” de NUMB3RS, la série dans laquelle les détectives s’appuient sur les mathématiques pour résoudre les meurtres en essayant de prévoir les comportements des criminels.