[Corpet Prévention Covid] - [Combien de contagieux ?] - [AdiosCorona: Covid+ alentour?]

Comment estimer la prévalence des contagieux ?
partant de données fiables: les entrées en Réanimation

Florence & Denis Corpet, v1:21/09 ... v4:6/11, v5: 20/11...16/02:21


Comment connaitre le nombre personnes infectées par le coronavirus ?
Explications : calcul du nombre de contagieux dans la rue aujourd'hui, et du classement de trente villes de France par Covid et du risque en réunion à Paris, Marseille, Lyon et Toulouse, selon le nombre de participants. Nous expliquons ci-dessous comment passer des données hospitalières de réanimation à la prévalence: la proportion de gens contagieux dans chaque ville
Metz-ton-masque-RL-Gilles-Wirtz
Une estimation c'est du gâteau : Cuisinez de bons ingrédients avec une bonne recette, ça sera bon ! Les ingrédients sont ici les paramètres et les données. Des paramètres stables, liés au Covid-19, et des données qui changent chaque jour. La recette est la façon de les combiner par des équations. Alors quels sont nos données et paramètres ?

Nous utilisons deux données et cinq paramètres:
D1- Les entrées en Réa (Réanimation-Covid, Unités de Soins Intensifs), données actualisées tous les jours sur Réa-GéoDES et Gouv.Covid
D2- Le nombre d’habitants du lieu, donnée de population trouvée sur Wikipédia.
     Et voici les 5 paramètres:
1- Le délai entre les premiers symptômes et l'entrée en Réa. Délai de huit jours d'après l'étude COVID-ICU dans Intensive Care Medicine
2- La proportion des patients de Réa qui décèdent du Covid. D'après l'étude COVID-ICU, ce taux de létalité est 31%.
3- Le taux de létalité chez les personnes infectées par le coronavirus. Cet Infection Fatality Rate était 0.8 au début, il est 0,5% actuellement en France d'après Salje dans Science
4- La durée de contagiosité: Le portage du SARS-CoV-2 dure 7 à 21 jours, mais les prélèvements ne sont plus infectieux 8 j après les 1ers symptômes d'après Wölfel dans Nature. Comptons donc 9 jours de contagion, commençant 2 j avant les 1ers symtômes et 7 j après.
5- Le pourcentage d'asymptomatiques. La proportion de personnes infectées qui n'ont pas de symptômes dans la population est de 60%, moyenne de deux études de population en Italie et en Angleterre (42,5% dans Lavezzo, Nature et 76,5% dans Petersen, Clin.Epidemiol.).

Voici maintenant les huit étapes du calcul:
a- Je prends le nombre d’entrées en Réa publié aujourd’hui (entrées d'hier): ce nombre bouge beaucoup dans la semaine, pour amortir ces oscillations, je fais la moyenne glissante des entrées en Réa sur 7 jours.
b- Pour connaitre le nombre de décès futurs liés à ces entrées en Réa, je les multiplie par la proportion qui va décéder: 31%
c- Pour connaitre le nombre de personnes infectées liées à ces décès, je les divise par l'Infection Fatality Rate: 0,5%. D'après ces 31% et 0,5% il y a une entrée en Réa pour 62 personnes infectées.
d- Chaque malade reste infectieux 9 jours en moyenne: Pour connaitre le nombre de contagieux, leur prévalence, je fais la somme des nouveaux contagieux sur neuf jours.
e- En moyenne, la contagiosité commence 10 jours avant la Réa : 8 j entre les 1er symptômes et la Réa, plus 2 j contagieux avant. Ceux qu'on compte aujourd'hui, entrés hier en Réa, sont donc sont devenus contagieux il y a onze jours.
f- J'ai donc calculé la prévalence des contagieux il y a 11 jours, mais pour aujourd’hui, comment faire ? Je fais l'hypothèse que les entrées en Réa pendant les 11 j qui viennent, vont continuer à évoluer sur la même courbe que la semaine dernière.
J'extrapole donc de 11 j vers le futur la courbe ajustée aux données sur 7 j, et cela me donne une estimation de la prévalence aujourd'hui. Comment choisir la courbe? Une exponentielle prévoit bien ce qui se passe en période décroissante. Par contre en montée, une droite se montre plus prédictive (observations empiriques sur 6 mois pour 30 villes).
g- Je divise ensuite par la taille de la population pour avoir la prévalence des contagieux en %.
h- Je multiplie enfin cette prévalence par la proportion d’asymptomatiques, 60% (qui inclue les pré-symptomatiques): Ce sont en effet les seuls que je risque de croiser dans la rue ou en réunion, les malades restant chez eux ou à l'hôpital.

Notre calculateur CAL-Covid donne les équations (inspirées de Thomas Pueyo) et un exemple de courbe d'extrapolation.

Finalement, que valent nos résultats ?
Notre modèle est modeste: les épidémiologistes "pro" prévoyent l'épidémie sur trois mois pour conseiller ministres et chefs d'états, pas nous. Nous répondons juste à une question simple pour "aujourd'hui" et ce n'est déjà pas si facile. Nous donnons une approximation du nombre de contagieux autour de nous, c'est un ordre de grandeur. Par définition l'ordre de grandeur c'est entre 10 fois moins et 10 fois plus. Voici quelques raisons de notre modestie:
- L'extrapolation: En raison du décalage entre la contagion et l'entrée en Réa, nous devons extrapoler la tendance sur 11 jours, par une courbe ajustée aux données passées. Si la tendance continue comme avant, notre estimation sera correcte. Mais si ça change brusquement, l'erreur est importante.
Par ailleurs le modèle exponentiel est trop sensible aux augmentations quand la ligne de base est nulle. Notre estimation de prévalence s'envole donc quand quelques malades entrent en Réa-Covid dans un département où il n'y en avait pas. L'exponentielle extrapolle ces premières "marches" vers de très grands nombres, 11 jours plus tard, comme à Brest le 21 décembre 2020. Pour limiter ces "dérapages" nous avons ajouté le 21/01/21 une correction de continuité au nombre d'entrées en Réa (Yates= +0,5). Après estimation de la courbe exponentielle on soustrait 4,5 (=9x0,5). Cela évite les "zéros" et ne modifie pas les résultats des gros départements. Le 16/02/21 nous avons implémenté un modèle "mixte" qui ajuste sur une droite quand la courbe monte, et sur une exponentielle quans la courbe descend.
- Les paramètres: Nous utilisons cinq paramètres dont les valeurs sont des moyennes issues de publications (voir ci-dessus). Ces paramètres ont été mesurés par des études scientifiques. Si elles se trompent, nous aussi. Par exemple, si la proportion des asymptomatiques était 50% au lieu de 60%, notre résultat serait 20% trop grand.
- Les données de Réa: Nos données sont les entrées en réanimation. Si ces Unités de Soins Intensifs sont saturées, s'il y a transfert d'une région à l'autre, ou si les critères d'entrée en Réa changent, ça va fausser nos données, et donc nos résultats. Depuis sept. 2020 seuls les cas très graves de Covid hospitalisés sont envoyés en Réa. Les autres sont soignés "dans les services". Il est probable qu'il faudrait changer les taux de létalité (paramètre 2 & 3 ci-dessus), mais aucune publication ne prent en compte cette situation nouvelle: à suivre !
Il y a encore d'autres sources d'erreur possible, c'est pourquoi nous devons rester modeste, même si la concordance de nos estimations avec le taux d'incidence officiel nous rassure sur la validité de nos calculs.

Mariage
Un GROUPE dans une salle: comment 5‰ dehors devient 39% dedans ?

Un journaliste me demande: "Vous dites qu'il y avait 5 passants contagieux sur 1000 dans les rues de Lyon. Dans un goupe de 100 personnes, c'est 10 fois moins, donc 0,5 contagieux (= 0,5%): Pourquoi dites-vous que la proba. est de 39% ?" Oui, ce n'est pas facile de comprendre pourquoi ces % sont différents dans la rue et dans un groupe.
Explications: Dans l'exemple ci-dessus, une centaine de gens se rassemble dans une salle. Caculons la probabilité P que personne ne soit contaminé dans le groupe (=zéro-virus), en laissant entrer les gens un par un:
- Au début, personne dans la salle: zéro-personne = zéro-virus. La proba de zéro-virus est P=1
- Une personne, qui risque à 0,5% d'être contagieuse, entre dans la salle. La proba de zéro-virus dans la salle devient P = 1 - 0,5% = 1 - 0,005
- Une autre arrive, avec le même risque que la première*. La proba de zéro-virus sur ces deux-là, est P = (1- 0,005) x (1- 0,005) = (1- 0,005)2
- Pour trois personnes, c'est (1- 0,005)3, etc... et pour 100 c'est P= (1-0,005)100. Sur ma calculette ça fait 0,61. C'est la probabilité que personne ne soit contaminée dans le groupe.
L'inverse, la proba qu'au moins une personne soit contaminée, c'est 1-P = 0.39 = 39%, donc plus d'une chance sur trois qu'il y ait un contagieux dans le groupe (un ou plus). Et c'est là que ça dérape: on est au chaud, entre gens "biens", on tombe les masques, et ... s'il y a un contagieux il souffle des milliard de virus, qui vont infecter des gens. Si on reste longtemps, que c'est mal aéré et qu'on des interactions risquées (conversations à 2-3 rapprochés, chant, apéro), une personne peut en contaminer 20 ou 30 !

* Ce calcul est valable pour des gens indépendants, dont le risque infectieux ne dépend pas des autres. Car si le groupe est formé de familles, de gens qui habitent ensemble, c'est probable qu'ils seront infectés ensemble, ou au contraire, tous indemnes. En simplifiant on peut compter chaque famille comme "une personne", et donc deux familles de 5 formeraient un groupe de 2 et pas de 10. En fait, c'est un peu plus compliqué et je n'expose pas ici le calcul...


Références
- Dans le texte ci-dessus, cliquer le nom de l'étude, en petites lettres : c'est un lien qui renvoie directement à l'article scientifique utilisé.
- Toutes mes "SOURCES" sont aussi résumées en français en bas de la page Adios Corona: Combien de gens sont contagieux COVID autour de moi ?

Pour m'écrire, E-mail en bas de page Denis