Potion Bottle Icon Manuel d'alchimie du code Potion Bottle Icon

Surmortalité COVID-19 au Québec: analyse avec R

- 1,120 mots - Temps de lecture estimé: 6 minutes

Offre de formation

Potion Bottle IconHéberger ton entreprise ou ton OBNL avec YunohostPotion Bottle Icon

Arrête de payer par utilisateur·ice pour des outils qui analysent tes données. Expérimente l'autohébergement sur un vrai serveur avec Yunohost et ses centaines d'applications libres.

Héberge tes données au Québec

🌘 Introduction

Je me lance aujourd’hui avec ce premier billet technique sur un sujet d’actualité : la surmortalité causée par la
COVID-19. Sujet de controverse dans l’opinion publique, c’est selon moi la réelle mesure de la gravité de la pandémie, car elle est indépendante des décisions politiques ou des volumes de tests.

🌘 Comment mesurer la surmortalité


Sun Face IconQuelle est la surmortalité COVID-19 au Québec en 2020 selon cette analyse avec R ?Sun Face Icon


L’analyse avec le modèle TBATS montre 5068 décès additionnels (118 par semaine) sur les 43 premières semaines de 2020 par rapport aux prévisions basées sur 2010-2019. Cela correspond aux décès COVID-19 rapportés par le MSSS, confirmant l’absence de surattribution.

En construisant un modèle de séries chronologiques et en mesurant la déviation des réalisations (cas réels) en dehors de la prédiction, nous obtenons la surmortalité (ou dans le cas contraire, la sous-mortalité). Nous pouvons aussi calculer l’excès au-delà d’un intervalle de confiance.

Je cherche ici à déterminer si les statistiques de décès attribués à la COVID-19 sont réalistes. Mon approche se base sur les données de la mortalité hebdomadaire colligées par l’Institut de la Statistique du Québec, qui serviront à construire le modèle et à le tester, ainsi que les données quotidiennes de décès liés à la COVID-19 compilées par Isha Berry et le COVID-19 Canada Open Data Working Group, qui contiennent les cas de décès identifiés à la COVID-19.

🌘 Observation des données

Les données hebdomadaires de décès vont servir de base afin de construire un modèle de séries chronologiques. Voici l’historique de données que nous utiliserons. Ces données sont combinées selon le sexe pour des fins de simplification des analyses.

Nombre hebdomadaire de décès au Québec, 2010-2020

Les données de l’année 2020 seront utilisées comme données de test.

La dernière semaine considérée dans ces données correspond à la semaine CDC 43 de l’année 2020.

Nous voulons prédire le nombre de décès qui auront lieu dans les 43 premières semaines de 2020 à partir des observations des 521 semaines précédentes. Ensuite, nous comparerons les résultats obtenus aux statistiques officielles afin d’estimer la surmortalité liée à l’épidémie de COVID-19.

🌘 Décomposition de la série chronologique

Ce graphique illustre une décomposition de la série chronologique selon la méthode classique de la moyenne mobile.

moyenne mobile

On remarque une forte saisonnalité due à la saison hivernale où on enregistre plus de décès, ce qui correspond aussi aux pics de fréquentation des hôpitaux.

🌘 Modèle TBATS pour prédire les décès de 2020-2021

On effectue les prédictions avec le modèle TBATS (Exponential smoothing state space model with Box-Cox transformation, ARMA errors, Trend and Seasonal components), une méthode pour les séries intégrées (tendance positive) avec des motifs de saisonnalité irréguliers.

Prédictions de la mortalité du modèle TBATS

🌘 Test de la prédiction

On effectue une superposition des données observées aux données prédites, ce qui nous permet de constater l’erreur de prédiction du modèle de séries chronologique.

Nombre de décès actuels et prévus, Intervalles de confiance à 95%

🌘 Portrait de la surmortalité


Sun Face IconComment calculer la surmortalité avec un modèle TBATS en R ?Sun Face Icon


Pour calculer la surmortalité, entraîne le modèle TBATS sur les données hebdomadaires de l’ISQ (2010-2019, 521 semaines), puis génère les prédictions pour les semaines 1 à 43 de 2020 avec forecast::tbats(). La comparaison des décès observés aux décès prédits donne l’excès de mortalité, accompagné des intervalles de confiance à 80 % et à 95 %.

Il y a eu, durant la période de prévision, 5068 décès additionnels par rapport aux prévisions du modèle. C’est une moyenne de 118 décès par semaine sur la période observée.

Nombre de décès additionnels par semaine (surmortalité). Par rapport aux prévisions du modèle TBATS et données ISQ

On ajoute les intervalles de confiance à 80% et 95% sur l’erreur de prédiction du modèle. Je calcule ces intervalles de confiance en soustrayant la borne inférieure au nombre observé pour obtenir la borne supérieure de l’erreur et vice-versa.

Intervalles de confiance à 80 et 95% Par rapport aux prévisions du modèle TBATS et données ISQ

🌘 Comparaison de la surmortalité calculée avec les données du MSSS


Sun Face IconLa surmortalité au Québec est-elle due au COVID-19 ou surestimée ?Sun Face Icon


Les décès calculés par surmortalité (modèle TBATS vs données ISQ) correspondent aux décès COVID-19 rapportés par le MSSS avec un décalage de une à deux semaines attribuable aux délais de déclaration. Cette concordance confirme que la surmortalité observée est principalement due à la pandémie et qu’il n’y a pas de surattribution des décès.

Dans cette section, nous utiliserons les données compilées par le MSSS sur les décès liés à la COVID-19 afin de déterminer si la majorité de la surmortalité peut être attribuée à la pandémie. Afin de convertir les données du MSSS sur la même base que les données de l’ISQ, il faut identifier la semaine CDC correspondante.

Il est aussi important ici de noter que nous utilisons la date de rapport du décès qui peut être différente de celle de la date réelle du décès. Il faut donc s’attendre à un certain décalage entre les données de l’ISQ et du MSSS de l’ordre d’une à deux semaines, tel qu’il est observé fréquemment dans les annonces dans les médias.

Comparaison des décès additionnels, Surmortalité rapport aux prévisions du modèle TBATS et données ISQ

On remarque que les deux courbes correspondent sensiblement aux mêmes nombres de décès, mais avec un décalage dans les déclarations de décès liés à la COVID-19 auprès du MSSS. À partir de ces observations, on peut donc en tirer la conclusion que la surmortalité observée est principalement due à la pandémie de COVID-19. Il n’y aurait donc pas de surattribution des décès.

🌘 Références

Offre de service

Moon Phases IconConsultation stratégique IA et vie privée — 2 heures — 490 $Moon Phases Icon

Tu veux intégrer l’IA sans compromettre les données de ta clientèle ? En 2 heures, je t’aide à définir une stratégie IA responsable, basée sur les normes ISO et IEEE.

La consultation inclut un plan d'action détaillé pour mettre en œuvre les recommandations et prioriser les étapes suivantes.

Réserve ta Consultation stratégique
Abonne-toi au fil RSS pour ne rien manquer.

Étiquettes