Je débute cette nouvelle série de billets en réconciliant deux objectifs que j'ai en 2021:

  • Produire davantage de matériel sur la situation sociale et économique au Québec
  • Réappendre Apache Spark, parce que je suis devenu vraiment rouillé! Quand je l'ai appris la première fois, l'interface PySpark était à ses tout débuts, presque tout se faisait uniquement en Scala.

photo défavorisé

Contexte

Donc voici le contexte d'étude de cette séquence: l'Institut national de santé publique du Québec (INSPQ) produit aux 5 ans depuis 1991 un indice de défavorisation selon deux mesures: la défavorisation sociale et la défavorisation matérielle.

Ces mesures sont construites à partir de diverses sources de données, dont le recensement, et sont calculées selon le même découpage géographique (aire de diffusion), puis aggrégées selon les territoires des différentes entités du système de santé Québécois, du CLSC à la région socio-sanitaire.

Mon objectif ici est de comprendre la défavorisation au Québec avec une analyse de données en PySpark. Je vais tenter de reconstruire cette mesure depuis les mêmes sources à l'aide d'un modèle prédictif. J'aimerais aussi en explorer certaines particularités et par la suite, voir l'impact de celle-ci sur l'évolution de la situation dans nos systèmes de santé et d'éducation.

Les outils que je prévois utiliser

Voici les logiciels que j'ai identifiés comme pouvant m'être utiles pour la réalisation de ce projet:

Quelques illustrations sur les territoires

Statistiques Canada et Postes Canada

Le recensement comporte son propre découpage géographique. Pour en consulter la documentation, voir le glossaire illustré

Découpage du recensement

Système de santé québécois

Au Québec, le territoire est découpé différemment selon les ministères. Pour le ministère de la santé et des services sociaux (MSSS), on retrouve les entités suivantes, de la plus petite à la plus grande.

  • Territoire de CLSC
  • Réseau local de services
  • Réseaux universitaires intégrés de santé
  • Réseau territorial de services
  • Régions socio-sanitaires

Le système qui gère ces territoires se nomme M34. Les détails se trouvent ici: Découpage territorial

Crédits médias

Note

Si la licence du matériel utilisé est plus restrictive que la licence utilisée sur mon blog, c'est la première qui s'applique. Donc si vous reproduisez cet article, il est possible que vous ayez à supprimer certains médias de votre reproduction.

Article précédent Article suivant