Villes intelligentes - Où sont les statisticiens?

Conférence présentée à l’Université Laval

Date: 9 novembre 2017
Heure: 13:30
Endroit: VCH-2820
Conférencier: Aurélie Labbe

🌘 Transports

Quel rôle les statisticiens jouent‑ils dans les villes intelligentes ?

Ils transforment les flux massifs de données temporelles et spatiales (GPS, capteurs, caméras) en informations exploitables grâce à des modèles statistiques avancés (modèles spatiaux, régressions à effets aléatoires, processus gaussiens). Cela permet d’optimiser la mobilité, la sécurité routière et la planification urbaine.

Un exemple de données qui ne sont pas exploitées:

Toronto: plus de 100 caméras au centre-ville.
Aucune données extraite, aucune prise de décision automatisée.

🌘 Applications

Instrumentation de l’infrastructure
Résolution de problèmes en temps réel
Mieux comprendre les comportements de mobilité

🌘 Type de données

Données temporelles et spatiales
Volumes, temps de parcours, matrices origine-destination
Grande fréquence: secondes et millisecondes
Données mixtes: voitures, autobus, camions, piétons, vélos dans le même ensemble de données. On doit ensuite souvent les trier.

🌘 Types de technologies

Capteurs en un point donné: radar, magnétique, infrarouge
Données GPS: Téléphone intelligent, Google Maps
Données de surveillance: Caméras et capteurs intégrés aux infrastructures telles que feux de circulation, lampadaires, …

Quels modèles statistiques sont couramment utilisés pour analyser les accidents de la route ?

Le modèle de Besag‑York‑Mollié (BYM), une régression de Poisson avec effets aléatoires spatiaux et non structurés, est fréquemment employé. Il capture la dépendance spatiale entre intersections et les variations locales, offrant des estimations précises du nombre d’accidents.

🌘 1er projet

Ville de Québec
Données GPS
Sécurité routière dans le monde: 1 million de morts, 50 millions de blessés annuellement

🌘 Application Mon Trajet

Indice de congestion
Indice de vitesse moyenne / variation
Données d’accidents du MTQ

Version modifiées du modèle de Besag-York-Mollié:

Nombre d’accidents suit une distribution de Poisson
Modèle log-linéaire + u + v
effets aléatoires:
- u: Structure gaussienne: corrélation échangeable (données entre deux intersections, peu importe la paire)
- v: corrélation spatiale autoregressive: définir les voisins

🌘 Logiciels

librairie R-INLA, remplace MCMC dans R pour ce type de problèmes:
Très rapide, quelques secondes
Utilise la loi de Laplace

Utilisation:

calculer les valeurs manquantes
Beaucoup de points sans voisins, mauvaise prédiction avec les modèles utilisés
Overfitting

Pistes de recherche en cours:

disconnected graphs: Freni-Sterrantino, 2017
Processus gaussien
Multinomiale: sévérité des accidents

🌘 2e projet

Sécurité des carrefours avec arrêts 4 directions
Ville de Montréal
Sécurité des piétons
Utilisation de données vidéo: caméra à l’intersection

🌘 Calculer des indicateurs de comportement d’arrêt et de conduite

(x,y) par objet (voiture, vélo, piéton)
Indicateur de “time to collision”
Taux de conflits, comportement

🌘 Modèle de régression avec effets aléatoires

vitesse minimum dans l’intervalle 15 m avant et 15 m après
x: géométrie de la route, passage piéton, …

En ce moment, ils font une moyenne des courbes:

Analyse des courbes à la place
Analyse de données fonctionnelles
Clustering selon le comportement des usagers

🌘 3e projet

Projet avec Intact Assurances
Assurance auto Pay As You Drive
Enregistre les trajets sur 6 mois
350000 clients, 15 terabytes de données

Comment le map‑matching améliore‑t‑il la qualité des données GPS ?

Le map‑matching associe chaque point GPS à la route la plus probable en utilisant des algorithmes géométriques ou probabilistes (HMM). Cela corrige les erreurs de localisation, surtout en milieu urbain dense, et fournit des trajectoires fiables pour l’analyse comportementale et la tarification à l’usage.

🌘 Nettoyage des données

Map matching (a posteriori)
Erreur plus forte en milieu urbain
Évaluer et tester ce qu’il y a dans la littérature
Méthode la plus performante sur la plateforme de Intact

🌘 Map matching

1re génération: géométrique et topologique
2e génération: algorithmes probabilistes: candidats possibles pour les trajectoires, on prend la plus fréquente
- Modèles HMM: hidden markov models
- États cachés: segments routiers cachés
- Variables observées
  - 2 composantes:
    - distribution conditionnelle des mesures: estimation de l’erreur de mesure du gps
    - probabilités de transition: utiliser la topologie du réseau pour réduire l’espace de transition possible

On a besoin de données pour lesquelles on connaît les trajectoires:

Scénarios de trajets à Montréal
20 téléphones et boitier d’intact + vrai gps

🌘 Travaux futurs

Améliorer les modèles avec d’autres types de données collectées par les GPS
Modèle de mouvement du véhicule
Comment calculer le score de bonne conduite

Domaine vraiment pris d’assaut par les ingénieurs et pas nécessairement les statisticiens.