Conférence présentée à l’Université Laval
- Date: 9 novembre 2017
- Heure: 13:30
- Endroit: VCH-2820
- Conférencier: Aurélie Labbe
🌘 Transports
Quel rôle les statisticiens jouent‑ils dans les villes intelligentes ?
Ils transforment les flux massifs de données temporelles et spatiales (GPS, capteurs, caméras) en informations exploitables grâce à des modèles statistiques avancés (modèles spatiaux, régressions à effets aléatoires, processus gaussiens). Cela permet d’optimiser la mobilité, la sécurité routière et la planification urbaine.
Un exemple de données qui ne sont pas exploitées:
- Toronto: plus de 100 caméras au centre-ville.
- Aucune données extraite, aucune prise de décision automatisée.
🌘 Applications
- Instrumentation de l’infrastructure
- Résolution de problèmes en temps réel
- Mieux comprendre les comportements de mobilité
🌘 Type de données
- Données temporelles et spatiales
- Volumes, temps de parcours, matrices origine-destination
- Grande fréquence: secondes et millisecondes
- Données mixtes: voitures, autobus, camions, piétons, vélos dans le même ensemble de données. On doit ensuite souvent les trier.
🌘 Types de technologies
-
Capteurs en un point donné: radar, magnétique, infrarouge
-
Données GPS: Téléphone intelligent, Google Maps
-
Données de surveillance: Caméras et capteurs intégrés aux infrastructures telles que feux de circulation, lampadaires, …
Quels modèles statistiques sont couramment utilisés pour analyser les accidents de la route ?
Le modèle de Besag‑York‑Mollié (BYM), une régression de Poisson avec effets aléatoires spatiaux et non structurés, est fréquemment employé. Il capture la dépendance spatiale entre intersections et les variations locales, offrant des estimations précises du nombre d’accidents.
🌘 1er projet
- Ville de Québec
- Données GPS
- Sécurité routière dans le monde: 1 million de morts, 50 millions de blessés annuellement
🌘 Application Mon Trajet
- Indice de congestion
- Indice de vitesse moyenne / variation
- Données d’accidents du MTQ
Version modifiées du modèle de Besag-York-Mollié:
- Nombre d’accidents suit une distribution de Poisson
- Modèle log-linéaire + u + v
- effets aléatoires:
- u: Structure gaussienne: corrélation échangeable (données entre deux intersections, peu importe la paire)
- v: corrélation spatiale autoregressive: définir les voisins
🌘 Logiciels
- librairie R-INLA, remplace MCMC dans R pour ce type de problèmes:
- Très rapide, quelques secondes
- Utilise la loi de Laplace
Utilisation:
- calculer les valeurs manquantes
- Beaucoup de points sans voisins, mauvaise prédiction avec les modèles utilisés
- Overfitting
Pistes de recherche en cours:
- disconnected graphs: Freni-Sterrantino, 2017
- Processus gaussien
- Multinomiale: sévérité des accidents
🌘 2e projet
- Sécurité des carrefours avec arrêts 4 directions
- Ville de Montréal
- Sécurité des piétons
- Utilisation de données vidéo: caméra à l’intersection
🌘 Calculer des indicateurs de comportement d’arrêt et de conduite
- (x,y) par objet (voiture, vélo, piéton)
- Indicateur de “time to collision”
- Taux de conflits, comportement
🌘 Modèle de régression avec effets aléatoires
- vitesse minimum dans l’intervalle 15 m avant et 15 m après
- x: géométrie de la route, passage piéton, …
En ce moment, ils font une moyenne des courbes:
- Analyse des courbes à la place
- Analyse de données fonctionnelles
- Clustering selon le comportement des usagers
🌘 3e projet
-
Projet avec Intact Assurances
-
Assurance auto Pay As You Drive
-
Enregistre les trajets sur 6 mois
-
350000 clients, 15 terabytes de données
Comment le map‑matching améliore‑t‑il la qualité des données GPS ?
Le map‑matching associe chaque point GPS à la route la plus probable en utilisant des algorithmes géométriques ou probabilistes (HMM). Cela corrige les erreurs de localisation, surtout en milieu urbain dense, et fournit des trajectoires fiables pour l’analyse comportementale et la tarification à l’usage.
🌘 Nettoyage des données
- Map matching (a posteriori)
- Erreur plus forte en milieu urbain
- Évaluer et tester ce qu’il y a dans la littérature
- Méthode la plus performante sur la plateforme de Intact
🌘 Map matching
- 1re génération: géométrique et topologique
- 2e génération: algorithmes probabilistes: candidats possibles pour les trajectoires, on prend la plus fréquente
- Modèles HMM: hidden markov models
- États cachés: segments routiers cachés
- Variables observées
- 2 composantes:
- distribution conditionnelle des mesures: estimation de l’erreur de mesure du gps
- probabilités de transition: utiliser la topologie du réseau pour réduire l’espace de transition possible
- 2 composantes:
On a besoin de données pour lesquelles on connaît les trajectoires:
- Scénarios de trajets à Montréal
- 20 téléphones et boitier d’intact + vrai gps
🌘 Travaux futurs
- Améliorer les modèles avec d’autres types de données collectées par les GPS
- Modèle de mouvement du véhicule
- Comment calculer le score de bonne conduite
Domaine vraiment pris d’assaut par les ingénieurs et pas nécessairement les statisticiens.