Conférence présentée à l’Université Laval
- Date: 9 novembre 2017
- Heure: 13:30
- Endroit: VCH-2820
- Conférencier: Aurélie Labbe
🌘 Transports
Un exemple de données qui ne sont pas exploitées:
- Toronto: plus de 100 caméras au centre-ville.
- Aucune données extraite, aucune prise de décision automatisée.
🌘 Applications
- Instrumentation de l’infrastructure
- Résolution de problèmes en temps réel
- Mieux comprendre les comportements de mobilité
🌘 Type de données
- Données temporelles et spatiales
- Volumes, temps de parcours, matrices origine-destination
- Grande fréquence: secondes et millisecondes
- Données mixtes: voitures, autobus, camions, piétons, vélos dans le même ensemble de données. On doit ensuite souvent les trier.
🌘 Types de technologies
- Capteurs en un point donné: radar, magnétique, infrarouge
- Données GPS: Téléphone intelligent, Google Maps
- Données de surveillance: Caméras et capteurs intégrés aux infrastructures telles que feux de circulation, lampadaires, …
🌘 1er projet
- Ville de Québec
- Données GPS
- Sécurité routière dans le monde: 1 million de morts, 50 millions de blessés annuellement
🌘 Application Mon Trajet
- Indice de congestion
- Indice de vitesse moyenne / variation
- Données d’accidents du MTQ
Version modifiées du modèle de Besag-York-Mollié:
- Nombre d’accidents suit une distribution de Poisson
- Modèle log-linéaire + u + v
- effets aléatoires:
- u: Structure gaussienne: corrélation échangeable (données entre deux intersections, peu importe la paire)
- v: corrélation spatiale autoregressive: définir les voisins
🌘 Logiciels
- librairie R-INLA, remplace MCMC dans R pour ce type de problèmes:
- Très rapide, quelques secondes
- Utilise la loi de Laplace
Utilisation:
- calculer les valeurs manquantes
- Beaucoup de points sans voisins, mauvaise prédiction avec les modèles utilisés
- Overfitting
Pistes de recherche en cours:
- disconnected graphs: Freni-Sterrantino, 2017
- Processus gaussien
- Multinomiale: sévérité des accidents
🌘 2e projet
- Sécurité des carrefours avec arrêts 4 directions
- Ville de Montréal
- Sécurité des piétons
- Utilisation de données vidéo: caméra à l’intersection
🌘 Calculer des indicateurs de comportement d’arrêt et de conduite
- (x,y) par objet (voiture, vélo, piéton)
- Indicateur de “time to collision”
- Taux de conflits, comportement
🌘 Modèle de régression avec effets aléatoires
- vitesse minimum dans l’intervalle 15 m avant et 15 m après
- x: géométrie de la route, passage piéton, …
En ce moment, ils font une moyenne des courbes:
- Analyse des courbes à la place
- Analyse de données fonctionnelles
- Clustering selon le comportement des usagers
🌘 3e projet
- Projet avec Intact Assurances
- Assurance auto Pay As You Drive
- Enregistre les trajets sur 6 mois
- 350000 clients, 15 terabytes de données
🌘 Nettoyage des données
- Map matching (a posteriori)
- Erreur plus forte en milieu urbain
- Évaluer et tester ce qu’il y a dans la littérature
- Méthode la plus performante sur la plateforme de Intact
🌘 Map matching
- 1re génération: géométrique et topologique
- 2e génération: algorithmes probabilistes: candidats possibles pour les trajectoires, on prend la plus fréquente
- Modèles HMM: hidden markov models
- États cachés: segments routiers cachés
- Variables observées
- 2 composantes:
- distribution conditionnelle des mesures: estimation de l’erreur de mesure du gps
- probabilités de transition: utiliser la topologie du réseau pour réduire l’espace de transition possible
- 2 composantes:
On a besoin de données pour lesquelles on connaît les trajectoires:
- Scénarios de trajets à Montréal
- 20 téléphones et boitier d’intact + vrai gps
🌘 Travaux futurs
- Améliorer les modèles avec d’autres types de données collectées par les GPS
- Modèle de mouvement du véhicule
- Comment calculer le score de bonne conduite
Domaine vraiment pris d’assaut par les ingénieurs et pas nécessairement les statisticiens.