Calcul de la fréquentation débruitée
Les cellules de comptage sont des capteurs installés à l'entrée et à la sortie des véhicules qui comptent automatiquement les passagers qui montent et qui descendent. Néanmoins, ces capteurs n'arrivent pas toujours à détecter parfaitement le bon nombre de passagers ni le sens du mouvement (montée ou descente). Par ailleurs, ces capteurs peuvent dysfonctionner (pas de mesure) ou échouer à transmettre l'information.
Cela se traduit par un certain nombre d'incohérences dans les données collectées :
- la somme des montées à l'échelle d'une course n'est pas égale à la somme des descentes
- la charge est négative à un ou plusieurs points de la course
- aucune descente ou aucune montée n'est comptabilisée sur une course, ce qui se traduit par une charge qui augmente ou diminue continûment d'arrêt en arrêt
- le nombre de montées ou de descentes est disproportionné par rapport à la capacité du véhicule
Principe du débruitage
Le débruitage est une méthode algorithmique de retraitement des données de comptage qui vise à supprimer le "bruit", c'est à dire les incohérences, des données de comptage.
Cette méthode prend comme base les travaux de chercheurs espagnols publiés dans la revue Applied Mathematical Modelling. Notre équipe R&D a enrichi ces travaux avec la prise en compte de l'historique des données de comptages pour dégager des tendances, et la comparaison avec les données billettiques.
Contraintes
Cette méthode modifie les données de comptage pour qu'elles respectent les contraintes suivantes :
- le nombre de montées à l'échelle d'une course est égal au nombre de descentes
- il ne peut pas y avoir de descentes au premier arrêt ni de montée au dernier arrêt du course
- les montées, descentes et la charge doivent être inférieures à 140% de la capacité du véhicule
- la charge ne peut pas être négative
- lorsque les données billettiques sont disponibles, les montées, descentes et la charge comptage ne peuvent pas être inférieures aux valeurs billettique
(NB : cette dernière contrainte est supprimée s'il n'y a pas de solution respectant les autres contraintes)
Toutes ces contraintes sont appliquées et respectées en sortie de l'algorithme. La charge débruitée respecte donc toutes ces contraintes.
Optimisation
L'algorithme fonctionne sur un principe d'optimisation qui va chercher à minimiser une fonction de coût de manière à trouver itérativement la meilleure solution, tout en restant la plus proche des données en entrée. Pour cela, il recherche les solutions qui minimisent :
- le plus gros écart entre les données brutes et les données débruitées
- la somme des écarts entre les données brutes et les données débruitées
On quantifie ainsi la similarité entre les valeurs brutes et les valeurs débruitées, en appliquant également le seuil suivant : un écart de plus de 50% (ou 5 pour les comptages inférieur à 10) est considéré comme non similaire (similarité égale à 0).
Ces optimisations ne sont pas appliquées :
- aux montées, si la somme des montées d'une course est égale à 0
- aux descentes, si la somme des descentes d'une course est égale à 0
Utilisation des tendances historiques
L'algorithme sélectionne ensuite la solution la plus cohérente avec l'historique des données comptage et billettique.
Il analyse pour cela, par direction, jour de la semaine et tranche horaire dynamique (de 15 minutes minimum) et à l'échelle de la course, la répartition des montées/descentes sur le mois en cours et le mois précédent. Il sélectionne la solution qui correspond le plus à cette répartition.
L'historique utilisé est une combinaison (pondérée) des données billettique et comptage disponibles : si x% des véhicules sont équipés en cellules, alors l'historique se base à x% des données comptages et à 100-x% sur les données billettiques.
Périmètre et filtres
Le débruitage est appliqué aux données de comptages dont la somme des montées et/ou des descentes à l'échelle de la course est supérieure à 0. Les courses qui n'ont que des montées ou que des descentes sont donc conservées, mais on n'analyse pas dans ce cas l'écart entre les données observées et les données débruitées.
Les courses où tous les comptages sont à 0 sont également conservées (à l'identique ; elles ne sont pas débruitées), sauf si on dispose de données billettiques et que la somme des validations est supérieure à 0, auquel cas elles sont filtrées.
Certaines courses ne peuvent pas être débruitées :
- l'algorithme n'a pas pu trouver de solution respectant les contraintes et seuils autorisés
- la billettique est trop au dessus du comptage, ce qui fait qu'appliquer la contrainte billettique nécessiterait de trop dépasser les seuils d'écart
- la somme des montées et des descentes est égale à 0 alors qu'il y a des validations sur la course
Dans ces cas, la course est filtrée et n'est pas incluse dans le calcul des indicateurs.
Débruitage et indicateurs extrapolés
Le débruitage s'applique également aux indicateurs extrapolés (Montées/descentes extrapolées, Charge extrapolée, Courses en surcharge extrapolées). Son fonctionnement est toutefois légèrement différent.
En particulier :
- Prise en compte des dessertes spécifiques : si le plan de transport théorique ne prévoit pas d'arrêt à une gare donnée pour une circulation donnée, aucune montée/descente ne sera assignée à cette gare pour cette circulation. La charge sera donc identique avant et après le passage par cette gare;
- Conservation des données de comptage : le débruitage a pour contrainte supplémentaire de ne pas supprimer de montées/descentes par rapport aux données extrapolées non débruitées. La cohérence de la circulation (somme des montées = somme des descentes, charge toujours positive) n'est obtenue qu'en ajoutant autant de montées/descentes extrapolées que nécessaire pour respecter ces contraintes.
Indicateurs concernés par le débruitage
Sur Transport Analytics, les indicateurs suivants sont débruités :
- Module Rejeu : lorsque la charge sélectionnée est la Charge (cellules de comptage)
- Module Fréquentation : Charge, Courses en surcharge, Montées/descentes
- Module Course : Charge
Sur Occupancy API, la prédiction de charge est également débruitée.
Visualisation des données non débruitées
Les indicateurs de Charge et de Montées/descentes brutes (c'est-à-dire non débruitées) se trouvent dans le module Qualité, sous le groupe d'indicateurs "Comptage" :
