Calcul de la fréquentation unifiée

Contexte

Transport Analytics intègre deux sources de données pour l'analyse de la fréquentation d'un réseau de transport :

  • les données billettiques, qui permettent de reconstituer des montées/descentes et une charge billettique grâce à l'algorithme de reconstitution des ODs de Citio ;
  • les données des cellules de comptage.

Néanmoins, prises séparément, aucune de ces deux sources ne permet pas de visualiser exhaustivement la fréquentation du réseau :

  • les données billettiques n'intègrent pas la fraude, les non validations, les valideurs HS, etc. et sous-estiment donc la charge moyenne à bord et les taux de remplissage ;
  • les données de comptage ne sont présentes que sur les véhicules équipés (généralement autour de 30% de la flotte) et ne permettent donc pas de calculer la fréquentation totale.

Nous avons donc imaginé des indicateurs de fréquentation qui combinent ces deux sources de données pour visualiser la fréquentation totale du réseau : ce sont les indicateurs unifiés.

Principe du modèle

Les indicateurs unifiés se basent sur les valeurs billettiques augmentées d'un taux de fraude. Ce taux de fraude est estimé algorithmiquement en mesurant le delta entre la fréquentation billettique et la fréquentation comptage débruitée.

Cas de figures traités

Ce modèle s'applique différemment selon que la ligne concernée est équipée ou non en cellules de comptage :

  • Sur les lignes (partiellement) équipées en cellules de comptages,
    • Pour les courses qui ont de la billettique et du comptage, les montées/descentes unifiées correspondent aux montées/descentes comptage débruitées ;
    • Pour les courses qui ont de la billettique mais pas de comptage, on estime les montées/descentes unifiées à partir des montées/descentes billettique. On modélise pour cela un taux de fraude moyen à la montée par ligne et station sur 30 jours glissants. L'unification consiste alors à appliquer ce taux de fraude aux montées/descentes billettiques
  • Sur les lignes sans cellules de comptages, le taux de fraude n'est pas connu. Dans ce cas, la solution dépend du mode :
    • S'il s'agit d'une ligne du même mode (bus/tram/...) que les lignes équipées, on applique alors un modèle supplémentaire de régression spatiale qui regarde le taux de fraude sur les stations géographiquement voisines des stations appartenant à des lignes sans mesures de comptage. Ainsi, si une station sans comptage est proche d'une station avec comptage, leurs taux de fraude seront similaires.
    • S'il s'agit d'une ligne d'un autre mode (par exemple, une ligne de tram alors que toutes les lignes équipées en comptage sont des lignes de bus), le modèle d'unification n'est pas appliqué. Par défaut, c'est la charge rehaussée qui est affichée.

Calcul de la charge

La charge est ensuite calculée selon la méthode habituelle à partir des montées/descentes : elle est égale aux montées moins les descentes additionnée de la charge déjà présente :

  • pour les courses avec comptages, la charge unifiée est égale à la charge comptage débruitée
  • pour les courses sans comptage, elle est égale à la charge billettique augmentée d'un taux de fraude calculé
    • soit sur la base de l'historique des courses avec comptage
    • soit sur la base de l'historique des stations géographiquement proches

Remarque sur l'utilisation des données

On notera ainsi que chaque course avec de la billettique et du comptage débruité est utilisé deux fois :

  • elle est prise en compte pour la modélisation du taux de fraude
  • elle est réutilisée dans le calcul du KPI : si la mesure existe, on n'en estime pas une nouvelle

Ce modèle de charge unifiée revient ainsi à 1) modéliser un taux de fraude et 2) à l'appliquer à la charge billettique.

Indicateurs concernés par ce modèle

Sur Transport Analytics, les indicateurs suivants sont unifiés :

Visualisation des données non unifiées

Les indicateurs de charge et de montées/descentes issus des données de comptage brutes (c'est-à-dire non débruitées) se trouvent dans le module Qualité, sous le groupe d'indicateurs "Comptages" :

Les indicateurs de charge et de montées/descentes issus des données billettique brutes (c'est-à-dire non rehaussées) se trouvent dans le module Qualité, sous le groupe d'indicateurs "Billettique" :

A noter : le KPI "Validations" du module Fréquentation affiche quant à lui la donnée billettique brute (c'est-à-dire non rehaussée).

Avez-vous trouvé ce que vous cherchiez ?

Reconstitution des flux O-D et de la Charge

Contact