Calcul de prédiction de la fraude

Masha Timofeeva Mis à jour par Masha Timofeeva

Dernière mise à jour : 03-10-2025

Le module Prochains passages affiche les prochains passages théoriques définis par le GTFS (ou équivalent), ainsi qu’une prédiction de charge et de fraude pour chacune des courses et à chacun des arrêts.

Principe général

La prédiction de fraude repose sur l’analyse de 6 mois d’historique de charges billettiques et de comptage. Elle correspond à la fraude à bord du véhicule à l’arrivée à l’arrêt, c’est-à-dire avant tout échange voyageur.

La fraude est calculée comme la différence entre :

  • la charge unifiée,
  • la charge billettique rectifiée.

Ces calculs prennent en compte :

  • la ligne et la direction,
  • l’arrêt,
  • le jour de la semaine,
  • la tranche de 15 minutes,
  • la période de l’année (scolaire ou vacances).

Les données étant envoyées quotidiennement, les prédictions sont mises à jour chaque nuit dans Citio.

Étapes de calcul

1. Calcul historique des passagers ayant validé

Dans un premier temps, on utilise les validations billettiques pour déterminer la charge à bord des véhicules représentée par des utilisateurs ayant validé leur titre. Cette charge, dite billettique, est calculée sur les 6 mois précédant la date actuelle en soustrayant aux validations à chaque arrêt les descentes déduites à partir de divers modèles déterministes et statistiques.

2. Calcul historique des passagers en règle

La charge billettique ainsi créée est ajustée en ajoutant aux montées et descentes billettiques un certain nombre de voyageurs simulés, qui modélisent les problèmes de remontées des validations, les validations délocalisées, les valideurs ou cartes hors service. De fait, cette deuxième charge, supérieure à la première, représente tous les passagers en règle à bord des véhicules. Elle est également calculée sur les 6 derniers mois.

3. Calcul historique des passagers totaux

Les cellules de comptage permettent de déterminer quelle est la charge réelle des véhicules circulant sur le réseau, comprenant les passagers en règles ainsi que les fraudeurs. Divers traitements sont appliqués aux comptages afin de les mettre en conformité avec les charges précédemment calculées. Plusieurs algorithmes de régression permettent d'avoir une charge totale sur l'ensemble des véhicules du réseau.

4. Calcul historique de la fraude

Sur les 6 derniers mois, la fraude correspond donc à chaque arrêt à la différence entre la charge totale et la charge représentée par les passagers en règle.

5. Prédiction de la charge et de la fraude

Pour chaque passage futur, la charge et la fraude sont estimées en calculant les moyennes des circulations historiques présentant les mêmes caractéristiques que le passage considéré :

  • même station ;
  • même ligne et direction ;
  • même jour de la semaine ;
  • même quart d'heure.

Avez-vous trouvé ce que vous cherchiez ?

Analyses croisées sur Fraud Tracker

Prédiction de fraude

Contact