Des algorithmes pour prévoir nos comportements
Le Secrétariat général pour la modernisation de l’action publique, par l’intermédiaire ses propres datascientists, a signé avec l’École une convention pour la modélisation de deux processus ponctuels (amélioration du retour à l’emploi et la prévention des vols de voiture).
Pour mener à bien ces missions, les datascientists de l’Administrateur général des données coopéreront avec le Centre de mathématiques appliquées de l’X dans la modélisation mathématique des processus ponctuels.
L’élaboration d’algorithmes prédictifs, qui fait intervenir de nombreuses techniques issues des statistiques, a pour but d’associer une probabilité à un événement futur. Le calcul de cette probabilité est fondé sur l’observation de toutes les données passées caractérisant le comportement à prédire.
De nombreuses politiques publiques pourront bénéficier des apports des sciences de la donnée, afin d’améliorer leur efficacité, leur définition ou encore leur pilotage.
La coopération avec l’École polytechnique, qui enrichira les travaux menés en propre par l’Administrateur général des données, débutera notamment par deux applications concrètes : l’amélioration du retour à l’emploi et la prévention des vols de voiture.
Prédire les parcours de retour à l’emploi
Le parcours d’un demandeur d’emploi s’étudie comme un phénomène temporel pour lequel on s’intéresse à l’état binaire « cherche un emploi » / « a retrouvé un emploi » connaissant le parcours professionnel antérieur du demandeur d’emploi ainsi que des informations personnelles (âge, sexe, domicile, qualifications, etc.).
La collaboration vise à concevoir un modèle prédictif du temps de retour à l’emploi, à partir de l’analyse anonymisée du parcours de deux millions de chômeurs sur trois ans. L’objectif poursuivi est de fournir des indications et des recommandations personnalisées aux demandeurs d’emploi pour optimiser leur retour à l’emploi.
Anticiper le vol de voitures
La criminalité se modélise comme une somme d’infractions pénales. © SDECORET / FOTOLIA
La criminalité se modélise comme une somme d’infractions pénales. Leur incidence dépend de facteurs géographiques, d’indicateurs sociaux et du contexte (date, données météorologiques, etc.) qui entrent dans le cadre de l’étude des processus ponctuels.
La collaboration permettra de déterminer un modèle de prédiction des vols de véhicules dans l’Oise, grâce aux données fournies par le ST(SI)² (Service des technologies et des systèmes d’information de la sécurité intérieure). Ce travail vise à répondre à une demande des forces de sécurité intérieure d’optimiser leur allocation de ressources.
Cette collaboration est portée par l’Administrateur général des données pour le SGMAP et par Emmanuel Bacry et Stéphane Gaiffas, chercheurs au Centre de mathématiques appliquées (CMAP – École polytechnique/CNRS).
Emmanuel Bacry est par ailleurs responsable de la convention de recherche signée avec la Caisse nationale d’assurance maladie des travailleurs salariés en janvier 2015, visant à favoriser le développement des technologies du big data appliqué au domaine de la santé.