Analyse de Risques et saisie des données bilancielles : Confidentialité absolue et zéro erreur exigées !
1. Les nouveaux impératifs des Autorités Bancaires Européennes.
Avec l’expansion mondiale du libéralisme économique comme source de progrès pour nos sociétés démocratiques, est apparu un besoin de garantie de confidentialité comme règle du jeu économique nécessaire à la compétition loyale souhaitée.
En particulier, l’Autorité Bancaire Européenne (European Bank Authority : EBA) a en 2019 demandé à ses Banques affiliées de l’UE de réinternaliser les saisies de tout document financier, et donc des bilans nécessaires aux analyses de risques de leurs Entreprises clientes, au motif de réduire les possibilités de fuites de données en plaçant ces saisies sous leur contrôle et donc sous leur responsabilité, au lieu de continuer à les sous-traiter à des sociétés de saisie spécialisée comme elles le font depuis de nombreuses années.
Outre que cela ne supprime pas le risque de fuites à travers leurs propres opérateurs de saisie, cette demi-mesure est économiquement très coûteuse pour ces non-professionnels de la saisie manuelle de données que sont les Banques et autres Organismes Financiers.
« L’Autorité Bancaire Européenne a demandé à ses Banques affiliées de l’UE de réinternaliser les saisies de tout document financier, et donc des bilans nécessaires aux analyses de risques de leurs Entreprises clientes. »
De ce fait, la Société Inovatic Technologies et sa filiale de Production Inovatic Services, leaders depuis plus de 20 ans sur ce marché, sont très impactées par cette ré-internalisation forcée.
Par ailleurs, cette exigence de Confidentialité de l’EBA se heurte à une autre exigence universelle s’agissant de données financières : l’Intolérance à toute erreur de saisie !
Autre exigence de ce marché : l’Exhaustivité : même si le travail humain peut être tentativement automatisé par des logiciels de reconnaissance de caractères, ces techniques ne peuvent jamais garantir l’absence d’erreurs et il faut toujours faire vérifier/corriger les montants financiers ainsi trouvés par des humains qui, pour ce faire, doivent donc voir sur leurs écrans lesdits montants, pouvant occasionner des fuites de données de la part d’opérateurs indélicats.
Cette incompatibilité entre ces trois impératifs : confidentialité absolue, saisie garantie sans fautes, exhaustivité du service, semble inéluctable mais la Société INOVATIC TECHNOLOGIES a réussi à contourner la difficulté par l’invention d’un Procédé résolvant ce paradoxe apparent, illustrant sa devise : « C’était impossible, nous l’avons fait ! »
2. Le contexte général du besoin.
Toute Entreprise est nécessairement conduite à s’appuyer sur une (ou plusieurs) Banque(s) de son choix pour gérer ses flux financiers, ses fluctuations de trésorerie liées aux cycles caractéristiques de son marché et aux délais de paiements de ses clients. À cet égard, elle est tributaire des dates de clôture de ses exercices fiscaux/comptables à l’issue desquels il est possible de dresser un bilan de ses résultats.
Ses Banques peuvent alors, au vu de ces bilans, avoir une visibilité sur sa solidité financière et sur la confiance qu’elles peuvent lui accorder en s’appuyant sur ce passé constaté et en ajustant les découverts autorisés et les taux d’intérêts à leur appliquer, pour couvrir ces risques.
C’est ainsi que les Banques demandent à leurs Entreprises Clientes de leur envoyer leurs Bilans une fois établis pour l’Administration Fiscale afin de réaliser cette Analyse de Risques. Ces Bilans-Comptes de résultats sont reçus sous forme d’images des documents et leurs données doivent être extraites avant leur entrée dans le Logiciel d’Analyse de Risques.
C’est là qu’intervient la nécessité d’un partenaire tel qu’Inovatic spécialisé dans ces extractions de données, les Banques n’ayant pas vocation à développer cette compétence.
3. Le contexte opérationnel du Problème.
Le Problème posé est maintenant de trouver un Procédé informatique de saisie semi-manuelle permettant de concilier les trois impératifs apparemment contradictoires de garantie de confidentialité absolue des montants saisis/vérifiés/corrigés manuellement, d’exactitude garantie desdits montants et d’exhaustivité du traitement. Il est de bonne pratique de définir d’abord comment doit se présenter le résultat que l’on cherche.
Dit simplement, on cherche des montants comptables associés à des postes attendus sur le Document. Il est donc nécessaire de définir un paramétrage de ces postes attendus avec des identifiants choisis pour chaque type répertorié de bilans.
Le résultat doit être une suite de couples <Identifiant, valeur> couvrant tous les identifiants attendus par l’ordinateur-Noyau de l’Application pour le type de Bilan détecté.
La Structure Informatique de la Chaine de traitement proposée par Inovatic.
Elle est composée d’un Ordinateur de traitement et d’un Pilote d’Interface.
L’Ordinateur Noyau
Il est protégé de tout risque d’intrusion et est chargé de recevoir le Document à traiter. Ses entrées/sorties ne se font qu’à travers des messages reçus et envoyés, garantissant l’impossibilité d’en prendre le contrôle par intrusion.
Le Pilote d’interface
Il est chargé de gérer interactivement les actions des Opérateurs humains de saisie/vérification/corrections. L’envoi des tâches à effectuer se fait par messages reçus du Noyau.
Les résultats de l’action des opérateurs humains sont retournés à travers des messages retournés au Noyau.
4. La confidentialité des montants contenus dans les cases du document : le Document Défiguré.
Elle est assurée, à réception d’un nouveau Document Bilanciel par le Noyau, par un traitement préalable qui lui permet d’identifier (par une reconnaissance des textes caractéristiques du type de Bilan reçu tolérante aux erreurs d’OCR) son modèle de référence, puis en vidant toutes les cases des tableaux du Document de leurs chiffres (« figures » en anglais) et en envoyant à l’interface le Document ainsi « Défiguré ». Les opérateurs humains peuvent alors reconnaître les identifiants des cases à travers les rubriques alphanumériques horizontales et verticales les localisant sur le modèle de référence et en interprétant leurs variantes linguistiques éventuelles, sans jamais voir les valeurs associées.
Quant à la reconnaissance/vérification des montants, elle est effectuée à travers l’extraction par le Noyau des images individuelles des chiffres composant les montants, puis le regroupement de ces pièces détachées (ayant perdu leur localisation d’origine), à travers une relation de proximité de formes ayant la propriété que deux images ainsi regroupées ne peuvent jamais représenter des chiffres différents. Une telle relation, inédite, a été inventée par Inovatic et baptisée « Coïncidence Forte ».
« Diviser le nombre de chiffres à vérifier d’un facteur d’environ 100, augmentant d’autant la productivité des opérateurs humains ! »
Cette relation, qui se révèle être une relation d’équivalence, permet au Noyau de regrouper les images en classes d’équivalence dont il reste à déterminer, pour chacune, la valeur de 0 à 9 sur l’une des images représentatives de la « classe », traditionnellement appelée « Modèle » en Intelligence Artificielle. Puis, le Noyau utilise un OCR (« Optical Charactère Recognition », en français « Reconnaissance Optique de Caractères ») pour attribuer une valeur à chacun de ces Modèles. La Coïncidence Forte discrimine en général les styles droit/italique et normal/gras donnant 40 modèles au moins, auxquels il faut ajouter les chiffres abîmés par des taches mal placées qui peuvent être notamment déclarés non reconnus. Cette reconnaissance par OCR est susceptible de causer des erreurs de reconnaissance nécessitant une vérification par opérateur humain.
Une retombée intéressante de ce procédé est de diviser le nombre de chiffres à vérifier d’un facteur d’environ 100, augmentant d’autant la productivité des opérateurs humains !
Une fois le document traité sous ses deux aspects par l’interface, le Pilote d’Interface retourne au Noyau deux fichiers :
- un Fichier des Identifiants localisés contenant la liste des cases identifiées avec leurs localisations dans le Document et la valeur de son identifiant trouvé,
- un Fichier des Modèles Renseignés contenant pour chaque modèle, son image représentative et sa valeur associée (0 à 9), garantie vérifiée/corrigée/complétée par un opérateur humain.
À réception, le Noyau reconstitue les montants de chaque case identifiée en extrayant à nouveau dans le Document originel les images des chiffres le composant, et en trouvant, pour chacune d’elles, son modèle de rattachement en passant en revue tous les modèles et en trouvant celui coïncidant fortement avec elle, lui permettant d‘en déduire sa valeur associée (0 à 9). Les caractères signant le montant (‘()’ ou ‘-‘) sont reconnus en tant que tels par le Noyau.
5. Cerise sur le gâteau : le Dossier Révélateur.
Une retombée géniale du Procédé inventé est la possibilité de stocker les résultats du travail des Opérateurs humains, constitué des deux fichiers résultants retournés au Noyau par l’Interface :
- Le fichier des Identifiants localisés
- Le fichier des Modèles Renseignés.
Ces données à elles seules ne permettant pas de reconstituer les montants, l’archivage préserve la Confidentialité, sauf à disposer à nouveau du Document initial, permettant au Noyau de le dépouiller à nouveau comme il l’a fait la première fois. C’est cette propriété qui est mise à profit pour générer à nouveau les résultats lorsque le Noyau détecte qu’il reçoit, à travers une autre Banque, un bilan déjà traité, réalisant sans trahir la confidentialité une mutualisation de fait de la saisie ! À noter que les montants extraits sont ceux figurant sur le Document reçu, fussent-ils différents (ce qu’ils ne devraient pas être !) …
Pour se faire, à chaque traitement d’un bilan, les deux fichiers résultants sont regroupés dans un « Dossier Révélateur » et archivés par le Noyau dans une base de données, sous un index identifiant le Document sans ambiguïté, par exemple :
< Siret de l’Entreprise, date de clôture >
Lors de la réception d’un nouveau Bilan à traiter, en préalable au traitement, le Noyau extrait automatiquement son Siret et sa date de clôture qu’il sait localiser par différents moyens, et, s’il trouve dans la base de données que le bilan a déjà été traité, il génère à nouveau les résultats à partir du Dossier Révélateur et de l’image du bilan reçu comme il l’a fait lors de son premier passage.
La plupart des Entreprises travaillant avec plusieurs Banques, cela permet de diviser par 2 ou 3 les coûts de « saisie », pourvu qu’il y ait un seul prestataire pour le pays concerné.
Conclusion
Le Procédé inventé par Inovatic a vocation à s’implanter dans l’ensemble de l’UE, puis dans tous les pays industrialisés où la problématique de la Confidentialité et de l’exactitude rigoureuse des données extraites est une exigence naturelle.
Par ailleurs, le procédé bénéficie d’un atout supplémentaire décisif par la baisse drastique de ses coûts de productions, quand bien même la confidentialité ne serait pas requise !
Ayant fait l’objet d’un Brevet Internationnal, le Procédé va permettre à Inovatic de s’imposer dans l’ensemble des Pays développés.