Quand un passionné de comptabilité rencontre un féru d’algorithmes, la gestion des notes de frais n’est plus une corvée. Vincent Porcel, chef de produit Cleemy et Jonathan Grandperrin, cofondateur de Mindee, reviennent sur la genèse et les perspectives de leur partenariat technologique.
Retrouvez ci-dessous la transcription partielle du podcast :
Quel est l’impact de l’IA sur l’expérience utilisateur ?
À 4 minutes 05
VP : Dans le cas de Cleemy, c’est assez radical. Au lieu de saisir leurs dépenses, les utilisateurs prennent une photo et l’algorithme fait le reste. C’est particulièrement intéressant quand on le couple avec le rapprochement bancaire, c’est-à-dire en récupérant les transactions pour les comparer automatiquement avec les photos des justificatifs.
Si on regarde plus dans le détail, les performances de la technologie ont un gros impact. Par exemple, le moteur de reconnaissance d’images que nous utilisions avant Mindee lisait correctement les justificatifs, mais prenait 12 secondes avant de rendre son verdict. Cela nous avait contraint à proposer une expérience utilisateur asynchrone, c’est-à-dire que nous incitions l’utilisateur à prendre en photo ses justificatifs, éventuellement à la chaîne, puis nous le redirigions vers une galerie de justificatifs où il voyait les images passer graduellement à l’état « traité ». Le moteur de Mindee tourne en moins d’une demi-seconde. Nous allons donc ajuster l’expérience utilisateur pour qu’elle soit synchrone. L’utilisateur verra directement la dépense se créer et la galerie passe aux oubliettes.
Il n’y a pas besoin d’être un expert pour s’apercevoir que le domaine de recherche du Deep Learning est extrêmement fécond. Le gros déclic du potentiel de l’IA pour moi a été quand je me suis mis à réutiliser Google Traductions après des années de désamour. Il y a 4/5 ans, les textes traduits étaient abominables (ou très rigolos, au choix), mais les résultats sont devenus intelligibles et parfois élégants.
Comment Lucca a-t-il vu le potentiel de l’intelligence artificielle dans le cadre du traitement des notes de frais ?
À 6 minutes 11
VP : Déjà en constatant que les approches statistiques n’étaient pas assez performantes. Notre ancien moteur de reconnaissance n’utilisait pas de technologies IA et on sentait que ses performances plafonnaient.
Une fois qu’on a constaté ça, on creuse un peu, on apprend que le Deep Learning est particulièrement bon sur les problématiques liées à l’image. Et en creusant un peu plus, on s’aperçoit que les algorithmes de Deep Learning s’exécutent vite : dans les fondements mathématiques, c’est du calcul de matrices, ce qu’on utilise aussi pour calculer des images en 3D… Puisqu’un PC de particulier sait faire tourner un jeu vidéo rudement impressionnant, on sentait bien que la technologie avait du potentiel, tant sur la précision que sur la rapidité d’exécution.
C’est une dialectique intéressante : l’IA automatise certaines tâches, ce qui va au-delà d’une amélioration de l’expérience utilisateur. Une bonne IA crée en fait un nouvel usage, où l’esprit humain est mobilisé sur des choses un peu plus relevées !
Pourquoi avoir fait appel à une jeune startup (sans client à l’époque), plutôt que de créer une équipe de recherche dédiée chez Lucca ?
À 8 minutes 14
VP : J’avais déjà rencontré Jonathan il y a deux ans et il a pensé à moi lorsqu’il a voulu fonder Mindee.
Nous étions très intéressés, car pour un éditeur de taille moyenne comme Lucca, avec environ 150 personnes, il est très difficile de constituer une équipe de recherche et développement en IA. Déjà, parce que ce n’est pas notre métier : chez Lucca, nous sommes des experts des processus de gestion d’entreprise et de leur transcription sous la forme de logiciels, avec une ergonomie et une modélisation du métier poussées. L’algèbre linéaire, c’est moins notre créneau.
Recruter une équipe de data Scientists quand on n’a pas une connaissance poussée de ces métiers, c’est délicat. Les profils sont rares et surtout, comment dégoter les bons ?
En outre, les problématiques qui peuvent être résolues efficacement par IA ne correspondent généralement qu’à une partie d’un logiciel. Sur les notes de frais, extraire automatiquement les informations sur les justificatifs est un usage évident, mais ce n’est qu’une partie de la gestion des notes de frais. Il y a aussi la comptabilité, les règles d’engagement de frais, les circuits d’approbation, les interfaces bancaires…
Avoir un partenaire capable d’aligner une escouade de data scientists brillants, c’est bien plus séduisant, comme approche.
Comment s’est déroulée la collaboration entre Lucca et Mindee ?
À 10 minutes 04
VP : Nous avons commencé par une grosse session de formation pour nous remettre en jambes sur les mathématiques et concepts scientifiques derrière l’IA et fait nos premières armes avec les outils du domaine tels que Tensorflow. C’était important pour parler le même langage avant d’entrer dans le vif du sujet.
La suite du projet a nécessité une collaboration poussée entre experts technologiques et experts métier. Nous connaissons bien les notes de frais, nous savons ce qui est important ou pas sur les images, comment les segmenter, comment interpréter certains résultats… Et surtout, nous avions en stock des centaines de milliers d’images de justificatifs pour entraîner une intelligence artificielle. La fin du projet, c’était plus de l’ingénierie, afin de brancher l’algorithme de Mindee sur Cleemy.
JG : On développe une technologie qui permet d’extraire des informations sur tous types de documents. Il nous fallait donc un cas d’usage très complexe. C’est ce qui a été très séduisant avec Cleemy, c’est que ses utilisateurs ne prenaient pas nécessairement de belles photos de leurs justificatifs : certaines étaient floues, sur d’autres, les justificatifs étaient chiffonnés… C’était un gros challenge pour nous.
La relation de proximité avec les équipes Cleemy a été également très importante. Ils nous ont hébergé, accompagné dans la phase de R&D, nous ont apporté l’expertise métier, fourni les justificatifs…
Au tout début, on a demandé un petit échantillon de données (entre 5 et 10 000 justificatifs de notes de frais) à analyser. On a créé une librairie de code qui a permis d’entraîner nos algorithmes et de trouver la bonne approche. Ensuite, nous avons demandé à Cleemy de nous envoyer 100 000 justificatifs pour finaliser les entraînements. On s’est ensuite accordé sur la manière de travailler ensemble.
VP : Pour nous, c’était important que Mindee nous fournisse un service plus qu’un code, étant donné qu’ils ont plus de facilité à ouvrir le capot et à aller bidouiller dans la machine.
JG : On s’est vite rendu compte que transmettre un savoir si complexe (comment entraîner les algorithmes, les évaluer, les mettre en production) ne fonctionnait pas et que les entreprises étaient très contentes d’être accompagnées sur le long terme. Tout est hébergé chez nous, on est responsable de tout et si cela ne fonctionne pas, c’est de notre faute.
Quelles sont les prochaines étapes de l’IA sur la gestion des notes de frais ?
À 15 minutes 50
VP : On a de quoi s’amuser des années avec Mindee rien qu’avec le sujet de la note de frais. Il y a des choses qui pourraient être très utiles pour les utilisateurs finaux : passer en revue plus facilement les zones de prédiction de l’IA en coloriant l’image par exemple (comme avec un surligneur), extraire des nouvelles données comme les adresses, lever des alertes quand une demande de remboursement ne correspond pas à l’extraction de l’IA… Les possibilités sont très larges, autant pour la gestion des notes de frais que pour épargner un travail qui n’a absolument aucun intérêt. Lire un justificatif et recopier, c’est barbant !
En allant plus loin, on peut coupler cela à plusieurs sources de données comme des calendriers par exemple. En ajoutant d’autres algorithmes, on peut imaginer que la note de frais se fera toute seule. L’utilisateur n’interviendra que quand la machine indiquera ne pas être sûre. La note de frais est alors supprimé en tant que processus classique. On conservera juste la partie administrative, des approbateurs qui jugeront du bien fondé des notes de frais.
JG : La performance de l’intelligence artificielle est un gros enjeu car nous devons nous rapprocher de plus en plus de celle des humains. On va vers de la validation pure et simple, là où on avait auparavant des processus qui prenaient énormément de temps.
La technologie a cependant encore besoin d’évoluer, notamment pour simplifier l’entraînement des machines pour que cela soit accessible à tout le monde.