Professeure au Département d’informatique et membre de l’équipe Cedar entre Inria et le Laboratoire d’informatique de l’École polytechnique (LIX*), Yanlei Diao va mener le projet ExplainableAD sur le traitement des données de grandes dimensions.
23 jan. 2025
Recherche, LIX
Les données numériques sont devenues omniprésentes dans de nombreuses activités. Le nombre et la complexité de ces « big data » a explosé ces dernières années. Un des défis consiste à pouvoir analyser en temps réel des flux de données afin d’en extraire des informations pertinentes. Grâce à un précédent financement européen (une bourse ERC Consolidator pour le projet BigFastData), Yanlei Diao et son équipe ont développé des algorithmes dédiés à de telles analyses, en particulier capable de détecter des anomalies dans des séries de données, et d’en fournir des explications.
« Le projet ExplainableAD vise à aller plus loin en intégrant ces algorithmes dans un prototype de recherche entièrement fonctionnel, en les évaluant dans des cas d'utilisation réels, et en explorant des éventuels transferts de technologie » détaille la chercheuse.
Un exemple d’application est celui de la fraude financière, notamment pour les banques. Parmi les nombreuses données qui circulent sur les transactions, il s’agit d’abord pour le système de repérer celles qui paraissent anormales. Ensuite, le système fournit une explication : l’heure, le volume, l’origine ou la destination peuvent sortir de l’ordinaire. Les analystes ont ensuite les moyens de decider des actions nécessaires. « Dans le paysage global des systèmes de détection d'anomalies pleinement opérationnels, notre système est le seul qui offre ces explications » juge Yanlei Diao.
Le principal challenge réside dans le fait que, si les applications abondent, elles présentent des propriétés différentes. Ainsi les comportements « normaux » sont très divers. Il y a aussi la difficulté de séparer les anomalies des données qui sont bruitées. Si les applications financières et bancaires sont les premières auxquelles s’attaquera le projet ExeplainableAD, d’autres ont déjà été identifiées comme la gestion des réseaux et autres systèmes informatiques ou encore le domaine biomédical.
A propos des bourses ERC Proof of Concept
Les bourses ERC Proof of Concept s’inscrivent dans la continuité de projet de recherche déjà financée par une bourse du Conseil européen de la recherche. Ces bourses visent à faciliter l'exploration du potentiel d'innovation commerciale et sociale des projets, en permettant des études complémentaires.
*LIX : une unité mixte de recherche CNRS, École polytechnique, Institut Polytechnique de Paris, 91120 Palaiseau, France