Lundi 16 octobre 2023, Paul Monchot soutiendra sa thèse de doctorat intitulée "Quantification d'incertitudes au sein de réseaux de neurones : Application à la mesure automatisée de la taille de particules de TiO2".

Les travaux de recherche ont été réalisés dans le cadre d’une thèse CIFRE, en collaboration avec le laboratoire CMAP de l’école Polytechnique et le LNE au sein du département Sciences des données et incertitudes.

L’objectif de cette thèse est l’établissement d’une méthodologie de quantification de l’incertitude au sein des algorithmes d’apprentissage profond. Ces travaux de thèse se sont appuyés sur un cas d’application industriel consistant en la mesure automatisée de la taille de particules de TiO2.

Résumé de la thèse

L'utilisation croissante de solutions technologiques fondées sur des algorithmes d'apprentissage profond a connu une explosion ces dernières années en raison de leurs performances sur des tâches de détection d'objets, de segmentation d'images et de vidéos ou encore de classification, et ce dans de nombreux domaines tels que la médecine, la finance, la conduite autonome, etc. Dans ce contexte, la recherche en apprentissage profond se concentre de plus en plus sur l'amélioration des performances et une meilleure compréhension des algorithmes utilisés en essayant de quantifier l'incertitude associée à leurs prédictions. Fournir cette incertitude est clé pour une dissémination massive de ces nouveaux outils dans l'industrie et pour lever les freins actuels pour des systèmes critiques notamment. En effet, fournir l'information de l'incertitude peut revêtir une importance réglementaire dans certains secteurs d'activité.

Cette thèse expose les travaux menés sur la quantification de l'incertitude au sein des réseaux de neurones. Pour commencer, il est proposé un état des lieux approfondi en explicitant les concepts clés impliqués dans un cadre métrologique. Ensuite, le choix a été fait de se concentrer sur la propagation de l'incertitude des entrées à travers un réseau de neurones d'ores-et-déjà entraîné afin de répondre à un besoin industriel pressant. La méthode de propagation de l'incertitude des entrées proposée, nommée WGMprop, modélise les sorties du réseau comme des mixtures de gaussiennes dont la propagation de l'incertitude est assurée par un algorithme Split&Merge muni d'une mesure de divergence choisie comme la distance de Wasserstein. Une focalisation a été faite sur la quantification de l'incertitude inhérente aux paramètres du réseau. Dans ce cadre, une étude comparative des méthodes à l'état de l'art a été réalisée. Cette étude a notamment conduit à proposer une méthode de caractérisation locale des ensembles profonds, méthode faisant office de référence à l'heure actuelle. La méthodologie développée, nommée WEUQ, permet une exploration des bassins d'attraction du paysage des paramètres des réseaux de neurones en prenant en compte la diversité des prédicteurs. Enfin, le cas d'application développé est présenté, consistant en la mesure automatisée de la distribution des tailles de nanoparticules de dioxyde de titane (TiO2) à partir d'images acquises par microscopie électronique à balayage (MEB). Le développement de la brique technologique utilisée ainsi que les choix méthodologiques de quantification d'incertitudes découlant de ces recherches sont décrits à cette occasion.

Date et lieu de soutenance

Date : lundi 16 octobre 2023 à 15h

Lieu : Amphithéâtre BecquerelPolytechnique, campus de Palaiseau