Accès direct au contenu

CMLA

Version anglaise

aide

Proposition de thèse CMLA-DGA 2019-2020

Apprentissage profond et imagerie satellitaire



Profil recherché : master en traitement d'images, traitement du signal, mathématiques ou informatique exigés.

Environnement et rémunération


La thèse se fera en collaboration avec la DGA (Direction générale de l'armement) et des acteurs industriels (startups et services de R&D).
Le doctorant travaillera au sein des locaux du CMLA, ENS Paris-Saclay, sur le campus de Cachan, puis sur celui de Saclay.
Du fait des collaborations industrielles, la rémunération du doctorant sera majorée de 25% par rapport au taux standard.

Encadrement et contact

Les candidatures et demandes de renseignements s'effectuent auprès des directeurs de thèse :
Raffaele Grompone (CMLA, ENS Paris-Saclay)
Sébastien Drouyer (CMLA, ENS Paris-Saclay)

  • Inscription obligatoire à l'EDMH (école doctorale de mathématiques Jacques Hadamard), Université Paris-Saclay.
  • Durée : 3 ans
  • Langues : Français et/ou Anglais

Sécurisation par la méthode a contrario des résultats de l'apprentissage profond : application à la détection massive en imagerie satellitaire

Les réseaux de neurones ont révolutionné l'analyse d'images notamment dans les domaines de la détection d'objets et de la classification d'images.

Connaître le potentiel de généralisation des réseaux profonds à de nouvelles images, particulièrement lorsque la base d'apprentissage est petite, constitue un enjeu majeur. Le problème réside dans l'évaluation statistique de la validité d'une détection donnée.

C'est pourquoi la thèse développera une méthode de détection statistique a contrario permettant d'évaluer le degré de confiance à accorder à chaque détection.

Cette évaluation pour chaque réseau de neurones sur de nouveaux exemples permettra entre autres d'évaluer la "généralisabilité" d'un détecteur d'objets. La méthode sera testée en grandeur réelle sur des couvertures satellitaires de pays entiers pour y détecter toutes les installations d'un type spécifié.

Problématique générale et contexte

En traitement d'images, les performances des algorithmes de détection et de reconnaissance d'objets ont connu un essor considérable grâce à l'apprentissage profond. Dans les benchmarks publics tels que COCO ou Kitti, les algorithmes utilisant l'apprentissage profond occupent maintenant les premières places du classement. Cependant, ces approches ont plusieurs limitations.

L'un des problèmes majeurs est que les résultats donnés par les réseaux de neurones ne sont pas interprétables : quand ils fonctionnent, il est très difficile de savoir pourquoi car ils sont souvent constitués de millions de paramètres. Une conséquence directe est qu'il est difficile de prévoir la capacité du détecteur à généraliser.

Pour contrer ces effets, les benchmarks publics concentrent souvent des centaines de milliers voire des millions d'images annotées. Cependant, lorsque l'on a une application spécifique et que l'on veut entraîner les réseaux à détecter des objets qui n'existent pas dans les benchmarks publics, il n'est souvent pas possible de créer des bases de tailles aussi importantes.

Par ailleurs, il est possible de tromper les réseaux de neurones en ajoutant un bruit adapté aux images. Les exemples antagonistes (adversarial examples) illustrent ce problème : alors qu'un réseau de neurones réussit à classifier correctement une image, l'ajout d'un bruit spécifique, pourtant invisible pour l'observateur humain, induit en erreur ce même réseau.

De manière globale, il apparaît donc que la robustesse des réseaux de neurones face à de nouveaux exemples ou simplement en présence de bruit est difficile à évaluer. De plus, les réseaux de neurones ne fournissent pas de mesure de la fiabilité de leurs détections. Une telle mesure serait équivalente à un FDR ( false detection rate ) ou NFA (nombre de fausses alarmes).

Le projet de thèse part de l'hypothèse que la théorie dite a contrario peut apporter une contribution décisive à ce problème.

Le principe de non-accidentalité désigne le fait que les relations entre des éléments indépendants prennent un sens lorsqu'il semble invraisemblable qu'elles soient le fruit du hasard. Ce principe trouve une formalisation dans la théorie a contrario, qui est utilisée en vision par ordinateur pour déterminer des seuils de détection en accord avec la non-accidentalité. Dans sa forme la plus simple, cette théorie permet de fixer automatiquement un seuil permettant de différencier dans l'image un signal (ce que l'on veut détecter) du bruit.

L'objet de ce projet consiste donc à combiner les réseaux de neurones et la théorie a contrario pour à la fois permettre d'évaluer et d'améliorer la robustesse des réseaux de neurones et pour les appliquer à des tâches massives de télésurveillance de la Terre par satellite.

Ce projet de thèse rentre dans le cadre de la thématique prioritaire MRIS 2019 Traitement et Analyse des Contenus, du domaine Ingénierie de l'Information et Robotique.