Accès direct au contenu

CMLA

Version anglaise

aide

Accueil > Publications > Thèses du CMLA

Recherche - Valorisation

Évaluation d'algorithmes stéréoscopiques de haute précision

le 4 décembre 2017
14h00

Soutenance de thèse de Tristan Dagobert (CMLA)

DAGOBERT_Tristan.jpg

DAGOBERT_Tristan.jpg

Cette thèse étudie la précision en vision stéréo, les méthodes de détection dites extit{a contrario} et en présente une application à l'imagerie satellitaire.

La première partie a été réalisée dans le cadre du projet DGA-ANR-ASTRID «STÉRÉO». Son but est de définir les limites effectives des méthodes de reconstruction stéréo quand on contrôle toute la chaîne d'acquisition à la précision maximale, que l'on acquiert des paires stéréo en rapport $B/H$ très faible et sans bruit.

Pour valider ce concept, nous créons des vérités terrains très précises en utilisant un "rendeur". En gardant les rayons calculés durant le rendu, nous avons une information très dense sur la scène 3D.  Ainsi nous créons des cartes d'occultations, de disparités dont l'erreur de précision est inférieure à $10^{-6}$.
Nous avons mis à la disposition de la communauté de recherche des images de synthèse avec un SNR supérieur à 500 : un ensemble de 66 paires stéréo dont le $B/H$ varie de $1/2500$ à $1/50$.

Pour évaluer les méthodes de stéréo sur ce nouveau type de données, nous proposons des métriques calculant la qualité des cartes de disparités estimées, combinant la précision et la densité des points dont l'erreur relative est inférieure à un certain seuil.

Nous évaluons plusieurs algorithmes représentatifs de l'état de l'art
, sur les paires créées ainsi sur les paires de Middlebury, jusqu'à leurs limites de fonctionnement. Nous confirmons par ces analyses, que les hypothèses théoriques sur le bien fondé du faible $B/H$ en fort SNR sont valides, jusqu'à une certaine limite que nous caractérisons. 

Nous découvrons ainsi que de simples méthodes de flux optique pour l'appariement stéréo deviennent plus performantes que des méthodes variationnelles discrètes plus élaborées. Cette conclusion n'est toutefois valide que pour des forts rapports signal à bruit. L'exploitation des données denses nous permet de compléter les vérités terrain par une détection très précise des bords d'occultation. Nous proposons une méthode de calcul de contours vectoriels  subpixéliens à partir d'un nuage de points très dense, basée sur des méthodes extit{a contrario} de classification de pixels. 

La seconde partie de la thèse est dédiée à une application du flot optique subpixélien et des méthodes extit{a contrario} pour détecter des nuages en imagerie satellitaire.  Nous proposons une méthode qui n'exploite que l'information visible optique. Elle repose sur la redondance temporelle obtenue grâce au passage répété des satellites au-dessus des mêmes zones géographiques.

Nous définissons quatre indices pour séparer les nuages du paysage : le mouvement apparent inter-canaux, la texture locale, l'émergence temporelle et la luminance.  Ces indices sont modélisés dans le cadre statistique des méthodes extit{a contrario} qui produisent un NFA (nombre de fausses alarmes pour chacun). Nous proposons une méthode pour combiner ces indices et calculer un NFA beaucoup plus discriminant. Nous comparons les cartes de nuages estimées à des vérités terrain annotées et aux cartes nuageuses produites par les algorithmes liés aux satellites Landsat-8 et Sentinel-2.  Nous montrons que les scores de détection et de fausses alarmes sont supérieures à ceux obtenus avec ces algorithmes, qui pourtant utilisent une dizaine de bandes multi-spectrales.

Title : Evaluation of high precision low baseline stereo vision algorithms

This thesis studies the accuracy in stereo vision, detection methods called extit{a contrario} and presents an application to satellite imagery.

The first part was carried out within the framework of the project DGA-ANR-ASTRID "STEREO". The aim is to define the effective limits of stereo reconstruction when controlling the entire acquisition chain at the maximum precision, that one acquires stereo pairs in very low baseline and noise-free.

To validate this concept, we create very precise ground truths using a renderer. By keeping the rays computed during rendering, we have very dense information on the 3D scene. Thus we create occultation and disparity maps whose precision error is less than $ 10 ^ {- 6} $. We have made synthetic images available to the research community with an SNR greater than 500: a set of 66 stereo pairs whose $ B / H $ varies from $ 1 / 2500$ to $ 1 / 50$.

To evaluate stereo methods on this new type of data, we propose metrics computing the quality of the estimated disparity maps, combining the precision and the density of the points whose relative error is less than a certain threshold.

We evaluate several algorithms representative of the state of the art
, on the pairs thus created and on the Middlebury pairs, up to their operating limits. We confirm by these analyzes that the theoretical assumptions about the merit of the low $ B / H $ in high SNR are valid, up to a certain limit that we characterize.

We thus discover that simple optical flow methods for stereo matching become more efficient than more sophisticated discrete variational methods. This conclusion, however, is only valid for high signal-to-noise ratios. The use of the dense data allows us to complete the ground truths a subpixel detection of the occlusion edges. We propose a method to compute subpixel vector contours from a very dense cloud of points, based on pixel classification extit {a contrario} methods.

The second part of the thesis is devoted to an application of the subpixelian optical flow and extit {a contrario} methods to detect clouds in satellite  imagery. We propose a method that exploits only visible optical information. It is based on the temporal redundancy obtained by the repeated passages of the satellites over the same geographical zones.

We define four clues to separate the clouds from the landscape: the apparent inter-channel movement, Local texture, temporal emergence and luminance. These indices are modeled in the statistical framework of extit {a contrario} methods which produce an NFA (number of false alarms for each). We propose a method for combining these indices and computing a much more discriminating NFA. We compare the estimated cloud maps to annotated ground truths and the cloud maps produced by the algorithms related to the Landsat-8 and Sentinel-2 satellites. We show that the detection and false alarms scores are higher than those obtained with these algorithms, which however use a dozen multi-spectral bands.

Type :
Thèses - HDR
Lieu(x) :
Campus de Cachan
Salle Renaudeau

Tutelles






Thèse sous la direction

du prof. Jean-Michel MOREL (CMLA, ENS Paris-Saclay)

Jury

Mme Agnès Desolneux (examinatrice)
M. Pascal Monasse (examinateur)
M. Mariano Tepper (examinateur)

M. Christoph Garbe (rapporteur)
M. Michael Lindenbaum (rapporteur)

Recherche d'une actualité

Recherche d'une actualité