Back to Search Start Over

Towards a full France land cover with very high resolution satellite images

Authors :
Postadjian, Tristan
Laboratoire des Sciences et Technologies de l'Information Géographique (LaSTIG)
École nationale des sciences géographiques (ENSG)
Institut National de l'Information Géographique et Forestière [IGN] (IGN)-Institut National de l'Information Géographique et Forestière [IGN] (IGN)
Université Paris-Est
Clément Mallet
STAR, ABES
Source :
Réseau de neurones [cs.NE]. Université Paris-Est, 2020. Français. ⟨NNT : 2020PESC2018⟩
Publication Year :
2020
Publisher :
HAL CCSD, 2020.

Abstract

For political or environmental matters, land cover mapping has become more and more important since the beginning of the XXIst century. This mapping consists in, given a set of land cover classes, classifying ground-level objects according to these classes. Adressing very various applications, from a local scale (city-wise) to a more global scale (world-wide), several projects have been initiated so as to build land cover maps that would fit one of these applications. However, the current means to achieve this mapping are mainly manual, leading to high cost of production both in terms of man power and processing time. The task of building relevant land cover maps lies also in being able to monitor various phenomena in time, but acquiring data can be expansive for frequent updates or computation of maps at large scale. Yet, remote sensors have multiplied for the past two decades and the panel of such sensors is very wide and diverse in a spectral way and in terms of resolution. Among them, optical sensors boarded on Earth observation satellites acquire images in the visible and infrared spectrums, with high revisit time capabilities. SPOT 6 and 7 were launched in 2012 and 2014 respectively, and offer very high resolution images at 1.5m, in four bands. The French Mapping Agency computes each year a full France coverage from the SPOT data available through the THEIA data portal. Although this task has been widely studied in the past by the remote sensing community, by the means of supervised classifiers such as SVMs or random forests, none of the results have yet led to truly automated and satisfying maps that match existing specifications due to mislabelling errors that occur too often. In terms of methodology, the deep learning, and more specifically deep neural networks have proved to be far more efficient than other machine learning algorithms in various fields of research, from computer vision to natural language processing and system recommendation. These days, deep learning has become a part of everyday life, not only for academic research purposes, but also it society where it runs in the background of our smartphones for various tasks. Such ubiquity raises ethical issues: in particular, users’ browsing habits and behaviours are often monitored without them knowing to feed these algorithms. This heavy need for data is what allows deep learning to sketch more accurately a user behaviour, thus leading to more suitable commercial offers based on a history of purchases for instance.In our work, the French Mapping Agency topographic databases represent a real opportunity to massively train deep neural networks on the SPOT monoscopic very high resolution images, so as to produce land cover maps. The works reported in this dissertation are focused on this problematic of land cover mapping with deep neural networks on SPOT 6 and 7 data, with the additional constraint of tackling this task in a more general operational environment (large scale land cover mapping). This latter point ensures that the conducted experiments address occurring questions when classifying large geographic areas. For instance, a specific SPOT coverage is made of one image per territory, which means adjacent areas can have been acquired at different dates, leading to strong appearance discrepancies. Transfer learning is a tool that can help a lot in lots of scenarii so as to reduce both time computation and needs for training samples. Finally, in a context of the automatic update or re-computation of existing topographic database, the use of aerial images in deep neural networks is assessed in several tasks, with an emphasis on the training dataset conception from topographic database that can include some drawbacks<br />La connaissance de la couverture des territoires en terme d’occupation des sols est devenue un enjeu majeur du XXIème siècle. Que ce soit à l’échelle nationale ou à une échelle plus globale, les initiatives se multiplient pour proposer des cartographies d’occupation des sols qui répondent à des besoins propres à chacune. Consistant à classer des objets présents sur le sol selon des nomenclatures prédéfinies, la tâche est fastidieuse à l’heure actuelle avec des processus essentiellement manuels ou semi-manuels, nécessaires pour garantir le respect de certaines qualités et spécifications. La télédétection spatiale a connu un essor conséquent avec la multiplication des capteurs optiques d’observation de la Terre disponibles et de leur diversité en terme de résolutions spectrale, spatiale et temporelle. Ces capteurs optiques proposent chacun une description de la surface terrestre qui leur est propre. Les satellites SPOT 6 et SPOT 7 sont dotés de capteurs optiques à très haute résolution spatiale, et acquièrent des images dans quatre bandes spectrales à très haute résolution après pan-sharpening (1,5m). L’IGN, à partir de ces acquisitions SPOT disponibles sur le pôle de données surfaces continentales THEIA, produit chaque année une couverture d’orthophotos sur l’ensemble du territoire français. La problématique de cartographie de l’occupation des sols automatique à partir d’images aériennes ou satellites occupe la communauté de télédétection depuis longtemps, par le biais de processus de classification supervisés, tels que les SVMs, ou les forêts aléatoires pour, entre autres, la vitesse d’exécution de ces derniers. Mais les résultats obtenus par ces méthodes n'ont pas encore permis une réelle automatisation, notamment en adéquation avec des spécifications existantes (erreurs encore trop importantes). En parallèle de ces algorithmes depuis longtemps utilisés, des méthodes d’apprentissage automatique d’un genre nouveau, bien que reposant sur des concepts remontant aux années 1950, émergent depuis une décennie. L’apprentissage profond a fait ses preuves dans de nombreux domaines depuis le traitement naturel du langage, à la reconnaissance d’objets dans des images. Cet essor récent est la conséquence de la disponibilité de grandes bases de données d'apprentissage, ainsi que la croissance globale des puissances de calcul. Représentants principaux de cette famille d’apprentissage, les réseaux de neurones profonds ont un impact au quotidien. Que ce soit au niveau académique en terme de recherche, au niveau sociétal, au travers des smartphones par exemple, ou même au niveau politique, avec les questions déontologiques que cela peut poser en terme de confidentialité des données (RGPD) et de protection des libertés individuelles, l'apprentissage profond est au cœur de technologies utilisées par la plupart des gens à leur insu. En effet, pour afficher de telles performances dans tant de domaines, ces algorithmes nécessitent de gros volumes de données. Les bases de données géographiques de l’IGN sont donc une opportunité dans notre cas, permettant d’exploiter au mieux les images très haute résolution monoscopiques acquises par les satellites SPOT 6 et 7 en les classifiant automatiquement par réseaux de neurones profonds appris sur ces mêmes bases de données. C’est cette approche que nous proposons dans ces travaux de thèse, avec une volonté d’étudier cette problématique tout en se plaçant dans un cadre plus large à visée opérationnelle. Nous étudions les possibilités de transfert d’apprentissage qui offre beaucoup d’avantages en matière de charges de calcul et de jeu d’apprentissage. Enfin, l’exploitation jointe d’images aériennes et de réseaux de neurones profonds est étudiée, avec un accent mis sur la préparation des données d’apprentissage issues des bases de données géographiques de l’IGN qui présentent certains inconvénients

Details

Language :
French
Database :
OpenAIRE
Journal :
Réseau de neurones [cs.NE]. Université Paris-Est, 2020. Français. ⟨NNT : 2020PESC2018⟩
Accession number :
edsair.od......2592..1077f0f5b1be455c47eee9e11f57ceca