1. Samo-nadzirano učenje dubine za monokularnu direktnu vizualnu odometriju
- Author
-
Kapusović, Karlo and Marković, Ivan
- Subjects
depth from mono ,visual odometry ,TECHNICAL SCIENCES. Electrical Engineering ,TEHNIČKE ZNANOSTI. Elektrotehnika ,self-supervised learning ,vizulana odometrija ,samo-nadzirano učenje ,dubina iz monokularne slike - Abstract
Direktna vizualna odometrija skupina je algoritama koji estimiraju položaj kamere pomoću vrijednosti intenziteta piksela u slikama. Samim time je osjetljiva na pogreške kalibracije i inicijalizacije početnih vrijednosti. Iako stereo kamere omogućuju brzu inicijalizaciju i procjenu metričke skale, njihovo korištenje je složenije i zahtijeva kompleksniju kalibraciju kamera. Duboko učenje omogućuje estimaciju metrički točne dubine iz monokularnih slika. Korištenjem najnovijih pristupa samo-nadziranog učenja, omogućuje se učenje mreže bez označenog skupa podataka za treniranje. Stoga je moguća vrlo laka prilagodba neuronske mreže za različita okruženja. U diplomskome radu potrebno je iskoristiti dubinske mape iz neuronske mreže u direktnoj vizualnoj odometriji kako bi se poboljšala inicijalizacije i omogućila procjena metričke skale svijeta iz monokularnih slika. Direct visual odometry is a group of algorithms that estimate camera position using pixel intensity values in images. It is therefore sensitive to calibration errors and initialization of initial values. Although stereo cameras allow for rapid initialization and metric scale estimation, their use is more complex and requires more complex camera calibration. Deep learning allows the estimation of metrically accurate depth from monocular images. Using the latest approaches to self-supervised learning, network learning is enabled without a labeled training data set. Therefore, it is possible to very easily adapt the neural network to work in different environments. In this graduate thesis it is necessary to use depth maps from the neural network in direct visual odometry in order to improve the initializations and enable the assessment of the metric scale of the world from monocular images.
- Published
- 2022