張旭東 趙柏淦 吳國(guó)慶 姚建南
摘要:針對(duì)自動(dòng)駕駛領(lǐng)域現(xiàn)有方法在處理動(dòng)態(tài)、遮擋等復(fù)雜實(shí)際場(chǎng)景時(shí)存在的估計(jì)不準(zhǔn)確問題,提出了一種以多掩膜技術(shù)為基礎(chǔ)的無監(jiān)督深度與光流估計(jì)方法,通過無監(jiān)督學(xué)習(xí)從單目視頻序列中提取目標(biāo)深度、相機(jī)運(yùn)動(dòng)位姿和光流信息。根據(jù)不同外點(diǎn)類型設(shè)計(jì)了多種特定掩膜,以有效抑制外點(diǎn)對(duì)光照一致性損失函數(shù)的干擾,并在位姿估計(jì)和光流估計(jì)任務(wù)中起到剔除外點(diǎn)的作用。引入預(yù)訓(xùn)練的光流估計(jì)網(wǎng)絡(luò),協(xié)助深度和位姿估計(jì)網(wǎng)絡(luò)更好地利用三維場(chǎng)景的幾何約束,從而增強(qiáng)聯(lián)合訓(xùn)練性能。最后,借助訓(xùn)練得到的深度和位姿信息,以及計(jì)算得到的掩膜,對(duì)光流估計(jì)網(wǎng)絡(luò)進(jìn)行了優(yōu)化訓(xùn)練。在KITTI 數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,該策略能夠顯著提升模型的性能,并優(yōu)于其他同類型方法。
關(guān)鍵詞:無監(jiān)督學(xué)習(xí);深度估計(jì);位姿估計(jì);三維重建
中圖分類號(hào):TP 391 文獻(xiàn)標(biāo)志碼:A