近日,為了簡化計(jì)算機(jī)識別圖像的過程,來自Facebook人工智能研究實(shí)驗(yàn)室(FAIR)的六名成員利用Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu)創(chuàng)建了端到端的圖像檢測AI工具“DETR”。FAIR 稱,DETR是第一個(gè)成功將Transformer架構(gòu)集成為圖像對象檢測核心的工具。Transformer架構(gòu)可以像近年來對自然語言進(jìn)行處理一樣,徹底改變計(jì)算機(jī)視覺,或者縮小自然語言處理與計(jì)算機(jī)視覺之間的差距。研究員稱,通過將通用的CNN與Transformer架構(gòu)相結(jié)合,DETR可以直接(并行)預(yù)測最終的檢測結(jié)果,與許多其他現(xiàn)代檢測工具不同,新模型在概念上很簡單,不需要專門的數(shù)據(jù)庫。