適用于機(jī)載環(huán)境的智能計(jì)算處理器分析研究

2020-02-04 07:28:05文鵬程白林亭高澤程陶然

航空科學(xué)技術(shù) 2020年10期

文鵬程白林亭高澤程陶然

摘要：近年來，以深度學(xué)習(xí)為代表的人工智能技術(shù)在民用領(lǐng)域飛速發(fā)展。在航空應(yīng)用方面，人工智能技術(shù)將發(fā)揮重要的作用。人工智能技術(shù)在航空領(lǐng)域的應(yīng)用，必須要考慮機(jī)載環(huán)境的約束和限制，尤其對(duì)智能計(jì)算處理器更是有著嚴(yán)格的要求。綜合考慮人工智能技術(shù)的機(jī)載應(yīng)用場景、計(jì)算特性和算力需求，通過分析研究通用處理器以及智能專用處理器的架構(gòu)和適用性，基于異構(gòu)融合的設(shè)計(jì)思想，提出了一條可行的技術(shù)實(shí)施路線，為機(jī)載智能應(yīng)用提供計(jì)算支撐服務(wù)。

關(guān)鍵詞：航空人工智能；機(jī)載智能應(yīng)用；OODA；智能計(jì)算；智能專用處理器；通用處理器

中圖分類號(hào)：V247.1文獻(xiàn)標(biāo)識(shí)碼：ADOI：10.19452/j.issn1007-5453.2020.10.013

近年來，在算法、數(shù)據(jù)和算力的推動(dòng)下，以深度學(xué)習(xí)為代表的人工智能技術(shù)迎來了第三次發(fā)展浪潮[1]。計(jì)算機(jī)視覺[2]、自然語言理解[3]、人機(jī)博弈[4]等領(lǐng)域，均取得了長足的進(jìn)步，特定應(yīng)用成果甚至已經(jīng)超越了人類的能力水平。

軍事方面，人工智能技術(shù)將催生新型作戰(zhàn)力量，顛覆傳統(tǒng)作戰(zhàn)模式，智能化成為未來戰(zhàn)爭的核心要素。映射至航空[5]，人主機(jī)輔的輔助智能有助于解決有人飛機(jī)的一系列問題，如多任務(wù)并發(fā)、信息量飽和引發(fā)的飛行員工作負(fù)荷過載問題，高動(dòng)態(tài)、強(qiáng)對(duì)抗、復(fù)雜環(huán)境下的方案最優(yōu)選擇問題、記憶性序列操作與稀少性操作引發(fā)的飛行員動(dòng)作失誤問題等；人輔機(jī)主的自主智能有助于使無人飛機(jī)變得更加聰明，自動(dòng)勝任“臟活”“累活”和“枯燥的活”；人機(jī)融合的協(xié)同智能有助于有人/無人飛機(jī)構(gòu)建最優(yōu)作戰(zhàn)集合，降低“戰(zhàn)爭迷霧”，提高作戰(zhàn)效率，增加靈活性。

人工智能技術(shù)的落地，必須依賴于某一種計(jì)算平臺(tái)，而計(jì)算平臺(tái)的核心關(guān)鍵就是處理器。此類處理器基于人工智能技術(shù)特定的計(jì)算背景，亦可稱之為智能計(jì)算處理器。人工智能技術(shù)在航空領(lǐng)域的應(yīng)用，必須要考慮機(jī)載環(huán)境的約束和限制，尤其對(duì)智能計(jì)算處理器更是有著嚴(yán)格的要求，它是所有智能算法高效執(zhí)行的硬件基礎(chǔ)。為此，本文綜合考慮人工智能技術(shù)的機(jī)載應(yīng)用場景、計(jì)算特性、算力需求，通過分析研究通用處理器以及智能專用處理器的架構(gòu)和適用性，以期提出一條可行的技術(shù)實(shí)施路線，為機(jī)載智能應(yīng)用提供計(jì)算支撐服務(wù)。

1機(jī)載智能應(yīng)用特性分析

OODA理論[6]是由John Boyd從一對(duì)一空戰(zhàn)經(jīng)驗(yàn)中提出的，它由“觀察”（Observation）、“判斷”（Orientation）、“決策”（Decision）和“執(zhí)行”（Action）4個(gè)環(huán)節(jié)構(gòu)成，具有循環(huán)性、時(shí)效性、嵌套性等特點(diǎn)。在作戰(zhàn)中，對(duì)抗各方會(huì)不斷觀察周圍環(huán)境、獲取相關(guān)信息、判斷威脅、即時(shí)調(diào)整、做出決策，并采取相應(yīng)的行動(dòng)。如能夠努力縮短己方的OODA周期，并盡可能地增加敵方的OODA周期，使己方的響應(yīng)時(shí)間短于敵方的響應(yīng)時(shí)間，就能夠掌握作戰(zhàn)的主動(dòng)權(quán)，獲得巨大的優(yōu)勢(shì)。

人工智能技術(shù)與OODA相結(jié)合，它將實(shí)現(xiàn)對(duì)OODA4個(gè)環(huán)節(jié)的全覆蓋，有助于大幅縮短OODA周期，進(jìn)而以快制勝。其應(yīng)用模式如圖1所示。當(dāng)外部戰(zhàn)場環(huán)境信息經(jīng)傳感器采入后，觀察環(huán)節(jié)利用模板匹配、卷積神經(jīng)網(wǎng)絡(luò)（CNN）、循環(huán)神經(jīng)網(wǎng)絡(luò)（RNN）等算法對(duì)信息進(jìn)行處理，提取出有效特征，完成目標(biāo)感知與環(huán)境理解。判斷環(huán)節(jié)將上述結(jié)果進(jìn)行融合，并結(jié)合自身的狀態(tài)信息，利用知識(shí)圖譜、專家系統(tǒng)、長短時(shí)記憶網(wǎng)路（LSTM）等算法完成戰(zhàn)場態(tài)勢(shì)分析與威脅評(píng)估。然后轉(zhuǎn)入決策環(huán)節(jié)，該環(huán)節(jié)利用決策樹、模糊推理[7]、遺傳、差分進(jìn)化、粒子群等算法對(duì)己方下一步的行為動(dòng)作進(jìn)行引導(dǎo)，完成任務(wù)規(guī)劃與攻防決策。行動(dòng)環(huán)節(jié)根據(jù)決策結(jié)果，利用行為樹、強(qiáng)化學(xué)習(xí)等算法執(zhí)行具體的任務(wù)，完成火力打擊與支援保障。

將上述算法進(jìn)行分類，大體可以分為數(shù)據(jù)驅(qū)動(dòng)類算法、知識(shí)驅(qū)動(dòng)類算法和智能優(yōu)化類算法三類，如圖2所示。

（1）數(shù)據(jù)驅(qū)動(dòng)類算法

以深度神經(jīng)網(wǎng)絡(luò)為代表，基于對(duì)數(shù)據(jù)的表征學(xué)習(xí)，通過組合低層特征，形成更加抽象的高層表示，進(jìn)而發(fā)現(xiàn)數(shù)據(jù)的屬性類別。

（2）知識(shí)驅(qū)動(dòng)類算法

以專家系統(tǒng)、決策樹為代表，能夠有效利用人類長期總結(jié)出的各類先驗(yàn)知識(shí)，通過對(duì)已有知識(shí)的推理，尋求隱藏的關(guān)聯(lián)知識(shí)和結(jié)論，進(jìn)而求解相應(yīng)的問題。

（3）智能優(yōu)化類算法

智能優(yōu)化類算法又分為進(jìn)化優(yōu)化和群體優(yōu)化兩類。進(jìn)化優(yōu)化以遺傳、差分進(jìn)化為代表，它起源于達(dá)爾文的進(jìn)化論思想，通過模擬不同生物的進(jìn)化過程和機(jī)制，以自組織、自適應(yīng)、自學(xué)習(xí)的方式求解問題。群體優(yōu)化以粒子群為代表，它是一種仿生啟發(fā)式算法，通過模擬自然界中生物的各類生活習(xí)性，實(shí)現(xiàn)對(duì)復(fù)雜問題的優(yōu)化求解。對(duì)三類智能算法的計(jì)算特性及算力需求進(jìn)行分析，結(jié)果見表1。

此外，智能算法的機(jī)載實(shí)現(xiàn)還需要考慮以下幾點(diǎn)非功能屬性要求：

（1）實(shí)時(shí)性、確定性、可信性要求

機(jī)載智能計(jì)算系統(tǒng)必須實(shí)時(shí)給出確定的、可信的計(jì)算結(jié)果。

（2）高性能密度、低功耗要求

機(jī)載智能計(jì)算系統(tǒng)必須在計(jì)算/通信/存儲(chǔ)資源、體積、重量、功耗受限條件下實(shí)現(xiàn)對(duì)多樣化智能應(yīng)用的高性能計(jì)算支撐。

（3）抗惡劣環(huán)境、高可靠要求

機(jī)載智能計(jì)算系統(tǒng)必須適應(yīng)物理環(huán)境、電磁環(huán)境、賽博空間環(huán)境的影響，具備高可靠的運(yùn)行能力。

2通用處理器智能計(jì)算適用性分析

在機(jī)載領(lǐng)域，通用處理器主要包括中央處理器（CPU）、圖形處理器（GPU）、數(shù)字信號(hào)處理器（DSP）、現(xiàn)場可編程門陣列（FPGA）4大類，它們有著各自特定的應(yīng)用場景，其計(jì)算架構(gòu)和計(jì)算能力有著不一樣的設(shè)計(jì)。映射到智能計(jì)算領(lǐng)域，它們適用的智能應(yīng)用場景以及針對(duì)不同類型智能算法的計(jì)算速度和功率消耗會(huì)有所不同。開發(fā)人員上手的難易程度、對(duì)關(guān)鍵函數(shù)、關(guān)鍵運(yùn)算的優(yōu)化加速技巧也是機(jī)載實(shí)現(xiàn)需要考慮的因素。

2.1 CPU

CPU作為一款靈活性和通用性兼顧的處理器，最初的設(shè)計(jì)使用串行計(jì)算架構(gòu)，其大量的硬件資源被用于指令調(diào)度。CPU在執(zhí)行邏輯判斷與分支跳轉(zhuǎn)指令時(shí)，具有極大的優(yōu)勢(shì)。專家系統(tǒng)、決策樹、遺傳進(jìn)化、粒子群等知識(shí)驅(qū)動(dòng)類與智能優(yōu)化類算法的實(shí)現(xiàn)，CPU是很好的選擇。

不過，CPU并不適合于神經(jīng)網(wǎng)絡(luò)尤其是深度神經(jīng)網(wǎng)絡(luò)等數(shù)據(jù)驅(qū)動(dòng)類算法的計(jì)算。盡管使用編程語言在CPU上模擬神經(jīng)網(wǎng)絡(luò)的工作原理是神經(jīng)網(wǎng)絡(luò)最早也是最基本的研究手段，它實(shí)現(xiàn)簡單、易于更改，但CPU的架構(gòu)設(shè)計(jì)限制了神經(jīng)網(wǎng)絡(luò)計(jì)算速度的提升。即便是多核CPU能夠提供一定的并行計(jì)算能力，它仍然無法滿足隨神經(jīng)網(wǎng)絡(luò)飛速發(fā)展一起增長的模型規(guī)模、乘加計(jì)算量、數(shù)據(jù)交互量的需求。

2.2 GPU

GPU最早是為生成計(jì)算機(jī)多邊形網(wǎng)格圖形而設(shè)計(jì)的。它使用并行計(jì)算架構(gòu)，通過壓縮緩存空間、減少邏輯控制單元、增加計(jì)算單元、擴(kuò)大數(shù)據(jù)吞吐等方法，提供大規(guī)模并行計(jì)算能力。相比于CPU，GPU在矩陣乘法的計(jì)算上十分高效，可以很好地適應(yīng)神經(jīng)網(wǎng)絡(luò)高度并行化的計(jì)算特點(diǎn)，大幅縮短計(jì)算時(shí)間，提升計(jì)算效能。

但是，從智能計(jì)算的角度看，GPU存在與CPU一樣的缺陷——處理器的底層架構(gòu)并非專為智能計(jì)算而設(shè)計(jì)。GPU核可以看成是更為復(fù)雜的（用于分支預(yù)測(cè)和流程執(zhí)行的）CPU核的流線型版本。在實(shí)現(xiàn)大規(guī)模深度神經(jīng)網(wǎng)絡(luò)算法時(shí)，GPU同樣是通過集群的方式提高計(jì)算能力，進(jìn)而也不可避免地會(huì)產(chǎn)生過高的功率消耗。只不過相比于CPU，GPU有著更高的性能功耗比。此外，由于GPU將更多的晶體管用于計(jì)算，其邏輯控制單元通常設(shè)計(jì)得比較簡單，調(diào)度管理能力也就相應(yīng)地變?nèi)?，GPU常常是以協(xié)處理器的形式配合CPU共同完成智能計(jì)算任務(wù)的。

2.3 DSP

DSP從字面意思上講，它是專用于數(shù)字信號(hào)處理的，設(shè)計(jì)的初衷是為了更好地實(shí)現(xiàn)矩陣乘加計(jì)算。由于主要針對(duì)電信應(yīng)用，DSP核的數(shù)量往往不是很多（無須擁有16個(gè)或32個(gè)以上的核），但是這制約了DSP計(jì)算性能的大幅提升。當(dāng)前，DSP的計(jì)算性能很難與GPU相匹敵，市場份額正在逐漸減少。

在智能計(jì)算方向，DSP的一種應(yīng)用模式是將多個(gè)DSP核與CPU核集成，進(jìn)而以SoC的形式為深度神經(jīng)網(wǎng)絡(luò)的執(zhí)行提供硬件基礎(chǔ)。

2.4 FPGA

FPGA最大的特點(diǎn)是可編程，通過燒入配置文件可以靈活應(yīng)對(duì)多種應(yīng)用場景，具備一定的通用性。此外，F(xiàn)PGA可以進(jìn)行硬件功能的快速驗(yàn)證與評(píng)估，加快設(shè)計(jì)迭代。更為重要的是，F(xiàn)PGA具有大量的邏輯單元和豐富的布線資源，可以讓神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)充分的并行，進(jìn)而達(dá)到計(jì)算加速的目的。

與CPU相比，F(xiàn)PGA呈現(xiàn)出兩個(gè)特點(diǎn)。一是FPGA每個(gè)邏輯單元的功能在編程（燒寫）時(shí)就已經(jīng)確定，不需要指令，也不需要指令存儲(chǔ)器、譯碼器、運(yùn)算器等，因此功耗更低。二是FPGA中的寄存器和片上內(nèi)存均屬于各自的控制邏輯，不需要額外的仲裁和緩存，因此速度更快。

與GPU相比，F(xiàn)PGA同時(shí)擁有硬件流水線并行和數(shù)據(jù)并行兩種處理能力，且整數(shù)運(yùn)算性能更高。對(duì)于流式計(jì)算任務(wù)，F(xiàn)PGA的計(jì)算延遲要低很多，因此常用于深度神經(jīng)網(wǎng)絡(luò)的推理[8]。不過，F(xiàn)PGA通過硬件邏輯實(shí)現(xiàn)軟件算法，由于工具層面相對(duì)缺失，因此在實(shí)現(xiàn)復(fù)雜算法時(shí)開發(fā)難度較大，需要開發(fā)人員擁有足夠的經(jīng)驗(yàn)，這也是目前FPGA應(yīng)用過程中最大的短板。

2.5對(duì)比分析

CPU、GPU、DSP、FPGA等通用處理器架構(gòu)特性及其智能計(jì)算適用性對(duì)比分析見表2。

3智能專用處理器機(jī)載適用性分析

從廣義上講，只要能夠運(yùn)行人工智能算法的處理器都可稱為智能處理器。但是，通常意義上，智能專用處理器指的是針對(duì)人工智能算法做了特殊加速設(shè)計(jì)的處理器。現(xiàn)階段，這些人工智能算法一般以深度學(xué)習(xí)算法為主，也可以包括其他機(jī)器學(xué)習(xí)算法。

國外智能專用處理器產(chǎn)品相對(duì)成熟，市場也較穩(wěn)定，主要有谷歌的張量處理器（TPU）、IBM的真北（TrueNorth）等。但考慮到自主可控的因素，本文更加關(guān)注國內(nèi)智能專用處理器的發(fā)展。目前，國內(nèi)已呈現(xiàn)出百花齊放的態(tài)勢(shì)，參與競爭的單位既有像寒武紀(jì)、比特大陸、地平線這樣的創(chuàng)業(yè)公司，也有像華為這樣的IT巨頭，還有像清華大學(xué)、浙江大學(xué)這樣的研究機(jī)構(gòu)。它們都不是針對(duì)機(jī)載環(huán)境設(shè)計(jì)的，若要應(yīng)用于機(jī)載環(huán)境，必須做特殊的處理。

自2013年起，寒武紀(jì)先后發(fā)布了一系列智能專用處理器，包括國際首個(gè)深度學(xué)習(xí)處理器DianNao[9]、國際首個(gè)多核深度學(xué)習(xí)處理器DaDianNao[10]、國際首個(gè)通用機(jī)器學(xué)習(xí)處理器PuDianNao[11]，以及專用于攝像頭智能識(shí)別ShiDianNao[12]。寒武紀(jì)系列處理器的主要設(shè)計(jì)思想是：在提高計(jì)算處理能力的同時(shí)，優(yōu)化存儲(chǔ)資源的訪問效率，使得計(jì)算和存儲(chǔ)訪問更加平衡，進(jìn)而獲得更高的能效比。其關(guān)鍵技術(shù)是：通過使用片內(nèi)存儲(chǔ)，取消片外的動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器（DRAM），降低訪存時(shí)延/功耗；優(yōu)化存儲(chǔ)架構(gòu)及其物理布局，減小數(shù)據(jù)傳輸距離和通信時(shí)延。

目前，DianNao已經(jīng)形成了物理實(shí)體，并進(jìn)行了試驗(yàn)流片，但是未對(duì)外出售。DaDianNao也形成了物理實(shí)體，并進(jìn)行了商用流片。不過，由于它面向的是服務(wù)器應(yīng)用，其功耗無法滿足機(jī)載計(jì)算系統(tǒng)約束。此外，由于它目前采用的設(shè)計(jì)標(biāo)準(zhǔn)是商用標(biāo)準(zhǔn)，其工作溫度、振動(dòng)性能等也與機(jī)載計(jì)算系統(tǒng)的要求相距甚遠(yuǎn)。在實(shí)際使用時(shí)必須進(jìn)行特殊的關(guān)核處理以限制功耗，同時(shí)進(jìn)行嚴(yán)格的芯片篩選篩查工作以確保環(huán)境適用性。

比特大陸共推出了三款智能專用處理器。其中，BM1680是第一代產(chǎn)品。它集成有64個(gè)神經(jīng)網(wǎng)絡(luò)處理單元（NPU），由NPU調(diào)度引擎（NPU Schedule Engine）進(jìn)行統(tǒng)一調(diào)度，以最大化提高NPU的使用效率。此外，它還加入了全局直接存儲(chǔ)器訪問（Global DMA）模塊，用于大塊數(shù)據(jù)的讀寫搬移。BM1682是第二代產(chǎn)品。它更加專注于CNN、RNN等深度神經(jīng)網(wǎng)絡(luò)模型的推理。在28nm工藝下算力達(dá)到3TFLOPS@FP32，平均功耗僅為30W，實(shí)際性能在BM1680的基礎(chǔ)上提升5倍以上。

BM1880是面向邊緣計(jì)算的產(chǎn)品。它的核心是一個(gè)張量計(jì)算單元，包含512個(gè)乘加計(jì)算器（MAC），支持Winograd卷積運(yùn)算。此外，它還配置了2MB的靜態(tài)隨機(jī)存取存儲(chǔ)器（SRAM），用于系統(tǒng)性能優(yōu)化、數(shù)據(jù)重用，以提供最佳的編程靈活性。BM1880的調(diào)度引擎可以為張量計(jì)算單元提供極高的數(shù)據(jù)帶寬，對(duì)于8位數(shù)據(jù)寬度的數(shù)據(jù)，其算力可達(dá)1TOPS，而在Wingorad卷積加速運(yùn)算模式下，算力高達(dá)2TOPS。BM1880的典型功耗僅有2.5W。

與寒武紀(jì)的產(chǎn)品類似，比特大陸的產(chǎn)品目前也采用的是商用設(shè)計(jì)標(biāo)準(zhǔn)，機(jī)載計(jì)算系統(tǒng)若想應(yīng)用，必須進(jìn)行芯片篩選篩查工作。

地平線自主設(shè)計(jì)研發(fā)的智能專用處理器架構(gòu)BPU（brain processing unit），是典型的異構(gòu)多指令多數(shù)據(jù)架構(gòu)。由于對(duì)存儲(chǔ)單元進(jìn)行了特別優(yōu)化，數(shù)據(jù)能夠自由傳遞，并完成多種計(jì)算，提高計(jì)算效率。

按照感知、建模、決策三個(gè)階段，BPU對(duì)應(yīng)規(guī)劃了名為高斯、伯努利和貝葉斯的三代產(chǎn)品。作為它們的具化形式，“旭日”和“征程”兩個(gè)系列的處理器產(chǎn)品分別面向智能攝像頭和智能駕駛領(lǐng)域，專用性較強(qiáng)。

機(jī)載應(yīng)用時(shí)必須針對(duì)特定的場景，完成算法的遷移和適配，并盡可能地實(shí)現(xiàn)性能的進(jìn)一步優(yōu)化。

華為研制的Ascend310是一款應(yīng)用于端系統(tǒng)的低功耗智能計(jì)算片上系統(tǒng)（SoC）。它集成了兩個(gè)AI Core，主要負(fù)責(zé)執(zhí)行矩陣、向量計(jì)算密集的算子任務(wù)；集成了8個(gè)ARM Cortex A55，其中一部分A55可部署為AI CPU，負(fù)責(zé)執(zhí)行不適合跑在AI Core上的算子。此外，它采用層次化的片內(nèi)memory結(jié)構(gòu)，除了AI Core內(nèi)部有兩級(jí)memory buffer外，SoC芯片上還有8MB L2 buffer，專用于為AI Core、AI CPU提供高帶寬、低延遲的memory訪問。

不過，華為的處理器產(chǎn)品主要供內(nèi)部使用，對(duì)外開放程度并不高，尤其在軟件框架和工具支持層面，如何與機(jī)載計(jì)算系統(tǒng)相結(jié)合，是一個(gè)不得不考慮的問題。

清華大學(xué)類腦研究中心發(fā)布的神經(jīng)形態(tài)處理器天機(jī)（Tianjic）[13]，將人工神經(jīng)網(wǎng)絡(luò)（ANN）和脈沖神經(jīng)網(wǎng)絡(luò)（SNN）進(jìn)行異構(gòu)融合，兼顧目前技術(shù)成熟度相對(duì)較高的深度學(xué)習(xí)模型和未來有巨大發(fā)展?jié)摿Φ念惸X認(rèn)知模型，可用于計(jì)算機(jī)視覺、自然語言理解、目標(biāo)檢測(cè)、識(shí)別、跟蹤等多種應(yīng)用開發(fā)。

盡管清華大學(xué)類腦研究中心已經(jīng)跑通了“建?！抡妗?yàn)證—應(yīng)用演示”的全套流程，擁有完整的硬件平臺(tái)和軟件工具鏈，但由于Tianjic是一款概念很新的處理器，其開發(fā)與測(cè)試環(huán)境與以往有很大的不同，因此上手并不容易。

浙江大學(xué)聯(lián)合杭州電子科技大學(xué)發(fā)布的神經(jīng)形態(tài)處理器達(dá)爾文（Darwin）[14]，僅針對(duì)脈沖神經(jīng)網(wǎng)絡(luò)處理，其原理和功能特性與IBM的TrueNorth十分相似，但規(guī)模比TrueNorth小很多。Darwin支持8個(gè)物理神經(jīng)元，通過時(shí)分復(fù)用最大能夠模擬2048個(gè)邏輯神經(jīng)元、2048×2048個(gè)突觸，以及15個(gè)突觸延時(shí)。與清華大學(xué)的Tianjic一樣，Darwin的開發(fā)與測(cè)試環(huán)境上手也很困難。

上述智能專用處理器架構(gòu)特性及其機(jī)載適用性對(duì)比分析見表3。

4結(jié)束語

綜合考慮人工智能技術(shù)的機(jī)載應(yīng)用場景、計(jì)算特性、算力需求和機(jī)載實(shí)現(xiàn)的非功能屬性要求，通過對(duì)通用處理器以及智能專用處理器的架構(gòu)研究與分析發(fā)現(xiàn)，通用處理器在應(yīng)對(duì)不同類型的智能算法時(shí)，體現(xiàn)出了截然不同的適用性。而智能專用處理器在應(yīng)對(duì)特定的智能算法時(shí)，其計(jì)算效能相比于通用處理器有著極大的優(yōu)勢(shì)。但是，智能專用處理器往往存在通用計(jì)算能力弱和無法進(jìn)行多任務(wù)管理調(diào)度的問題，在機(jī)載應(yīng)用過程中也有著諸多限制。因此，一種可行的技術(shù)路線是實(shí)施通用處理器與智能專用處理器的異構(gòu)融合設(shè)計(jì)，以便充分發(fā)揮它們各自的優(yōu)勢(shì)，進(jìn)而為機(jī)載智能應(yīng)用提供計(jì)算支撐服務(wù)，實(shí)現(xiàn)對(duì)OODA全過程任務(wù)鏈多樣化智能應(yīng)用的全覆蓋。相比于之前僅能支撐某一個(gè)或某幾個(gè)特定智能應(yīng)用以及諸多約束和限制，技術(shù)上有了明顯的進(jìn)步。

參考文獻(xiàn)

[1]吳朝暉.人工智能的過去、現(xiàn)狀和未來[J].未來傳播， 2019， 26（3）： 2-5. Wu Zhaohui. The past， present and future of artificial intelligence[J]. Future Communication， 2019， 26（3）： 2-5.（in Chinese）

[2]He K，Zhang X，Ren S，et al. Deep residual learning for image recognition [C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition（CVPR），2016：770-778.

[3]Vaswani A，Shazeer N，Parmar N，et al. Attention is all you need [C]// Proceedings of the 31st Conference on Neural Information Processing Systems（NIPS 2017），2017.

[4]Silver D，Huang A，Maddison C J，et al. Mastering the game of go with deep neural networks and tree search[J]. Nature，2016，529：484-489.

[5]閆曉婧，楊濤，藥紅紅.國外第六代戰(zhàn)斗機(jī)概念方案與關(guān)鍵技術(shù)[J].航空科學(xué)技術(shù)， 2018， 29（4）：18-26. Yan Xiaojing， Yang Tao， Yao Honghong. Conceptual scheme and key technologies of sixth generation fighters[J]. Aeronautical Science & Technology， 2018，29（4）：18-26.（in Chinese）

[6]張宇，黃建新.應(yīng)用OODA環(huán)模型研究裝備對(duì)體系貢獻(xiàn)程度[J].現(xiàn)代防御技術(shù)， 2017， 45（2）：177-182. Zhang Yu， Huang Jianxin. Study on contribution degree of equipment to system of systems using OODA loop model [J]. Modern Defence Technology， 2017， 45（2）：177-182.（in Chinese）

[7]陳杰，程勝，徐夢(mèng).基于模糊控制理論的智能體運(yùn)動(dòng)控制方法[J].航空科學(xué)技術(shù)， 2019， 30（2）：74-78. Chen Jie，Cheng Sheng，Xu Meng. Research on an agent control method based on fuzzy control[J]. Aeronautical Science& Technology，2019，30（2）：74-78.（in Chinese）

[8]Shawahna A，Sait S M，El-Maleh A. FPGA-based accelerators of deep learning networks for learning and classification：a review[J]. IEEEAccess，2018（4）：1-41.

[9]Chen Tianshi，Du Zidong，Sun Ninghui，et al. DianNao：a small-footprint high-throughput accelerator for ubiquitous machine-learning[C]// Proceedings of the 19th International ConferenceonArchitecturalSupportforProgramming Languages and Operating Systems（ASPLOS 2014），2014.

[10]Chen Yunji，Luo Tao，Liu Shaoli，et al. DaDianNao：a machine-learning supercomputer[C]// Proceedings of the 47th IEEE/ACM International Symposium on Microarchitecture（MICRO 2014），2014.

[11]Liu Daofu，Chen Tianshi，Liu Shaoli，et al. PuDianNao：a polyvalent machine learning accelerator[C]// Proceedings of the 20th International Conference on Architectural Support for Programming Languages and Operating Systems（ASPLOS 2015），2015.

[12]Du Zidong，F(xiàn)asthuber R，Chen Tianshi，et al. ShiDianNao：shifting vision processing closer to the sensor[C]// Proceedings of the 42nd ACM/IEEE International Symposium on Computer Architecture（ISCA2015），2015.

[13]Shen Juncheng，Ma De，Gu Zonghua，et al. Darwin：a neuromorphic hardware co-processor based on Spiking Neural Networks[J]. Science China（Information Sciences），2016，59（2）：1-5.

[14]Pei Jing，Deng Lei，Song Sen，et al. Towards artificial general intelligence with hybrid Tianjic chip architecture[J]. Nature， 2019，572：106-111.（責(zé)任編輯王為）

作者簡介

文鵬程（1981-）男，博士，研究員。主要研究方向：嵌入式智能計(jì)算、智能信息處理、機(jī)載智能應(yīng)用。

Tel：029-89186541

E-mail：wpcheng@avic.com

白林亭（1990-）男，碩士，工程師。主要研究方向：可解釋智能、智能計(jì)算測(cè)評(píng)。

高澤（1994-）男，碩士，助理工程師。主要研究方向：知識(shí)工程、智能計(jì)算測(cè)評(píng)。

程陶然（1991-）女，碩士，工程師。主要研究方向：智能信息處理、機(jī)載智能應(yīng)用。

Analysis and Research of Intelligent Computing Processors for Airborne Environment

Wen Pengcheng*，Bai Linting，Gao Ze，Cheng Taoran

Aviation Key Laboratory of Science and Technology on Airborne and Missileborne Computer，AVIC Xian Aeronautics Computing Technique Research Institute，Xian 710065，China

Abstract： In recent years， artificial intelligence technology represented by deep learning has developed rapidly in the civil field. While for military application， such as aviation， AI technology will also play an important role. The AI application in the field of aviation must consider the constraints and limitations of the airborne environment， especially for the intelligent computing processors. Considering the airborne application scenario， computing characteristics and computing power requirements， the architecture and applicability of general purpose processors and AI processors were analyzed and studied. Then a feasible technical implementation route was proposed based on the idea of heterogeneous integration. It could provide basic computing services for airborne intelligent applications.

Key Words： aeronautical artificial intelligence； airborne intelligent application； OODA； intelligent computing； AI processor； general purpose processor

航空科學(xué)技術(shù)2020年10期

航空科學(xué)技術(shù)的其它文章: 基于學(xué)習(xí)自動(dòng)機(jī)的容噪模式分類; 基于過渡粒子群算法的搜尋方案; 基于人工智能的無人機(jī)區(qū)域偵察方法研究現(xiàn)狀與發(fā)展; 慣導(dǎo)智能故障診斷系統(tǒng)設(shè)計(jì); 民用飛機(jī)航路智能規(guī)劃技術(shù)研究; 大型飛機(jī)超速保護(hù)模糊控制律設(shè)計(jì)與仿真

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

適用于機(jī)載環(huán)境的智能計(jì)算處理器分析研究