陳 巍,肖 駿
(1.珠峰財(cái)產(chǎn)保險(xiǎn)股份有限公司, 北京 100055; 2.湖南有色金屬研究院, 湖南 長沙 410100)
科學(xué)知識圖譜是知識工程的分支,在大數(shù)據(jù)時代,知識圖譜讓機(jī)器理解網(wǎng)上非結(jié)構(gòu)化的文本,增強(qiáng)人工智能在搜索、機(jī)器人、智能穿戴家居及系統(tǒng)安全等方面[1-4]的可信性和可解釋性。近年來,科學(xué)知識圖譜由信息可視化已經(jīng)演變成知識可視化,它是揭示前沿科學(xué)技術(shù)、成果和評估的一種方法手段[5-11]。
知識圖譜的構(gòu)建有自頂向下(top-down)與自底向上(bottom-up)兩種方式,分為模式層與數(shù)據(jù)層,一系列的事實(shí)組成數(shù)據(jù)層,知識將以其為單位進(jìn)行存儲[12,13]。模式層構(gòu)建在數(shù)據(jù)層之上,是圖譜的核心。從架構(gòu)而言數(shù)據(jù)層是根基,一個優(yōu)質(zhì)的科學(xué)知識圖譜[14]需要補(bǔ)充前沿研究成果來整合和優(yōu)化數(shù)據(jù)層,僅局限于大數(shù)據(jù)的自身邏輯或圖譜來構(gòu)建技術(shù)架構(gòu)方面是遠(yuǎn)遠(yuǎn)不夠的。
優(yōu)質(zhì)的科學(xué)知識圖譜可以透視各領(lǐng)域中知識體系結(jié)構(gòu)的關(guān)聯(lián)與演變,要獲得優(yōu)質(zhì)圖譜,必須緊跟科技前沿:
1)智能AV系統(tǒng)?;诙喑叨褥丶皡f(xié)調(diào)駕駛行為的自動運(yùn)轉(zhuǎn)運(yùn)輸信號系統(tǒng)是一款對無人駕駛和私家車之間協(xié)調(diào)的系統(tǒng)[15-17],指紋和情感性格分析可以保證用戶和AV的交互。物聯(lián)網(wǎng)保證了水陸空實(shí)行智能交通體系的可能性[18-20]。相關(guān)研究內(nèi)容支撐智能交通領(lǐng)域知識圖譜核心技術(shù)數(shù)據(jù)層的構(gòu)建。
2)智能安全系統(tǒng)。依托于非線性降維的高維數(shù)據(jù)可視化和基于大量威脅數(shù)據(jù)建立的知識圖譜,在安全領(lǐng)域不僅可以為系統(tǒng)漏洞定位[21]提供優(yōu)質(zhì)的輔助信息,而且能為現(xiàn)有操作系統(tǒng)提供更好的隔離防護(hù)支持[22]。Ding[23]提出使得三個變量在低維隱空間下聯(lián)合的新方法,同時保留數(shù)據(jù)固有結(jié)構(gòu)。此外,非線性降維方法[24]和可視化、抽象化、系統(tǒng)化等特點(diǎn),在多層結(jié)構(gòu)聯(lián)合學(xué)習(xí)方法中[25,26]和高度碎片化的移動平臺安全防護(hù)[27]上也有廣泛的應(yīng)用。
3)無人駕駛船舶在海上航行時,其運(yùn)動狀態(tài)時刻受到颶風(fēng)、海流、潮汐和波浪等水文要素的影響。其中惡劣天氣是造成事故的主要誘因,如大風(fēng)浪、海嘯、極地航行等等[28],因此借助于大數(shù)據(jù),將風(fēng)險(xiǎn)進(jìn)行有效的量化分析是安全航行的首要工作[29-33]。
4)智能材料探索系統(tǒng)。基于第一性原理并借助于海量高質(zhì)量數(shù)據(jù),可以繪制高維度的知識圖譜。例如Shi等人[34-37]利用金屬原子-氫原子作用力數(shù)據(jù)來預(yù)測復(fù)雜催化劑度化程度,Jin[38-42]借助于基因圖譜預(yù)測真實(shí)反應(yīng)器中的細(xì)菌生長狀態(tài)。
5)深空探測采樣技術(shù)。Tian等人基于月壤顆粒與采樣鉆具相互作用模型,提出了一種能夠提高月壤取心率的新型取心鉆具[43,44]。該新型取心鉆具借助于模擬試驗(yàn)環(huán)境及月壤樣心擾動仿真數(shù)據(jù)[45,46],以輸送量最大和鉆進(jìn)功耗最低為優(yōu)化目標(biāo),對螺旋鉆桿的結(jié)構(gòu)參數(shù)進(jìn)行了優(yōu)化設(shè)計(jì)[47-49],提出了包裝容器的結(jié)構(gòu)參數(shù)參考值[50]。
6)癌癥藥物數(shù)據(jù)庫圖譜分析法。Kou等通過對數(shù)據(jù)庫的集合分析發(fā)現(xiàn)新的癌癥成因:點(diǎn)突變致癌癥蛋白結(jié)構(gòu)改變并且突變成簇排列[51],藥物設(shè)計(jì)中通過構(gòu)建抗癌藥物圖譜并對熱點(diǎn)歸類進(jìn)行癌癥靶點(diǎn)藥物設(shè)計(jì)[52-57],通過對蛋白質(zhì)-DNA非活性中心圖譜分析[58]和DNA損傷和藥物觀測系統(tǒng)[59-60],研發(fā)抗癌新藥。
以學(xué)科知識為對象的“科學(xué)知識圖譜”能使研究者發(fā)現(xiàn)隱藏知識規(guī)律,可將學(xué)科網(wǎng)絡(luò)結(jié)構(gòu)、知識單元互動和群體演化等隱含復(fù)雜關(guān)系以圖示展示,它是開展知識管理,識別和分析學(xué)科發(fā)展新趨勢、跟蹤前沿動態(tài)并輔助科技決策的簡便工具。