許文倩 黃 棟 陳照春 林 娟
(福建省特種設備檢驗研究院 福州 350008)
當前,特種設備在人們?nèi)粘I钜约案餍懈鳂I(yè)的生產(chǎn)過程中是不可或缺的要素。然而在其生產(chǎn)和使用等環(huán)節(jié)中的隱患越來越多,每個隱患都將可能是釀成事故的風險,這給特種設備安全監(jiān)管帶來了前所未有的挑戰(zhàn)[1-4]。因此,特種設備安全宣傳教育工作任務尤為艱巨。調(diào)研發(fā)現(xiàn),傳統(tǒng)開展特種設備宣傳教育的實踐中,需要選擇經(jīng)驗豐富、素質(zhì)全面的人員進行專門培訓來回答專業(yè)性的問題[5],投入的時間成本和人力資源成本不只是用金錢來簡單估算。即使如此也難以做到統(tǒng)一、全面的答復所有問題。
隨著人工智能的興起,AI智能交流機器人使特種設備的宣傳教育快速普及成為可能。因此,本研究將收集特種設備相關知識,結合特種設備知識的特點,選擇自然語言分析歸納方法,建立領域知識庫,彌補特種設備知識庫接口空白。通過搭建的特種設備知識庫,連接問答Web服務器,構建基于特種設備知識庫的AI交流機器人,從而打造特種設備專屬宣傳教育工作的新模式。
AI交流機器人的核心在于如何智能化地模擬人類進行回答。目前AI交流機器人需要固定的行業(yè)領域知識庫,如股票、游戲、電信、房產(chǎn)等,通過相應的知識庫接口,使得AI交流機器人能夠擁有交流或回復的功能[6-7]。由于當前特種設備本體描述的信息欠完備,未見針對特種設備領域的知識庫,因此在構建特種設備問答過程中會導致實例層的信息較少,使得當前AI無法對特種設備相關領域問答進行解惑。為了完備問答體系,建立特種設備領域知識庫,能力化、邏輯化和細致化對特種設備知識進行模塊化描述。
研究首先通過網(wǎng)絡信息,對市場監(jiān)督管理局、特種設備檢驗研究院等相關專業(yè)知識網(wǎng)頁進行的宣傳科普以及問答平臺進行分析,獲取相關知識并以Excel形式匯總問答題庫來源,部分網(wǎng)址如圖1所示。
圖1 特種設備相關知識庫源
通過收集當前常見特種設備知識問題,類比其他行業(yè)知識庫,以領域?qū)<业慕?jīng)驗、權威工具書、重要文獻、學位論文、期刊論文以及公共互聯(lián)網(wǎng)資源等的答案對特種設備知識庫進行整合分析,知識系統(tǒng)構建如圖2所示。
圖2 知識庫系統(tǒng)結構圖
為了簡化整合知識庫體系,避免重復問答,研究采用思維導圖對問答層級進行匯總,部分問答如圖3所示。
圖3 特種設備知識問答思維導圖
通過知識圖譜方法將八大類特種設備拓展分析,對思維導圖信息進行分類整合,通過知識圖譜模型來模塊化描述現(xiàn)實世界中各種人或物之間的關系[6,8-9]。在知識圖譜模型中使用節(jié)點來描述人或物,用節(jié)點之間的邊來描述人或物之間的關系;每個節(jié)點和關系都可設置不同的屬性進行區(qū)分。在知識圖譜中節(jié)點和節(jié)點之間的關系構成了一個主、謂、賓的三元組[8-10]。設計特種設備獨有的知識庫,并采用Neo4j進行圖譜整理以及語義分析[11]。
Neo4J為高級程序設計語言,程序提供API接口,并可執(zhí)行Cypher查詢命令,工作原理如圖4所示[12]。
圖4 Neo4J 數(shù)據(jù)庫工作原理
通過Match命令查詢出相連關系p1和p2,然后通過Create命令建立實體p1和p2的連接。構建如圖5所示知識圖譜結構,明確相關問題與答案體系,有序整理相關知識結構。
因此,在知識圖譜構建方面,圖譜以特種設備為中心,由八大特種設備為第二層級出發(fā),通過收集的相關特種設備法律法規(guī)、結構、安全等常見特種設備相關知識以及常見問題對知識圖譜進行初步整合,部分圖譜如圖5所示。研究提煉出相關特種設備領域問答928條,用于深入構建特種設備領域問答體系。
圖5 特種設備問答知識圖譜
研究構建的AI機器人對人類日常問答的流程歸納并進行類比模仿,并輸出答案結果。人機交互軟硬件系統(tǒng)流程具體細節(jié)如圖6所示,主要可分為4個部分:語音識別、AI問答服務器連接、問答數(shù)據(jù)庫搭建與電信號轉聲信號輸出。
圖6 特種設備知識庫的AI交流機器人問答流程
研究采用科大訊飛的AIUI語音識別軟硬一體的解決方案,通過創(chuàng)建整合處理的知識圖譜至自建獨立賬號技能庫,并對問答語言進行分析[12-13]。
在語音識別方面,AIUI模塊支持語義識別和離線識別[14]。語義識別屬于在線識別,領域問題以在線形式在訊飛云端服務器進行處理。離線識別采用本地離線識別引擎進行識別,其識別能力弱于在線識別功能。本研究語音主控的設計采用在線與離線相結合的混合識別方法,音頻將送到本地離線引擎和云端解析,并采用結果反饋優(yōu)先順序策略對問題進行分析。
此外,主控將添加已有的音樂、天氣等日常知識庫,并加入整合后的特種設備知識庫,同步云端配置特種設備知識技能庫,在系統(tǒng)中對關鍵字以及詞語語義進行分析,如圖7所示。以特種設備用途問題為例,輸入相同問題的不同表述,系統(tǒng)將會分析問題語義并返回一段包含了語義分析結果的Json數(shù)據(jù),如圖8所示。系統(tǒng)調(diào)用其提供的接口并解析輸出的Json數(shù)據(jù),實現(xiàn)問答對接。
圖7 語義分析案例
圖 8 問答案例
硬件部分采用雙麥識別響應方式,以陣列式輸入音頻,該方式具備功耗低、識別率高、響應迅速的特點。主要配有信號層處理、解碼層處理和對接層處理功能,如圖9所示[14]。
圖9 硬件系統(tǒng)設計
從嵌入式硬件角度劃分,分為電源模塊、DSP數(shù)字信號處理模塊、麥克風、揚聲器、AMP語音放大芯片、MCU主控制器模塊和存儲器模塊,如圖10所示。電源模塊包含實現(xiàn)鋰電池充電管理所需的電源;采用DSP模塊作為語音信號的專用微處理器,對語音信號進行算法識別與處理;通過雙麥陣列式麥克風與揚聲器實現(xiàn)語音數(shù)據(jù)聲電轉換;語音放大芯片主要實現(xiàn)語音電信號的濾波和編碼功能,通過自動增益控制器作用實現(xiàn)遠距離語音采集,經(jīng)過內(nèi)部多級放大電路得到穩(wěn)定放大信號并對語音進行壓縮編碼,輸給主控制器;MCU主控制器模塊主要實現(xiàn)將語音放大編碼芯片傳輸?shù)恼Z音文件寫入存儲器模塊,并完成文件讀寫管理和工作模式切換等任務;存儲器模塊主要用于實現(xiàn)語音數(shù)據(jù)的存儲和刪除。
圖 10 硬件設計
綜上,在知識交流過程中,由麥克風輸入語音音頻,把語音轉換為控制命令或文本,上傳AI問答服務器并實現(xiàn)問答數(shù)據(jù)庫連接,結果信息默認由串口部分輸出,并將電信號轉聲信號得出答案解析。
研究構建的特種設備領域AI交流機器人完成了特種設備相關知識整合,建立特種設備專業(yè)知識庫,融合自然語言處理技術,填補在AI交流領域特種設備知識庫的空白。
通過基于特種設備知識庫的AI交流機器人在特種設備安全宣傳教育領域的應用,有效提高特種設備安全宣傳教育的趣味性、影響力、針對性以及有效性,對提高設備安全宣傳教育質(zhì)量以及提升我國特檢隊伍形象具有重要的意義。