鞠曉峰,都軍,覃軍,修藝多,丁穎
(1.哈爾濱工業(yè)大學(xué)經(jīng)濟(jì)與管理學(xué)院;2.珠海釆筑電子商務(wù)有限公司;3.華僑城集團(tuán)有限公司)
由于數(shù)據(jù)量的發(fā)展,造成了搜索內(nèi)容繁雜無章,搜索結(jié)果難以滿足人們的需要等問題。因此智能問答系統(tǒng)成為一個新的熱點(diǎn)方向。本文首先介紹智能問答系統(tǒng)及其搭建方法,并以“Answer”智能問答系統(tǒng)為例,介紹了智能問答系統(tǒng)的實(shí)際應(yīng)用。
隨著當(dāng)今互聯(lián)網(wǎng)數(shù)據(jù)越來越繁雜,搜索引擎已經(jīng)難以滿足領(lǐng)域內(nèi)專業(yè)人士的定制化需求,同時(shí)隨著人工智能等技術(shù)的飛速發(fā)展,智能問答系統(tǒng)應(yīng)運(yùn)而生。問答系統(tǒng)是一種對用戶使用自然語言提出的問題能夠給出盡可能準(zhǔn)確的回答的計(jì)算機(jī)程序,智能問答系統(tǒng)是指通過人工智能、知識圖譜等技術(shù)建立的以一問一答形式,精確定位網(wǎng)站用戶所需要的提問知識,通過與網(wǎng)站用戶進(jìn)行交互,為網(wǎng)站用戶提供個性化的信息服務(wù)的問答系統(tǒng)[1]。
智能問答系統(tǒng)主要分為以下幾個核心模塊:知識庫、語義理解、搜索算法、語言輸出等。
知識庫的構(gòu)建依托海量的專業(yè)知識數(shù)據(jù),通常與知識管理系統(tǒng)具有相同的使用環(huán)境與功能需求。系統(tǒng)框架是指將知識管理與應(yīng)用設(shè)計(jì)成為一個簡單系統(tǒng),系統(tǒng)包含其內(nèi)部邏輯,對于不同的輸入可以產(chǎn)生不同的輸出[2]。
語義理解算法主要為離線語義推理,目前主流的方式為模糊算法等,對以一般集合論為基礎(chǔ)的描述工具的數(shù)理邏輯進(jìn)行拓展,從而建立了模糊推理理論。另外還需要對語法進(jìn)行分塊解析,包括詞義的解釋與詞性的標(biāo)注等。再通過相應(yīng)算法進(jìn)行推算[3]。
搜索算法需要根據(jù)用戶提出的問題進(jìn)行語義理解后的結(jié)果,使用人工智能加持下的常用搜索算法,在專業(yè)知識庫中檢索最具有效果的答案,并將結(jié)構(gòu)化數(shù)據(jù)組織輸出等內(nèi)容送給語言輸出模塊[4]。
語言輸出模塊主要負(fù)責(zé)對搜索到的結(jié)果進(jìn)行整理,并按照人類的自然語言進(jìn)行輸出,通常包括文字或聲音等形式。
一個系統(tǒng)的搭建常采用MVC的程序架構(gòu)模式,該模式實(shí)現(xiàn)了模型(Model)、控制器(Controller)和視圖(View)的隔離。智能問答系統(tǒng)的設(shè)計(jì)也可以基于MVC模式展開。
模型是控制軟件處理數(shù)據(jù)邏輯的部分。在智能問答系統(tǒng)中,模型應(yīng)包括相關(guān)領(lǐng)域內(nèi)的專業(yè)知識庫,作為基礎(chǔ)數(shù)據(jù),并包含語言處理、搜索等核心算法的實(shí)現(xiàn)功能,并與控制器與視圖做好相應(yīng)的數(shù)據(jù)交互。
控制器用于處理系統(tǒng)與用戶之間的數(shù)據(jù)交互,是系統(tǒng)輸入的關(guān)鍵組成部分。控制器負(fù)責(zé)采集用戶的輸入信息,進(jìn)行處理之后發(fā)送給模型進(jìn)行相應(yīng)的數(shù)據(jù)分析,等待視圖將結(jié)果返還給用戶之后迎接用戶的下一次輸入。
視圖將軟件中的數(shù)據(jù)展示給用戶,視圖和控制器一起完成了系統(tǒng)與用戶之間的交互功能。同時(shí),視圖中應(yīng)當(dāng)由配合控制器進(jìn)行相應(yīng)輸入輸出的控制組件,等待模型處理好控制器接收到的數(shù)據(jù)之后,視圖將處理結(jié)果返還給用戶,完成一次完整的軟件功能周期。
采筑平臺在當(dāng)代科技化商業(yè)模式的背景下,積極推進(jìn)科技與商業(yè)的融合,結(jié)合人工智能與知識圖譜等新型關(guān)鍵技術(shù),聯(lián)合華僑城、哈工大和行業(yè)優(yōu)秀供應(yīng)商共同研發(fā)了一套在線智能問答系統(tǒng)——Answer,用以實(shí)現(xiàn)專業(yè)知識的體系化、結(jié)構(gòu)化管理,保證專業(yè)知識能夠持續(xù)建設(shè)和傳承。
Answer系統(tǒng)的知識來源于完備準(zhǔn)確的真實(shí)行業(yè)數(shù)據(jù),具體為通過采筑平臺多年招標(biāo)采購經(jīng)驗(yàn),海量的歷史交易和質(zhì)量數(shù)據(jù),行業(yè)數(shù)據(jù)的知識結(jié)構(gòu)由行業(yè)多年工程服務(wù)、專家系統(tǒng)等進(jìn)行建設(shè)與維持。系統(tǒng)具備行業(yè)內(nèi)供方廠家全面的工程服務(wù)能力交付能力,領(lǐng)先的行業(yè)內(nèi)專家專業(yè)能力,能夠在線幫助解決工程材料領(lǐng)域?qū)I(yè)問題。
傳統(tǒng)采購工程知識基本存在于人工經(jīng)驗(yàn),因此智能問答系統(tǒng)Answer可以改變過去工程采購高度依賴于人,見面才可以完成采購的弊端,加快了企業(yè)采購工作、工程運(yùn)行的速度;提高了企業(yè)知識管理與儲備的能力。
聚焦垂直領(lǐng)域,致力于在線解決工程采購領(lǐng)域?qū)I(yè)問題。Answer智能問答系統(tǒng)將知識結(jié)構(gòu)聚焦于工程項(xiàng)目中的關(guān)鍵領(lǐng)域,保證在領(lǐng)域中的知識呈現(xiàn)一定的聚合性,使得知識在該領(lǐng)域的利用能夠最高效化,提高領(lǐng)域的發(fā)展。
細(xì)分?jǐn)?shù)據(jù)存儲,實(shí)現(xiàn)招標(biāo)采購領(lǐng)域知識結(jié)構(gòu)化。知識需要以結(jié)構(gòu)化、系統(tǒng)化的形式進(jìn)行保存,才能夠保證知識能夠被合理、高效地利用。Answer智能問答系統(tǒng)細(xì)分專業(yè)知識數(shù)據(jù),并實(shí)現(xiàn)知識的結(jié)構(gòu)化保存,能夠有效提高回答的準(zhǔn)確率。
知識積累沉淀,支持招標(biāo)采購過程數(shù)據(jù)傳承。知識的傳承能夠保證領(lǐng)域或行業(yè)長期保持進(jìn)步,傳統(tǒng)的知識的傳播方式主要依賴于人的經(jīng)驗(yàn)于教訓(xùn),使得知識的傳播效率大打折扣。Answer保證結(jié)構(gòu)化知識準(zhǔn)確、高效傳播,而不是依賴于人,利于知識的有效傳承。
打通時(shí)空壁壘,線上根據(jù)需求找到最佳答案。Answer系統(tǒng)能夠保證知識的時(shí)效性、便捷性等,它打通了時(shí)空的壁壘,使得對知識有需求的人可以隨時(shí)隨地對知識進(jìn)行定向的獲取,可以幫助人們根據(jù)各自的需求獲取最佳的答案。
Answer的架構(gòu)分為前端與后臺兩大部分,前端用于用戶的直接服務(wù),包括呼叫中心、語音識別模塊、業(yè)務(wù)服務(wù)、接入渠道等服務(wù);后臺包括智能呼叫中心、訓(xùn)練平臺、數(shù)據(jù)系統(tǒng)與知識云服務(wù)模塊等。具體產(chǎn)品架構(gòu)圖如圖1。
相較于傳統(tǒng)知識積累方式,Answer的數(shù)據(jù)積累和傳承更具有大數(shù)據(jù)時(shí)代的特色。采筑聯(lián)合地產(chǎn)龍頭萬科,將萬科36年來的工程采購經(jīng)驗(yàn),覆蓋80多個品類招標(biāo)采購,20余萬條訂單數(shù)據(jù),用于智能問答系統(tǒng)的知識儲備,并將海量天網(wǎng)檢測、招標(biāo)機(jī)器人結(jié)構(gòu)化招標(biāo)數(shù)據(jù)添加到采購行業(yè)的知識庫中,保證了答案覆蓋的全面性。
利用智能問答系統(tǒng),企業(yè)可以降本提效。Answer系統(tǒng)匯集了行業(yè)領(lǐng)先供應(yīng)商、采筑產(chǎn)品合伙人團(tuán)隊(duì)、采筑質(zhì)量專家委員會、行業(yè)協(xié)會權(quán)威專家、優(yōu)秀采購商等專家團(tuán)隊(duì)實(shí)際生產(chǎn)服務(wù)經(jīng)驗(yàn)和解決方案,依據(jù)大量、可靠的專業(yè)基礎(chǔ)知識進(jìn)行支撐,專業(yè)問題交流不需要見面也能獲得滿意的答案。
Answer系統(tǒng)是與頂尖高校團(tuán)隊(duì)建立聯(lián)合實(shí)驗(yàn)室,搭建會不斷深度學(xué)習(xí)的機(jī)器人。該系統(tǒng)不會保持一成不變,每完成一次招標(biāo)、每下一次訂單、每完成一次檢測和評估都會實(shí)現(xiàn)持續(xù)的數(shù)據(jù)加載和模型適配,保證系統(tǒng)的時(shí)效性,并逐步優(yōu)化其問答算法。
圖1 Answer的產(chǎn)品架構(gòu)圖
采筑聯(lián)合多方開發(fā)的智能問答機(jī)器人Answer作為一個行業(yè)專業(yè)知識管理的成功典范,將萬科集團(tuán)多年采購、招標(biāo)等經(jīng)驗(yàn)知識結(jié)構(gòu)化,形成了完備的采購知識問答庫,大大提高了相關(guān)工作的進(jìn)行效率。