国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)驅(qū)動(dòng)的專家知識(shí)資源建模方法與原型系統(tǒng)開(kāi)發(fā)研究

2019-04-01 12:43戰(zhàn)洪飛余軍合魏保偉
關(guān)鍵詞:維度專家規(guī)則

張 琪 戰(zhàn)洪飛 余軍合 魏保偉

(寧波大學(xué)機(jī)械工程與力學(xué)學(xué)院 浙江 寧波 315211)

0 引 言

知識(shí)資源是決定企業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)的重要資源,但由于企業(yè)知識(shí)管理實(shí)踐的缺乏及知識(shí)管理應(yīng)用理論的不足,使企業(yè)在業(yè)務(wù)執(zhí)行中的知識(shí)資源配置能力較差,不能夠很好地將正確的資源用在正確的業(yè)務(wù)上。同時(shí),知識(shí)資源配置上的不足也造成企業(yè)業(yè)務(wù)執(zhí)行績(jī)效低下,阻礙企業(yè)創(chuàng)新能力的提升。因而,如何有效經(jīng)營(yíng)企業(yè)的知識(shí)資源,在盤活企業(yè)內(nèi)部知識(shí)資源的基礎(chǔ)上如何高效利用企業(yè)外部的專家資源,這都是對(duì)企業(yè)競(jìng)爭(zhēng)力有重大影響的核心問(wèn)題。然而,目前專家知識(shí)資源信息建模技術(shù)與方法上的研究成果不能滿足企業(yè)的需求,企業(yè)難以獲取這些專家資源信息,優(yōu)化知識(shí)配置更無(wú)從談起。針對(duì)這一問(wèn)題,本文提出基于大數(shù)據(jù)技術(shù)及廣域的開(kāi)源數(shù)據(jù),構(gòu)建比較合理的專家資源模型,為企業(yè)開(kāi)展面向業(yè)務(wù)執(zhí)行的知識(shí)資源配置提供基礎(chǔ)理論參考。為了提高知識(shí)資源的求解效率,并及時(shí)提供需求的知識(shí)資源,國(guó)內(nèi)外學(xué)者已開(kāi)展了較豐富的研究。

文獻(xiàn)[1]認(rèn)為知識(shí)資源的獲取在專家知識(shí)系統(tǒng)的構(gòu)建是需要通過(guò)解決的實(shí)際問(wèn)題,并基于“洞察力”的假設(shè)理念為知識(shí)獲取和表示工具提供適合的哲學(xué)環(huán)境。文獻(xiàn)[2]認(rèn)為知識(shí)獲取在未來(lái)應(yīng)該從狹隘的技術(shù)、結(jié)構(gòu)和模型概念轉(zhuǎn)移到對(duì)業(yè)務(wù)問(wèn)題求解的專家系統(tǒng)的需求上。文獻(xiàn)[3]引入知識(shí)獲取技術(shù)提高組織知識(shí)的位置、所有權(quán)及影響的理解,而不是機(jī)構(gòu)執(zhí)行的數(shù)據(jù)流和任務(wù),并為組織問(wèn)題解決知識(shí)獲取提供了指導(dǎo)原則。文獻(xiàn)[4]基于問(wèn)題領(lǐng)域特征來(lái)規(guī)定某些知識(shí)獲取技術(shù),以生產(chǎn)和運(yùn)營(yíng)管理(P/OM)領(lǐng)域作為研究的試點(diǎn)領(lǐng)域,將P/OM任務(wù)映射到問(wèn)題域的一般分類方式。根據(jù)分類的結(jié)果構(gòu)建描述具有顯著知識(shí)的獲取技術(shù)。文獻(xiàn)[5]在訪談的層面上,結(jié)合工業(yè)界的高級(jí)管理人員擔(dān)任實(shí)驗(yàn)課題,比較非結(jié)構(gòu)化知識(shí)和結(jié)構(gòu)化知識(shí)獲取的方法,發(fā)現(xiàn)采用結(jié)構(gòu)化訪談方法獲取知識(shí)可以提高績(jī)效。文獻(xiàn)[6]認(rèn)為在業(yè)務(wù)領(lǐng)域中問(wèn)題以及求解的策略在選擇方面存在很大的差異,采用問(wèn)題分解和簡(jiǎn)化技術(shù)以便為管理決策提供適當(dāng)?shù)男畔?。郭健美等[7]在基于業(yè)務(wù)問(wèn)題求解的實(shí)際需求方面,提出了一種對(duì)于知識(shí)供應(yīng)過(guò)程的業(yè)務(wù)問(wèn)題求解模型。王德川等[8]針對(duì)企業(yè)業(yè)務(wù)問(wèn)題求解時(shí)方案制定不合理的現(xiàn)象,將企業(yè)中的知識(shí)庫(kù)用領(lǐng)域建模的方式進(jìn)行重新整理建模 ,設(shè)計(jì)了一種面向特定領(lǐng)域建模方法。姚平等[9]為了提取決策知識(shí),采用將模糊集和粗糙集理論相結(jié)合的方法獲取知識(shí)資源。羅琳等[10]從數(shù)據(jù)的內(nèi)涵出發(fā),提出了知識(shí)流動(dòng)的特點(diǎn),采用“數(shù)據(jù)-人-知識(shí)”模型,構(gòu)建了其理論框架,應(yīng)用在產(chǎn)學(xué)研協(xié)同創(chuàng)新知管網(wǎng)研究。劉驪等[11]以服裝數(shù)據(jù)作為驅(qū)動(dòng)力,構(gòu)建三維服裝模型,提高服裝建模的效率。徐建國(guó)等[12]采用數(shù)據(jù)驅(qū)動(dòng)的方式,采用技術(shù)評(píng)論數(shù)據(jù),應(yīng)用在技術(shù)網(wǎng)絡(luò)模型構(gòu)建。楊青等[13]以工程管理的角度,采用數(shù)據(jù)驅(qū)動(dòng)的方式,將工程管理按照時(shí)間維度、領(lǐng)域維度和方法維度三個(gè)維度,挖掘數(shù)據(jù)信息,及各個(gè)生命階段的數(shù)據(jù)類型。程進(jìn)等[14]以個(gè)性化制造企業(yè)流程工藝參數(shù)據(jù)作為驅(qū)動(dòng)力,研究其參數(shù)匹配方法, 有效地為制造工藝知識(shí)提供服務(wù)。

綜合國(guó)內(nèi)外的相關(guān)研究可以看出,以數(shù)據(jù)作為驅(qū)動(dòng),結(jié)合映射規(guī)則獲得更加全面的知識(shí)資源應(yīng)用在業(yè)務(wù)問(wèn)題的求解方面的研究和應(yīng)用較少,尤其是在知識(shí)資源獲取方法方面仍需要進(jìn)一步研究[15-21]。

以開(kāi)放數(shù)據(jù)資源進(jìn)行知識(shí)模型構(gòu)建仍舊存在較多的有價(jià)值性的工作。本文從企業(yè)業(yè)務(wù)問(wèn)題求解進(jìn)行分析,以數(shù)據(jù)作為驅(qū)動(dòng)力,利用已有的網(wǎng)絡(luò)數(shù)據(jù)資源,基于映射規(guī)則的方法進(jìn)行推理,填充企業(yè)業(yè)務(wù)問(wèn)題求解的專家知識(shí)資源模型,令專家知識(shí)資源模型更加全面細(xì)致,并研究數(shù)據(jù)驅(qū)動(dòng)的專家知識(shí)資源模型方法,進(jìn)行專家知識(shí)資源原型系統(tǒng)開(kāi)發(fā)。

1 模型構(gòu)建

1.1 模型維度的確定

面向業(yè)務(wù)問(wèn)題求解的專家知識(shí)資源建模是從業(yè)務(wù)問(wèn)題求解需求的角度出發(fā)構(gòu)建的,在業(yè)務(wù)的執(zhí)行過(guò)程中,會(huì)遇到比較復(fù)雜的業(yè)務(wù)難題或困難,本文將這類困難與難題的解決稱為業(yè)務(wù)問(wèn)題求解。而對(duì)于業(yè)務(wù)問(wèn)題求解的發(fā)生源于業(yè)務(wù)問(wèn)題的出現(xiàn),業(yè)務(wù)問(wèn)題的出現(xiàn)是企業(yè)業(yè)務(wù)人員在執(zhí)行不同業(yè)務(wù)活動(dòng)發(fā)生,因此,根據(jù)找到業(yè)務(wù)問(wèn)題求解的源頭,對(duì)其進(jìn)行解析,使出現(xiàn)業(yè)務(wù)問(wèn)題時(shí)能夠及時(shí)得到求解的方案,從而繼續(xù)推進(jìn)整個(gè)業(yè)務(wù)活動(dòng)。從中可以發(fā)現(xiàn),業(yè)務(wù)問(wèn)題求解的需求知識(shí)與專家知識(shí)資源的構(gòu)建之間有密不可分的關(guān)系,如圖1所示。

圖1 業(yè)務(wù)需求與專家知識(shí)資源的關(guān)系模型圖

在實(shí)際求解業(yè)務(wù)問(wèn)題中的過(guò)程中,業(yè)務(wù)問(wèn)題是具有多層次的結(jié)構(gòu),所以,業(yè)務(wù)求解需求就是按照層次粒度集成的集合體。根據(jù)此特性,業(yè)務(wù)求解需求是為業(yè)務(wù)問(wèn)題提供服務(wù),所以,業(yè)務(wù)需求也具有多層次的結(jié)構(gòu)。圍繞業(yè)務(wù)需求的涉及的知識(shí)資源角度,結(jié)合其多層次結(jié)構(gòu)的特點(diǎn),以企業(yè)中一系列的業(yè)務(wù)案例為例,分別從企業(yè)業(yè)務(wù)項(xiàng)目層次需求維度、知識(shí)領(lǐng)域需求維度、產(chǎn)品生命周期需求維度將企業(yè)業(yè)務(wù)需求的知識(shí)資源進(jìn)行分類,為專家知識(shí)資源建模做準(zhǔn)備。

結(jié)合劉則晴等[22]構(gòu)建的業(yè)務(wù)問(wèn)題模型,在此基礎(chǔ)上,構(gòu)建了業(yè)務(wù)需求的模型:

PK={Xk,Yk,Zk}k=1,2,…,n

式中:k為企業(yè)業(yè)務(wù)求解需求編號(hào),n為當(dāng)前企業(yè)內(nèi)的業(yè)務(wù)求解需求總數(shù)。

Xk={xki,i=1,2,3},xki表示第k個(gè)業(yè)務(wù)求解需求處于i層次的需求層次維度。

Yk={ykj,j=1,2,…,m},ykj表示第k個(gè)業(yè)務(wù)求解需求的知識(shí)領(lǐng)域維度總數(shù)。

Zk={zkt,t=1,2,…,n},zkt表示第k個(gè)業(yè)務(wù)求解需求的產(chǎn)品生命周期維度個(gè)數(shù)。

由于業(yè)務(wù)需求所處的項(xiàng)目層次維度不同,其求解的過(guò)程中所需要的知識(shí)資源也是存在差異性的,因而需求的專家知識(shí)資源也存在很大的差異性。

盡管項(xiàng)目層次不同,但專家知識(shí)資源每個(gè)維度的知識(shí)領(lǐng)域卻存在著相似性。因此,該專家雖然處于不同項(xiàng)目、任務(wù)、活動(dòng)層面中,但是都需要找到能夠與專家知識(shí)資源屬性一致的知識(shí)結(jié)構(gòu),而該結(jié)構(gòu)的構(gòu)成則可以定義為專家的知識(shí)單元維度。

在項(xiàng)目層次維度所處的任務(wù)層次,以及解決何種業(yè)務(wù)問(wèn)題是根據(jù)專家的業(yè)務(wù)經(jīng)驗(yàn)及經(jīng)歷。因而,確立了該專家的業(yè)務(wù)經(jīng)驗(yàn)及經(jīng)歷維度和教育經(jīng)歷維度。

在業(yè)務(wù)問(wèn)題求解的配置過(guò)程中,會(huì)出現(xiàn)專家之間的相互配合情況,若要業(yè)務(wù)問(wèn)題能夠順利得到解決,就需要對(duì)專家的脾氣秉性特征,及愛(ài)好等有所了解,因此,我們建立了專家知識(shí)資源模型中的又一個(gè)維度即愛(ài)好及特征,旨在業(yè)務(wù)問(wèn)題求解的知識(shí)應(yīng)用情景中為業(yè)務(wù)配置能夠順利進(jìn)展推進(jìn),并為專家在解決問(wèn)題時(shí)創(chuàng)造舒適環(huán)境,從而使業(yè)務(wù)問(wèn)題能夠高效合理地解決。

根據(jù)產(chǎn)品生命周期需求維度分析,主要是考慮該產(chǎn)品需求分析、設(shè)計(jì)、生產(chǎn)、銷售、售后、到回收階段,需要專家面對(duì)該流程中業(yè)務(wù)運(yùn)營(yíng)產(chǎn)生的問(wèn)題,求解業(yè)務(wù)問(wèn)題的能力,從中可以得到該專家知識(shí)資源模型中的業(yè)務(wù)能力維度。

通過(guò)對(duì)業(yè)務(wù)需求進(jìn)行解析,本文確立了專家知識(shí)資源的六個(gè)維度信息,分別為專家的基本屬性、業(yè)務(wù)經(jīng)驗(yàn)及經(jīng)歷、業(yè)務(wù)能力、教育經(jīng)歷、知識(shí)單元、愛(ài)好及特征。對(duì)每個(gè)維度又可以進(jìn)一步細(xì)分,以此作為專家知識(shí)資源與求解業(yè)務(wù)問(wèn)題需求契合度的依據(jù),并為專家知識(shí)資源模型提供基礎(chǔ)。

數(shù)據(jù)驅(qū)動(dòng)中數(shù)據(jù)即為專家知識(shí)資源模型的維度信息,驅(qū)動(dòng)專家知識(shí)模型的構(gòu)建。

1.2 模型構(gòu)建

結(jié)合上述的專家知識(shí)資源維度的分析,本文提出依托網(wǎng)絡(luò)數(shù)據(jù)資源,基于規(guī)則抽取、數(shù)據(jù)檢索及數(shù)據(jù)挖掘技術(shù)的專家知識(shí)資源模型,如圖2所示。首先專家模型的建立需要滿足業(yè)務(wù)問(wèn)題求解時(shí)對(duì)專家需求,利于實(shí)現(xiàn)專家知識(shí)資源的配置;另外如何獲取專家資源信息及建立專家資源信息庫(kù),這也是業(yè)務(wù)求解過(guò)程中的關(guān)鍵。

圖2 數(shù)據(jù)驅(qū)動(dòng)的專家知識(shí)資源模型框架

圖2中對(duì)專家知識(shí)資源模型中的6個(gè)維度及其維度進(jìn)行細(xì)分,并表示了每個(gè)維度信息之間的相互關(guān)系,及如何獲取專家知識(shí)模型資源中相對(duì)應(yīng)的數(shù)據(jù)獲取方式。以教育經(jīng)歷為例,其細(xì)分的維度為該專家的受教育時(shí)間(when)、受教育的學(xué)校即地點(diǎn)(where)、受教育的學(xué)習(xí)的專業(yè)信息(major),即為“2W1M”。該維度信息的獲得可以采用搜索方式,但有時(shí)該專家的某些信息又不能直接通過(guò)網(wǎng)絡(luò)搜索獲得,例如張三的畢業(yè)學(xué)校無(wú)法獲取,但從網(wǎng)絡(luò)數(shù)據(jù)中發(fā)現(xiàn)張三與李四是大學(xué)同學(xué),而李四的畢業(yè)學(xué)校可獲取。因而,就可以推斷出張三的畢業(yè)學(xué)校?;谶@樣的構(gòu)思,本文提出基于數(shù)據(jù)挖掘或基于規(guī)則推理得方式從網(wǎng)絡(luò)數(shù)據(jù)中抽出不能直接獲取的相關(guān)信息。

(1) 專家的基本屬性 基本屬性是作為業(yè)務(wù)求解過(guò)程中便于業(yè)務(wù)人員聯(lián)系專家,了解專家的基本狀況之用。該維度信息知識(shí)特征具有平行結(jié)構(gòu),無(wú)先后的順序,采用表格的形式記錄該基本屬性的細(xì)分維度。該數(shù)據(jù)是由搜索方式得到的數(shù)據(jù),若不能直接獲得數(shù)據(jù)則由推理規(guī)則獲取,如表1所示。

表1 專家的基本屬性

(2) 專家的教育經(jīng)歷 專家所掌握的基本知識(shí)與能力信息,是關(guān)于個(gè)體比較全局的知識(shí)與能力描述。該知識(shí)結(jié)構(gòu)為“2W1M”,相互之間是關(guān)聯(lián)關(guān)系。具體包括專家學(xué)習(xí)旅程中不同階段,分別為大學(xué)、研究生、博士生等,以及在什么時(shí)間進(jìn)入什么樣的院校學(xué)習(xí)什么專業(yè)。如表2所示。

表2 專家的教育經(jīng)歷

(3) 專家的業(yè)務(wù)能力 與業(yè)務(wù)求解密切相關(guān)的信息需求,了解專家能力特點(diǎn)是否可以為業(yè)務(wù)崗位需求相匹配。其知識(shí)結(jié)構(gòu)是按其掌握的熟練程度等級(jí)劃分,所以以金字塔的方式描述。該維度是由業(yè)務(wù)領(lǐng)域水平、語(yǔ)言溝通能力、組織協(xié)調(diào)能力、團(tuán)隊(duì)協(xié)作能力、全局意思能力組成。同時(shí),根據(jù)基于規(guī)則的推理進(jìn)行該維度的等級(jí)分類。

該維度主要是以研究領(lǐng)域作為研究專家業(yè)務(wù)能力的關(guān)鍵信息。如圖3所示,把研究領(lǐng)域細(xì)化到10個(gè)相應(yīng)的維度,分別是主要研究方向、學(xué)術(shù)論文影響因素、論文被引次數(shù)、榮譽(yù)和獎(jiǎng)勵(lì)、科研榮譽(yù)稱號(hào)、應(yīng)用案例、專利項(xiàng)目、科研項(xiàng)目、社會(huì)及學(xué)術(shù)兼職、主要著作和論文。根據(jù)上述10個(gè)細(xì)分維度,將專家業(yè)務(wù)能力更加具體展示給企業(yè)業(yè)務(wù)需求人員,作為企業(yè)業(yè)務(wù)應(yīng)用專家知識(shí)資源提供參考。

圖3 專家的業(yè)務(wù)能力圖

(4) 專家的業(yè)務(wù)經(jīng)歷及經(jīng)驗(yàn) 專家的業(yè)務(wù)經(jīng)歷和經(jīng)驗(yàn)的描述,進(jìn)一步展示專家能力范圍,而且此維度也最能反映專家過(guò)往與當(dāng)前的能力特長(zhǎng),是進(jìn)行專家資源配置的重要理論依據(jù)。圖4為該專家的業(yè)務(wù)經(jīng)歷及經(jīng)驗(yàn)知識(shí)模型圖。

圖4 專家的業(yè)務(wù)經(jīng)歷及經(jīng)驗(yàn)?zāi)P蛨D

每個(gè)專家在人生的不同階段都會(huì)遇到不同的專家,專家們相互交流,共同工作,知識(shí)會(huì)相互組合,并且創(chuàng)造形成新的知識(shí)。從專家自身的閱歷和經(jīng)驗(yàn),形成知識(shí)體系,專家知識(shí)是具有包含的關(guān)系等,從知識(shí)的寬度領(lǐng)域逐漸向深度邁進(jìn),形成專家自身的知識(shí)體系結(jié)構(gòu),為業(yè)務(wù)問(wèn)題求解效率帶來(lái)提升和改進(jìn)。

(5) 專家的知識(shí)單元 知識(shí)單元是對(duì)專家所在知識(shí)領(lǐng)域中具體的知識(shí)結(jié)構(gòu)的最直接闡述。結(jié)合面向業(yè)務(wù)求解的知識(shí)資源配置的需要,對(duì)其知識(shí)結(jié)構(gòu)進(jìn)行細(xì)致的分類。如圖5所示,其相互之間的關(guān)系是包含的關(guān)系,對(duì)于知識(shí)體系進(jìn)行逐級(jí)分層,從而在業(yè)務(wù)問(wèn)題求解時(shí)能夠及時(shí)找到需要的專家,并將專家的知識(shí)單元按照對(duì)知識(shí)掌握的熟練程度進(jìn)行劃分。

圖5 專家的知識(shí)單元

知識(shí)單元主要是按照對(duì)于知識(shí)的掌握的熟悉度,從一般到熟練,挖掘到專家構(gòu)建和掌握其知識(shí)體系的方式是源自于其教育生涯中科目信息,每個(gè)專家在知識(shí)獲取上都是以科目信息的傳授和深入挖掘,來(lái)構(gòu)建其完整的知識(shí)體系。因此,以科目信息建立規(guī)則,尋找相似知識(shí)單元結(jié)構(gòu)的專家,構(gòu)建專家知識(shí)資源模型。

(6) 專家的愛(ài)好及特征 該維度的模型信息是為業(yè)務(wù)求解中團(tuán)隊(duì)成員間可能的默契和配合程度而考慮的,在知識(shí)資源配置的協(xié)調(diào)決策中發(fā)揮輔助作用。如圖6所示,該維度信息主要是按照樹(shù)狀結(jié)構(gòu)進(jìn)行分類,找到專家的興趣點(diǎn)。其中主要包括專家喜好是運(yùn)動(dòng)類、文藝類,及專家的特征是有無(wú)宗教信仰、有無(wú)潔癖等特殊習(xí)慣。

圖6 專家的愛(ài)好及特征圖

2 建模方法研究

如圖2所示,數(shù)據(jù)獲取的方式有一種或者兩種方式結(jié)合甚至更多,本文結(jié)合專家知識(shí)資源模型構(gòu)建的數(shù)據(jù)需要,總結(jié)出3種數(shù)據(jù)獲取的方式,分別為基于規(guī)則的推理、基于數(shù)據(jù)檢索、基于數(shù)據(jù)挖掘的獲取方式。

2.1 基于規(guī)則的推理獲取方法

由于數(shù)據(jù)的廣泛性,圖2中各維度模型中的信息很難從數(shù)據(jù)源中直接獲取,因而本文定義數(shù)據(jù)分析挖掘的映射規(guī)則,建立模型映射的規(guī)則庫(kù)。所謂的規(guī)則就是從數(shù)據(jù)源信息推導(dǎo)出模型信息的推理原則,如圖7所示。

圖7 基于規(guī)則的獲取流程圖

廣義多源數(shù)據(jù)是指互聯(lián)網(wǎng)中開(kāi)放的數(shù)據(jù)源;獲取規(guī)則,主要是基于推理規(guī)則的方式獲取專家模型,根據(jù)業(yè)務(wù)需求的知識(shí)資源,利用推理規(guī)則填充專家知識(shí)模型某些維度信息的數(shù)據(jù)。例如:A專家1994年本科畢業(yè)清華大學(xué)的機(jī)械制造及其自動(dòng)化專業(yè),那么從這條專家的個(gè)人信息中,可以定義規(guī)則“該專家應(yīng)該基本具有機(jī)械制造及自動(dòng)化領(lǐng)域的基本專家知識(shí)與技能,并基本具有1994年清華大學(xué)所開(kāi)設(shè)專業(yè)知識(shí)中的知識(shí)單元結(jié)構(gòu)”。基于這條規(guī)則,所需獲取的進(jìn)一步信息就是獲取1994年清華大學(xué)機(jī)械制造及其自動(dòng)化專業(yè)的本科課程體系,或獲取與A專家相近就學(xué)情形的其他專家的個(gè)人信息,以此推導(dǎo)出A專家可能的知識(shí)單元維度信息構(gòu)成及教育經(jīng)驗(yàn)維度的求學(xué)信息。

通過(guò)不斷積累的大量規(guī)則的建立,利用軟件技術(shù)即可實(shí)現(xiàn)專家資源模型信息的自動(dòng)獲取。使專家模型的數(shù)據(jù)信息更加完整。

專家知識(shí)的推理規(guī)則可表示為:

規(guī)則1:If “時(shí)間=×××”and“地點(diǎn)=某高校名稱”and“專業(yè)=教育部開(kāi)設(shè)某專業(yè)名稱”,then“該專家的科目信息=具體根據(jù)教育部制定與修訂《普通高等教育學(xué)校本科專業(yè)目錄》中的信息確定該專家科目信息的知識(shí)結(jié)構(gòu)”。

規(guī)則2:If “A專家與B為同時(shí)同學(xué)校同專業(yè)”,then“該專家A與專家B具有相同的科目信息和知識(shí)結(jié)構(gòu)”。

規(guī)則3:If “申請(qǐng)項(xiàng)目團(tuán)隊(duì)人數(shù)>5”and“撰寫論文的團(tuán)隊(duì)人數(shù)>5”and“專家參與的科研活動(dòng)”and“該專家的存在社會(huì)及學(xué)術(shù)兼職”,then“團(tuán)隊(duì)能力較強(qiáng)”。

If “申請(qǐng)項(xiàng)目團(tuán)隊(duì)人數(shù)>5”and“撰寫論文的團(tuán)隊(duì)人數(shù)>5”and“該專家的存在社會(huì)及學(xué)術(shù)兼職”,then“團(tuán)隊(duì)能力較強(qiáng)”。

If “申請(qǐng)項(xiàng)目團(tuán)隊(duì)人數(shù)>5”and“撰寫論文的團(tuán)隊(duì)人數(shù)>5”and“專家參與的科研活動(dòng)”,then“團(tuán)隊(duì)能力較強(qiáng)”。

If “申請(qǐng)項(xiàng)目團(tuán)隊(duì)人數(shù)>5”and“專家參與的科研活動(dòng)”and“該專家的存在社會(huì)及學(xué)術(shù)兼職”,then“團(tuán)隊(duì)能力較強(qiáng)”。

If “撰寫論文的團(tuán)隊(duì)人數(shù)>5”and“專家參與的科研活動(dòng)”and“該專家的存在社會(huì)及學(xué)術(shù)兼職”,then“團(tuán)隊(duì)能力較強(qiáng)”。

If “申請(qǐng)項(xiàng)目團(tuán)隊(duì)人數(shù)>5”and“撰寫論文的團(tuán)隊(duì)人數(shù)>5”,then“團(tuán)隊(duì)能力一般”。

If “申請(qǐng)項(xiàng)目團(tuán)隊(duì)人數(shù)>5”and“專家參與的科研活動(dòng)”,then“團(tuán)隊(duì)能力一般”。

If “申請(qǐng)項(xiàng)目團(tuán)隊(duì)人數(shù)>5”and“該專家的存在社會(huì)及學(xué)術(shù)兼職”,then“團(tuán)隊(duì)能力一般”。

If “撰寫論文的團(tuán)隊(duì)人數(shù)>5”and“專家參與的科研活動(dòng)”,then“團(tuán)隊(duì)能力一般”。

If “撰寫論文的團(tuán)隊(duì)人數(shù)>5”and“該專家的存在社會(huì)及學(xué)術(shù)兼職”,then“團(tuán)隊(duì)能力一般”。

If “專家參與的科研活動(dòng)”and“該專家的存在社會(huì)及學(xué)術(shù)兼職”,then“團(tuán)隊(duì)能力一般”。

If “申請(qǐng)項(xiàng)目團(tuán)隊(duì)人數(shù)>5”,then“團(tuán)隊(duì)能力較弱”。

If “撰寫論文的團(tuán)隊(duì)人數(shù)>5”,then“團(tuán)隊(duì)能力較弱”。

If “專家參與的科研活動(dòng)”,then“團(tuán)隊(duì)能力較弱”。

If “該專家的存在社會(huì)及學(xué)術(shù)兼職”,then“團(tuán)隊(duì)能力較弱”。

滿足以上三條及其以上的內(nèi)容,該專家的業(yè)務(wù)能力較強(qiáng)。滿足兩條,該專家的團(tuán)隊(duì)能力一般。滿足上面一條內(nèi)容則該專家的團(tuán)隊(duì)能力較弱。

專家業(yè)務(wù)能力維度的描述,以該專家的團(tuán)隊(duì)能力維度進(jìn)行其推理規(guī)則的詳細(xì)闡述,其他細(xì)分維度信息獲取規(guī)則方式與此相同,由于篇幅問(wèn)題,暫不贅述。

規(guī)則4:If “描述該專家的信息出現(xiàn)干凈,整潔”,and“出現(xiàn)程度副詞,較,極其”,then“該專家有潔癖習(xí)慣”。

If “該專家信仰某種宗教”or“該專家信仰佛教”,then“該專家有宗教信仰”。

If “描述該專家做事嚴(yán)謹(jǐn)”and“被評(píng)為某種具有嚴(yán)謹(jǐn)工作性質(zhì)的獎(jiǎng)項(xiàng),帶有程度副詞”or“該專家被評(píng)為某種帶有感情色彩,我最喜愛(ài),我最敬佩”,then“該專家做事嚴(yán)謹(jǐn),平易近人”。

專家愛(ài)好及特征維度信息的描述,主要是根據(jù)描述信息出現(xiàn)的關(guān)鍵詞及修飾該關(guān)鍵詞的程度副詞進(jìn)行數(shù)據(jù)推理和填充。

2.2 基于數(shù)據(jù)檢索的獲取技術(shù)

根據(jù)網(wǎng)上已存在的數(shù)據(jù),通過(guò)對(duì)其數(shù)據(jù)進(jìn)行關(guān)鍵詞檢索得到的數(shù)據(jù)信息可直接填充進(jìn)專家知識(shí)模型細(xì)分的維度信息內(nèi)容,如圖2所示。以專家知識(shí)資源中的教育經(jīng)歷為例,進(jìn)行維度信息的獲取。提出基于數(shù)據(jù)挖掘中廣泛使用的網(wǎng)絡(luò)爬蟲(chóng)技術(shù),從互聯(lián)網(wǎng)環(huán)境中廣泛獲取與專家相關(guān)的各類信息,作為數(shù)據(jù)挖掘的數(shù)據(jù)源。

某些數(shù)據(jù)經(jīng)過(guò)檢索得到,但是,并不能直接填充到專家知識(shí)模型中相對(duì)應(yīng)的字段維度信息,需要對(duì)檢索到的數(shù)據(jù)進(jìn)行相關(guān)的處理,本文采用數(shù)據(jù)統(tǒng)計(jì)的方式,具體應(yīng)用于專家的文獻(xiàn)被引次數(shù)及專家成果影響因素和專家論文被引次數(shù)。

2.2.1 論文被引總次數(shù)及成果影響因素

論文被引總次數(shù)的確定,方便對(duì)專家進(jìn)行配置時(shí)提供相應(yīng)的理論參考。該方法的計(jì)算方式,主要是按照參考文獻(xiàn)中作者的排序作為其貢獻(xiàn)影響的依據(jù)。若為第一作者,則其貢獻(xiàn)量最大,則按引用次數(shù)與因子1相乘,若作者是第二位及其之后出現(xiàn),將引用次數(shù)按照總?cè)藬?shù)平分,具體計(jì)算如下所示:

(1)

式中:a1,a2,…,an指專家為第一位作者的引用次數(shù);b1,b2,…,bn指專家作為第二位及以后作者的引用次數(shù),且參與學(xué)術(shù)論文創(chuàng)作的作者人數(shù)是2個(gè)人;c1,c2,…,cn指專家作為第二位及以后作者的引用次數(shù),且參與學(xué)術(shù)論文創(chuàng)作的作者人數(shù)是3個(gè)人;d1,d2,…,dn指專家作為第二位及以后作者的引用次數(shù),且參與學(xué)術(shù)論文創(chuàng)作的作者人數(shù)是4個(gè)人;e1,e2,…,en指專家作為第二位及以后作者的引用次數(shù),且參與學(xué)術(shù)論文創(chuàng)作的作者人數(shù)是5個(gè)人,由于一般學(xué)術(shù)論文規(guī)定的最多人數(shù)為5個(gè)人,所以,本文將專家論文被引用次數(shù)按最多人數(shù)為5個(gè)人進(jìn)行其引用次數(shù)總和計(jì)算。

2.2.2 成果影響因素計(jì)算

成果影響因素,文中的成果影響因子主要是根據(jù)文章被引次數(shù),完成其影響成果的確定,之所以要計(jì)算成果因素,是為專家在配置知識(shí)資源時(shí)提供相應(yīng)的數(shù)據(jù)參考,決定哪位專家在同一領(lǐng)域中更適合勝任該工作。本文采用文獻(xiàn)[23]介紹的I3(Integrated Impact Indicator)[24],I3使用的是無(wú)參統(tǒng)計(jì)的方式評(píng)價(jià)偏態(tài)分布的期刊被引頻次,并且利用標(biāo)準(zhǔn)差來(lái)檢驗(yàn)評(píng)價(jià)結(jié)果,對(duì)于期刊評(píng)價(jià)法和科研人員評(píng)價(jià)比期刊因子更加合理。本文采用科研指標(biāo)I3,計(jì)算公式如下:

Ia=∑ixi·f(xi)

(2)

式中:xi表示第i等級(jí)的權(quán)值,f(xi)表示該權(quán)值為xi的論文出現(xiàn)的數(shù)量?;谥锌圃簩?duì)于期刊的劃分[23]并結(jié)合PR6[24],對(duì)該權(quán)值與等級(jí)的劃分范圍進(jìn)行調(diào)整,并根據(jù)專家學(xué)術(shù)論文的等級(jí)進(jìn)行了重新界定。

2.3 基于數(shù)據(jù)挖掘的獲取技術(shù)

如圖1所示,專家知識(shí)資源模型框架充分考慮了企業(yè)業(yè)務(wù)問(wèn)題求解時(shí)的知識(shí)需求,而對(duì)于模型各維度實(shí)例信息的獲取,本文采用互聯(lián)網(wǎng)中的開(kāi)源數(shù)據(jù)挖掘技術(shù)來(lái)實(shí)現(xiàn)?;玖鞒倘鐖D8所示。

圖8 基于數(shù)據(jù)挖掘的流程圖

該流程主要以對(duì)專家摘要、論文摘要、專家數(shù)據(jù)進(jìn)行清洗、提取專家專利數(shù)據(jù)、論文摘要數(shù)據(jù)中的描述專家研究領(lǐng)域及方向的術(shù)語(yǔ)、利用互信息的分詞方式提取關(guān)鍵詞。

對(duì)專家摘要、論文摘要、專家數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,利用了數(shù)據(jù)清洗的理念,去除數(shù)據(jù)的雜質(zhì)。

提取專家專利數(shù)據(jù)、論文摘要數(shù)據(jù)中的描述專家研究領(lǐng)域及方向的術(shù)語(yǔ),采用對(duì)數(shù)據(jù)進(jìn)行分詞處理。

利用互信息的分詞方式提取關(guān)鍵詞:本文采用一種無(wú)監(jiān)督學(xué)習(xí)的專業(yè)領(lǐng)域分詞歧義方法[25],采用互信息的方式,因?yàn)槠浞衷~效果較好,且具有穩(wěn)定性。該方法采用定量估計(jì)兩個(gè)漢字間的結(jié)合力方式,從而確定兩個(gè)字之間的聯(lián)系強(qiáng)度,以此作為依據(jù)判斷兩個(gè)字是否需要進(jìn)行分詞。但由于某些領(lǐng)域的專家的研究方向并不僅限于兩個(gè)漢字之間,例如某專家擅長(zhǎng)“知識(shí)管理”,如果只是兩個(gè)詞之間的緊密度的話,分詞就為“知識(shí)/管理”與研究領(lǐng)域的專家知識(shí)描述相違背。因而,本文采用是多字詞的互信息。即一個(gè)詞由多個(gè)字組成時(shí),先計(jì)算專業(yè)研究領(lǐng)域的兩兩臨近字的互信息,再取平均值。算法如下:

(3)

mi(xi,xi+1)指兩兩相近字的互信息,其計(jì)算方式如下:

(4)

式中:xi、xi+1指兩個(gè)相近字。用mi表示兩個(gè)詞的相近度,以此作為研究分詞的理論依據(jù),確立得到的分詞信息能夠描述專家的研究領(lǐng)域的知識(shí)資源信息,更好地解釋專家的研究領(lǐng)域內(nèi)容。同時(shí)進(jìn)行關(guān)鍵詞提取及詞頻統(tǒng)計(jì),為基于推理規(guī)則的方式獲取模型數(shù)據(jù)做準(zhǔn)備。

通過(guò)編寫網(wǎng)絡(luò)爬蟲(chóng)程序爬取專家知識(shí)資源信息,構(gòu)建專家知識(shí)模型。根據(jù)上述三種方式,節(jié)省數(shù)據(jù)清洗和數(shù)據(jù)處理步驟,利用爬蟲(chóng)直接獲取該專家模型需求的信息源。

3 原型系統(tǒng)開(kāi)發(fā)

為了能夠方便開(kāi)發(fā)者進(jìn)行開(kāi)發(fā),本節(jié)設(shè)計(jì)并開(kāi)發(fā)該數(shù)據(jù)驅(qū)動(dòng)的基于規(guī)則映射形成的專家知識(shí)資源原型系統(tǒng),為專家知識(shí)資源配置服務(wù)做準(zhǔn)備。采用PHP+MySQL的模式進(jìn)行Web開(kāi)發(fā),基于B/S框架。數(shù)據(jù)庫(kù)采用標(biāo)準(zhǔn)的SQL語(yǔ)言,由于MySQL是具有開(kāi)放源代碼的特點(diǎn),因此,可以根據(jù)用戶個(gè)人需要需求的要求進(jìn)行修改。PHP是一種嵌入到HTML中的腳本語(yǔ)言,絕大多部分源于C語(yǔ)言,也有少數(shù)承自Java和Perl,并由服務(wù)器進(jìn)行解釋的腳本語(yǔ)言。本系統(tǒng)使用的軟件開(kāi)發(fā)環(huán)境為:Windows10,MySQL Sever11.0.10.(數(shù)據(jù)庫(kù)),PHPSTUDY20180211(調(diào)試環(huán)境),PhpStorm(編程軟件)。圖9為該系統(tǒng)的框架圖。

圖9 系統(tǒng)架構(gòu)圖設(shè)計(jì)

根據(jù)圖2和圖9的理論框架設(shè)計(jì)構(gòu)圖的模型,構(gòu)建專家知識(shí)模型系統(tǒng)如圖10所示。

圖10 數(shù)據(jù)驅(qū)動(dòng)的專家知識(shí)資源模型系統(tǒng)

4 應(yīng)用實(shí)例

本模型以實(shí)驗(yàn)室為研究對(duì)象,進(jìn)行了該系統(tǒng)的測(cè)試和試驗(yàn),驗(yàn)證了該方案的可行性。具體操作是通過(guò)輸入某位專家的名字得到其相應(yīng)的數(shù)據(jù)信息,顯示了專家信息中部分維度中的數(shù)據(jù)信息,分別是業(yè)務(wù)經(jīng)驗(yàn)及經(jīng)歷維度,進(jìn)行實(shí)例展示。同時(shí),在科目信息旁邊有一個(gè)紅色驚嘆號(hào)的標(biāo)志,可以看到該數(shù)據(jù)的獲取方法,如圖11所示。

圖11 數(shù)據(jù)驅(qū)動(dòng)的專家知識(shí)資源部分模型系統(tǒng)

5 結(jié) 語(yǔ)

數(shù)據(jù)驅(qū)動(dòng)的基于規(guī)則的專家知識(shí)資源建模及獲取技術(shù),能通過(guò)數(shù)據(jù)本身相關(guān)的規(guī)則進(jìn)行推理,實(shí)現(xiàn)智能化獲取數(shù)據(jù)的方式,減少人工編輯工作量。并且,數(shù)據(jù)的多源性使得獲取知識(shí)多樣性,滿足知識(shí)的個(gè)性化要求,并快速地為企業(yè)提供合理的配置專家作準(zhǔn)備工作,在業(yè)務(wù)問(wèn)題求解方面提高效率,將數(shù)據(jù)可視化,為業(yè)務(wù)人員在求解過(guò)程中提供參考。

猜你喜歡
維度專家規(guī)則
理解“第三次理論飛躍”的三個(gè)維度
撐竿跳規(guī)則的制定
致謝審稿專家
認(rèn)識(shí)黨性的五個(gè)重要維度
淺論詩(shī)中“史”識(shí)的四個(gè)維度
奧斯卡的規(guī)則變了!
讓規(guī)則不規(guī)則
TPP反腐敗規(guī)則對(duì)我國(guó)的啟示
請(qǐng)叫我專家
專家面對(duì)面
旬阳县| 昔阳县| 婺源县| 绥棱县| 武宣县| 余姚市| 凤山市| 中牟县| 泸西县| 绥棱县| 蓝山县| 大英县| 富川| 普兰店市| 乐业县| 淄博市| 诸暨市| 托克托县| 苏尼特左旗| 明溪县| 尚义县| 白河县| 小金县| 邮箱| 通城县| 新巴尔虎左旗| 手游| 恩施市| 称多县| 金乡县| 景泰县| 洞头县| 富顺县| 依安县| 汉寿县| 天水市| 汝州市| 乐至县| 广安市| 高唐县| 汤原县|