陶礫 劉恒初 楊朔 林勇
摘? 要: 在實際應用中,根據(jù)關(guān)鍵詞或者學科分類等方法不能找到合適的項目評審專家。文章通過對中文分詞技術(shù)、相似度匹配算法、專家檢索方法等的研究,對專家的論文、著作進行挖掘與分析,通過同義詞分析和向量模型來計算專家著作與項目領(lǐng)域之間的相似性,并通過相似度計算方法將專家的研究領(lǐng)域與項目的學科領(lǐng)域自動匹配,從而達到準確地推薦項目評審專家的目的。
關(guān)鍵詞: 專家?guī)? 遴選; 中文分詞技術(shù); 專家推薦
中圖分類號:TP317.1? ? ? ? ? 文獻標志碼:A? ? ?文章編號:1006-8228(2019)07-36-03
Abstract: In practical application, it is difficult to find appropriate project evaluation experts according to keywords or subject classification methods. In this paper, through the researches on Chinese word segmentation technology, similarity matching algorithm and expert retrieval method, expert's papers and works are mined and analyzed, the similarity between expert's works and project fields is calculated through synonym analysis and vector model, and the similarity calculation method is used to automatically match the research field of the expert and the subject area of the project, to achieve the purpose of accurately recommending experts for project evaluation.
Key words: expert database; selection; Chinese word segmentation technology; recommending expert
0 引言
從國家到地方,各領(lǐng)域各企事業(yè)單位都投入大量人力、物力開展科研和產(chǎn)業(yè)建設(shè),在項目招標、申報、實施、驗收等階段,都需要組織專家進行評審。評審專家作為項目評審及成果評審的主體,他們的選擇影響著這些項目評審、成果評審的客觀性和準確性[1]。高質(zhì)量的專家評審能夠為項目質(zhì)量把關(guān),保障國家、企業(yè)的投資用到真正有益的項目上。而如何為項目招標、申報、驗收等工作選定合適的評審專家是正確評價項目質(zhì)量和提升項目風險管理水平的關(guān)鍵[2]。本文提出一種專家遴選的方法,通過對專家信息的挖掘分析并利用相似度計算方法匹配專家,使得系統(tǒng)能夠精確的推薦相應的專家。
1 專家信息提取
專家信息提取主要包括對專家特征提取、項目資料特征提取。
⑴ 專家特征主要基于專家的論文、專利、著作等內(nèi)容信息,文檔來源比較豐富,包括了比單一文檔更多的信息,是對專家各方面的全面標識,并在一定程度上反映了專家所研究的領(lǐng)域和水平[3]。
以專家文檔為分析內(nèi)容,使用中文分詞技術(shù)對專家文檔的標題、關(guān)鍵字、摘要、正文等進行分詞,運用詞頻統(tǒng)計算法,計算每個詞項與候選專家的相關(guān)度,將結(jié)果作為內(nèi)容特征值存儲起來,建立專家?guī)靃4]。
⑵ 項目資料特征提取,一般各種項目申報書、驗收申請書都有固定的格式,因此,可以對科技項目申報書進行文本分塊處理,并對其文本進行分析,建立項目資料特征庫。
2 專家信息的分析及構(gòu)建
在完成專家信息提取后,需要對已提取信息進行處理并構(gòu)建相應的檢索庫,包括以下內(nèi)容。
⑴ 同義詞詞典:通過同義詞的獲取能夠搜索到更全面更準確的信息,利用模糊匹配實現(xiàn)關(guān)鍵詞對應,故考慮使用二維數(shù)組來構(gòu)造該詞典。
在本系統(tǒng)中,同義詞詞典選擇基于字符串匹配的分詞方法,因為這種分詞方法具有算法簡單、運行效率高等特點。
⑵ 專家檢索:針對專家檢索,專家檢索將專家作為實體檢索的一個特例,利用能夠表征專家專長的各種知識資源,包括網(wǎng)頁、電子郵件、報告數(shù)據(jù)庫文件等,識別專家在某給定查詢的專長相關(guān)性程度,并按相關(guān)性程度高低排序返回專家結(jié)果列表的過程。
⑶ 專家回避:根據(jù)實際需要,主要通過專家?guī)熘袠俗⒌膯挝淮_認專家的同事關(guān)系,根據(jù)提交的相關(guān)項目資料確認項目合作關(guān)系,將專家與項目之間的關(guān)系分析識別并根據(jù)緊密程度予以合理量化,同時,根據(jù)不同的評審要求,設(shè)置評審閾值,根據(jù)值的高低采取回避措施。
⑷ 專家分組:根據(jù)專家?guī)熘械膶<倚畔⒑蛯<姨卣髦?,以專家領(lǐng)域研究的相似度為基礎(chǔ),并結(jié)合專家分組的互斥規(guī)則進行專家的自動分組功能[5]。
通過對專家的研究論文等著作進行挖掘與分析,計算專家著作與項目領(lǐng)域之間的相似性,將相似度高的專家研究領(lǐng)域與項目學科領(lǐng)域自動匹配,再結(jié)合一定的抽取規(guī)則和回避規(guī)則,最終可構(gòu)建一套可面向各領(lǐng)域項目評審的匹配度高的專家遴選庫。
3 專家遴選系統(tǒng)的設(shè)計及分析
3.1 專家信息
專家若已注冊,則直接登錄,否則需要注冊,其注冊流程描述如下。
⑴ 姓名:請輸入您的姓名。
⑵ 證件類型:有三種類型可選,分別是:身份證、軍官證、護照。
⑶ 身份證(軍官證、護照)號碼:正確輸入對應類型的證件號碼。
⑷ 手機號:輸入您的11位手機號。
⑸ 用戶名:請正確輸入您的用戶名(字母開頭,可填寫字母、數(shù)字加下劃線)。
⑹ 密碼:請輸入您的密碼,密碼長度不能少于6位。
⑺ 重復密碼:重復輸入您的密碼,保證兩次輸入的密碼一致。
⑻ 專家地區(qū):請選擇您是省內(nèi)/省外專家。
⑼ 工作單位:點擊“選擇”按鈕,右側(cè)會出現(xiàn)選擇單位框,分兩種搜索方式,按名稱查詢選擇和按單位層級選擇,按名稱查詢選擇支持模糊搜索,選擇好后點擊“確認單位”按鈕,如果沒有找到單位請選擇“新增單位”按鈕,按照提示完善單位信息。
⑽ 驗證碼:點擊發(fā)送驗證碼,系統(tǒng)將往您的手機發(fā)送一條信息,將信息中的驗證碼在120秒內(nèi)輸入,若您的手機沒有接收到信息,請等待120秒后重新點擊發(fā)送驗證碼按鈕。
⑾ 專家基本信息填寫完成后,點擊“注冊”按鈕,系統(tǒng)提示“基本信息注冊成功”后,跳轉(zhuǎn)到專家詳細信息填寫界面。其界面如圖1所示。
在完成基礎(chǔ)信息的錄入后,需要填寫專家的特征信息,包括專家的詳細信息和特征信息,在系統(tǒng)后臺會將專家信息和特征信息進行分析,并通過分詞和語義模糊化,將特征信息載入專家?guī)熘?,專家特征信息錄入界面如圖2所示。
3.2 專家?guī)旃芾?/p>
在專家?guī)旃芾砟K中管理員可以對專家?guī)煜嚓P(guān)信息可以進行直觀的查看統(tǒng)計,包含子庫建設(shè)情況,省內(nèi)外,區(qū)域,年齡,專家類型的圖表統(tǒng)計。統(tǒng)計可以通過數(shù)據(jù)表格形式和圖樣形式展示,圖樣形式如圖3所示。
專家?guī)斐峁﹫D形化顯示外,還能夠?qū)<疫M行分組。將專家細分為子庫后,可設(shè)置對應類別的滿足條件,篩選滿足條件的專家,本系統(tǒng)不僅可以手動分配專家子庫,還可以配置對應的業(yè)務領(lǐng)域的滿足條件,系統(tǒng)根據(jù)設(shè)置的領(lǐng)域條件篩選專家進入相應的領(lǐng)域分組中。若自動劃分專家不符合條件,可以管理該分組中的專家信息,進行相應的補充或者移出分組等操作。專家?guī)煸诖娣艑<翌I(lǐng)域信息的同時,還能夠?qū)<疫M行評審信用進行查詢和管理。
3.3 專家評審配置和抽取
當抽取專家時,可設(shè)定抽取條件,進行手工篩選和抽取操作或系統(tǒng)更新設(shè)定的關(guān)聯(lián)評審項目,實現(xiàn)系統(tǒng)自動抽取專家并通知專家參加評審。抽取過程中全程自動處理,避免人工干預。在選擇專家評審模式后,可配置短信模板,可針對不同情況配置短信模板。當評審結(jié)果為平票時,本系統(tǒng)還支持多輪評審,直至票選出最優(yōu)項目。
3.4 后臺監(jiān)控進度
管理員可以通過后臺監(jiān)控模塊對專家評審結(jié)果進行實時的監(jiān)控分析,該界面顯示所有在評項目,支持對單個項目進行狀態(tài)監(jiān)控,在屏蔽掉專家基礎(chǔ)信息后僅顯示評審的進度,保護了在評專家的隱私信息。其總監(jiān)控界面如圖4所示。
4 結(jié)論
本文通過對中文分詞技術(shù)、相似度匹配算法以及專家檢索方法等進行研究,實現(xiàn)了專家遴選系統(tǒng)的設(shè)計,以達到準確地進行專家推薦的目的,最終建設(shè)一套可面向各領(lǐng)域項目評審的匹配度高的專家遴選系統(tǒng)。本項目的研究應用能夠為各種項目評審工作遴選出研究領(lǐng)域匹配度高的專家,保證項目評審的有效性和權(quán)威性,保證評審活動公平公正合理的進行。解決專家關(guān)鍵詞標注不規(guī)范、匹配不精確等已有專家遴選系統(tǒng)存在的問題。
參考文獻(References):
[1] 高琢玉.基于多目標決策的專家遴選算法的研究[D].中南大學博士學位論文,2011.4.
[2] 王嘉鵬.農(nóng)村信用社信貸項目評審專家智能管理軟件的設(shè)計與實現(xiàn)[D].電子科技大學碩士學位論文,2014.9.
[3] 鄭義平.基于非結(jié)構(gòu)化數(shù)據(jù)的專家綜合評價技術(shù)研究與應用[D].廣東工業(yè)大學碩士學位論文,2014.10.
[4] 陸偉,韓曙光.組織專家的檢索系統(tǒng)設(shè)計與實現(xiàn)[J].情報學報,2008.27(5):657-663
[5] 楊藝,余魯.精品課程智能評價系統(tǒng)設(shè)計[J].重慶工商大學學報(自然科學版),2013.30(10):96-102