国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于DEA結(jié)合技術(shù)的專家?guī)旌蜻x特征智能抽取均衡實(shí)現(xiàn)

2024-03-08 00:00:00陳柳王丹淋陳晗呂曉俊金奕
粘接 2024年12期
關(guān)鍵詞:關(guān)聯(lián)規(guī)則評(píng)價(jià)指標(biāo)

關(guān)鍵詞:DEA;關(guān)聯(lián)規(guī)則;專家數(shù)據(jù)庫;專業(yè)特征集;評(píng)價(jià)指標(biāo)

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1001-5922(2024)12-0173-05

評(píng)標(biāo)專家數(shù)據(jù)庫是收集和整理各位專家專業(yè)特征的信息并將其用于招標(biāo)評(píng)選的數(shù)據(jù)庫[1],通過對(duì)評(píng)標(biāo)專家數(shù)據(jù)庫的抽取[2],對(duì)投標(biāo)文件進(jìn)行評(píng)審和比較,以確定中標(biāo)人。在當(dāng)今的招標(biāo)過程中,評(píng)標(biāo)專家數(shù)據(jù)庫的隨機(jī)抽取算法越來越受到關(guān)注。如建立一個(gè)反饋機(jī)制,不斷更新專業(yè)特征工作記錄,并提取專業(yè)特征長(zhǎng)期和短期知識(shí)特征[3]。建立一個(gè)專業(yè)特征語料庫,構(gòu)造專業(yè)領(lǐng)域詞匯要素特征,并利用雙向門控神經(jīng)網(wǎng)絡(luò),提取特定詞語之間的依賴關(guān)系[4]。采集專業(yè)特征評(píng)審意見作為數(shù)據(jù)樣本,采用數(shù)據(jù)挖掘技術(shù)獲取知識(shí)元,基于此建立專業(yè)特征領(lǐng)域知識(shí)結(jié)構(gòu),給出科學(xué)的專業(yè)特征抽取結(jié)果[5]。

基于此,提出一種結(jié)合DEA與關(guān)聯(lián)規(guī)則的評(píng)標(biāo)專家數(shù)據(jù)庫隨機(jī)抽取算法,通過規(guī)則建立、獲取候選專業(yè)特征集、專業(yè)特征評(píng)價(jià)和隨機(jī)抽選等環(huán)節(jié),從庫中選取符合項(xiàng)目要求的評(píng)標(biāo)專業(yè)特征,期望能夠?yàn)轫?xiàng)目提供更好的專業(yè)支持,推動(dòng)項(xiàng)目的成功實(shí)施。

1結(jié)合DEA與關(guān)聯(lián)規(guī)則設(shè)計(jì)隨機(jī)抽取算法

1.1制定評(píng)標(biāo)專業(yè)特征挑選規(guī)則

從評(píng)標(biāo)專家數(shù)據(jù)庫內(nèi)抽取專業(yè)特征時(shí),需要考慮具體的項(xiàng)目需求和人數(shù)需求,指定專業(yè)特征挑選規(guī)則[6],以期最終隨機(jī)抽取結(jié)果滿足預(yù)期要求。每一次評(píng)標(biāo)專家數(shù)據(jù)庫隨機(jī)抽取過程中,專業(yè)特征被抽取概率可以表示為:

式中:i表示評(píng)標(biāo)專業(yè)特征;I表示評(píng)標(biāo)專家數(shù)據(jù)庫內(nèi)專業(yè)特征數(shù)量;P表示專業(yè)特征被抽取概率。

同時(shí),充分考慮庫內(nèi)每個(gè)評(píng)標(biāo)專業(yè)特征參加評(píng)價(jià)的次數(shù),并獲取專業(yè)特征參與項(xiàng)目次數(shù)分布圖。將其融入到后續(xù)評(píng)標(biāo)專家數(shù)據(jù)庫隨機(jī)抽取過程中,以專業(yè)特征挑選滿足均勻分布為目標(biāo),給出關(guān)于專業(yè)特征人數(shù)的挑選規(guī)則。

式中:N表示專業(yè)特征挑選人數(shù);δ表示庫內(nèi)評(píng)標(biāo)專業(yè)特征已參與項(xiàng)目的次數(shù)。

最后,考慮到評(píng)標(biāo)專業(yè)特征被挑選概率分布是不能直接獲取的,將其看做一個(gè)不確定性量,引入信息熵思想用來度量概率分布。

式中:E表示信息熵值;L表示取極大值的函數(shù)。

通過式(3)解析出評(píng)標(biāo)專家數(shù)據(jù)庫中每個(gè)專業(yè)特征的隨機(jī)抽取概率,通過選取信息熵極大值,確保評(píng)標(biāo)專家數(shù)據(jù)庫內(nèi)眾多專業(yè)特征的任意選擇趨于均衡[7],避免出現(xiàn)評(píng)標(biāo)專業(yè)特征被忽略的情況。

1.2設(shè)計(jì)基于關(guān)聯(lián)規(guī)則的候選專業(yè)特征聚類算法

在給出多條評(píng)標(biāo)專業(yè)特征挑選規(guī)則后,運(yùn)用關(guān)聯(lián)規(guī)則算法,計(jì)算當(dāng)前評(píng)標(biāo)專家數(shù)據(jù)庫中各個(gè)專業(yè)特征的支持度和可信度,并觀察不同評(píng)標(biāo)專業(yè)特征之間的相似程度,實(shí)現(xiàn)專業(yè)特征聚類,形成候選專業(yè)特征集合[8]。通常情況下,一條關(guān)聯(lián)規(guī)則是由規(guī)則前件和規(guī)則后件組成的,二者分別對(duì)應(yīng)著支持度項(xiàng)集、可信度項(xiàng)集。以任意2名專業(yè)特征為例,前者對(duì)后者給出的支持度和置信度分別可以表示為:

假如2名評(píng)標(biāo)專業(yè)特征之間不存在關(guān)聯(lián)規(guī)則,即可判斷二者之間的置信度為0。針對(duì)關(guān)聯(lián)矩陣中相同位置的值進(jìn)行加權(quán)平均計(jì)算,得到原始矩陣的對(duì)稱矩陣,更準(zhǔn)確地反映不同專業(yè)特征之間的關(guān)聯(lián)程度。以此為基礎(chǔ)進(jìn)行評(píng)標(biāo)專業(yè)特征的模糊C均值聚類,給定聚類目標(biāo)函數(shù)如式(7)所示。

式中:J表示模糊C均值聚類目標(biāo)函數(shù);U表示隸屬度集合;g表示聚類中心;G表示評(píng)標(biāo)專業(yè)特征聚類的個(gè)數(shù);?表示加權(quán)指數(shù);ε表示隸屬度;d表示聚類中心與專業(yè)特征之間的模糊距離。

通過對(duì)式(7)求解,得出最優(yōu)模糊C均值聚類結(jié)果,將庫內(nèi)的所有評(píng)標(biāo)專業(yè)特征分為多個(gè)聚類,觀察每個(gè)類別中的專業(yè)特征是否能夠滿足挑選規(guī)則,找到滿足挑選規(guī)則的分類,得到滿足均衡性要求的候選評(píng)標(biāo)專業(yè)特征集合。

1.3建立評(píng)標(biāo)專業(yè)特征評(píng)價(jià)指標(biāo)體系

考慮到專業(yè)特征抽取的影響條件繁多,在已知候選評(píng)標(biāo)專業(yè)特征集合的情況下,深入分析眾多專業(yè)特征選取影響因素,并應(yīng)用層次分析法,構(gòu)建圖1所示的評(píng)標(biāo)專業(yè)特征綜合素質(zhì)評(píng)價(jià)指標(biāo)體系。通過該指標(biāo)體系全面評(píng)估每一名候選專業(yè)特征的專業(yè)能力和基本能力[9],只有符合候選企業(yè)需求的專業(yè)特征才能被抽取出來。

由圖1可知,在分析不同評(píng)標(biāo)專業(yè)特征綜合素質(zhì)時(shí),分別從基礎(chǔ)能力、評(píng)標(biāo)能力、評(píng)標(biāo)態(tài)度和其他方面,選定專業(yè)特征綜合素質(zhì)評(píng)價(jià)指標(biāo)。并在方案層中,針對(duì)所有指標(biāo)進(jìn)行兩兩對(duì)比,判斷所有專業(yè)特征抽取影響指標(biāo)之間的相對(duì)重要程度,給定指標(biāo)權(quán)重系數(shù),針對(duì)指標(biāo)權(quán)重系數(shù)和指標(biāo)評(píng)分進(jìn)行加權(quán)計(jì)算,獲取專業(yè)特征綜合素質(zhì)評(píng)估結(jié)果。

1.4構(gòu)建DEA評(píng)標(biāo)專家數(shù)據(jù)庫隨機(jī)抽取模型

為了確保專業(yè)特征智能隨機(jī)抽取結(jié)果更加準(zhǔn)確,將數(shù)學(xué)規(guī)劃領(lǐng)域的數(shù)據(jù)包絡(luò)分析法引入到隨機(jī)抽取方案確定過程中,將每個(gè)抽取方案看作一個(gè)決策單元,通過比較多個(gè)決策單元的相對(duì)效率,對(duì)候選評(píng)標(biāo)專業(yè)特征進(jìn)行定級(jí)排隊(duì)[10]。以任意一輸入變量為例,其對(duì)應(yīng)的決策單元有7個(gè),將其投影到目標(biāo)空間內(nèi),可以得到圖2所示的DMU投影結(jié)果。

由圖2可知,連接決策單元投影點(diǎn)3、5、1、6和7,再引伸一段垂直線和水平線,即可形成分段線型的“最小凸包”,保證所有投影點(diǎn)都位于“最小凸包”的上方,這種情況下“最小凸包”就可以充當(dāng)理想邊界。以此為基礎(chǔ)篩選所有輸入分量。假設(shè)當(dāng)前存在多個(gè)可供隨機(jī)抽取的候選評(píng)標(biāo)專業(yè)特征,可以構(gòu)成數(shù)個(gè)評(píng)標(biāo)專家數(shù)據(jù)庫隨機(jī)抽取方案,每個(gè)隨機(jī)抽取方案的評(píng)價(jià)指標(biāo)中包含幾個(gè)獨(dú)立的公共因子,而輸入變量中又存在特殊因子,將公共因子和特殊因子線性組合起來,即可得到因子分析數(shù)學(xué)模型,提取發(fā)揮主導(dǎo)作用的因子。

確定評(píng)價(jià)指標(biāo)體系主因子之后,將評(píng)標(biāo)專業(yè)特征綜合素質(zhì)評(píng)價(jià)結(jié)果也看作DEA模型的一項(xiàng)輸入指標(biāo),通過DEA模型評(píng)價(jià)每個(gè)評(píng)標(biāo)專業(yè)特征參與項(xiàng)目的投入產(chǎn)出效率,從而實(shí)現(xiàn)評(píng)標(biāo)專家數(shù)據(jù)庫的有效隨機(jī)抽取。以任意一個(gè)決策單元為例,將其對(duì)應(yīng)的投入產(chǎn)出模型結(jié)果表示如圖3。

圖3中,m表示投入單元數(shù)量;n表示決策單元數(shù)量;p表示產(chǎn)出單元數(shù)量;a、b分別表示輸入、輸出單元的度量權(quán)重;o表示輸入的投入量;u表示輸出的產(chǎn)出量。

求出式(9)的最優(yōu)解,最優(yōu)解取值為1是DEA有效的充分必要條件,利用上述模型進(jìn)行一系列推算,得到DEA模型認(rèn)可的方案,這些專業(yè)特征挑選方案的投入和產(chǎn)出水平是合理的,可以作為專業(yè)特征智能隨機(jī)抽取結(jié)果。

2實(shí)驗(yàn)結(jié)果與分析

2.1評(píng)標(biāo)專家數(shù)據(jù)庫基本情況

在測(cè)試基于DEA與關(guān)聯(lián)規(guī)則的新型抽取算法應(yīng)用效果時(shí),選定四川省多個(gè)行業(yè)廳局組成的評(píng)標(biāo)專家數(shù)據(jù)庫作為研究對(duì)象,該專家數(shù)據(jù)庫內(nèi)的記錄人員涵蓋了17個(gè)行業(yè)廳局。經(jīng)過統(tǒng)計(jì)可知,該評(píng)標(biāo)專家數(shù)據(jù)庫內(nèi)共存在7822名專業(yè)特征,具體分布情況如表1所示。

為了簡(jiǎn)化評(píng)標(biāo)專家數(shù)據(jù)庫隨機(jī)抽取算法的實(shí)驗(yàn)過程,從上述專家數(shù)據(jù)庫內(nèi)選定10名專業(yè)特征作為備選,這10名專業(yè)特征在2020~2023年的挑選概率如圖4所示。

運(yùn)用新研究算法按照項(xiàng)目要求產(chǎn)生專業(yè)特征抽取結(jié)果,以此來體現(xiàn)結(jié)合DEA與關(guān)聯(lián)規(guī)則的新算法的優(yōu)越效果。此外,將文獻(xiàn)[3]和文獻(xiàn)[4]給出算法應(yīng)用到實(shí)驗(yàn)過程中,作為新研究算法的對(duì)照組,以便更加直觀地展現(xiàn)新算法的應(yīng)用價(jià)值。

2.2專業(yè)特征隨機(jī)抽取結(jié)果

為了便于驗(yàn)證隨機(jī)抽取算法,以此為核心開發(fā)一個(gè)評(píng)標(biāo)專家數(shù)據(jù)庫隨機(jī)抽取平臺(tái),根據(jù)招標(biāo)項(xiàng)目評(píng)價(jià)要求,在專業(yè)特征自動(dòng)抽取頁面設(shè)置多條抽取條件,如圖5所示。

通過關(guān)聯(lián)規(guī)則聚類、專業(yè)特征綜合素質(zhì)評(píng)估、隨機(jī)抽取方案驗(yàn)證等環(huán)節(jié),給出最終抽取結(jié)果,如圖6所示。

由圖6可知,專業(yè)特征隨機(jī)抽取結(jié)果顯示了專業(yè)特征編號(hào)、姓名、第一專業(yè)和職稱。整體來看,該結(jié)果基本滿足了圖5所示的抽取條件,這證明了新研究算法是可行的。

2.3均衡性分析

為了避免評(píng)標(biāo)專家數(shù)據(jù)庫內(nèi)的部分專業(yè)特征出現(xiàn)坐冷板凳的情況,在設(shè)計(jì)隨機(jī)抽取算法時(shí)需要滿足均衡性要求。因此,本次實(shí)驗(yàn)過程中也針對(duì)這一評(píng)估內(nèi)容進(jìn)一步測(cè)試,應(yīng)用3種算法重復(fù)進(jìn)行多次評(píng)標(biāo)專業(yè)特征隨機(jī)抽取,并統(tǒng)計(jì)不同評(píng)標(biāo)專業(yè)特征被抽取次數(shù),得到圖7所示的統(tǒng)計(jì)結(jié)果。

由圖7可以看出,結(jié)合DEA和關(guān)聯(lián)規(guī)則的新算法應(yīng)用后,數(shù)次隨機(jī)抽取結(jié)果顯示每名專業(yè)特征的被抽取次數(shù)都在30~35次之間,沒有出現(xiàn)特別大的差異,證明了其良好的均衡能力。而2種文獻(xiàn)給出算法隨機(jī)抽取結(jié)果中,專業(yè)特征被抽取次數(shù)存在過多和過少情況,相對(duì)來說依舊存在非均衡問題。

3結(jié)語

提出了一種基于DEA結(jié)合技術(shù)的專家數(shù)據(jù)庫專業(yè)特征智能隨機(jī)抽取均衡實(shí)現(xiàn)方法,該算法能夠綜合考慮項(xiàng)目需求、專業(yè)特征的專業(yè)領(lǐng)域、技術(shù)水平、工作效率等多方面因素,提高專業(yè)特征抽取的準(zhǔn)確性和均衡性。在未來的研究中,將繼續(xù)深入探討DEA和關(guān)聯(lián)規(guī)則在評(píng)標(biāo)專家數(shù)據(jù)庫隨機(jī)抽取算法中的應(yīng)用,不斷完善和優(yōu)化算法性能,為招標(biāo)過程中的評(píng)標(biāo)專家數(shù)據(jù)庫隨機(jī)抽取提供更加準(zhǔn)確、高效的方法。

猜你喜歡
關(guān)聯(lián)規(guī)則評(píng)價(jià)指標(biāo)
基于Apriori算法的高校學(xué)生成績(jī)數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析
基于關(guān)聯(lián)規(guī)則和時(shí)間閾值算法的5G基站部署研究
關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
數(shù)據(jù)挖掘在高校課堂教學(xué)質(zhì)量評(píng)價(jià)體系中的應(yīng)用
旅游產(chǎn)業(yè)與文化產(chǎn)業(yè)融合理論與實(shí)證分析
中國(guó)藥品安全綜合評(píng)價(jià)指標(biāo)體系研究
第三方物流企業(yè)績(jī)效評(píng)價(jià)研究綜述
商(2016年33期)2016-11-24 23:50:25
基于UML的高校思想政治教育工作評(píng)價(jià)系統(tǒng)的分析與研究
公共文化服務(wù)體系評(píng)價(jià)指標(biāo)的國(guó)際經(jīng)驗(yàn)與啟示
關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進(jìn)
农安县| 吉林省| 灵川县| 金沙县| 白河县| 昆山市| 慈溪市| 通城县| 抚顺县| 芷江| 信阳市| 富裕县| 格尔木市| 哈密市| 漳浦县| 安龙县| 平果县| 嘉黎县| 鄂伦春自治旗| 平乡县| 大厂| 汉阴县| 东安县| 博兴县| 武义县| 平顶山市| 长治市| 晋中市| 县级市| 百色市| 南投县| 哈密市| 鸡东县| 临夏市| 蕉岭县| 健康| 徐汇区| 防城港市| 大渡口区| 苍溪县| 宾川县|