国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于數(shù)據(jù)挖掘的高校人才科研能力綜合評(píng)價(jià)方法研究

2014-03-05 08:13莊新田
關(guān)鍵詞:數(shù)據(jù)挖掘關(guān)聯(lián)聚類

譚 雷,莊新田,韓 鵬

(1.東北大學(xué) 工商管理學(xué)院,遼寧 沈陽(yáng) 110819;2.東北大學(xué)秦皇島分校 人事處,河北 秦皇島 066004;3.東北大學(xué) 信息科學(xué)與工程學(xué)院,遼寧 沈陽(yáng) 110819)

科研人才是支撐國(guó)家和區(qū)域經(jīng)濟(jì)發(fā)展的核心因素[1-2],也是高校競(jìng)爭(zhēng)中重要而稀缺的資源。人才具有的綜合科研能力是高校的核心競(jìng)爭(zhēng)力,直接決定了整個(gè)高校的科研水平和發(fā)展?jié)摿?。因此,科學(xué)評(píng)價(jià)高校人才的科研能力、合理劃分高校人才梯隊(duì)層次、制定符合高校人才梯隊(duì)發(fā)展的人才工作措施,已成為近年來(lái)各大高校人才工作的研究熱點(diǎn)。

人才科研能力的多樣性要求現(xiàn)代高校的人才管理應(yīng)更具人性化、科學(xué)性和適應(yīng)性[3]。目前國(guó)內(nèi)高校人才工作中存在著人才觀念陳舊、人才管理機(jī)制滯后、人才引力不夠等問(wèn)題,針對(duì)這些問(wèn)題的研究主要依托工作經(jīng)驗(yàn)、績(jī)效推斷法與傳統(tǒng)人力資源理論[4],缺乏科學(xué)有效的信息技術(shù)作為支撐,無(wú)法適應(yīng)高校人才數(shù)量的增長(zhǎng)和類型的多樣化,難以滿足新時(shí)期人才工作的要求。而數(shù)據(jù)挖掘技術(shù)能很好地適合海量、動(dòng)態(tài)的高校人才信息,因而受到各界的廣泛關(guān)注,并在國(guó)內(nèi)高校的人事工作上得到了初步應(yīng)用。其中,高建偉等[5]研究了數(shù)據(jù)挖掘在引進(jìn)人才尤其是引進(jìn)高層次人才研究中的應(yīng)用,但是其關(guān)聯(lián)分析置信度較低,影響了所提策略的可用性;白菲等[6]采用數(shù)據(jù)挖掘的方法對(duì)高校人才庫(kù)進(jìn)行了分析,但是其僅利用了人事信息而未考慮科研信息中的重要評(píng)價(jià)指標(biāo)對(duì)人才類型劃分的影響;鄭春香等[7]應(yīng)用數(shù)據(jù)挖掘技術(shù)對(duì)高校人力資源數(shù)據(jù)源中的信息進(jìn)行分析,但其方法不能得到每一類關(guān)聯(lián)的置信度等信息;李峰等[8]研究了人才科研指數(shù)與人才水平的關(guān)系,但是其采用基于K-means算法的聚類方法,存在無(wú)法處理分類型變量、易受極端數(shù)據(jù)值影響的弱點(diǎn)[9],不利于大規(guī)模的人才信息處理。

綜合既有的研究成果,本文基于數(shù)據(jù)挖掘技術(shù),根據(jù)高校人才的科研數(shù)據(jù)特點(diǎn),設(shè)計(jì)適用于高校人才工作的數(shù)據(jù)挖掘分析方法,并將相關(guān)參數(shù)結(jié)合信息庫(kù)和數(shù)據(jù)挖掘平臺(tái),制作程序模塊,從而實(shí)現(xiàn)高校人才科研能力批量、實(shí)時(shí)跟蹤評(píng)價(jià)。

一、適用于高校人才的數(shù)據(jù)挖掘分析方法

1.高校人才的科研能力在數(shù)據(jù)方面的特點(diǎn)

高校人才的科研能力在數(shù)據(jù)方面有許多特點(diǎn)。首先,人才的評(píng)價(jià)因素多樣、數(shù)據(jù)類型復(fù)雜、條目繁多,數(shù)值呈現(xiàn)出天然的異構(gòu)性;其次,高校人才群體呈現(xiàn)天然的多層次性,由于高校人才的科研路徑、時(shí)間、背景、成果存在不同,其科研水平的表現(xiàn)形式具有方向性的差異;再次,人才的影響因素具有變化性,科研能力的影響因素不僅取決于個(gè)體本身,還受到資源與團(tuán)隊(duì)等諸多外界因素的影響。因此,對(duì)于復(fù)雜多樣而且嬗變的高校人才信息影響因素,傳統(tǒng)人事工作中的人才測(cè)評(píng)或勝任力模型難以勝任,而數(shù)據(jù)挖掘技術(shù)為解決這類問(wèn)題提供了新的方法。

2.人才科研能力測(cè)評(píng)方法的構(gòu)建

本文基于數(shù)據(jù)挖掘技術(shù)進(jìn)行人才科研能力的建模。數(shù)據(jù)挖掘(data mining)是一門(mén)涉及數(shù)理統(tǒng)計(jì)技術(shù)、人工智能及知識(shí)工程等領(lǐng)域的新興交叉學(xué)科[10]。數(shù)據(jù)挖掘又稱數(shù)據(jù)庫(kù)知識(shí)發(fā)現(xiàn)(KDD),是從大量的、不完全的、有噪聲的、模糊隨機(jī)的數(shù)據(jù)中提取未知但有價(jià)值的信息和知識(shí)的復(fù)雜過(guò)程,是一類深層次的數(shù)據(jù)分析方法[11]。本文主要采用數(shù)據(jù)挖掘中的聚類分析、關(guān)聯(lián)分析方法對(duì)高校人才數(shù)據(jù)庫(kù)進(jìn)行數(shù)據(jù)挖掘。其中,聚類分析通過(guò)選擇一定的評(píng)價(jià)指標(biāo)作為細(xì)分變量,按照一定的劃分標(biāo)準(zhǔn)對(duì)人才群體進(jìn)行分類;關(guān)聯(lián)分析用于發(fā)掘大量數(shù)據(jù)中項(xiàng)集之間有意義的關(guān)聯(lián),在人才評(píng)價(jià)指標(biāo)信息與人才類型之間進(jìn)行規(guī)則挖掘,以期尋找影響人才發(fā)展的主要因素。通過(guò)聚類分析和關(guān)聯(lián)分析,進(jìn)而構(gòu)建科研能力評(píng)價(jià)模型,使數(shù)據(jù)庫(kù)中海量異構(gòu)的信息得到有效整合,匯聚、抽取、提升為規(guī)律性強(qiáng)的、可用性高的科研能力信息,使有關(guān)政策有的放矢,為科技人才管理提供有用的決策信息,從而幫助高校人事部門(mén)改進(jìn)人才引進(jìn)策略和激勵(lì)方案。

二、高校人才科研能力聚類分析

1.人才科研能力評(píng)價(jià)指標(biāo)的劃分

科研能力評(píng)價(jià)指標(biāo)體系主要來(lái)源于創(chuàng)新投入、創(chuàng)新產(chǎn)出、創(chuàng)新資源三個(gè)方面[12]:創(chuàng)新投入認(rèn)為創(chuàng)新能力的來(lái)源在于創(chuàng)新投入,主要從資金、人力投入等方面提取評(píng)價(jià)指標(biāo);創(chuàng)新產(chǎn)出認(rèn)為傳統(tǒng)的科研創(chuàng)新產(chǎn)出反映了科研與創(chuàng)新能力,主要從論文、專著、專利、承擔(dān)項(xiàng)目、科技成果獎(jiǎng)勵(lì)及人才培養(yǎng)等方面總結(jié)評(píng)價(jià)指標(biāo);創(chuàng)新資源認(rèn)為科研創(chuàng)新能力的強(qiáng)弱與參與科研的人力資源和設(shè)備資源等相聯(lián)系,主要從人員、設(shè)備、設(shè)施等方面提出評(píng)價(jià)指標(biāo)。通過(guò)對(duì)組織科技創(chuàng)新能力評(píng)價(jià)和某高?,F(xiàn)有人才科研能力與科研成果的梳理,本文綜合借鑒以上三種觀點(diǎn),通過(guò)咨詢相關(guān)專家,同時(shí)結(jié)合高校實(shí)際情況,選取了具有代表性的科研能力評(píng)價(jià)指標(biāo),見(jiàn)表1。

表1 科研能力評(píng)價(jià)指標(biāo)

2.評(píng)價(jià)指標(biāo)數(shù)據(jù)庫(kù)的樣本聚類預(yù)處理

首先對(duì)樣本進(jìn)行分析和預(yù)處理,由于樣本總體的人事數(shù)據(jù)與科研數(shù)據(jù)的來(lái)源的統(tǒng)計(jì)方式不同,匯總的樣本包含大量異構(gòu)信息,因此須先通過(guò)數(shù)據(jù)篩選、清洗、離散化等預(yù)處理步驟,實(shí)現(xiàn)數(shù)據(jù)的規(guī)范化。本文根據(jù)特征變量值離散化準(zhǔn)則,對(duì)表格進(jìn)行匿名化和編碼,對(duì)特征值較多的范圍型特征變量進(jìn)行離散化,概化為較少的特征值,以加快聚類處理速度,獲得優(yōu)良的聚類結(jié)果。預(yù)處理后的樣本向量如下:

其中,N為樣本集合的容量;xiq為樣本集合中第i個(gè)樣本Xi中的第q個(gè)屬性值。

3.基于兩步聚類算法的聚類分析

兩步聚類(two-step clustering)算法首先通過(guò)預(yù)聚類對(duì)樣本集合進(jìn)行粗略劃分,進(jìn)而根據(jù)親疏程度差別進(jìn)行對(duì)子類的合并,實(shí)現(xiàn)聚類[12]。該算法克服了K-means算法的缺點(diǎn),能夠有效診斷樣本中的離群點(diǎn)和噪聲數(shù)據(jù)。采用數(shù)據(jù)挖掘平臺(tái)SPSS Clementine搭建聚類分析數(shù)據(jù)流如圖1所示。

其中,人事數(shù)據(jù)與科研數(shù)據(jù)經(jīng)合并、過(guò)濾后,填入各評(píng)價(jià)指標(biāo),并經(jīng)由分箱標(biāo)準(zhǔn)化后采樣輸入兩步聚類算法。為進(jìn)一步提高聚類的準(zhǔn)確性,對(duì)數(shù)值型聚類變量采用F檢驗(yàn)法進(jìn)行檢驗(yàn),令假設(shè)為各聚類變量均值無(wú)顯著差異;對(duì)分類型變量采用卡方檢驗(yàn)法進(jìn)行檢驗(yàn),零假設(shè)為各類別分布無(wú)顯著差異。運(yùn)行建立的聚類分析數(shù)據(jù)流,即可獲得所用數(shù)據(jù)庫(kù)的聚類分析結(jié)果。

圖1 聚類分析數(shù)據(jù)流圖

三、高校人才科研能力關(guān)聯(lián)分析

1.基于Apriori算法的關(guān)聯(lián)分析

在聚類分析的基礎(chǔ)上,為充分利用其分析結(jié)果,發(fā)現(xiàn)人才各個(gè)評(píng)價(jià)因素與人才科研能力類型的關(guān)聯(lián)規(guī)律性,為人事部門(mén)在人才引進(jìn)、選拔等工作提供數(shù)據(jù)支撐,本文采用關(guān)聯(lián)分析對(duì)聚類結(jié)果進(jìn)行進(jìn)一步挖掘,采用基于兩階段頻集思想的Apriori廣度優(yōu)先算法,其利用頻繁項(xiàng)集非單調(diào)性,自底向上地搜索整個(gè)數(shù)據(jù)源,通過(guò)迭代檢索出事務(wù)數(shù)據(jù)庫(kù)中所有頻繁項(xiàng)集,進(jìn)而利用頻繁項(xiàng)集構(gòu)造出滿足預(yù)設(shè)條件的關(guān)聯(lián)規(guī)則[13]。本文對(duì)所用數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析的數(shù)據(jù)流如圖2所示。

圖2 關(guān)聯(lián)分析數(shù)據(jù)流圖

2.關(guān)聯(lián)分析的結(jié)果篩選

本文利用支持度、置信度對(duì)關(guān)聯(lián)分析結(jié)果進(jìn)行了篩選。其中支持度反映關(guān)聯(lián)是否是普遍存在規(guī)律,對(duì)于關(guān)聯(lián)規(guī)則M?N,可表示為:

可信度反映本研究所得關(guān)聯(lián)規(guī)則的預(yù)測(cè)強(qiáng)度,即規(guī)則成立概率。M?N的可信度求解公式如下:

四、算例分析與提升策略

1.算例構(gòu)建與計(jì)算機(jī)仿真

本文隨機(jī)抽取某高校的科研人員,組成樣本數(shù)為379的總體,選取了該高校最新的研究人員人事數(shù)據(jù)與近三年的科研累計(jì)數(shù)據(jù),基于預(yù)設(shè)的評(píng)價(jià)指標(biāo)基于SPSS Clementine平臺(tái)進(jìn)行計(jì)算機(jī)仿真實(shí)驗(yàn),并對(duì)仿真結(jié)果進(jìn)行了分析。

選取檢驗(yàn)統(tǒng)計(jì)量為1.0的聚類變量組成聚類結(jié)果,經(jīng)整理后發(fā)現(xiàn),該校人才樣本被明顯劃分為四類。根據(jù)其聚類變量的整體表現(xiàn),將其分類為骨干、潛力、資深、低效四種類型的人才。其中,骨干型人才的整體年齡、教齡較小,多來(lái)自于該校和除該校以外的985高校的優(yōu)秀博士,職稱集中于副高級(jí)和中級(jí)職稱。這類人群呈現(xiàn)很高的論文寫(xiě)作、活動(dòng)參與和縱向項(xiàng)目開(kāi)發(fā)能力,發(fā)表論文質(zhì)量較高,但在學(xué)術(shù)組織中參與較少,橫向項(xiàng)目開(kāi)發(fā)能力較弱;潛力人才主要由包括本校在內(nèi)的國(guó)內(nèi)985/211類院校的普通博士、碩士畢業(yè)生組成,年齡、教齡均很小,各方面科研能力尚未起步,整體職稱較低;資深型人才主要由學(xué)校中年齡、教齡較大的高級(jí)/副高級(jí)專家組成,他們積極參與學(xué)術(shù)組織并擔(dān)任管理職務(wù),具有良好的科研水平、項(xiàng)目開(kāi)發(fā)能力與科研活動(dòng)能力,橫向項(xiàng)目開(kāi)發(fā)能力尤其突出,其學(xué)歷和來(lái)源學(xué)校受歷史原因的影響而呈現(xiàn)出多樣性;低效型群體包含教齡、年齡大,職稱低,尚無(wú)明顯科研成果的中年教師群體。

進(jìn)一步采用所提關(guān)聯(lián)分析方法確定評(píng)價(jià)因素與科研能力類型的聯(lián)系,經(jīng)篩選后各類型人才的典型關(guān)聯(lián)規(guī)則如表2所示。

表2 各類人才分類典型關(guān)聯(lián)規(guī)則 %

由表2可知,具有較高支持度和置信度的關(guān)聯(lián)規(guī)則與聚類分析得到的各類型人才特征基本匹配,且得到了適用于判斷各類型人才的基本方法。

2.基于數(shù)據(jù)挖掘的提升策略

在對(duì)該校人才科研能力類型與評(píng)價(jià)因素進(jìn)行充分的聚類分析和關(guān)聯(lián)分析基礎(chǔ)上,結(jié)合關(guān)聯(lián)規(guī)則和工作經(jīng)驗(yàn),進(jìn)一步細(xì)化和制定各類人才的考核方法,以利于對(duì)現(xiàn)有人才考核辦法進(jìn)行科學(xué)修訂,設(shè)計(jì)更好的人才評(píng)價(jià)體系。由本算例結(jié)果可得出以下主要結(jié)論:

(1)學(xué)緣關(guān)系對(duì)該??蒲星闆r影響較大。過(guò)半數(shù)留校教師對(duì)學(xué)校的科研工作沒(méi)有明顯貢獻(xiàn),其中非博士群體更為明顯;與之相對(duì),從985高校引進(jìn)的博士研究生均在入校短時(shí)間內(nèi)呈現(xiàn)出良好的科研能力。因此該校人才引進(jìn)中應(yīng)根據(jù)學(xué)校的實(shí)際情況,制定切實(shí)可行的高層次人才引進(jìn)的戰(zhàn)略規(guī)劃,注重引進(jìn)其他985高校的高學(xué)歷人才,并在現(xiàn)有科研隊(duì)伍中促進(jìn)不同的一流高校畢業(yè)教師的學(xué)術(shù)交流,改善該校的學(xué)緣結(jié)構(gòu)。

(2)骨干人才中學(xué)術(shù)組織參與度與橫向項(xiàng)目開(kāi)發(fā)能力較低。學(xué)術(shù)組織是科研人員拓寬視野、展現(xiàn)能力的有效平臺(tái),該校的這一資源主要被資深型人才群體掌握,而骨干型人才對(duì)學(xué)術(shù)組織的參與度較低,且資深型群體通過(guò)廣泛的學(xué)術(shù)關(guān)系與積累,在承擔(dān)橫向項(xiàng)目方面占據(jù)優(yōu)勢(shì)。因此應(yīng)充分發(fā)揮資深型人才作為學(xué)校寶貴資源的價(jià)值,鼓勵(lì)骨干型人才與之進(jìn)行充分交流,加強(qiáng)骨干型人才的學(xué)術(shù)交際,進(jìn)一步增強(qiáng)其橫向科研能力。

(3)各類型人才的科研能力差異化明顯。針對(duì)目前該校各類型人才的科研能力在各個(gè)評(píng)價(jià)指標(biāo)上均呈現(xiàn)明顯差異的情況,亟需針對(duì)不同類型設(shè)置富有針對(duì)性的人事/科研工作策略。對(duì)于骨干型人才宜采用較強(qiáng)的正向激勵(lì)制度,通過(guò)設(shè)置種子基金、科研經(jīng)費(fèi)、獎(jiǎng)金等方式,進(jìn)一步提高其科研水平,加速人才成長(zhǎng),形成拔尖梯隊(duì),同時(shí)幫助其進(jìn)行各類獎(jiǎng)項(xiàng)、項(xiàng)目的申報(bào),加速產(chǎn)生在國(guó)內(nèi)外具有重大影響的科研成果;對(duì)于資深型人才應(yīng)進(jìn)行針對(duì)性的細(xì)致工作,充分發(fā)揮每一位資深專家的資源性價(jià)值,帶動(dòng)學(xué)校整體科研能力的提高;對(duì)于潛力型人才應(yīng)加強(qiáng)引導(dǎo),鼓勵(lì)其加入骨干人才的科研院所,共同組成優(yōu)秀的學(xué)科梯隊(duì),構(gòu)成該??蒲械膬?chǔ)備力量,并為他們制定切實(shí)可行的發(fā)展計(jì)劃,提供各類進(jìn)修機(jī)會(huì),保證科研隊(duì)伍的可持續(xù)發(fā)展;對(duì)于低效型人才,其較低的科研效率不但會(huì)造成資源的浪費(fèi),也會(huì)制約學(xué)校整體科研水平的提升,因此在其考核指標(biāo)中應(yīng)制定負(fù)激勵(lì)措施,正確引導(dǎo)其價(jià)值取向,促使其加緊科研工作,并引入淘汰制度,對(duì)于能力表現(xiàn)不適于從事科研工作的人員進(jìn)行篩選淘汰。

五、結(jié) 語(yǔ)

本文基于數(shù)據(jù)挖掘技術(shù)劃分了適用于高校人才科研能力考察的評(píng)價(jià)指標(biāo),在此基礎(chǔ)上提出了采用聚類分析和關(guān)聯(lián)分析進(jìn)行人才科研能力的評(píng)價(jià)方法,并利用SPSS Clementine數(shù)據(jù)挖掘平臺(tái)對(duì)其進(jìn)行了實(shí)現(xiàn)。通過(guò)該平臺(tái),以某校人才數(shù)據(jù)為算例進(jìn)行了采樣和數(shù)據(jù)挖掘。算例表明本文所構(gòu)建的科研能力評(píng)價(jià)方法能夠很好地體現(xiàn)出人才的科研特征,具有較強(qiáng)可操作性。在今后的工作和研究中可進(jìn)一步利用數(shù)據(jù)挖掘技術(shù)對(duì)所提方法進(jìn)行檢驗(yàn)和修正,通過(guò)實(shí)際工作的運(yùn)用進(jìn)一步檢驗(yàn)研究成果的可用性,不斷提高該方法的準(zhǔn)確率,使之成為高校人事工作的重要信息支持工具,更好地為高校科研人才服務(wù)。

[1] 王疐曈.遼寧實(shí)施人才強(qiáng)省戰(zhàn)略面臨的問(wèn)題與對(duì)策研究[J].東北大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2005,7(6):422-425.

[2] 張?zhí)m霞,金環(huán).高層次人才隊(duì)伍建設(shè)與東北老工業(yè)基地振興[J].東北大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2004,6(2):111-114.

[3] 高艷.人力資源管理理論研究綜述[J].西北大學(xué)學(xué)報(bào):哲學(xué)社會(huì)科學(xué)版,2005,35(2):127-141.

[4] 陳慧.人力資源管理研究綜述[J].北京郵電大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2002,4(3):26-30.

[5] 高建偉,羅省賢.數(shù)據(jù)挖掘在人才引進(jìn)中的應(yīng)用[J].四川師范大學(xué)學(xué)報(bào):自然科學(xué)版,2005,28(1):123-126.

[6] 白菲,孟超英.數(shù)據(jù)挖掘技術(shù)在高校人才引進(jìn)中的應(yīng)用[J].太原大學(xué)學(xué)報(bào),2005,6(4):52-55.

[7] 鄭春香,董甲東.分類挖掘技術(shù)在高校人事管理中的應(yīng)用[J].信息技術(shù),2006(10):53-55.

[8] 李鋒,尹潔,吳潔,等.基于數(shù)據(jù)挖掘的高校人才引進(jìn)與培養(yǎng)策 略研究 [J].科技進(jìn)步與對(duì)策,2010,27(12):149-151.

[9] Amorim R C,Mirkin B.Minkowski Metric,F(xiàn)eature Weighting and Anomalous Cluster Initializing in K-means Clustering[J].Pattern Recognition,2012,45(3):1061-1075.

[10] Fayyad U M,Piatetsky-Shapiro G,Smyth P,et al.Advances in Knowledge Discovery and Data Mining[M].Palo Atto:American Association for Artificial Intelligence Press,1996:101-106.

[11] 熊平.數(shù)據(jù)挖掘算法與Clementine實(shí)踐[M].北京:清華大學(xué)出版社,2011:2-4.

[12] 吳小妹,陳敏玲,繆仁炳.基于科技創(chuàng)新人才信息平臺(tái)數(shù)據(jù)挖掘的科研能力評(píng)價(jià)模型研究[J].科技通報(bào),2011,27(1):154-160.

[13] 薛薇,陳歡歌.Clementine數(shù)據(jù)挖掘方法及應(yīng)用[M].北京:電子工業(yè)出版社,2010:279-286.

猜你喜歡
數(shù)據(jù)挖掘關(guān)聯(lián)聚類
不懼于新,不困于形——一道函數(shù)“關(guān)聯(lián)”題的剖析與拓展
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
基于K-means聚類的車-地?zé)o線通信場(chǎng)強(qiáng)研究
“一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
奇趣搭配
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
基于高斯混合聚類的陣列干涉SAR三維成像
智趣
基于Spark平臺(tái)的K-means聚類算法改進(jìn)及并行化實(shí)現(xiàn)
基于改進(jìn)的遺傳算法的模糊聚類算法