国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

NSTL原文傳遞服務(wù)用戶畫(huà)像分析

2019-04-18 01:50:48
醫(yī)學(xué)信息學(xué)雜志 2019年11期
關(guān)鍵詞:語(yǔ)種畫(huà)像原文

蔣 君 王 超 張 玢

(中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所/圖書(shū)館 北京 100005)

1 引言

隨著信息時(shí)代的到來(lái),跨領(lǐng)域多學(xué)科交叉研究不斷深化,任何一家圖書(shū)館的館藏資源都難以滿足用戶多樣化信息需求,需要通過(guò)文獻(xiàn)資源共享和文獻(xiàn)傳遞的方式來(lái)解決[1]。用戶畫(huà)像技術(shù)能夠較好地描述用戶特征和信息需求,在用戶和圖書(shū)館之間搭起交流橋梁,有利于驅(qū)動(dòng)原文傳遞的創(chuàng)新發(fā)展。

用戶畫(huà)像以數(shù)據(jù)分析為工具,通過(guò)對(duì)用戶屬性、行為等方面的挖掘,了解并跟蹤用戶的需求變化,從而進(jìn)行精準(zhǔn)營(yíng)銷[2]。最早提出用戶畫(huà)像概念的是交互設(shè)計(jì)之父A. Cooper,將其定義為基于用戶真實(shí)數(shù)據(jù)的虛擬代表。Rebecca M. Quintana將用戶畫(huà)像描述為一個(gè)從海量數(shù)據(jù)中獲取、由用戶信息構(gòu)成的形象集合,通過(guò)這個(gè)集合可以描述用戶偏好興趣等個(gè)性化需求[3]。在圖書(shū)情報(bào)領(lǐng)域,Amato G認(rèn)為信息提供者的最終目標(biāo)是滿足用戶的信息需求,為用戶定制用戶畫(huà)像[4]。Mao Jin探討基于標(biāo)簽的個(gè)性化推薦新方法[5]。王慶基于用戶畫(huà)像進(jìn)行圖書(shū)館資源推薦模式設(shè)計(jì)與分析,為圖書(shū)館開(kāi)展個(gè)性化服務(wù)提供新思路[6]。許鵬程在數(shù)據(jù)驅(qū)動(dòng)下進(jìn)行數(shù)字圖書(shū)館用戶畫(huà)像模型構(gòu)建,以促進(jìn)數(shù)字圖書(shū)館的知識(shí)服務(wù)升級(jí)[7]。陸堯針對(duì)區(qū)域圖書(shū)館聯(lián)盟文獻(xiàn)傳遞進(jìn)行用戶行為分析,提出改進(jìn)意見(jiàn)[8]。本文在國(guó)家科技圖書(shū)文獻(xiàn)中心(National Science and Technology Library,NSTL)原文傳遞的基礎(chǔ)上對(duì)用戶畫(huà)像進(jìn)行分析,以便精準(zhǔn)了解用戶需求,實(shí)現(xiàn)資源服務(wù)內(nèi)容精細(xì)化。

2 數(shù)據(jù)與方法

2.1 數(shù)據(jù)來(lái)源

中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所/圖書(shū)館(以下簡(jiǎn)稱醫(yī)科院圖書(shū)館)為NSTL的醫(yī)學(xué)分中心,面向全國(guó)科研單位提供醫(yī)學(xué)類信息服務(wù)工作。醫(yī)科院圖書(shū)館目前擁有醫(yī)學(xué)及相關(guān)學(xué)科高質(zhì)量數(shù)據(jù)庫(kù)91個(gè),電子期刊16 300余種,紙本期刊4 500余種,涵蓋基礎(chǔ)醫(yī)學(xué)、臨床醫(yī)學(xué)、藥學(xué)、公共衛(wèi)生等醫(yī)學(xué)各學(xué)科及化學(xué)、心理學(xué)等醫(yī)學(xué)交叉學(xué)科。本文選取醫(yī)科院圖書(shū)館2018年1月1日-12月31日期間通過(guò)NSTL原文傳遞系統(tǒng)向全國(guó)醫(yī)學(xué)科研機(jī)構(gòu)提供的80 866篇原文傳遞文獻(xiàn)為數(shù)據(jù)源。

2.2 研究方法

對(duì)80 866篇原文傳遞文獻(xiàn)進(jìn)行數(shù)據(jù)清洗和整理,采用文獻(xiàn)計(jì)量學(xué)方法分析原文傳遞的語(yǔ)種、出版年等外在特征,聚類分析法計(jì)算出文獻(xiàn)的領(lǐng)域特征,時(shí)序分析法分析用戶申請(qǐng)的時(shí)間規(guī)律,從用戶的行為信息和偏好興趣兩個(gè)維度對(duì)用戶畫(huà)像進(jìn)行分析,以便優(yōu)化資源建設(shè),改進(jìn)工作流程,提高工作效率和用戶滿意度。

2.3 分析框架

用戶畫(huà)像是一個(gè)長(zhǎng)期逐步完善的過(guò)程,其目標(biāo)是通過(guò)對(duì)用戶行為、偏好等方面分析,給用戶打上標(biāo)簽,以便精準(zhǔn)快速分析用戶行為習(xí)慣,為其提供個(gè)性化服務(wù)。NSTL原文傳遞用戶畫(huà)像是在原文傳遞的基礎(chǔ)上通過(guò)原文傳遞系統(tǒng)獲得用戶行為數(shù)據(jù)并進(jìn)行預(yù)處理,形成規(guī)范化用戶信息加以存儲(chǔ),然后對(duì)這些用戶信息進(jìn)行分類聚類等統(tǒng)計(jì)分析,勾勒出精確的用戶畫(huà)像,從而指導(dǎo)原文傳遞服務(wù)升級(jí)。用戶畫(huà)像分析框架,見(jiàn)圖1。

圖1 用戶畫(huà)像分析框架

3 用戶畫(huà)像構(gòu)建

3.1 用戶偏好

3.1.1 語(yǔ)種 2018年共有458位用戶通過(guò)NSTL原文傳遞服務(wù)平臺(tái)向醫(yī)科院圖書(shū)館申請(qǐng)?jiān)膫鬟f服務(wù),單個(gè)用戶最高申請(qǐng)次數(shù)為20 675次。醫(yī)科院圖書(shū)館發(fā)送原文傳遞文獻(xiàn)80 866篇,去重后為50 648篇,其中單篇最高發(fā)送量為81次。將80 866篇原文傳遞文獻(xiàn)按語(yǔ)種進(jìn)行分類,見(jiàn)表1??梢钥闯鲈奈墨I(xiàn)主要以外文文獻(xiàn)為主,占99.6%。同時(shí)還有33篇中文文獻(xiàn),全部是北京協(xié)和醫(yī)學(xué)院的學(xué)位論文。分析其原因主要是:(1)醫(yī)科院圖書(shū)館以外文文獻(xiàn)為主,國(guó)外許多重要期刊是從創(chuàng)刊開(kāi)始進(jìn)行收錄,覆蓋范圍廣泛。(2)國(guó)際上多數(shù)醫(yī)學(xué)期刊論文使用英文發(fā)表。(3)除使用英語(yǔ)的國(guó)家外,日本、法國(guó)、德國(guó)等國(guó)也有較好的醫(yī)學(xué)專業(yè)和醫(yī)學(xué)期刊,并且有些小語(yǔ)種(如匈牙利語(yǔ)、荷蘭語(yǔ)、波蘭語(yǔ)等)在國(guó)內(nèi)是獨(dú)家館藏。(4)中文文獻(xiàn)一般可以從中國(guó)知網(wǎng)或萬(wàn)方等網(wǎng)絡(luò)數(shù)據(jù)庫(kù)上查找全文,但北京協(xié)和醫(yī)學(xué)院的碩博論文只能在圖書(shū)館獲得。

表1 原文傳遞文獻(xiàn)語(yǔ)種分析

3.1.2 類型 80 866篇原文傳遞文獻(xiàn)共分為4種類型,見(jiàn)表2。在4種類型中期刊占絕大多數(shù),其他3種類型只有少量,這與其自身特點(diǎn)有關(guān):(1)期刊論文主要報(bào)道學(xué)術(shù)研究、學(xué)術(shù)創(chuàng)新點(diǎn)等成果,一般需要通過(guò)專家審稿,具有嚴(yán)謹(jǐn)性和連續(xù)性的特點(diǎn),且醫(yī)科院圖書(shū)館的外文醫(yī)學(xué)期刊較為豐富,是醫(yī)學(xué)研究人員首選。(2)會(huì)議論文是圍繞某個(gè)會(huì)議主題在特定領(lǐng)域內(nèi)的文章,是同領(lǐng)域內(nèi)最新、最前沿的成果匯總,能及時(shí)反映學(xué)科發(fā)展趨向,有一定的參考價(jià)值[9]。(3)學(xué)位論文是作者為獲得某種學(xué)位而撰寫(xiě)的研究報(bào)告或科學(xué)論文,具有一定獨(dú)創(chuàng)性,參考文獻(xiàn)多、全面,有助于對(duì)相關(guān)文獻(xiàn)進(jìn)行追蹤檢索[10],并且北京協(xié)和醫(yī)學(xué)院的學(xué)位論文是醫(yī)科院圖書(shū)館的特色館藏。(4)圖書(shū)的內(nèi)容比較系統(tǒng)、全面、成熟、可靠,但時(shí)效性不及其他類型文獻(xiàn),因此這類文獻(xiàn)用戶參考較少。對(duì)于這4種類型文獻(xiàn)所包含的語(yǔ)種,期刊論文涉及語(yǔ)種較多,由除中文外的其他多語(yǔ)種文獻(xiàn)組成,而學(xué)位論文僅包含中文文獻(xiàn),會(huì)議論文和叢書(shū)僅包含英文文獻(xiàn)。

表2 原文傳遞文獻(xiàn)類型分析

3.1.3 年代 原文傳遞文獻(xiàn)按出版年代分布,見(jiàn)圖2,可以看出:(1)1995-2018年每年都有申請(qǐng),基本上是年代越新申請(qǐng)量越大(2018年除外),說(shuō)明用戶非常重視文獻(xiàn)的時(shí)效性,希望獲得最前沿的科技成果。(2)2011-2018年的文獻(xiàn)占比為51%,超過(guò)半數(shù),2015-2017年這3年的文獻(xiàn)需求量最多,其中2015年的文獻(xiàn)超過(guò)6 000篇,說(shuō)明近3年的文獻(xiàn)是研究人員關(guān)注的重點(diǎn)。(3)2000年之前的文獻(xiàn)約占5.5%,主要集中在《生殖醫(yī)學(xué)雜志》(86篇,影響因子0.452,JCR分區(qū)Q4,婦產(chǎn)科)和《神經(jīng)外科學(xué)雜志》(83篇,影響因子4.319,JCR分區(qū)Q1,臨床神經(jīng)病外科學(xué))等期刊,說(shuō)明這些醫(yī)學(xué)期刊具有長(zhǎng)尾效應(yīng),對(duì)現(xiàn)在仍有影響。期刊、會(huì)議和學(xué)位論文3種原文傳遞文獻(xiàn)數(shù)量排名前3,將這3種類型分別按年代進(jìn)行排序,見(jiàn)圖3。期刊從1995-2018年都有使用,與總體趨勢(shì)一樣,年代越新使用量越大(2018年除外);會(huì)議論文重點(diǎn)關(guān)注前一年(2017年)的文獻(xiàn),共計(jì)21篇;學(xué)位論文涉及2010-2017年10年的文獻(xiàn),且每年2~3篇,分布比較均勻。

圖2 原文傳遞文獻(xiàn)年代分析

圖3 期刊類型文獻(xiàn)年代分析

3.1.4 來(lái)源 原文傳遞文獻(xiàn)共涉及3 883種來(lái)源文獻(xiàn),前360種期刊累計(jì)占比達(dá)50%。按文獻(xiàn)量倒序排列,選取排名前20位,累積占比9%,見(jiàn)表3??傮w來(lái)看:(1)排名前20位的來(lái)源文獻(xiàn)申請(qǐng)次數(shù)都在240以上,最高達(dá)558次。(2)20種來(lái)源文獻(xiàn)的JCR分區(qū),Q1、Q2、Q3、Q4分別占50%、10%、10%和25%,多數(shù)文獻(xiàn)分布在第1個(gè)分區(qū),說(shuō)明申請(qǐng)文獻(xiàn)的質(zhì)量較高。(3)排名前3的是《國(guó)際病毒學(xué)雜志》、《肝臟與胃腸病學(xué)》和《白血病和淋巴瘤》,這3種期刊的JCR分區(qū)均位于Q2~Q4,說(shuō)明用戶相對(duì)期刊來(lái)說(shuō),更看中單篇文獻(xiàn)的質(zhì)量。(4)3大頂級(jí)醫(yī)學(xué)期刊《柳葉刀》(Lancet)、《新英格蘭醫(yī)學(xué)雜志》(NEJM)、《美國(guó)醫(yī)學(xué)會(huì)雜志》(JAMA)分別位列第4、11和16位,影響因子較高,受到研究者的廣泛關(guān)注。(5)還有一種期刊《印度醫(yī)學(xué)會(huì)雜志》(第8位)未被收入SCI中,沒(méi)有影響因子和JCR分區(qū),但是文獻(xiàn)傳遞量較高,說(shuō)明用戶關(guān)注印度相關(guān)的醫(yī)學(xué)信息。

表3 前20位原文傳遞文獻(xiàn)來(lái)源分析

3.1.5 學(xué)科分類 將文獻(xiàn)按《中國(guó)圖書(shū)館圖書(shū)分類法》(以下簡(jiǎn)稱中圖法)進(jìn)行整理,除去沒(méi)有分類的1 934篇(暫歸為其他)外,共涉及中圖法12個(gè)大類,超過(guò)中圖法大類的50%,見(jiàn)圖4。其中R醫(yī)藥、衛(wèi)生領(lǐng)域最多,約占92%;其次是Q生物科學(xué),占4%;再次是O數(shù)理科學(xué)和化學(xué)、T工業(yè)技術(shù)、N自然科學(xué)總論、D政治法律、S農(nóng)業(yè)科學(xué)等與醫(yī)學(xué)相關(guān)學(xué)科;此外還包括X環(huán)境科學(xué)、G文化科學(xué)、B哲學(xué)宗教、C社會(huì)科學(xué)總論和P天文學(xué)等邊緣學(xué)科,表明這些學(xué)科與醫(yī)學(xué)有交叉研究。在2級(jí)類目中,R73腫瘤學(xué)、R9藥學(xué)的文獻(xiàn)傳遞量最大,其次是R6外科學(xué)、R75皮膚病學(xué)與性病學(xué)、R74神經(jīng)病學(xué)與精神病學(xué)等,由此得出這些領(lǐng)域是目前醫(yī)學(xué)人員研究的重點(diǎn)。在非醫(yī)藥衛(wèi)生領(lǐng)域,Q5生物化學(xué)、Q2細(xì)胞生物學(xué)、O6化學(xué)等領(lǐng)域文獻(xiàn)較多。

3.1.6 標(biāo)題聚類 從文獻(xiàn)標(biāo)題入手,運(yùn)用Gephi可視化關(guān)系網(wǎng)絡(luò)分析軟件對(duì)內(nèi)容進(jìn)行分析。首先將所有標(biāo)題進(jìn)行分詞,去除沒(méi)有意義的代詞、介詞、副詞、量詞等停用詞,選取詞頻在500以上的詞,對(duì)其進(jìn)行統(tǒng)計(jì)和聚類,揭示詞與詞之間的關(guān)聯(lián)關(guān)系,見(jiàn)圖5。通過(guò)分析可知這些文獻(xiàn)主要聚為4類:以臨床(clinical)為代表的粉色圖標(biāo)、以肌肉內(nèi)(intramuscular)為代表的綠色圖標(biāo)、以治療(treatment)為代表的橙色圖標(biāo)和以影響(effect)為代表的藍(lán)色圖標(biāo)。粉色圖標(biāo)主要與臨床、癥、腺癌、肝臟、肺、腫瘤、分子、基因、血清等有關(guān),代表腺癌、肝癌、肺癌等腫瘤在分子、基因和血清等方向的臨床研究;綠色圖標(biāo)主要與肌肉、治療管理、原發(fā)性、淋巴瘤、案例、外科、劑量、診斷等有關(guān),代表原發(fā)性淋巴瘤、肌肉瘤等案例的診斷和手術(shù);橙色圖標(biāo)主要與治療、注射、藥物、慢性、急性、疾病、風(fēng)險(xiǎn)等有關(guān),代表慢性或急性疾病的注射或藥物治療及其風(fēng)險(xiǎn)因素。藍(lán)色圖標(biāo)主要說(shuō)明相關(guān)影響。各類內(nèi)關(guān)系密切,各類間也有相互關(guān)聯(lián),連接的粗細(xì)代表關(guān)聯(lián)強(qiáng) 度。

圖4 原文傳遞文獻(xiàn)學(xué)科分類

圖5 標(biāo)題聚類分析

3.2 用戶行為

提交申請(qǐng)時(shí)間不僅可以反映用戶工作習(xí)慣,還便于醫(yī)科院圖書(shū)館根據(jù)需求量大小更好地安排工作。以下從工作日、月份、周期和時(shí)段4個(gè)時(shí)間維度對(duì)用戶提交時(shí)間進(jìn)行分析。從工作日來(lái)看,周一到周五的原文傳遞提交量相對(duì)較多,周末較少。周三是用戶提交需求的高峰期,周二和周四其次,兩頭最少,見(jiàn)圖6。從提交月份來(lái)看,10月、11月是最高峰,其次是7月和9月,然后是1月、3月和5月,見(jiàn)圖7。這與申報(bào)獎(jiǎng)項(xiàng)、課題和職稱評(píng)定有一定關(guān)系。從提交周期來(lái)看,第41周(10月7-13日)提交需求最多,其次是第17周(4月22-28日)、37周(9月9-15日)和48周(11月25日-12月1日),基本上都在提交月份的高峰期內(nèi),見(jiàn)圖8。其中第41周與十一放假后需求積壓反彈有關(guān)聯(lián)。從提交時(shí)段來(lái)看,在24個(gè)時(shí)點(diǎn)中有3個(gè)高峰期:9-11點(diǎn)是第1個(gè)高峰期,也是提交量最大的時(shí)間段,12-16點(diǎn)是第2個(gè)高峰期,20-22點(diǎn)又迎來(lái)一個(gè)小高峰,見(jiàn)圖9。從用戶原文傳遞申請(qǐng)的全年時(shí)間分布分析,總體來(lái)說(shuō)用戶在10月節(jié)后第1個(gè)星期和4月、11月最后1個(gè)星期的周二到周四上午9-11點(diǎn)提交的申請(qǐng)最多,可以提前做好準(zhǔn)備,根據(jù)需求量大小對(duì)工作人員進(jìn)行相應(yīng)調(diào)整,以便更好地為用戶服務(wù)。

圖6 提交工作日分析

圖7 提交月份分析

圖8 提交周期分析

圖9 提交時(shí)段分析

4 啟示與建議

4.1 關(guān)注用戶需求,適時(shí)調(diào)整館藏資源

從原文傳遞的分析結(jié)果可以看出大部分用戶關(guān)注腫瘤學(xué)、藥學(xué)、外科等領(lǐng)域資源及一些重點(diǎn)期刊,適當(dāng)加強(qiáng)相應(yīng)學(xué)科的資源建設(shè)將更好地滿足用戶需求。原文傳遞需求的學(xué)科分布將是加強(qiáng)針對(duì)性資源建設(shè)的參考,應(yīng)定期向資源建設(shè)部反映館內(nèi)發(fā)送申請(qǐng)的情況,以便圖書(shū)館在購(gòu)買新增資源時(shí)參考。

4.2 注重文獻(xiàn)種類多樣性,文獻(xiàn)語(yǔ)種多樣化

從用戶需求特征看,期刊文獻(xiàn)的需求量最大,但會(huì)議論文、學(xué)位論文和叢書(shū)也有需求,可能以后還包括標(biāo)準(zhǔn)、專利、科技報(bào)告等其他類型文獻(xiàn)。從用戶對(duì)文獻(xiàn)語(yǔ)種的需求看,除英文外小語(yǔ)種文獻(xiàn)也占有一定比例。為滿足用戶需求的多樣化和個(gè)性化,建議文獻(xiàn)采集時(shí)盡量擴(kuò)充文獻(xiàn)類型和語(yǔ)種。

4.3 拓展特種文獻(xiàn)保障,完善館藏資源揭示

原文傳遞的關(guān)鍵是找到用戶需要的文獻(xiàn)資源,這就意味著對(duì)文獻(xiàn)要進(jìn)行全面的揭示和完善的查詢。目前圖書(shū)館中有少數(shù)館藏資源只保存紙質(zhì)版,尚沒(méi)有進(jìn)行數(shù)字化加工,難以實(shí)現(xiàn)統(tǒng)一揭示,尤其是一些珍貴的特藏文獻(xiàn),目前只有紙版保存。因此建議盡量實(shí)現(xiàn)圖書(shū)館的數(shù)字化處理,有利于文獻(xiàn)的長(zhǎng)久保存和有效利用。

4.4 預(yù)估工作強(qiáng)度,合理安排時(shí)間

根據(jù)用戶提交申請(qǐng)時(shí)間可以推斷出原文傳遞在每年的10月、11月達(dá)到高峰期,在每天的9-11點(diǎn)是一個(gè)高峰時(shí)段,可以根據(jù)分析結(jié)果預(yù)估工作量,做好工作安排,快捷高效地為用戶服務(wù)。

4.5 加強(qiáng)宣傳推廣,提高用戶滿意度

相對(duì)于館藏16 300余種電子期刊和4 500余種紙本期刊,原文傳遞文獻(xiàn)使用量相對(duì)較少。為使用戶能夠有效使用圖書(shū)館資源,應(yīng)不斷進(jìn)行原文傳遞服務(wù)的宣傳和推廣工作??梢圆捎冒l(fā)放宣傳手冊(cè)、舉辦講座、走進(jìn)課堂或者以公眾號(hào)的方式進(jìn)行宣傳,重點(diǎn)介紹圖書(shū)館館藏資源和原文傳遞的使用方法,為用戶提供參考。此外可以向注冊(cè)和潛在用戶發(fā)放調(diào)查問(wèn)卷,收集相關(guān)需求,以便及時(shí)改進(jìn),更好地為用戶服務(wù)。

5 結(jié)語(yǔ)

原文傳遞是數(shù)字時(shí)代傳統(tǒng)圖書(shū)館開(kāi)展主動(dòng)服務(wù)的一種表現(xiàn)形式。本文通過(guò)分析原文傳遞數(shù)據(jù),描述用戶畫(huà)像特征,建立以用戶需求和滿意度為出發(fā)點(diǎn)的原文傳遞服務(wù)形式,根據(jù)用戶畫(huà)像中的需求調(diào)整館藏資源,注重文獻(xiàn)種類的多樣性,完善館藏資源揭示,根據(jù)用戶請(qǐng)求時(shí)間分布,更加合理地安排工作,加強(qiáng)宣傳推廣,最終提高用戶滿意度。

猜你喜歡
語(yǔ)種畫(huà)像原文
威猛的畫(huà)像
《波斯語(yǔ)課》:兩個(gè)人的小語(yǔ)種
“00后”畫(huà)像
畫(huà)像
“一帶一路”背景下我國(guó)的外語(yǔ)語(yǔ)種規(guī)劃
讓句子動(dòng)起來(lái)
嘗糞憂心
賣身葬父
Performance of a double-layer BAF using zeolite and ceramic as media under ammonium shock load condition
潛行與畫(huà)像
武安市| 玛沁县| 连城县| 景德镇市| 万盛区| 东阳市| 元阳县| 肥西县| 榕江县| 馆陶县| 台州市| 北流市| 五台县| 吉林市| 莆田市| 句容市| 青州市| 桐柏县| 明溪县| 铜鼓县| 翁牛特旗| 清河县| 临泽县| 来宾市| 寿宁县| 广平县| 清镇市| 西乌珠穆沁旗| 连南| 遂昌县| 定安县| 阜新| 武川县| 新田县| 棋牌| 辉县市| 长沙县| 竹溪县| 资阳市| 凤冈县| 广元市|