国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

高校圖書館典型用戶群體電子資源行為數(shù)據(jù)分析實(shí)證研究*
——基于創(chuàng)文圖書館電子資源綜合管理與利用系統(tǒng)

2022-08-04 12:39
新世紀(jì)圖書館 2022年7期
關(guān)鍵詞:檢索資源用戶

0 引言

隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展以及大數(shù)據(jù)時(shí)代的到來,科研數(shù)據(jù)應(yīng)用呈現(xiàn)開放共享的大趨勢,電子資源已成為用戶獲取信息的主要來源。訪問電子資源的行為數(shù)據(jù)能精準(zhǔn)地反映出用戶在教學(xué)、科研等方面的信息需求。一般而言,用戶電子資源行為數(shù)據(jù)(以下簡稱“行為數(shù)據(jù)”)受用戶信息素養(yǎng)與學(xué)術(shù)素養(yǎng)共同影響,通過用戶瀏覽、下載、檢索等行為,既可以反映用戶在線檢索技巧的熟悉程度和意識(shí)強(qiáng)弱,又可以反映用戶對(duì)科研學(xué)科領(lǐng)域的熟悉程度,以及研究任務(wù)的學(xué)術(shù)深度。但是,行為數(shù)據(jù)的采集、整理、分析是一項(xiàng)艱巨的任務(wù),目前業(yè)界很少有這方面的實(shí)證研究。為了踐行這一目標(biāo),同時(shí)降低數(shù)據(jù)采集的廣度及難度,本文通過具體案例,闡明如何通過對(duì)典型用戶群體行為數(shù)據(jù)及其學(xué)歷、職稱、科研成果等相關(guān)數(shù)據(jù)的交叉融合分析,預(yù)測用戶行為,顯性化用戶資源利用行為的規(guī)律與特征,以此實(shí)現(xiàn)電子資源與用戶個(gè)性化需求的精準(zhǔn)化、精細(xì)化對(duì)接,從而為推進(jìn)圖書館學(xué)科服務(wù)向縱深化發(fā)展提供有益參考與借鑒。

1 基于創(chuàng)文系統(tǒng)的行為數(shù)據(jù)研究分析介紹

目前,業(yè)界對(duì)利用大數(shù)據(jù)進(jìn)行個(gè)性化學(xué)科服務(wù)的研究和實(shí)踐方興未艾,筆者在實(shí)踐中發(fā)現(xiàn)有以下難點(diǎn):受人力、資源、技術(shù)設(shè)備等因素的制約,對(duì)于大多數(shù)高校圖書館來說,既難以廣泛搜集全體用戶的各方面數(shù)據(jù),也難以分析處理大數(shù)據(jù);學(xué)科館員個(gè)人所具有的學(xué)科知識(shí)儲(chǔ)備尚達(dá)不到用戶對(duì)嵌入式學(xué)科服務(wù)的需求;學(xué)科館員嵌入服務(wù)前沒有形成服務(wù)預(yù)案或服務(wù)預(yù)案不完備,導(dǎo)致科研工作者對(duì)盲目式的嵌入服務(wù)有排斥心理。對(duì)于上述情況,行為數(shù)據(jù)正是解決這些難點(diǎn)的利器。該數(shù)據(jù)具有類型單一、價(jià)值密度高等特點(diǎn)。本文從創(chuàng)文圖書館電子資源綜合管理系統(tǒng)(以下簡稱“創(chuàng)文系統(tǒng)”)入手,抽取典型用戶群體中的具體案例,通過分析、挖掘其利用電子資源的行為數(shù)據(jù),揭示出該群體利用電子資源的偏好、使用規(guī)律及研究的學(xué)科領(lǐng)域等特征,緊貼用戶需求,以期為用戶提供有準(zhǔn)備、有目標(biāo)、有內(nèi)容的服務(wù)。這種服務(wù)模式有利于增強(qiáng)用戶粘性、提高用戶滿意率,旨在在精準(zhǔn)化、精細(xì)化、個(gè)性化的資源推薦過程中,進(jìn)一步拓展圖書館學(xué)科服務(wù)的深度和廣度。

1.1 研究群體

本文所指的典型用戶群體是使用校外訪問系統(tǒng)的頻次位于前25%位的教師群體,并同時(shí)具備以下條件之一:在學(xué)校所屬學(xué)科領(lǐng)域科研工作中具有較大影響力;副高及以上職稱者;博士研究生;年度科研積分在教師群體中位于前25%。選取典型用戶群體的優(yōu)點(diǎn)在于:第一,該群體區(qū)別于全體用戶,分析結(jié)果具有明顯的區(qū)分度和針對(duì)性,能更準(zhǔn)確地定位用戶的需求,并在對(duì)重點(diǎn)群體實(shí)行重點(diǎn)跟蹤服務(wù)的過程中,提高服務(wù)效率,提升服務(wù)內(nèi)涵;第二,該群體對(duì)電子資源的高利用率能保證有足夠的樣本數(shù)量,同時(shí)使分析結(jié)果具備統(tǒng)計(jì)學(xué)意義;第三,高利用率也體現(xiàn)出該群體對(duì)文獻(xiàn)資源的較高需求,利于與其建立良好的溝通機(jī)制;第四,該群體本身具備較強(qiáng)的科研工作能力及較高的學(xué)術(shù)影響力,能夠?qū)Ρ疚牡难芯科鸬椒e極的推動(dòng)作用;第五,行為數(shù)據(jù)也反映了用戶真實(shí)的信息需求,通過分析該數(shù)據(jù),可以很好地跟蹤用戶的研究方向,并準(zhǔn)確找到嵌入式服務(wù)的契合點(diǎn)。

1.2 研究系統(tǒng)

四川輕化工大學(xué)圖書館于2016年引入了校外訪問系統(tǒng),即創(chuàng)文系統(tǒng)。該系統(tǒng)可以讓廣大用戶在校外隨時(shí)隨地通過各種前端設(shè)備(PC或移動(dòng)設(shè)備)訪問校圖書館購買或自建的、遠(yuǎn)程或本地的所有電子資源,同時(shí)該系統(tǒng)詳細(xì)記錄了具體用戶利用電子資源時(shí)瀏覽、檢索、下載的行為數(shù)據(jù)

?,F(xiàn)階段,絕大多數(shù)數(shù)據(jù)庫都是基于校園網(wǎng)IP地址作身份認(rèn)證的權(quán)限訪問,學(xué)校網(wǎng)關(guān)Web日志中用戶訪問網(wǎng)絡(luò)資源行為數(shù)據(jù)又包含有大量涉及個(gè)人隱私的敏感數(shù)據(jù),因此難以從以上兩個(gè)途徑獲取具有個(gè)體信息的訪問電子資源行為數(shù)據(jù)。創(chuàng)文系統(tǒng)數(shù)據(jù)在一定程度上能體現(xiàn)出用戶訪問電子資源的總體情況并符合本文對(duì)樣本數(shù)據(jù)的需求,因此,本文研究的數(shù)據(jù)源于從創(chuàng)文系統(tǒng)中提取的行為數(shù)據(jù)。與此同時(shí),筆者前期已經(jīng)實(shí)現(xiàn)了從創(chuàng)文系統(tǒng)的訪問日志文件中提取用戶行為數(shù)據(jù),也詳細(xì)介紹了行為數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu),以及如何對(duì)這些數(shù)據(jù)進(jìn)行清洗,并最終將其存儲(chǔ)在SQL Server數(shù)據(jù)庫中的技術(shù)和方法

。

1.3 研究方法

本文以圍繞典型用戶群體為選取原則,提取主要研究方向?yàn)楦咝阅苡操|(zhì)合金及金屬陶瓷制備,具有高級(jí)職稱、作為特殊人才引進(jìn)的某中青年教師于2019年5月至2021年5月在創(chuàng)文系統(tǒng)上的行為數(shù)據(jù)為樣本數(shù)據(jù)進(jìn)行分析和挖掘。限于篇幅,涉及的重點(diǎn)在于該用戶多維度的檢索詞分析過程。主要分析方法有以下幾個(gè)方面:第一,通過對(duì)瀏覽、下載、訪問等用戶行為在時(shí)間軸上的計(jì)數(shù),反映用戶的總體訪問特征;第二,分析用戶的檢索詞,對(duì)檢索詞的基本構(gòu)成進(jìn)行歸類,對(duì)用戶輸入的檢索詞進(jìn)行分詞處理;第三,利用Python統(tǒng)計(jì)詞頻,利用EXCEL計(jì)算檢索詞的檢索次數(shù)、四分位數(shù)、眾數(shù)等描述性統(tǒng)計(jì)量;第四,利用Pythoon和WorldCloud繪制高頻檢索詞的詞云圖;第五,提取高頻檢索詞,利用Python建立共詞矩陣和相關(guān)系數(shù)矩陣,并用Gephi繪制知識(shí)圖譜,揭示用戶最感興趣的學(xué)科領(lǐng)域;第六,結(jié)合中圖法的相關(guān)類目進(jìn)行關(guān)鍵詞分析,對(duì)用戶的檢索詞進(jìn)行分析并優(yōu)化,幫助用戶更加精準(zhǔn)地獲取文獻(xiàn)信息;第七,通過其他相關(guān)關(guān)鍵詞分析,幫助用戶拓寬研究思路。

4.交代時(shí)間、地點(diǎn)、人物或中心事件?!堵牫薄烽_頭:“一年夏天……”交代事情發(fā)生的時(shí)間、地點(diǎn)、人物?!豆枢l(xiāng)》開頭:“我冒了嚴(yán)寒……”時(shí)間、地點(diǎn)、人物和中心事件均有所交代。記敘類的文章多以這樣的方式開頭。

2 創(chuàng)文系統(tǒng)用戶訪問的時(shí)間規(guī)律和成果產(chǎn)出關(guān)系

訪問量的多少是反映用戶利用電子資源意愿的直接指標(biāo)。本文從時(shí)間維度進(jìn)行統(tǒng)計(jì),全面、直觀地揭示出用戶在2019—2021年的訪問規(guī)律。從圖1可以看出,該用戶在2019各月份的訪問次數(shù)最少,2020年各月份的訪問次數(shù)最多,高峰期主要集中在2020年2月、7月、9月,即寒暑假期間,而2021年用戶訪問次數(shù)相對(duì)于2020年呈現(xiàn)下降趨勢。同時(shí),筆者在CNKI上進(jìn)行檢索,發(fā)現(xiàn)該用戶在2019至2021年期間共計(jì)發(fā)文9篇,其中2020年5篇、2021年2篇。據(jù)呈現(xiàn)的狀態(tài)可以推測出該用戶的科研成果產(chǎn)出高峰與其年份訪問高峰基本趨于吻合。由此可見,校外訪問系統(tǒng)中的電子資源在用戶科研過程中起到了較大推動(dòng)作用;電子資源的訪問頻率能在一定程度上反映用戶科研需求狀態(tài)及科研成果的產(chǎn)出效率。

第二,在制定會(huì)計(jì)準(zhǔn)則時(shí),考慮不到不同利益集團(tuán)的需要,注重基本原則的指導(dǎo),同時(shí)要相應(yīng)增加實(shí)施的細(xì)則,不能只依靠會(huì)計(jì)人員的經(jīng)驗(yàn)。

3 創(chuàng)文系統(tǒng)用戶訪問的資源偏好

電子資源的偏好是體現(xiàn)用戶檢索特征的重要指標(biāo)。本文通過對(duì)用戶選擇數(shù)據(jù)庫的偏好、資源語種及瀏覽、檢索、下載行為等進(jìn)行統(tǒng)計(jì)發(fā)現(xiàn)如下情況。該用戶選擇的數(shù)據(jù)庫中,知網(wǎng)占比達(dá)到了總訪問量的96.12%;該用戶訪問的資源語種主要是中文,外文數(shù)據(jù)庫的訪問量只有0.6%。從該用戶檢索、瀏覽、下載的次數(shù)可以看出,用戶進(jìn)行1次檢索后,平均只有4次查看了檢索結(jié)果的詳細(xì)頁,有1.6次下載了文獻(xiàn)。同時(shí),用戶在2年多的時(shí)間內(nèi)下載了近4000篇文獻(xiàn)。從瀏覽和下載的有效性及文獻(xiàn)下載量來看,該用戶的檢索結(jié)果大多不盡如人意,可預(yù)測出該用戶的檢索意圖多趨于模糊,檢索結(jié)果難以契合用戶本身的科研需求。

由此分析,需加強(qiáng)以下幾個(gè)方面的工作:其一,對(duì)用戶個(gè)體檢索能力及科研需求內(nèi)涵進(jìn)行全面評(píng)估,在此基礎(chǔ)上精細(xì)化培訓(xùn)方案,促使用戶在有針對(duì)性的培訓(xùn)過程中提高檢索效率,縮短科研周期;其二,優(yōu)化電子資源的配置,加大電子資源宣傳推廣工作,提高電子資源的使用率,使其最大限度地滿足用戶科研需求;其三,對(duì)數(shù)據(jù)庫商提出意見和建議,如進(jìn)一步完善數(shù)據(jù)庫檢索界面、優(yōu)化及增加平臺(tái)檢索功能,以期提升資源檢索效率,促進(jìn)用戶滿意度。

4 創(chuàng)文系統(tǒng)用戶使用的檢索詞分析

4.1 檢索詞的構(gòu)成分析

從提取的數(shù)據(jù)可以看出,用戶的檢索詞由以下幾種形式構(gòu)成:第一,純粹的專業(yè)術(shù)語,可能是一個(gè)或多個(gè),如果是多個(gè),使用空格、“+”“-”等符號(hào)組成,如“碳化+WC”;第二,語句式檢索詞,其包括專業(yè)術(shù)語和“如何”“淺談”“發(fā)展”等無檢索意義的詞語,如“超硬材料行業(yè)的發(fā)展”;第三,單純的以作者名為檢索詞或采用“作者+關(guān)鍵詞”這種復(fù)合檢索式,如“張立 硬質(zhì)合金”;第四,文獻(xiàn)篇名;第五,單純以標(biāo)準(zhǔn)號(hào)檢索或采用“標(biāo)準(zhǔn)號(hào)+關(guān)鍵詞”這種復(fù)合檢索式,如“GB/T 13313-2008 軋輥肖氏、里氏硬度試驗(yàn)方法”。

從檢索詞的構(gòu)成分析中可以總結(jié)出該用戶檢索過程存在一些不足:使用類似百度等搜索引擎的檢索表達(dá)式在CNKI中進(jìn)行檢索,導(dǎo)致查全率和查準(zhǔn)率不高;檢索作者時(shí)常常只使用作者名為檢索詞,導(dǎo)致檢索結(jié)果過多且不精確;當(dāng)有比較明確的檢索點(diǎn)時(shí),使用其他關(guān)鍵詞反而會(huì)影響檢索結(jié)果,如前文提到的“標(biāo)準(zhǔn)號(hào)+關(guān)鍵詞”這種復(fù)合檢索式;從未使用中圖分類號(hào)作為檢索詞。

4.2 檢索詞的分詞處理

用戶每次檢索使用的檢索詞常常由多個(gè)關(guān)鍵詞構(gòu)成,將每個(gè)關(guān)鍵詞從檢索詞中分離出來是下一步進(jìn)行具體關(guān)鍵詞分析的必要前提。本文使用Python和Jieba

對(duì)用戶的檢索詞進(jìn)行分詞。雖然Jieba是目前較為流行的分詞庫,但有以下幾點(diǎn)需要注意,否則會(huì)產(chǎn)生大量分詞錯(cuò)誤的問題。第一,創(chuàng)建自定義詞表。雖然Jieba使用HMM模型和Viterbi算法讓自己具有一定的新詞識(shí)別能力,但其自主學(xué)習(xí)的功能仍很薄弱,而且用戶輸入的檢索詞含有大量其研究領(lǐng)域的專業(yè)術(shù)語,如拋釉磚、炭相、石墨烯等,使用Jieba自帶的語料庫不能正確識(shí)別它們,因此需要添加自定義詞典,并使用Jieba的load_userdict( )函數(shù)加載,這樣才能確保Jieba正確識(shí)別上述詞語。第二,處理特殊字符。因用戶的專業(yè)領(lǐng)域涉及大量的分子式,如WC-Ti(C_N)-Co。這些分子式含有大量的特殊字符,若單純地將這些分子式添加到自定義詞表并不能生效,故要對(duì)Jieba根目錄下的__init__.py文件和Jieba根目錄下posseg文件夾中的__init__.py進(jìn)行修改

。如此,才能讓Jieba正確識(shí)別分子式中的特殊字符。第四,建立停用詞表。用戶檢索詞中包含大量“淺談”等無檢索意義的詞語,分詞時(shí)需要將這些詞語剔除。故需要?jiǎng)?chuàng)建一個(gè)停用詞詞表,將分詞結(jié)果與停用詞表中的詞語進(jìn)行比較,然后從中刪除存在于停用詞表中的詞語。第五,反復(fù)迭代。添加自定詞典和創(chuàng)建停用詞表是一個(gè)比較繁瑣的工作,需要反復(fù)比較、反復(fù)迭代才能獲得較高的準(zhǔn)確性。

4.3 檢索詞多維度分析

檢索、發(fā)文關(guān)鍵詞的對(duì)比分析能揭示出用戶的科研方向與其檢索文獻(xiàn)的吻合度。表1顯示:第一,從檢索關(guān)鍵詞看,其眾數(shù)和最小值都是1,共有791次,占總檢索關(guān)鍵詞檢索次數(shù)的46%,中位數(shù)為2,第三、四分位數(shù)是4。從發(fā)文關(guān)鍵詞看,其眾數(shù)和最小值都是1,共有25次,占總發(fā)文關(guān)鍵詞出現(xiàn)次數(shù)的96%,以上數(shù)據(jù)推測該用戶的研究方向可能趨于模糊;第二,用戶的檢索和發(fā)文出現(xiàn)最多次數(shù)的關(guān)鍵詞是相同的,同時(shí)在用戶發(fā)文關(guān)鍵詞中,通過統(tǒng)計(jì)有20個(gè)是其檢索文獻(xiàn)使用的關(guān)鍵詞,這些詞在檢索中最少出現(xiàn)次數(shù)是1,最多出現(xiàn)次數(shù)是777。通過檢索、發(fā)文關(guān)鍵詞的對(duì)比分析能幫助用戶梳理、回顧整個(gè)研究過程中關(guān)鍵詞的變化歷程,同時(shí)可參考將用戶發(fā)文關(guān)鍵詞在檢索時(shí)次數(shù)的多少作為判斷推送文獻(xiàn)的優(yōu)先級(jí)的標(biāo)準(zhǔn),以此實(shí)現(xiàn)文獻(xiàn)的精準(zhǔn)推薦。

后現(xiàn)代主義知識(shí)觀認(rèn)為,知識(shí)以其自組織性、不確定性、非線性和解釋性,能夠在教學(xué)中不斷創(chuàng)生。知識(shí)并非像知識(shí)本體論認(rèn)為的具有確定性,也非本體論規(guī)定的具有先驗(yàn)性。羅蒂(R Rorty)觀點(diǎn)認(rèn)為:教學(xué)任務(wù)不是簡單的知識(shí)傳遞和道德教化的過程,教學(xué)該是即時(shí)創(chuàng)作,是師生的共同解讀,知識(shí)能在動(dòng)態(tài)的即時(shí)創(chuàng)作中變得鮮活。即時(shí)創(chuàng)作的教學(xué)觀下,教師對(duì)知識(shí)的權(quán)威,學(xué)生作為知識(shí)的容器,以及教材是知識(shí)載體的看法不再成立。

詞頻顯示了用戶對(duì)檢索詞所對(duì)應(yīng)的相關(guān)學(xué)科領(lǐng)域的關(guān)注度。結(jié)合Python 和Pandas 模塊,可以方便地統(tǒng)計(jì)檢索詞分詞后的關(guān)鍵詞檢索詞頻。統(tǒng)計(jì)詞頻的基本原理是將分詞后的關(guān)鍵詞轉(zhuǎn)換為Series,然后調(diào)用Pandas 中的value_counts( )函數(shù)計(jì)算每個(gè)關(guān)鍵詞出現(xiàn)的頻次。在此基礎(chǔ)上,為了更形象、直觀地展示用戶檢索詞的頻次關(guān)系,本文使用Python 和WordCloud

為檢索次數(shù)≥5 的關(guān)鍵詞生成 “高頻關(guān)鍵詞詞云圖”。詞云圖中關(guān)鍵詞的字號(hào)大小代表了檢索頻次的多少。從圖2 中可以清晰、直觀地看出在該用戶訪問過程中,“硬質(zhì)合金”“合金”“金剛石”“WC”“WC-Co”等是出現(xiàn)頻率較高的關(guān)鍵詞。將高頻檢索關(guān)鍵詞結(jié)合用戶的科研成果,可精準(zhǔn)掌握其主要研究方向?yàn)椤案咝阅苡操|(zhì)合金及金屬陶瓷的制備”。通過高頻關(guān)鍵詞分析,可精確掌握用戶研究方向,并在此基礎(chǔ)上提前做好工作預(yù)案,使服務(wù)做到有的放矢。

本研究采用紅茶浸泡除腥的方式,研究紅茶脫腥處理對(duì)海螺肉感官和品質(zhì)特性的影響,并對(duì)海螺肉中的揮發(fā)性成分進(jìn)行分析。此外,實(shí)驗(yàn)以菌落總數(shù)為微生物指標(biāo),以TBA值、pH為理化指標(biāo),研究經(jīng)紅茶脫腥處理的海螺肉在貯藏過程中的品質(zhì)變化,評(píng)價(jià)紅茶脫腥處理對(duì)海螺肉的抑菌保鮮效果。

4.3.1 高頻關(guān)鍵詞分析,精準(zhǔn)掌握研究方向

4.3.3 關(guān)鍵詞共現(xiàn)分析,發(fā)掘研究方向

共現(xiàn)分析揭示了檢索關(guān)鍵詞之間的共現(xiàn)關(guān)系,它體現(xiàn)了用戶感興趣的不同學(xué)科領(lǐng)域之間聯(lián)系的緊密程度。本文利用Python和Pandas庫創(chuàng)建關(guān)鍵詞共詞矩陣和關(guān)鍵詞相關(guān)系數(shù)矩陣,并選取檢索詞頻≥20的52個(gè)關(guān)鍵詞創(chuàng)建上述兩個(gè)矩陣。

創(chuàng)建共詞矩陣的主要步驟如下:

步驟一:使用set( )函數(shù)為這52個(gè)關(guān)鍵詞創(chuàng)建集合。

步驟二:將用戶每次輸入的檢索詞分詞后的結(jié)果存儲(chǔ)為list列表。

for(i in1∶2 000){x=runif(n,0,1); y=(sum(x)-n×0.5)/sqrt(n/12); A[i]=y}

步驟三:使用pd.DataFrame(0, columns=key_set, index=key_set)語句初始化全0共詞矩陣,其中的key_set參數(shù)的值為這52個(gè)高頻關(guān)鍵詞集合,目的是將它們指定為Dataframe的行、列索引。

步驟四:遍歷用戶檢索詞分詞列表,并取其與高頻詞的交集。當(dāng)交集的元素個(gè)數(shù)大于1時(shí),表示高頻詞間有共詞關(guān)系。

本文利用Ochiia系數(shù)

將共詞矩陣轉(zhuǎn)換為相關(guān)系數(shù)矩陣。Ochiia系數(shù)的計(jì)算公式如下:

其中,O

為Ochiia系數(shù),N

代表檢索詞A和B同時(shí)出現(xiàn)的頻次,N

和N

分別代表A檢索詞和B檢索詞出現(xiàn)的總頻次。

當(dāng)?shù)谝婚撝翟诓ǚ?,2之間時(shí),若不進(jìn)行特征點(diǎn)一致性補(bǔ)償,則特征點(diǎn)t2將會(huì)提前一個(gè)周期,在波峰5下降沿的過零點(diǎn)處,此時(shí)若要保證特征點(diǎn)一致則到達(dá)特征點(diǎn)時(shí)間應(yīng)調(diào)整為t1;當(dāng)?shù)谝婚撝翟诓ǚ?,4之間時(shí),若不進(jìn)行特征點(diǎn)一致性補(bǔ)償,則特征點(diǎn)t2將會(huì)滯后一個(gè)周期,在波峰7下降沿的過零點(diǎn)處,此時(shí)若要保證特征點(diǎn)一致則到達(dá)特征點(diǎn)時(shí)間應(yīng)調(diào)整為t3。綜上所述,到達(dá)特征點(diǎn)時(shí)間T應(yīng)根據(jù)第一閾值所在位置選取為:

步驟五:兩次遍歷該交集的元素,外循環(huán)從第一個(gè)元素開始直到最后一個(gè)元素,內(nèi)循環(huán)從第二個(gè)元素開始直到最后一個(gè)元素。

隨著2016年我國加入華盛頓成員國,國內(nèi)高校掀起工程教育國際認(rèn)證的浪潮。工程教育認(rèn)證中強(qiáng)調(diào)學(xué)生的實(shí)作技能,鼓勵(lì)課程設(shè)計(jì)/畢業(yè)設(shè)計(jì)能出實(shí)際作品,鼓勵(lì)學(xué)生以團(tuán)隊(duì)合作的形式完成,這是頂石(Capstone)的基本要求。3D打印技術(shù)是實(shí)現(xiàn)產(chǎn)品從電腦屏幕到實(shí)物最為便捷的方式,具有時(shí)間和成本優(yōu)勢,從而備受關(guān)注和學(xué)生喜愛。從專業(yè)認(rèn)證的發(fā)展需求看,3D打印技術(shù)在高校中的應(yīng)用將逐步擴(kuò)大。

步驟六:遍歷時(shí),首先將共詞矩陣行、列索引分別與外、內(nèi)循環(huán)的元素名相同的位置元素的數(shù)值加1;然后將共詞矩陣列、行索引分別與外、內(nèi)循環(huán)的元素名相同的位置元素的數(shù)值加1。

4.3.2 檢索、發(fā)文關(guān)鍵詞對(duì)比分析,精準(zhǔn)文獻(xiàn)推薦

使用該公式,就是在共詞矩陣的基礎(chǔ)上創(chuàng)建相關(guān)系數(shù)矩陣。基本方法與創(chuàng)建共詞矩陣大同小異,要注意兩點(diǎn):其一,將共詞矩陣對(duì)角線上代表高頻檢索詞的詞頻元素的數(shù)值由0改寫為相應(yīng)的詞頻;其二,遍歷元素是要利用Ochiia系數(shù)公式計(jì)算相應(yīng)的值。

利用式(4)通過節(jié)點(diǎn)域的上下邊界和期望值,得到每個(gè)指標(biāo)變量的最優(yōu)值如表4。綜合權(quán)重為0.520,0.292,0.188。

最后,在相關(guān)系統(tǒng)矩陣的基礎(chǔ)上,利用Gephi軟件

繪制用戶檢索關(guān)系詞的共現(xiàn)關(guān)系圖(如圖3)。圖中的每個(gè)節(jié)點(diǎn)代表一個(gè)高頻關(guān)鍵詞,點(diǎn)的大小代表了頻次的多少。節(jié)點(diǎn)之間的邊的粗細(xì)代表了節(jié)點(diǎn)相關(guān)性的大小。在圖3中,可以看出硬質(zhì)合金、工藝、金剛石等是用戶檢索次數(shù)最多的關(guān)鍵詞,而金剛石與薄膜、金剛石與涂層、凝膠與溶膠等是相關(guān)性很高的關(guān)鍵詞。通過關(guān)鍵詞共現(xiàn)分析結(jié)果向用戶推薦相關(guān)性較高的關(guān)鍵詞進(jìn)行組合檢索,可在進(jìn)一步提高文獻(xiàn)推送準(zhǔn)確性的同時(shí),幫助用戶發(fā)掘新的研究方向及交叉學(xué)科增長點(diǎn)。

4.3.4 結(jié)合中圖法分析檢索關(guān)鍵詞,提升用戶研究成效

中圖分類號(hào)能夠有效地將檢索結(jié)果限定在需要的學(xué)科范圍,是用戶提高檢索效率的重要工具。將該用戶檢索過程中使用的高頻關(guān)鍵詞與中圖法中的學(xué)科分級(jí)類目進(jìn)行比對(duì),發(fā)現(xiàn)如TG135.5硬質(zhì)合金、TG146.4稀有金屬及其合金、TG146.411鎢、TG146.412鉬等能對(duì)應(yīng)或包含用戶使用的高頻關(guān)鍵詞。再如,“焊接”是用戶使用較為頻繁的檢索關(guān)鍵詞,比照中圖法類目,發(fā)現(xiàn)“TG4焊接、金屬切割及金屬粘接”與之相符,其下位類還包括焊接材料、焊接工藝、焊接設(shè)備等類目。

綜上,結(jié)合中圖分類號(hào)和檢索關(guān)鍵詞,通過中圖分類號(hào)將文獻(xiàn)的學(xué)科類別限制在用戶研究領(lǐng)域內(nèi),既能幫助用戶提高文獻(xiàn)檢索的查準(zhǔn)率,又能充分拓展其研究方向,從而達(dá)到綜合提升用戶研究成效的目的。

4.3.5 其他相關(guān)關(guān)鍵詞分析,拓寬用戶思路

該用戶在檢索中還涉及到其他不直接反映學(xué)科領(lǐng)域的相關(guān)關(guān)鍵詞,即標(biāo)準(zhǔn)號(hào)和作者。通過這些關(guān)鍵詞分析,既可以間接圍繞用戶研究學(xué)科領(lǐng)域進(jìn)行分析,也能夠?qū)υ撚脩粽麄€(gè)檢索詞分析體系進(jìn)行完善和補(bǔ)充。第一,標(biāo)準(zhǔn)號(hào)。如以BS ISO 513-2012和DIN ISO 513-199為檢索點(diǎn)進(jìn)行檢索,從檢索出來的標(biāo)準(zhǔn)名稱、中國標(biāo)準(zhǔn)分類號(hào)及國際標(biāo)準(zhǔn)分類號(hào)的類目名稱中提取對(duì)應(yīng)的關(guān)鍵詞。發(fā)現(xiàn)有些關(guān)鍵詞如硬質(zhì)合金等是用戶高頻關(guān)鍵詞之一,而有些關(guān)鍵詞如排屑等卻從未出現(xiàn)在用戶的檢索詞中。第二,作者。如搜索次數(shù)大于等于3次的有顏娟、廖軍、張立等,將重點(diǎn)關(guān)注的作者名與高頻關(guān)鍵詞相關(guān)聯(lián)進(jìn)行組合檢索,發(fā)現(xiàn)這些作者均是從事硬質(zhì)合金材料和技術(shù)研究的專家及本地企業(yè)工作者。

三是明確管護(hù)責(zé)任。針對(duì)不同工程的性質(zhì)和特點(diǎn),采取專業(yè)化管理、社會(huì)化管理和自主管理等多種方式,將工程管護(hù)責(zé)任落實(shí)到產(chǎn)權(quán)的所有者和使用者,同時(shí)健全管理制度約束管理主體,確保工程能夠正常地發(fā)揮效益,確保用水戶的利益不受損害。

為此,在為用戶提供檢索建議或文獻(xiàn)推送服務(wù)時(shí),可將標(biāo)準(zhǔn)名稱、標(biāo)準(zhǔn)分類號(hào)類目名稱中從未出現(xiàn)的關(guān)鍵詞作為檢索點(diǎn),幫助用戶擴(kuò)大檢索結(jié)果,拓寬研究思路。同時(shí),可進(jìn)一步搜集用戶重點(diǎn)關(guān)注對(duì)象的科研背景信息及從事相關(guān)專業(yè)領(lǐng)域的的企業(yè)信息,為用戶衡量與對(duì)口企業(yè)合作的可行性提供決策性參考依據(jù),并從中開拓出創(chuàng)造校企合作的價(jià)值空間。

“美麗中國”是黨的十九大提出作為建設(shè)社會(huì)主義現(xiàn)代化強(qiáng)國的重要目標(biāo),強(qiáng)調(diào)要推進(jìn)綠色發(fā)展,構(gòu)建清潔低碳、安全高效的能源體系。南方電網(wǎng)云南電網(wǎng)公司作為扎根云南、從事基礎(chǔ)產(chǎn)業(yè)和公共事業(yè)的中央企業(yè),積極響應(yīng)國家號(hào)召、主動(dòng)承擔(dān)社會(huì)責(zé)任,全心全意為云南經(jīng)濟(jì)社會(huì)發(fā)展服務(wù),不斷加大充電基礎(chǔ)設(shè)施和車聯(lián)網(wǎng)平臺(tái)建設(shè),全力助推云南省新能源汽車產(chǎn)業(yè)發(fā)展。

5 創(chuàng)文系統(tǒng)隱私保護(hù)探討

行為數(shù)據(jù)是研究用戶檢索行為和科研方向的重要信息源,也是圖書館做好學(xué)科服務(wù)的根本前提。近年來,國內(nèi)外對(duì)安全、規(guī)范使用個(gè)人信息日益關(guān)注,“數(shù)據(jù)正義”(Data justice)這一理論也應(yīng)運(yùn)而生。目前“數(shù)據(jù)正義”作為一個(gè)發(fā)展中的理念,含義尚未定型,其中安全、規(guī)范使用個(gè)人信息是其核心思想。國家對(duì)個(gè)人信息的收集、存儲(chǔ)、處理做了明確規(guī)定,要求必須遵循“合法、正當(dāng)、必要的原則”,特別是對(duì)利用用戶畫像等手段為用戶提供服務(wù)作了詳細(xì)、具體的信息安全規(guī)范

。另外,“數(shù)據(jù)正義”在數(shù)據(jù)可見性、用戶參與性和數(shù)據(jù)歧視三方面有著規(guī)范和約束,用戶對(duì)個(gè)人數(shù)據(jù)的采集、存儲(chǔ)及應(yīng)用范圍須具有知情權(quán)

。《中華人民共和國國民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要》強(qiáng)調(diào),要統(tǒng)籌數(shù)據(jù)開發(fā)利用、隱私保護(hù)和公共安全,加快建立數(shù)據(jù)資源產(chǎn)權(quán)、交易流通、安全保護(hù)等基礎(chǔ)制度和標(biāo)準(zhǔn)規(guī)范

。以此為導(dǎo)向,本文在提取用戶個(gè)人數(shù)據(jù)的過程中特別注意保護(hù)用戶隱私,保證采集的手段、內(nèi)容和用途對(duì)用戶保持透明,讓用戶自主選擇哪些行為數(shù)據(jù)、哪些時(shí)段、哪些網(wǎng)站的數(shù)據(jù)允許被采集,這些數(shù)據(jù)可以在哪些范圍內(nèi)使用,同時(shí)用戶可以自主保存、刪除自己的數(shù)據(jù),切實(shí)消除用戶顧慮。

6 結(jié)語

本文通過對(duì)典型用戶群體訪問創(chuàng)文系統(tǒng)行為數(shù)據(jù)多角度、多層次的分析,揭示出用戶資源利用的行為規(guī)律與特征,以期促進(jìn)圖書館學(xué)科服務(wù)更具備可操作性和實(shí)踐性。本研究從反映具體用戶真實(shí)檢索意圖的檢索行為入手,如訪問時(shí)間、資源偏好、選用的檢索詞等探尋其文獻(xiàn)需求和檢索規(guī)律,在一定程度上可為圖書館電子資源行為數(shù)據(jù)的深入研究提供參考,對(duì)推動(dòng)有效發(fā)掘用戶個(gè)性化需求及圖書館深層次服務(wù)建設(shè)具有積極意義,但還存在以下幾方面的改進(jìn)之處。

第一,典型用戶群體具有一定數(shù)量,在進(jìn)行檢索詞分析的時(shí)候需要反復(fù)迭代才能取得較好的分詞效果,同時(shí)需建立具有學(xué)校專業(yè)特色的分詞詞典庫,進(jìn)一步提高分詞效率和準(zhǔn)確性;第二,分析過程的思路方法與應(yīng)用角度還需進(jìn)一步拓展,如將本館集成管理系統(tǒng)數(shù)據(jù)、門禁數(shù)據(jù)及學(xué)校教務(wù)系統(tǒng)數(shù)據(jù)和人事系統(tǒng)數(shù)據(jù),與創(chuàng)文系統(tǒng)數(shù)據(jù)進(jìn)行融合,將用戶的信息行為數(shù)據(jù)與其從事的科學(xué)研究及相關(guān)專業(yè)學(xué)習(xí)相結(jié)合,進(jìn)一步提升數(shù)據(jù)的維度及分析的準(zhǔn)確性;第三,通過在線交流、面對(duì)面溝通、電話溝通和問卷調(diào)查等多種方式,對(duì)典型用戶群體進(jìn)行調(diào)研,印證分析結(jié)果,并在此基礎(chǔ)上深入研究,構(gòu)建典型用戶群體文獻(xiàn)信息推薦模型并建立服務(wù)工作流程,撰寫用戶檢索分析報(bào)告及資源推薦報(bào)告以此優(yōu)化用戶檢索策略、提供精準(zhǔn)文獻(xiàn)服務(wù)。

上述探索點(diǎn)將是筆者后續(xù)努力的方向,旨在更好、更全面地研究用戶數(shù)據(jù),突出重點(diǎn)學(xué)科的科研價(jià)值和應(yīng)用價(jià)值,為圖書館用戶提供更優(yōu)質(zhì)的學(xué)科服務(wù)。

[1]創(chuàng)文科技[EB/OL]. [2020-08-13].http://www.cwkeji.cn/html/product.html#4_3.

[2]刁羽,賀意林.用戶訪問電子資源行為數(shù)據(jù)的獲取研究:基于創(chuàng)文圖書館電子資源綜合管理與利用系統(tǒng)[J].圖書館學(xué)研究,2020(3):40-47.

[3]Jieba[EB/OL].[2020-08-04]. https://github.com/fxsjy/jieba.

[4]Jieba分詞加入特殊字符和空格[EB/OL].[2020-08-10].https://www.cnblogs.com/callyblog/p/10097 847.html.

[5]WordCloud for Python documentation[EB/OL].[2020-08-13]. http://amueller.github.io/word_cloud/.

[6]使用Ochiia系數(shù)將共詞矩陣轉(zhuǎn)換為相關(guān)矩陣(基于EXCEL+VBA的實(shí)現(xiàn))[EB/OL].[2020-09-20]. https://blog.csdn.net/u010785550/article/details/107406230.

[7]The Open Graph Viz Platform[EB/OL].[2020-09-23]. https://gephi.org/.

[8]國家市場監(jiān)督管理總局.信息安全技術(shù)個(gè)人信息安全規(guī):GB/T35273—2020[S].北京:中國標(biāo)準(zhǔn)出版社,2020:2.

[9]LINET T . What is data justice? The case for connecting digital rights and freedoms globally[EB/OL].(2017-11-07)[2021-02-23]. https://journals.sagepub.com/doi/full/10.1177/2053951717736335.

[10]中華人民共和國國民經(jīng)濟(jì)和社會(huì)發(fā)展第十四個(gè)五年規(guī)劃和2035年遠(yuǎn)景目標(biāo)綱要[EB/OL].[2021-3-13].http://www.gov.cn/xinwen/2021-03/13/content_5592681.htm.

猜你喜歡
檢索資源用戶
基于用戶和電路的攻擊識(shí)別方法
2021少兒出版用戶觸達(dá)能力指數(shù)
CNKI檢索模式結(jié)合關(guān)鍵詞選取在檢索中的應(yīng)用探討
通過實(shí)際案例談如何利用外文庫檢索提高檢索效率
我給資源分分類
瑞典專利數(shù)據(jù)庫的檢索技巧
挖掘文本資源 有效落實(shí)語言實(shí)踐
資源回收
英國知識(shí)產(chǎn)權(quán)局商標(biāo)數(shù)據(jù)庫信息檢索
信用卡資深用戶
高州市| 青阳县| 澎湖县| 涿州市| 贡嘎县| 金寨县| 逊克县| 合阳县| 南城县| 乐安县| 贡嘎县| 塔河县| 清涧县| 福清市| 江永县| 甘谷县| 玉龙| 措美县| 姚安县| 德庆县| 涪陵区| 兴宁市| 通许县| 洮南市| 龙岩市| 永嘉县| 河津市| 西充县| 濮阳市| 阿勒泰市| 阳春市| 抚顺县| 安龙县| 屯门区| 抚远县| 隆安县| 邛崃市| 湘潭县| 丰顺县| 潼南县| 太康县|