汪蕓輝 馮樹勛 苑朋彬
(中國科學(xué)技術(shù)信息研究所,北京 100038)
大數(shù)據(jù)背景下,通過獲取用戶數(shù)據(jù),從中分析出用戶的潛在需求,并以此針對不同用戶提供知識服務(wù),已經(jīng)成為各大型網(wǎng)站建設(shè)與發(fā)展的主要趨勢。如何發(fā)現(xiàn)用戶需求并提供解決方案與定制服務(wù)是提高網(wǎng)站服務(wù)質(zhì)量的關(guān)鍵因素。本文將基于用戶小數(shù)據(jù)的概念,提出一種國家科技報告服務(wù)系統(tǒng)的知識服務(wù)模式,以期提高網(wǎng)站知識服務(wù)水平,更好地發(fā)展和完善國家科技報告服務(wù)系統(tǒng),進(jìn)一步推動我國科技報告制度建設(shè)工作。
Deborah Estrin在2014年最早發(fā)現(xiàn)人們每天訪問的社交網(wǎng)絡(luò)、搜索引擎、手機(jī)APP、電子商務(wù)等網(wǎng)站產(chǎn)生了大量的數(shù)字痕跡,而通過收集和分析這些用戶數(shù)據(jù),能夠?yàn)橛脩籼峁┒ㄖ品?wù)并改善系統(tǒng)性能?;谶@一發(fā)現(xiàn),Estrin[1]提出了“small data, where n=me”的理念,表示用戶小數(shù)據(jù)就是收集和分析關(guān)于我(me)的全部數(shù)據(jù),正是這些數(shù)量巨大且來源于不同應(yīng)用的用戶個體數(shù)據(jù)的總體構(gòu)成了用戶小數(shù)據(jù)[2]。對于不同領(lǐng)域來說,用戶小數(shù)據(jù)所涵蓋的范圍也不盡相同。如在醫(yī)療領(lǐng)域,用戶小數(shù)據(jù)指病人的治療計劃、用藥信息、日常活動等;在競技體育領(lǐng)域,用戶小數(shù)據(jù)則包括運(yùn)動員的生理參數(shù)、訓(xùn)練方案等;在圖書情報領(lǐng)域,用戶小數(shù)據(jù)可以指個體用戶空間上全方位的、時間上全過程的、深度上全精細(xì)化的所有可利用的數(shù)據(jù)[3]。本文所提出的用戶小數(shù)據(jù)概念是文獻(xiàn)服務(wù)型網(wǎng)站的用戶小數(shù)據(jù),是指用戶在使用服務(wù)系統(tǒng)獲取科技信息資源過程中所產(chǎn)生的全部行為信息,即以網(wǎng)站用戶為單位,圍繞個體用戶所展開的全方位數(shù)據(jù)[4]。
科技報告是對國家創(chuàng)新和科技進(jìn)步有重要影響的知識資源,國家科技報告服務(wù)系統(tǒng)是對科技報告資源進(jìn)行存儲、共享,方便科研人員與社會大眾瀏覽查詢科技報告的服務(wù)平臺,是獲取國內(nèi)科技報告資源最主要也是最重要的窗口[9]。在互聯(lián)網(wǎng)時代,科研人員和科技管理者對科技報告資源的需求日漸增加,科技報告資源管理機(jī)構(gòu)在做好收藏、整理、共享等基礎(chǔ)工作的前提下,對科技報告進(jìn)行整合、創(chuàng)新并拓展科技報告的服務(wù)方式與服務(wù)范圍,為用戶提供個性化服務(wù)產(chǎn)品便尤為重要。
國家科技報告服務(wù)系統(tǒng)主要提供文獻(xiàn)資源共享服務(wù)。目前,該系統(tǒng)具有分類導(dǎo)航功能,可以向用戶提供基本的信息服務(wù)。用戶可以根據(jù)科技報告的來源、學(xué)科、地域和類型進(jìn)行瀏覽;還可以通過某個檢索字段(如題名、關(guān)鍵詞)進(jìn)行初級檢索,或?qū)萍紙蟾尜Y源進(jìn)行高級檢索;該系統(tǒng)還可以向非注冊用戶提供科技報告資源的摘要瀏覽權(quán)限,注冊用戶則可以在線瀏覽科技報告的全部內(nèi)容。但是,國家科技報告服務(wù)系統(tǒng)的服務(wù)模式只屬于基本的文獻(xiàn)信息服務(wù),缺乏針對用戶實(shí)際知識需求的服務(wù)過程,還沒有達(dá)到知識服務(wù)的水平。因此,將對用戶小數(shù)據(jù)的收集、處理與分析引入國家科技報告服務(wù)系統(tǒng)的管理模式中,使用戶更方便、快捷地獲取所需要的科技報告,為用戶提供更為個性化、多樣化的知識服務(wù),是提高系統(tǒng)整體的管理水平和服務(wù)質(zhì)量的有效途徑之一。
正如前文所述,本文所指的用戶小數(shù)據(jù)是圍繞文獻(xiàn)服務(wù)型網(wǎng)站的個體用戶而言的,是用戶在進(jìn)行科研活動時全面描述該用戶的數(shù)據(jù)[10]。國家科技報告服務(wù)系統(tǒng)的科技報告資源只有實(shí)名注冊的用戶才可以進(jìn)行全文瀏覽,因此該系統(tǒng)的用戶小數(shù)據(jù)均為實(shí)名注冊用戶數(shù)據(jù)。這些數(shù)據(jù)主要可以分成基本屬性、興趣數(shù)據(jù)和行為數(shù)據(jù)三大類,其構(gòu)成情況見表1。
表1 國家科技報告服務(wù)系統(tǒng)用戶小數(shù)據(jù)的構(gòu)成
國家科技報告服務(wù)系統(tǒng)用戶小數(shù)據(jù)的基本屬性是對個體用戶客觀特征的描述,包括姓名、性別、年齡、專業(yè)、所屬地區(qū)、學(xué)歷等,用戶的基本屬性數(shù)據(jù)一般不會產(chǎn)生變化,具有很高的穩(wěn)定性;國家科技報告服務(wù)系統(tǒng)用戶小數(shù)據(jù)的興趣數(shù)據(jù)包括用戶在系統(tǒng)中最常瀏覽的科技報告領(lǐng)域、科技計劃項(xiàng)目等,這一類數(shù)據(jù)在特定時間內(nèi)具有穩(wěn)定性,如用戶在某一科研課題的研究過程中,會長期關(guān)注這一領(lǐng)域的科技報告,課題結(jié)題后也許就會關(guān)注其他新的領(lǐng)域,因此這類數(shù)據(jù)是會發(fā)生改變的;國家科技報告服務(wù)系統(tǒng)用戶小數(shù)據(jù)的行為數(shù)據(jù)是指用戶在系統(tǒng)中的全部活動記錄,包括用戶個體對網(wǎng)站的訪問頻率、停留時長等,行為數(shù)據(jù)隨著用戶活動狀態(tài)的變化而不斷更新,具有極高的動態(tài)性。
獲取并分析系統(tǒng)用戶的個體化、動態(tài)化、精準(zhǔn)化小數(shù)據(jù),可以將這些信息有機(jī)結(jié)合起來,實(shí)時、準(zhǔn)確地發(fā)現(xiàn)和預(yù)測用戶的閱讀興趣,構(gòu)建國家科技報告服務(wù)系統(tǒng)的用戶畫像,為用戶提供知識服務(wù),進(jìn)一步提升國家科技報告服務(wù)系統(tǒng)的網(wǎng)站能力與服務(wù)質(zhì)量。
基于前文對用戶小數(shù)據(jù)特征以及國家科技報告服務(wù)系統(tǒng)管理現(xiàn)狀的分析,本研究基于用戶小數(shù)據(jù)的國家科技報告服務(wù)系統(tǒng)知識服務(wù)模式,將用戶小數(shù)據(jù)概念引入國家科技報告服務(wù)管理中,為進(jìn)一步提升知識服務(wù)能力提出理論構(gòu)想。
3.2.1 構(gòu)建原則
1.2.3 效果評價 出院時及出院后3個月和6個月內(nèi)通過來院診查形式對患者疼痛和椎動脈供血情況進(jìn)行比較。
(1)夯實(shí)數(shù)據(jù)基礎(chǔ),保障數(shù)據(jù)安全。國家科技報告服務(wù)系統(tǒng)收藏了科技部、自然基金委等多個部門的科技報告數(shù)據(jù)、各省市等多區(qū)域的科技報告數(shù)據(jù)以及注冊用戶的基本信息、用戶行為等大量用戶小數(shù)據(jù)??萍紙蟾鏀?shù)據(jù)涵蓋了我國多個技術(shù)領(lǐng)域的先進(jìn)研究成果,用戶數(shù)據(jù)包括了姓名、身份證號等個人信息。對這些數(shù)據(jù)資源進(jìn)行整合并做好數(shù)據(jù)保護(hù)工作,是在提供知識服務(wù)過程中必須重點(diǎn)關(guān)注的問題。落實(shí)數(shù)據(jù)整合與保護(hù),一方面要從技術(shù)層面進(jìn)行強(qiáng)化,加強(qiáng)知識管理、做好數(shù)據(jù)集成管理工作,進(jìn)一步加強(qiáng)系統(tǒng)安全保護(hù);另一方面要著重提高人員知識保護(hù)的意識,嚴(yán)禁出現(xiàn)數(shù)據(jù)泄露等不良行為。
(2)以用戶需求為中心。國家科技報告服務(wù)系統(tǒng)的本質(zhì)是文獻(xiàn)服務(wù)類網(wǎng)站。文獻(xiàn)服務(wù)類網(wǎng)站必須以用戶需要為導(dǎo)向、以用戶滿意為目標(biāo)、以用戶便利為原則[11]。因此,在國家科技報告服務(wù)系統(tǒng)實(shí)施知識服務(wù)的過程中,也應(yīng)將“以用戶需求為中心”作為最重要的原則之一,根據(jù)科研人員、科技管理者等不同用戶的不同需求,提供更具有針對性并且更為有效的知識服務(wù)。
3.2.2 構(gòu)成要素
基于用戶小數(shù)據(jù)的國家科技報告服務(wù)系統(tǒng)知識服務(wù)模式應(yīng)立足于系統(tǒng)用戶小數(shù)據(jù),結(jié)合系統(tǒng)本身所擁有的科技報告資源,展現(xiàn)出二者的關(guān)聯(lián)性,為用戶提供具有針對性的科技報告資源,滿足用戶需要,同時針對用戶評價進(jìn)行整合與評估,及時發(fā)現(xiàn)需要改進(jìn)的薄弱點(diǎn)。因此,基于用戶小數(shù)據(jù)的國家科技報告服務(wù)系統(tǒng)知識服務(wù)模式應(yīng)具備以下幾項(xiàng)構(gòu)成要素。
(1)知識資源:是指國家科技報告服務(wù)系統(tǒng)所產(chǎn)生的用戶小數(shù)據(jù)以及所擁有的全部知識資源,這是為用戶提供知識服務(wù)的基礎(chǔ)和基本條件。
(2)用戶需求:用戶是知識服務(wù)最終的接收方和索取方,用戶對系統(tǒng)的信息與知識需求是提供知識服務(wù)的源動力。
(3)解決方案:是指在用戶提出知識需求或遇到難以解決的問題以及使用后對系統(tǒng)進(jìn)行問題反饋時,國家科技報告服務(wù)系統(tǒng)為用戶提供的知識服務(wù)方案和最終結(jié)果。
3.2.3 知識服務(wù)流程
圖1 是本文構(gòu)建的基于用戶小數(shù)據(jù)的國家科技報告服務(wù)系統(tǒng)知識服務(wù)流程。該服務(wù)流程涵蓋了前述的“知識資源”“用戶需求”“解決方案”3 個構(gòu)成要素?!爸R資源”是指國家科技報告服務(wù)系統(tǒng)用戶小數(shù)據(jù)庫與國家科技報告數(shù)據(jù)庫,而“用戶需求”“解決方案”是指知識服務(wù)等關(guān)鍵構(gòu)成要素以及數(shù)據(jù)收集與資源整合等功能模塊,以獲取得到的用戶小數(shù)據(jù)和自身擁有的科技報告資源為基礎(chǔ),圍繞用戶需求開展知識服務(wù)。
基于用戶小數(shù)據(jù)的知識服務(wù)模式強(qiáng)調(diào)對小數(shù)據(jù)的全面收集與處理。國家科技報告服務(wù)系統(tǒng)目前擁有實(shí)名注冊用戶超過5 萬個,收藏科技報告共25 萬余篇。相較于其他文獻(xiàn)服務(wù)型網(wǎng)站,該系統(tǒng)用戶數(shù)量與文獻(xiàn)資源較少,對于用戶小數(shù)據(jù)的收集、處理都具有一定的優(yōu)勢,通過對系統(tǒng)實(shí)名注冊用戶的基本屬性、愛好與行為數(shù)據(jù)進(jìn)行獲取與分析,結(jié)合國家科技報告資源數(shù)據(jù)庫,為用戶提供全方位、多層次的個性化知識服務(wù),滿足用戶動態(tài)化的需求。
國家科技報告服務(wù)系統(tǒng)用戶小數(shù)據(jù)庫由用戶基本屬性、興趣數(shù)據(jù)與行為數(shù)據(jù)組成。對這些小數(shù)據(jù)進(jìn)行獲取、存儲與組織,將其梳理、提煉和匯總,并使之有序化,是國家科技報告服務(wù)系統(tǒng)提供知識服務(wù)的基礎(chǔ)。獲取全部的用戶小數(shù)據(jù)并對其進(jìn)行分析,是了解用戶需求、提供個性化知識服務(wù)的重要基石,但在數(shù)據(jù)獲取的過程中將面臨用戶隱私泄露等風(fēng)險。如何做到對用戶小數(shù)據(jù)的保護(hù)、使系統(tǒng)用戶的合法權(quán)益不受侵犯也成為了在數(shù)據(jù)處理過程中所面臨的重要挑戰(zhàn)。因此,需要制定用戶隱私保障機(jī)制來規(guī)范用戶小數(shù)據(jù)的共享與使用,保護(hù)用戶小數(shù)據(jù)的安全,也就是保障系統(tǒng)的服務(wù)品質(zhì),提升用戶的知識服務(wù)體驗(yàn)。
知識服務(wù)的關(guān)鍵是發(fā)現(xiàn)用戶的個性化需求,應(yīng)在此基礎(chǔ)之上提供解決用戶特定問題的服務(wù)和資源配置方案[12]。不同層次、不同專業(yè)背景的系統(tǒng)用戶需求狀態(tài)是完全不同的[13],因此在基于用戶小數(shù)據(jù)的國家科技報告服務(wù)系統(tǒng)知識服務(wù)模式中,需要結(jié)合系統(tǒng)貯藏的大量科技報告資源與用戶小數(shù)據(jù)庫,分析用戶使用國家科技報告服務(wù)系統(tǒng)的情況,包括系統(tǒng)登錄次數(shù)、在各頁面的停留時間、瀏覽收藏科技報告資源的情況、檢索歷史等,利用數(shù)據(jù)挖掘技術(shù)、資源聚類等手段,獲取數(shù)據(jù)關(guān)聯(lián)關(guān)系,從而分析獲得用戶的知識需求,形成用戶需求庫。
圖1 基于用戶小數(shù)據(jù)的國家科技報告服務(wù)系統(tǒng)知識服務(wù)流程
根據(jù)系統(tǒng)用戶在不同科研階段具有不同需求的特點(diǎn),在國家科技報告數(shù)據(jù)庫的支持下,將與用戶需求相匹配的科技報告資源提供給系統(tǒng)用戶。提供方式主要有以下幾種:一是推送服務(wù)。推送服務(wù)是利用用戶興趣與行為數(shù)據(jù),提供用戶可能會感興趣的內(nèi)容,國家科技報告服務(wù)系統(tǒng)可以基于用戶需求庫,在知識挖掘的基礎(chǔ)上利用信息推送技術(shù)[14],通過電子郵件為用戶推送科技報告資源,使用戶不需主動檢索便可獲取到所需要的知識資源。二是定題服務(wù)。定題服務(wù)是指針對某一領(lǐng)域或科技計劃項(xiàng)目的科技報告資源,通過對國家科技報告數(shù)據(jù)庫中相關(guān)主題科技報告的整理、加工等操作,為不同需求的系統(tǒng)用戶集中提供某一特定主題的科技報告知識服務(wù)。三是一對一咨詢服務(wù)。以用戶需求為前提的知識咨詢服務(wù)具有動態(tài)、便捷、高效的特點(diǎn),而對于國家科技報告服務(wù)系統(tǒng),以龐大的科技報告資源為依托,為用戶解決實(shí)際問題并提供相應(yīng)對策是提升服務(wù)質(zhì)量的重要舉措。此外,還應(yīng)分類、歸納用戶遇到較多的問題,為用戶提供自助式知識服務(wù),從而在一定程度上減輕人力資源成本。
用戶評價是知識服務(wù)過程中不可或缺的環(huán)節(jié)。系統(tǒng)用戶對知識服務(wù)效果的評價是優(yōu)化知識服務(wù)策略、檢驗(yàn)知識服務(wù)成效的重要手段,而用戶對知識服務(wù)效果的滿意與否也同樣反映在用戶行為小數(shù)據(jù)的變化上。對用戶的動態(tài)需求的再挖掘可以進(jìn)一步完善知識服務(wù)形式,形成國家科技報告服務(wù)系統(tǒng)知識服務(wù)閉環(huán)模式。
3.2.4 支撐因素
(1)制度支撐。我國科技報告建設(shè)工作起步于2012年??萍疾垦芯恐贫藝铱萍紙蟾嬷贫冉ㄔO(shè)總體方案,明確了建立科技報告制度的總體目標(biāo)、重點(diǎn)任務(wù)和時間進(jìn)度安排[15]。2016年12月,科技部印發(fā)了《中央財政科技計劃(專項(xiàng)、基金等)科技報告管理暫行辦法》,明確提出了有關(guān)科技報告統(tǒng)一呈交、規(guī)范管理和共享使用的相關(guān)要求。這標(biāo)志著我國科技報告制度建設(shè)已初步形成,并從根本上保證了科技報告呈交的強(qiáng)制性,規(guī)范了科技報告的產(chǎn)生、收集、管理和共享過程[16]。因此,國家科技報告服務(wù)系統(tǒng)的建立、科技報告資源的收藏與共享全都離不開國家制度層面的保障,這是國家科技報告服務(wù)系統(tǒng)能夠?qū)嵤┲R服務(wù)的基礎(chǔ)。
(2)技術(shù)支撐。信息技術(shù)是互聯(lián)網(wǎng)時代的主體與核心。在國家科技報告服務(wù)系統(tǒng)實(shí)施知識服務(wù)的過程中,承載海量科技報告數(shù)據(jù)與用戶小數(shù)據(jù)資源,并對其進(jìn)行進(jìn)一步整合與分析,則需要強(qiáng)大的信息技術(shù)硬件與軟件支撐,而優(yōu)化知識檢索方式,拓展系統(tǒng)服務(wù)功能,通過數(shù)據(jù)分析提取用戶潛在需求并為之提供相應(yīng)的知識服務(wù)都離不開先進(jìn)的信息技術(shù),因此信息技術(shù)也是國家科技報告服務(wù)系統(tǒng)知識服務(wù)能夠有效推進(jìn)的重要保障之一。
(3)人員支撐。隨著系統(tǒng)開展知識服務(wù)工作的不斷深入,對系統(tǒng)管理人員提出了新的要求,不同學(xué)科、不同專業(yè)領(lǐng)域的管理人員也是國家科技報告服務(wù)系統(tǒng)知識服務(wù)模式的重要保障,因此要培養(yǎng)專業(yè)型、技術(shù)型的管理人才,建立健全人員管理機(jī)制與內(nèi)部激勵機(jī)制,使管理人員最大化地服務(wù)于用戶,進(jìn)一步保障系統(tǒng)知識服務(wù)能力。
國家科技報告服務(wù)系統(tǒng)自正式開通以來,一直致力于為用戶提供豐富、全面的科技報告資源。隨著社會發(fā)展與互聯(lián)網(wǎng)日新月異的變化,文獻(xiàn)服務(wù)類網(wǎng)站需要提供優(yōu)質(zhì)的知識服務(wù)以滿足用戶的個性化需求,這是適應(yīng)信息化發(fā)展的客觀需要和必然選擇。以小數(shù)據(jù)視角來審視知識服務(wù)流程,對用戶小數(shù)據(jù)進(jìn)行系統(tǒng)化、有序化、顯性化處理,為用戶提供個性化知識產(chǎn)品這一模式是適用于國家科技報告服務(wù)系統(tǒng)自身特點(diǎn)的知識服務(wù)道路。當(dāng)然,以用戶小數(shù)據(jù)為基礎(chǔ)的知識服務(wù)模式,還需在未來的工作中進(jìn)一步探索和完善,如何將其應(yīng)用于實(shí)際工作中,并使系統(tǒng)向知識化、
智能化發(fā)展,是國家科技報告服務(wù)系統(tǒng)接下來所要面對的挑戰(zhàn)與機(jī)遇。