丁利 趙麗梅
摘 要:基于社會網(wǎng)絡(luò)分析方法構(gòu)建科學(xué)數(shù)據(jù)開放共享領(lǐng)域作者合著網(wǎng)絡(luò),并對合著網(wǎng)絡(luò)的密度、中心性、結(jié)構(gòu)洞和成分指標(biāo)進(jìn)行測度分析;在研究核心作者團(tuán)體的基礎(chǔ)上,對該團(tuán)體的合著網(wǎng)絡(luò)和研究主題進(jìn)行分析,揭示出核心作者團(tuán)體合著網(wǎng)絡(luò)特點,并挖掘領(lǐng)域內(nèi)研究主題,以期推動科學(xué)數(shù)據(jù)開放共享研究領(lǐng)域的發(fā)展。
關(guān)鍵詞:社會網(wǎng)絡(luò)分析;SNA;科學(xué)數(shù)據(jù);開放共享;作者合著
中圖分類號:G203? 文獻(xiàn)標(biāo)識碼:A
Research on Open Sharing Co-author of Scientific Data in China Based on SNA
DING Li, ZHAO Limei
Abstract: Based on social network analysis, this paper constructs the co-author network in the field of open sharing of scientific data, and measures the density, centrality, structure holes and component indexes of the co-author network. On the basis of studying the core author group, this paper analyzes its co-author network and research themes, reveals its characteristics of co-author network, and excavates the research themes in the field, so as to promote the development of open sharing of scientific data.
Keywords: social network analysis;SNA;scientific data;open sharing;co-author
0 引言
科學(xué)數(shù)據(jù)是關(guān)于科學(xué)研究過程數(shù)據(jù)和產(chǎn)出數(shù)據(jù)的記錄,是科學(xué)研究的重要組成部分。科學(xué)數(shù)據(jù)的開放共享是發(fā)揮數(shù)據(jù)價值的前提,也是實現(xiàn)數(shù)據(jù)驅(qū)動創(chuàng)新的重要環(huán)節(jié)??茖W(xué)數(shù)據(jù)開放共享是指在網(wǎng)絡(luò)環(huán)境下,個人或機(jī)構(gòu)向社會或用戶提供可開放共享的科學(xué)數(shù)據(jù),并授權(quán)他人免費使用的一種行為[1]。
可開放共享的科學(xué)數(shù)據(jù)允許任何人或機(jī)構(gòu)進(jìn)行下載、復(fù)制、傳遞、再加工等數(shù)據(jù)處理,是促進(jìn)數(shù)據(jù)重用和數(shù)據(jù)流動的重要途徑。隨著科學(xué)研究成果和過程數(shù)據(jù)記錄的不斷增加,科學(xué)數(shù)據(jù)開放共享引起了越來越多的重視和關(guān)注。為促進(jìn)科學(xué)數(shù)據(jù)開放共享,國務(wù)院辦公廳在2018年3月發(fā)布的《科學(xué)數(shù)據(jù)管理辦法》中指出“科學(xué)數(shù)據(jù)開放為常態(tài)、不開放為例外”的共享原則[2];此外2020年11月3日公布的《中共中央關(guān)于制定國民經(jīng)濟(jì)和社會發(fā)展第十四個五年規(guī)劃和二〇三五年遠(yuǎn)景目標(biāo)的建議》中指出“建立數(shù)據(jù)資源產(chǎn)權(quán)……推動數(shù)據(jù)資源開發(fā)利用”、“擴(kuò)大基礎(chǔ)公共信息數(shù)據(jù)有序開放,建設(shè)國家數(shù)據(jù)統(tǒng)一共享開放平臺”[3]。
伴隨著科學(xué)數(shù)據(jù)開放共享研究工作的大量開展,國內(nèi)不少學(xué)者基于科學(xué)數(shù)據(jù)開放共享的政策與服務(wù)進(jìn)行研究。目前學(xué)者對科學(xué)數(shù)據(jù)開放共享政策[4-9]、利益相關(guān)者[10-12]、數(shù)據(jù)服務(wù)[13-15]、平臺建設(shè)[16-17]、保障體系[18-20]、數(shù)據(jù)重用困境[21-23]等方面進(jìn)行了廣泛研究。但有關(guān)作者合著關(guān)系的相關(guān)研究在國內(nèi)科學(xué)數(shù)據(jù)開放共享領(lǐng)域很少。作者合著關(guān)系是研究合著論文的作者之間的關(guān)系,合著發(fā)文往往能比獨立發(fā)文產(chǎn)生更廣泛的學(xué)術(shù)影響力[24],也有利于學(xué)者個人從合著中獲取更多的學(xué)術(shù)資源[25]。本文擬對國內(nèi)科學(xué)數(shù)據(jù)開放共享領(lǐng)域作者合著關(guān)系進(jìn)行分析,基于社會網(wǎng)絡(luò)分析方法,借助Ucinet和VOSviewer等軟件,構(gòu)建合著作者之間的矩陣,通過密度分析、中心性分析、結(jié)構(gòu)洞分析、成分分析和關(guān)鍵詞聚類分析等方法,探討科學(xué)數(shù)據(jù)開放共享作者合著研究領(lǐng)域整體合著現(xiàn)狀和研究主題。
1 數(shù)據(jù)來源與研究方法
1.1 數(shù)據(jù)來源
本研究的數(shù)據(jù)樣本來源于CNKI中國期刊全文數(shù)據(jù)庫,檢索時間為2022年4月10日,以主題詞(“科學(xué)數(shù)據(jù)”O(jiān)R“科研數(shù)據(jù)”O(jiān)R“研究數(shù)據(jù)”O(jiān)R“科技數(shù)據(jù)”)AND(“開放共享”O(jiān)R“開放獲取”)構(gòu)建檢索表達(dá)式,檢索時間范圍設(shè)定為不限至2021年,檢索共獲得相關(guān)論文725篇。經(jīng)過數(shù)據(jù)清洗,刪除無作者、通知、序、行動倡議、征稿啟事、報告等不符合要求的文獻(xiàn),最終得到639篇論文,作為進(jìn)一步分析的樣本。
1.2 研究方法
社會網(wǎng)絡(luò)分析(Social Network Analysis,即SNA)是社會學(xué)大師懷特等人推導(dǎo)出的一種數(shù)學(xué)分析方法,主要分析各行動者之間的關(guān)系模式,可應(yīng)用于作者合著關(guān)系分析,可以反映人與人之間或各組織之間重要的知識聯(lián)系[26]。本文基于社會網(wǎng)絡(luò)分析方法構(gòu)建科學(xué)數(shù)據(jù)開放共享領(lǐng)域作者合著網(wǎng)絡(luò),并對合著網(wǎng)絡(luò)的密度、中心性、結(jié)構(gòu)洞和成分指標(biāo)進(jìn)行測度分析;在揭示出核心作者團(tuán)體的基礎(chǔ)之上,對該團(tuán)體的合著網(wǎng)絡(luò)和研究主題進(jìn)行分析,揭示出核心作者團(tuán)體合著網(wǎng)絡(luò)特點,并挖掘領(lǐng)域內(nèi)研究熱點。
2? 數(shù)據(jù)預(yù)處理
2.1 對作者合著網(wǎng)絡(luò)的總體分析
科學(xué)數(shù)據(jù)開放共享作者合著研究領(lǐng)域論文年度發(fā)文量趨勢見圖1,從圖1可知,合著文獻(xiàn)首次發(fā)表于2004年,其后近十年的時間,合著發(fā)文量一直為個位數(shù),從2013開始,合著文獻(xiàn)發(fā)表數(shù)量開始呈現(xiàn)逐年遞增狀態(tài)。在經(jīng)過文獻(xiàn)清洗后的639篇論文中,作者合著情況統(tǒng)計見圖2,可以發(fā)現(xiàn)在國內(nèi)科學(xué)數(shù)據(jù)開放共享領(lǐng)域中單篇論文以2-3位作者合著為主,占所有文獻(xiàn)的46.95%。此外,有一篇文獻(xiàn)合著作者人數(shù)達(dá)23人。對收集的639篇文獻(xiàn)樣本進(jìn)行統(tǒng)計分析,得到表1,可知文獻(xiàn)作者數(shù)量共計1146人,其中獨著作者182位,合著作者964位。合作度是指所發(fā)表論文的篇均作者數(shù),合作率是指合著論文總數(shù)占論文總數(shù)的比例,合作度和合作率可以反映一定領(lǐng)域內(nèi)作者的合作程度[27],根據(jù)表1可得作者合作度為1.79,合作率為63.2 2%,說明國內(nèi)科學(xué)數(shù)據(jù)開放共享領(lǐng)域作者重視合作,傾向于合著發(fā)文。
2.2 高產(chǎn)作者識別
經(jīng)統(tǒng)計,2004年至2021年間,科學(xué)數(shù)據(jù)開放共享領(lǐng)域合著作者人數(shù)共964位,占相關(guān)文獻(xiàn)作者總數(shù)的84.1 2%,由于合著作者人數(shù)眾多,識別同一領(lǐng)域中高產(chǎn)作者群,可與中心性、結(jié)構(gòu)洞排名靠前的合著作者進(jìn)行對比比較,有利于分析作者合著網(wǎng)絡(luò)特性,促進(jìn)團(tuán)體合作。根據(jù)普萊斯定律,發(fā)表論文數(shù)K篇以上的作者為杰出科學(xué)家,即高產(chǎn)作者,計算公式為K=0.749Nmax,Nmax為該主題下最高產(chǎn)的那位科學(xué)家所發(fā)表的合著論文數(shù)。在國內(nèi)科學(xué)數(shù)據(jù)開放共享領(lǐng)域,最高產(chǎn)合著作者發(fā)表論文16篇,代入公式可得K≈2.996,所以發(fā)文量在3篇及以上的作者,為科學(xué)數(shù)據(jù)開放共享作者合著研究領(lǐng)域的高產(chǎn)合著作者(共56位,見表2)。
2.3 構(gòu)建矩陣
首先構(gòu)建合著作者之間的合著矩陣。使用Excel軟件將著者數(shù)據(jù)進(jìn)行預(yù)處理,然后借助Ucinet軟件構(gòu)建出合著作者之間的964*964合著關(guān)系矩陣(見表3),這里由于篇幅限制,不能列出完整的作者合著關(guān)系矩陣,這里僅展示部分作者合著矩陣。
3 合著作者整體網(wǎng)絡(luò)分析
利用Netdraw工具對964位作者構(gòu)成的合著矩陣進(jìn)行可視化處理,得到科學(xué)數(shù)據(jù)開放共享領(lǐng)域合著作者的整體合著網(wǎng)絡(luò),見圖3。其中節(jié)點代表本研究領(lǐng)域內(nèi)合著作者,連線表示作者之間的合著關(guān)系,線的粗線表示作者之間的合著強(qiáng)度,節(jié)點的大小代表作者發(fā)文量的多少。從圖3可以發(fā)現(xiàn),雖然合著現(xiàn)象普遍,但整體網(wǎng)絡(luò)較為松散,小團(tuán)體合作現(xiàn)象普遍,作者合著整體網(wǎng)絡(luò)中最大合作團(tuán)體是以顧立平為核心的150人團(tuán)體(下文稱這一最大團(tuán)體為核心作者團(tuán)體)。
3.1 密度分析
密度分析反映了節(jié)點間的稀疏,成員之間的聯(lián)系越多,該網(wǎng)絡(luò)的密度越大。整體的密度越大,該網(wǎng)絡(luò)對其中的節(jié)點的行為、態(tài)度影響可能越大。網(wǎng)絡(luò)密度通過對社會網(wǎng)絡(luò)中實際存在的邊數(shù)與可容納的邊數(shù)上限的比值計算,以數(shù)值的形式表示該網(wǎng)絡(luò)中節(jié)點間相互連邊的密集程度[28]。密度值介于0-1之間,值越接近1表明節(jié)點之間彼此的關(guān)系越緊密[29]。利用Ucinet軟件測算整體合著網(wǎng)絡(luò)的密度,可知國內(nèi)科學(xué)數(shù)據(jù)開放共享作者合著領(lǐng)域的密度值僅為0.003,網(wǎng)絡(luò)密度較低,表明節(jié)點之間的關(guān)系較為松散,成員之間的聯(lián)系不多,尚未形成密集型合著網(wǎng)絡(luò)。這是目前學(xué)術(shù)合作的一種正?,F(xiàn)象,學(xué)者之間由于空間、時間和地域的限制,導(dǎo)致合著發(fā)文多為同一單位師師之間,或是師生之間,小團(tuán)體合著較為普遍,那么在整體網(wǎng)絡(luò)中的表現(xiàn)就為節(jié)點之間的連接性差,密度值低。
3.2 中心性分析
中心性最早是用來研究人或者組織在社會網(wǎng)絡(luò)中居于怎么樣的地位。中心性的測度指標(biāo)有點度中心度、接近中心度和中間中心度等三種形式。在社會網(wǎng)絡(luò)中,點度中心度測算的是一個節(jié)點與其他節(jié)點直接相連的點的個數(shù),刻畫的是網(wǎng)絡(luò)節(jié)點自身的交易能力;中間中心度是一個節(jié)點如果處于其他很多點對中間,那么這個節(jié)點就具有很高的測算指標(biāo)數(shù),因而是一種控制能力指數(shù);接近中心度測算的是行動者在多大程度上不受其他行動者的控制,在網(wǎng)絡(luò)中如果一個節(jié)點與其他節(jié)點的連接“距離”都很短,那么該點就具有較高的接近中心度。利用Ucinet軟件對合著作者的中心性進(jìn)行測算,得到排名前20位的合著作者,見表4和表6。
3.2 .1 點度中心度
點度中心度測算的是與某點直接相連的點的個數(shù),與合著團(tuán)體的規(guī)模和次數(shù)相關(guān)。合著發(fā)文量排名第一的作者顧立平教授,中心度最高,為50,其與他人合著次數(shù)最多,合著規(guī)模也最大,在國內(nèi)科學(xué)數(shù)據(jù)開放共享作者合著領(lǐng)域擁有重要地位。而合著發(fā)文量排在前三的盛小平、黃如花的點度中心度分別為18、16,點度中心度的排名分別為38和42,這是由于盛小平和黃如花教授的合著發(fā)文多為師生之間合著,合著團(tuán)體多為2-3人,雖合著次數(shù)多,但合著規(guī)模不大所致。此外,有一篇文章是由米琳瑩等23位作者完成(見表5),通過測算23位作者的點度中心度大于等于22,這是由于此篇論文合著團(tuán)體規(guī)模過大而導(dǎo)致的特殊情況,由此也能看出點度中心度的大小與合著團(tuán)體的規(guī)模正向相關(guān)。
3.2 .2 接近中心度
接近中心度數(shù)值越小,說明該點距離其他點的距離短,更容易獲取資源且受其他人控制的力度小。根據(jù)表4,接近中心度數(shù)值最小的人是石蕾,其次是胡良霖、鄭曉歡,說明其獲取資源比較容易且不易受他人控制。石蕾、胡良霖、鄭曉歡分別隸屬于國家科技基礎(chǔ)條件平臺中心、中國科學(xué)院計算機(jī)網(wǎng)絡(luò)信息中心、中國科學(xué)院辦公廳,由此也可看出業(yè)界的學(xué)者相比于學(xué)界的學(xué)者更容易獲取資源。此外,將接近中心度排名前20位的合著作者分別與高產(chǎn)作者、核心作者團(tuán)體進(jìn)行對比,可以發(fā)現(xiàn)這20位合著作者均屬于核心作者團(tuán)體中,但只有12位作者屬于高產(chǎn)作者,說明接近中心度數(shù)值越小的人建立合著關(guān)系的能力越強(qiáng),但發(fā)文量和接近中心度指標(biāo)之間并無正向關(guān)系。
3.2 .3 中間中心度
中間中心度越大,表明越多人經(jīng)過這條網(wǎng)絡(luò)路徑,說明該點合著渠道較廣,建立合著關(guān)系的能力較強(qiáng),連接他人的能力較大。根據(jù)表6可以看出,排名前20位合著作者的中間中心度的數(shù)值差異很大,在所有的964位合著作者中,有12.3 4%的人中間中心度不為零,且中間中心度數(shù)值差異明顯,表明在同一領(lǐng)域中,只有少數(shù)人掌握了大量的資源,起到了溝通橋梁的作用。此外,對中間中心度排名前20的合著作者的單位和身份進(jìn)行統(tǒng)計(單位信息以知網(wǎng)作者認(rèn)證為主,身份信息來源于論文作者簡介或機(jī)構(gòu)網(wǎng)站),可以發(fā)現(xiàn)科學(xué)數(shù)據(jù)開放共享作者合著領(lǐng)域中間中心度高的學(xué)者大部分是來自于中國科學(xué)院和國家科技基礎(chǔ)條件平臺中心。一方面,由于機(jī)構(gòu)匯聚了科學(xué)數(shù)據(jù)開放共享學(xué)科領(lǐng)域內(nèi)的頂尖人才;另一方面,由于其上述機(jī)構(gòu)的特殊性,學(xué)者掌握資源,所以在合著網(wǎng)絡(luò)中占據(jù)優(yōu)勢地位,具有較高的中間中心度。
3.3 結(jié)構(gòu)洞分析
結(jié)構(gòu)洞是兩個行動者之間的非冗余的聯(lián)系。該指標(biāo)反映節(jié)點在網(wǎng)絡(luò)中的信息、資源和權(quán)力,處于結(jié)構(gòu)洞位置的節(jié)點具有信息優(yōu)勢和控制優(yōu)勢,對其他節(jié)點產(chǎn)生重要影響。結(jié)構(gòu)洞的分析指標(biāo)包括有效規(guī)模、效率和限制度,有效規(guī)模越大,節(jié)點獨立性越強(qiáng);效率越高,個體行動越有效,對其他節(jié)點的影響越大;限制度越低,網(wǎng)絡(luò)越開放,即結(jié)構(gòu)洞數(shù)量越多[30]。本文利用Ucinet軟件對科學(xué)數(shù)據(jù)開放共享領(lǐng)域的合著作者進(jìn)行結(jié)構(gòu)洞分析,對限制度指標(biāo)進(jìn)行升序排序,得到表7。根據(jù)表7,可知顧立平的有效規(guī)模最大,限制度最小,說明其在該領(lǐng)域社會網(wǎng)絡(luò)中充當(dāng)結(jié)構(gòu)洞的位置,在網(wǎng)絡(luò)中具有重要地位,這與前面的中心性分析一致,說明其在科學(xué)數(shù)據(jù)開放共享領(lǐng)域中具有權(quán)威性。
3.4 成分分析
如果一個網(wǎng)絡(luò)可以分為幾個部分,每個部分的內(nèi)部成員之間存在關(guān)聯(lián),而各個部分之間沒有任何關(guān)聯(lián),在這種情況下,我們把這些部分稱為成分,在本文中也稱其為團(tuán)體。通過Ucinet軟件對作者合著數(shù)據(jù)進(jìn)行處理,可以得到科學(xué)數(shù)據(jù)開放共享領(lǐng)域的論文作者合著團(tuán)體,見表8。科學(xué)數(shù)據(jù)開放共享領(lǐng)域合著作者共964位,一共形成了226個團(tuán)體,其中2-3人的團(tuán)體最為普遍數(shù)量達(dá)到160個,占所有團(tuán)體的70.8%,說明小團(tuán)體合著現(xiàn)象普遍。合著論文發(fā)文量排名前三的作者顧立平、黃如花、盛小平分別位于人數(shù)排名前三為150、50和19的團(tuán)體中,說明合著發(fā)文量與團(tuán)體大小有關(guān),但三人彼此之間并無合著關(guān)系。將高產(chǎn)合著作者與核心作者團(tuán)體進(jìn)行比對,發(fā)現(xiàn)50%的高產(chǎn)合著作者屬于核心作者團(tuán)體。
4 核心作者團(tuán)體合著網(wǎng)絡(luò)及主題分析
從密度、中心性、結(jié)構(gòu)洞和成分四個方面對作者合著網(wǎng)絡(luò)整體情況進(jìn)行分析,可以從整體層面得知科學(xué)數(shù)據(jù)開放共享領(lǐng)域合著作者在社會網(wǎng)絡(luò)中所處的位置以及資源掌握情況。但是個體網(wǎng)絡(luò)是否也具有整體網(wǎng)絡(luò)社會網(wǎng)絡(luò)特征,本文將以顧立平為核心的核心作者團(tuán)體為例,探討整體網(wǎng)絡(luò)中個體網(wǎng)絡(luò)的社會網(wǎng)絡(luò)特征。此外,從前文可知,將高產(chǎn)合著作者與核心作者團(tuán)體進(jìn)行比對,有50%的高產(chǎn)合著作者屬于核心作者團(tuán)體,所以對核心作者團(tuán)體研究主題進(jìn)行分析挖掘,可以在一定程度上展現(xiàn)整體合著作者的研究主題。
4.1 核心作者團(tuán)體網(wǎng)絡(luò)分析
通過Ucinet軟件測算核心作者團(tuán)體密度,得到團(tuán)體密度值為0.056,約是整體密度的18倍(整體網(wǎng)絡(luò)的密度值為0.003),說明相對于整體社會網(wǎng)絡(luò),團(tuán)體之間的合著關(guān)系更為密切,網(wǎng)絡(luò)連通率相對較好,成員內(nèi)部之間的聯(lián)系也較多。對核心團(tuán)體之間的社會網(wǎng)絡(luò)關(guān)系進(jìn)行可視化,結(jié)果見圖4。從圖4可得,核心團(tuán)體的社會網(wǎng)絡(luò)關(guān)系總體上呈現(xiàn)出以顧立平為核心向外發(fā)散趨勢,同時經(jīng)過中心性和結(jié)構(gòu)洞指標(biāo)測算(見表9),發(fā)現(xiàn)團(tuán)體中顧立平、李成贊、劉峰、周園春、崔辰州、郝晉新、胡良霖、姜璐璐、黎建輝、石蕾、薛艷杰、于策、袁海波、鄭曉歡在網(wǎng)絡(luò)中處于重要地位,在中心性和結(jié)構(gòu)洞指標(biāo)測算中至少出現(xiàn)2次。
4.2 核心作者團(tuán)體研究主題分析
關(guān)鍵詞能夠表達(dá)某一學(xué)科領(lǐng)域的熱點研究方向和研究主題,關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)可以根據(jù)關(guān)鍵詞之間的親疏遠(yuǎn)近關(guān)系分析其中的研究主題[31],從而到達(dá)探討科學(xué)數(shù)據(jù)開放共享研究領(lǐng)域中核心作者團(tuán)體研究主題的目的?;诤诵淖髡邎F(tuán)體合著發(fā)表的63篇論文,從中提取關(guān)鍵詞196個,導(dǎo)入VOSviewer中,生成關(guān)鍵詞共現(xiàn)圖譜,見圖5。其中節(jié)點的大小取決于關(guān)鍵詞同時出現(xiàn)的次數(shù),節(jié)點的顏色代表其所屬的聚類,不同的顏色代表不同的聚類。根據(jù)結(jié)果顯示,研究主題主要聚類為開放共享、數(shù)據(jù)管理、數(shù)據(jù)政策、數(shù)據(jù)出版、數(shù)據(jù)倫理5類。
4.2 .1 開放共享主題聚類分析
現(xiàn)代意義上的開放共享,是指在網(wǎng)絡(luò)環(huán)境中,個人和機(jī)構(gòu)向社會或用戶提供數(shù)據(jù)、信息和作品,并授權(quán)他人免費使用的一種行為[32]。開放共享一方面可以使先進(jìn)科學(xué)成果在世界范圍內(nèi)快速傳播和利用,擴(kuò)大了知識傳播范圍,加速了科學(xué)知識創(chuàng)新;另一方面,隨著科學(xué)研究成果的傳播,越來越多的研究依賴現(xiàn)有的數(shù)據(jù),通過二次分析得到新發(fā)現(xiàn),提高了科研人員研究效率和學(xué)術(shù)影響力[33]。在核心作者團(tuán)體中該研究主題聚焦于科學(xué)數(shù)據(jù)開放共享的原則、共享模式、標(biāo)準(zhǔn)規(guī)范、影響因素等方面。在科學(xué)數(shù)據(jù)開放共享成為全球共識下,F(xiàn)AIR原則已成為科學(xué)數(shù)據(jù)開放共享過程中數(shù)據(jù)管理的國際準(zhǔn)則[34]。目前,關(guān)于科學(xué)數(shù)據(jù)共享模式的研究,國內(nèi)學(xué)者根據(jù)數(shù)據(jù)所依據(jù)的組織形式,將科學(xué)數(shù)據(jù)開放共享模式分成政策驅(qū)動模式、部門交互模式、企業(yè)驅(qū)動模式、國際合作模式等[35]。此外,我國科學(xué)數(shù)據(jù)共享仍然存在一些不足,所以需要識別影響科學(xué)數(shù)據(jù)共享的影響因素[36],加強(qiáng)科學(xué)數(shù)據(jù)開放共享能力建設(shè),推動科學(xué)數(shù)據(jù)的進(jìn)一步開放共享。
4.2 .2 數(shù)據(jù)管理主題聚類分析
數(shù)據(jù)管理是指管理研究項目中所使用或是產(chǎn)出的數(shù)據(jù)。在數(shù)據(jù)生命周期內(nèi),對項目研究過程中的所收集、使用和產(chǎn)生的數(shù)據(jù)進(jìn)行規(guī)劃管理,以確保數(shù)據(jù)質(zhì)量,提高數(shù)據(jù)準(zhǔn)確性、完整性和安全性,最大程度地發(fā)揮數(shù)據(jù)價值等[37],為后續(xù)數(shù)據(jù)開放共享提供良好基礎(chǔ)。該研究主題主要包含科學(xué)數(shù)據(jù)共享的數(shù)據(jù)管理政策、數(shù)據(jù)治理等方面。2018年《科學(xué)數(shù)據(jù)管理辦法》的出臺,為我國科學(xué)數(shù)據(jù)管理與共享工作提供了政策指導(dǎo)與依據(jù)[38]。但通過調(diào)研發(fā)現(xiàn),《科學(xué)數(shù)據(jù)管理辦法》的總體落實情況不理想,管理者應(yīng)從實踐研究、機(jī)制體制建設(shè)、相關(guān)利益者合作等方面推動數(shù)據(jù)管理工作的落實[39]。在科學(xué)數(shù)據(jù)管理過程中,數(shù)據(jù)治理是數(shù)據(jù)管理另一重要部分,數(shù)據(jù)治理可以明確數(shù)據(jù)所有權(quán)、生存權(quán)、使用權(quán)、出版權(quán)和交易權(quán),進(jìn)一步促進(jìn)了科學(xué)數(shù)據(jù)共享體系的建立[40]。
4.2 .3 數(shù)據(jù)政策主題聚類分析
科學(xué)數(shù)據(jù)開放共享政策是指某一機(jī)構(gòu)或者組織關(guān)于如何有效實施科學(xué)數(shù)據(jù)開放共享的相關(guān)規(guī)定或制度安排[41]。制定科學(xué)數(shù)據(jù)開放共享的政策,是為研究加速、促進(jìn)研究發(fā)現(xiàn)、促進(jìn)科研人員交流合作、明確研究責(zé)任、提升研究效率與創(chuàng)新能力保駕護(hù)航[42-43]。該主題主要聚焦于國內(nèi)外科學(xué)數(shù)據(jù)開放共享政策調(diào)研和文本內(nèi)容分析方面。美國、英國、德國等西方國家陸續(xù)發(fā)布了多項科學(xué)數(shù)據(jù)管理政策,我國科研人員從不同維度進(jìn)行了調(diào)研分析,并在應(yīng)用方面進(jìn)行了積極探索[42,44-45]。在2000年,英國通過《信息自由法》,為信息開放共享提供了法律保障,為科學(xué)數(shù)據(jù)的開放共享奠定了基礎(chǔ)[46]。在國內(nèi),2018年國務(wù)院頒發(fā)《科學(xué)數(shù)據(jù)管理辦法》并實施,保障了科學(xué)數(shù)據(jù)安全,促進(jìn)了科學(xué)數(shù)據(jù)共享,提高了我國科學(xué)數(shù)據(jù)開放共享水平[47]。
4.2 .4 數(shù)據(jù)出版主題聚類分析
數(shù)據(jù)出版是指通過一定的公共平臺發(fā)布科研數(shù)據(jù)集,使得公眾根據(jù)一定的條件可以發(fā)現(xiàn)、獲取、利用和評價這些數(shù)據(jù)集[48]。數(shù)據(jù)出版是科學(xué)數(shù)據(jù)開放共享的重要方式之一,數(shù)據(jù)出版完成了傳統(tǒng)圖書出版模式至公共平臺出版模式的轉(zhuǎn)變,進(jìn)一步推進(jìn)了科學(xué)數(shù)據(jù)長期保存和數(shù)據(jù)有效管理[49],促進(jìn)了科學(xué)數(shù)據(jù)的可發(fā)現(xiàn)性、可訪問性、可互操作性和可重用性。核心作者團(tuán)體在數(shù)據(jù)出版主題的研究著重于機(jī)制模式、特征、平臺效能等方面。在整個科研數(shù)據(jù)生態(tài)體系中,建立方便、可靠、可測量、可驗證、可支持FAIR原則的數(shù)據(jù)出版機(jī)制是重要基礎(chǔ)[50]。目前,關(guān)于科學(xué)數(shù)據(jù)出版模式主要分為三種:獨立的數(shù)據(jù)出版、論文附件形式數(shù)據(jù)出版、數(shù)據(jù)論文出版[51]。此外,基于數(shù)據(jù)庫WOS的調(diào)研發(fā)現(xiàn),國內(nèi)在科學(xué)數(shù)據(jù)出版數(shù)量上領(lǐng)先,但科研人員更傾向于在國外出版物、存儲平臺上進(jìn)行數(shù)據(jù)發(fā)布,因此管理層面應(yīng)制定政策、投入資金,激勵國內(nèi)優(yōu)秀科學(xué)數(shù)據(jù)出版平臺和出版物的發(fā)展[52]。
4.2 .5 數(shù)據(jù)倫理主題聚類分析
數(shù)據(jù)倫理是在收集、整理、分析、傳播、重用等數(shù)據(jù)相關(guān)活動中應(yīng)遵守的準(zhǔn)則和規(guī)范,是倫理研究在大數(shù)據(jù)領(lǐng)域的延伸和拓展[53]。數(shù)據(jù)倫理對數(shù)據(jù)生命周期內(nèi)可能產(chǎn)生的倫理問題進(jìn)行規(guī)范約束,要求對數(shù)據(jù)進(jìn)行正確使用,認(rèn)識數(shù)據(jù)的價值,確保數(shù)據(jù)安全,維護(hù)數(shù)據(jù)領(lǐng)域的正常秩序。核心作者團(tuán)體在該主題的研究主要包括數(shù)據(jù)倫理的政策和框架研究等??蒲腥藛T在數(shù)據(jù)共享過程中遭遇隱私泄露、產(chǎn)權(quán)不明等倫理困境,制約了科學(xué)數(shù)據(jù)的開放共享[23]。劉金亞等從政策信息角度,挖掘數(shù)據(jù)倫理規(guī)則,為有效實現(xiàn)科學(xué)數(shù)據(jù)價值最大化提供了價值指南[54],其次劉金亞等為推動科研數(shù)據(jù)共享,構(gòu)建了面向科研人員的數(shù)據(jù)倫理框架,幫助科研人員克服數(shù)據(jù)倫理障礙[55]。此外,陳勁等發(fā)現(xiàn)如果提升科研人員的倫理道德意識,規(guī)避數(shù)據(jù)共享過程中的負(fù)面?zhèn)惱韱栴},可以促進(jìn)科學(xué)數(shù)據(jù)開放共享的發(fā)展[56]。
5 結(jié)語
本文基于社會網(wǎng)絡(luò)分析方法,借助Ucinet和VOSviewer等軟件,構(gòu)建合著作者之間的矩陣,通過密度分析、中心性分析、結(jié)構(gòu)洞分析和成分分析等方法,揭示出國內(nèi)科學(xué)數(shù)據(jù)開放共享研究領(lǐng)域作者合著現(xiàn)狀和核心作者團(tuán)體;在揭示出核心作者團(tuán)體的基礎(chǔ)之上,對該團(tuán)體的合著網(wǎng)絡(luò)和研究主題進(jìn)行分析,發(fā)現(xiàn)核心作者團(tuán)體合著網(wǎng)絡(luò)特征,并挖掘領(lǐng)域內(nèi)研究主題。根據(jù)對整體網(wǎng)絡(luò)的分析,發(fā)現(xiàn)研究領(lǐng)域內(nèi)有合著現(xiàn)象逐年增多現(xiàn)象,以及尚未形成密集型合著網(wǎng)絡(luò)和小團(tuán)體合著現(xiàn)象普遍等特點,這是由于空間、時間和地域的限制,導(dǎo)致合著發(fā)文學(xué)者多為同一單位師師之間,或是師生之間。因此建議國內(nèi)科學(xué)數(shù)據(jù)開放共享領(lǐng)域內(nèi)作者加強(qiáng)溝通和交流,以實現(xiàn)信息交流和資源共享,完成從小團(tuán)體到大團(tuán)體的轉(zhuǎn)變。根據(jù)對核心作者團(tuán)體的分析,一方面,相對于整體合著網(wǎng)絡(luò),核心作者團(tuán)體的網(wǎng)絡(luò)密度更高,作者之間的聯(lián)系更為密切;另一方面,目前國內(nèi)科學(xué)數(shù)據(jù)開放共享作者合著研究領(lǐng)域的研究主題有開放共享、數(shù)據(jù)管理、數(shù)據(jù)政策、數(shù)據(jù)出版和數(shù)據(jù)倫理等方面。此外研究領(lǐng)域內(nèi)有合著現(xiàn)象逐年增多現(xiàn)象,說明科學(xué)數(shù)據(jù)開放共享研究領(lǐng)域愈發(fā)受到學(xué)界的關(guān)注和重視,未來學(xué)者可以基于以上研究主題進(jìn)行合作交流,促進(jìn)大規(guī)模團(tuán)體合作的形成,推動科學(xué)數(shù)據(jù)開放共享研究領(lǐng)域的發(fā)展。
參考文獻(xiàn):
[1]盛小平,袁圓.科學(xué)數(shù)據(jù)開放共享中的數(shù)據(jù)權(quán)利治理研究[J].中國圖書館學(xué)報,2021,47(5):80-96.
[2]國務(wù)院辦公廳關(guān)于印發(fā)科學(xué)數(shù)據(jù)管理辦法的通知:科學(xué)數(shù)據(jù)管理辦法[EB/OL].[2022-09-12].http://www.gov.cn/gongbao/content/2018/content_5283177.htmHYPERLINK"http://www.gov.cn/gongbao/content/2018/content_5283177.htm".
[3]中共中央關(guān)于制定國民經(jīng)濟(jì)和社會發(fā)展第十四個五年規(guī)劃和二〇三五年遠(yuǎn)景目標(biāo)的建議[EB/OL].[2022-09-12].http://www.gov.cn/zhengce/2020-11/03/content_5556991.htm.
[4]馬海群,蒲攀.國內(nèi)外開放數(shù)據(jù)政策研究現(xiàn)狀分析及我國研究動向研判[J].中國圖書館學(xué)報,2015,41(5):76-86.
[5]劉嘉琪,任妮,劉桂鋒.政府?dāng)?shù)據(jù)開放共享政策的內(nèi)容體系構(gòu)建研究[J].數(shù)字圖書館論壇,2022(8):19-26.
[6]趙洋,程雪涓.政策工具視域下我國開放數(shù)據(jù)政策研究[J].圖書館雜志,2021,40(11):31-38,47.
[7]姜鑫.世界一流大學(xué)科學(xué)數(shù)據(jù)開放共享政策研究:基于質(zhì)性文本分析視角[J].圖書館學(xué)研究,2021(20):55-67.
[8]支鳳穩(wěn),趙宇晨.我國科技計劃項目科學(xué)數(shù)據(jù)匯交政策分析[J].圖書館學(xué)研究,2021(23):45-52.
[9]盛小平,宋大成.數(shù)據(jù)管理與數(shù)據(jù)治理的比較分析及其對制定科學(xué)數(shù)據(jù)開放共享政策的啟示[J].圖書情報工作,2020,64(22):4-10.
[10]夏義堃,管茜,周艷.生命科學(xué)數(shù)據(jù)管理的主體責(zé)任與驅(qū)動機(jī)制研究:基于利益相關(guān)者理論的分析[J].圖書與情報,2021(3):35-46.
[11]陳媛媛,王苑穎.科研數(shù)據(jù)開放共享的利益相關(guān)者互動關(guān)系[J].圖書館論壇,2020,40(5):55-63.
[12]盛小平,王毅.利益相關(guān)者在科學(xué)數(shù)據(jù)開放共享中的責(zé)任與作用:基于國際組織科學(xué)數(shù)據(jù)開放共享政策的分析[J].圖書情報工作,2019,63(17):31-39.
[13]武彤.基于數(shù)據(jù)生命周期的美國研究圖書館科學(xué)數(shù)據(jù)開放共享服務(wù)研究[J].圖書與情報,2019(1):135-144.
[14]顧立平.科研模式變革中的數(shù)據(jù)管理服務(wù):實現(xiàn)開放獲取、開放數(shù)據(jù)、開放科學(xué)的途徑[J].中國圖書館學(xué)報,2018,44(6):43-58.
[15]汪滿容,劉桂鋒,劉瓊.新加坡高校圖書館科研數(shù)據(jù)管理服務(wù)調(diào)研與啟示[J].圖書館學(xué)研究,2018(9):64-71,22.
[16]鄭榮,張薇,高志豪.基于區(qū)塊鏈技術(shù)的政府?dāng)?shù)據(jù)開放共享平臺構(gòu)建與運行機(jī)制研究[J].情報科學(xué),2022,40(5):137-143.
[17]陳鳳珍,游麗金,楊帆,等.CNGBdb:國家基因庫生命大數(shù)據(jù)平臺[J].遺傳,2020,42(8):799-809.
[18]齊法制,陳剛,程耀東.建立權(quán)責(zé)明晰且能力健全的科學(xué)數(shù)據(jù)開放共享機(jī)制:以高能物理領(lǐng)域為例[J].中國科學(xué)基金,2019,33(3):229-236.
[19]是沁,儲節(jié)旺.基于系統(tǒng)動力學(xué)的科學(xué)數(shù)據(jù)開放共享保障機(jī)制研究[J].情報雜志,2018,37(11):143-149.
[20]王晴.論科學(xué)數(shù)據(jù)開放共享的運行模式、保障機(jī)制及優(yōu)化策略[J].國家圖書館學(xué)刊,2014,23(1):3-9.
[21]張瀟月,顧立平,胡良霖.國內(nèi)外開放科研數(shù)據(jù)重用困境解決措施述評[J].圖書館,2021(3):80-89.
[22]關(guān)琳琳,金鑫,馬瀚青,等.國際數(shù)據(jù)期刊出版質(zhì)量控制機(jī)制研究[J].中國科技期刊研究,2021,32(10):1269-1277.
[23]梁宇,鄭易平.科研數(shù)據(jù)共享中的數(shù)據(jù)倫理問題研究[J].中國科技論壇,2022(1):22-27.
[24]高瑾.數(shù)字人文領(lǐng)域女性學(xué)者的影響力研究:以合著網(wǎng)絡(luò)分析為例[J].圖書館論壇,2022,42(1):117-129.
[25]龐雨靜,盧新元,張恒.SNA視角下國內(nèi)智慧圖書館領(lǐng)域作者合作的特征挖掘與關(guān)系預(yù)測[J].情報科學(xué),2022,40(6):124-131.
[26]楊琳,李健,鄧小昭.國內(nèi)個人信息安全領(lǐng)域作者潛在合作關(guān)系研究[J].情報探索,2021(2):87-95.
[27]王衛(wèi),閆帥,史銳涵.作者合作網(wǎng)絡(luò)連接影響因素分析:以圖情領(lǐng)域為例[J].情報科學(xué),2018,36(1):61-66,74.
[28]黃麗霞,紀(jì)蘇桐.基于SNA國內(nèi)閱讀推廣領(lǐng)域作者合作關(guān)系研究[J].圖書情報工作,2020,64(7):119-126.
[29]劉軍.社會網(wǎng)絡(luò)分析導(dǎo)論[M].北京:社會科學(xué)文獻(xiàn)出版社,2004:100
[30]邱均平,王菲菲.基于SNA的國內(nèi)競爭情報領(lǐng)域作者合作關(guān)系研究[J].圖書館論壇,2010,30(6):34-40,134.
[31]李娜.我國“一帶一路”研究熱點問題探析:基于知識圖譜的視角[C]//中國圖書館學(xué)會.中國圖書館學(xué)會年會論文集(2017年卷).北京:國家圖書館出版社,2018:597-608.
[32]盛小平,楊智勇.開放科學(xué)、開放共享、開放數(shù)據(jù)三者關(guān)系解析[J].圖書情報工作,2019,63(17):15-22.
[33]張旺,程慧平.科學(xué)數(shù)據(jù)開放共享策略機(jī)制及優(yōu)化路徑研究[J].情報雜志,2020,39(5):154-161.
[34]宋佳,溫亮明,李洋.科學(xué)數(shù)據(jù)共享FAIR原則:背景、內(nèi)容及實踐[J].情報資料工作,2021,42(1):57-68.
[35]左建安,陳雅.大數(shù)據(jù)時代的科學(xué)數(shù)據(jù)共享模式研究[J].新世紀(jì)圖書館,2014(3):32-35.
[36]溫亮明,李洋.我國科學(xué)數(shù)據(jù)開放共享模式、標(biāo)準(zhǔn)與影響因素研究[J].圖書情報研究,2021,14(1):33-41.
[37]盛小平,田婧,向桂林.科學(xué)數(shù)據(jù)開放共享中的數(shù)據(jù)質(zhì)量治理研究[J].圖書情報工作,2020,64(22):11-24.
[38]邢文明,洪芳林,李曉妍.科學(xué)數(shù)據(jù)管理體系的二維視角:《科學(xué)數(shù)據(jù)管理辦法》解讀[J].圖書情報工作,2019,63(23):30-37.
[39]李洋,溫亮明.《科學(xué)數(shù)據(jù)管理辦法》落實現(xiàn)狀、影響因素及推進(jìn)策略研究[J].圖書情報工作,2021,65(2):65-74.
[40]莊嚴(yán),楊帥,劉照坤,等.農(nóng)業(yè)科學(xué)觀測數(shù)據(jù)權(quán)屬與保護(hù)路徑研究[J].農(nóng)業(yè)大數(shù)據(jù)學(xué)報,2020,2(4):107-112.
[41]盛小平,武彤.國內(nèi)外科學(xué)數(shù)據(jù)開放共享研究綜述[J].圖書情報工作,2019,63(17):6-14.
[42]劉莉,劉文云,劉建,等.英國科研數(shù)據(jù)管理與共享政策研究[J].情報資料工作,2019,40(5):46-53.
[43]張曉林.實施公共資助科研項目研究數(shù)據(jù)開放共享的政策建議[J].中國科學(xué)基金,2019,33(1):79-87.
[44]衛(wèi)軍朝,閆妍,王海彪.科學(xué)數(shù)據(jù)開放政策保障體系的構(gòu)建與應(yīng)用[J].圖書館學(xué)研究,2017(22):46-54.
[45]丁培.國外大學(xué)科研數(shù)據(jù)管理政策研究[J].圖書館論壇,2014,34(5):99-106.
[46]楊靜,趙俊杰.國外科學(xué)數(shù)據(jù)管理情況研究[J].全球科技經(jīng)濟(jì)瞭望,2019,34(1):26-31.
[47]高瑜蔚,石蕾,朱艷華,等.《科學(xué)數(shù)據(jù)管理辦法》實施細(xì)則比較研究:以正式發(fā)布的11份細(xì)則為例[J].中國科技資源導(dǎo)刊,2019,51(3):1-10,17.
[48]孔麗華,習(xí)妍,張曉林.數(shù)據(jù)出版的趨勢、機(jī)制與挑戰(zhàn)[J].中國科學(xué)基金,2019,33(3):237-245.
[49]李思經(jīng),宋立榮,王健.面向開放共享的科學(xué)數(shù)據(jù)出版:機(jī)遇、挑戰(zhàn)與對策[J].中國科技期刊研究,2021,32(5):671-679.
[50]劉茲恒,涂志芳.數(shù)據(jù)出版及其質(zhì)量控制研究綜述[J].圖書館論壇,2020,40(10):99-107.
[51]涂志芳.科學(xué)數(shù)據(jù)出版生態(tài)系統(tǒng)與質(zhì)量控制體系構(gòu)建[J].圖書與情報,2019(1):125-134.
[52]王衛(wèi)軍,李成贊,鄭曉歡,等.全球科學(xué)數(shù)據(jù)出版發(fā)展態(tài)勢分析:基于Web of Science數(shù)據(jù)庫的調(diào)研[J].中國科學(xué)數(shù)據(jù)(中英文網(wǎng)絡(luò)版),2021,6(3):267-285.
[53]宋晶晶.由信息倫理向數(shù)據(jù)倫理轉(zhuǎn)型:溯源、驅(qū)動與路徑[J].圖書館學(xué)研究,2020(3):35-39,60.
[54]劉金亞,諶悅,章成志,等.數(shù)據(jù)倫理政策的量化研究:基于天文領(lǐng)域的數(shù)據(jù)管理辦法[J].信息資源管理學(xué)報,2021,11(6):63-75.
[55]劉金亞,顧立平,張瀟月,等.開放科研數(shù)據(jù)環(huán)境下科研人員的數(shù)據(jù)倫理框架研究[J].情報理論與實踐,2021,44(2):83-89.
[56]陳勁,陽鎮(zhèn).數(shù)字化時代下的開放科學(xué):倫理難題與推進(jìn)路徑[J].吉林大學(xué)社會科學(xué)學(xué)報,2021,61(3):116-128,236.
作者簡介:
丁利(1993— ),女,黑龍江大學(xué)信息管理學(xué)院碩士研究生在讀。研究方向:科學(xué)數(shù)據(jù)共享。
趙麗梅(1979— ),女,博士,教授,通訊作者,任職于黑龍江大學(xué)信息管理學(xué)院。研究方向:科學(xué)數(shù)據(jù)管理、計量、分析與評價,圖書館運營管理。