余厚強,章 瑋,曹雪婷
(1. 中山大學信息管理學院,廣州 510006;2. 南京理工大學經濟管理學院,南京 210094)
2020 年2 月,教育部、科技部正式印發(fā)的《關于規(guī)范高等學校SCI 論文相關指標使用樹立正確評價導向的若干意見》①http://www.moe.gov.cn/srcsite/A16/moe_784/202002/t20200223_423334.html中明確指出,“堅決摒棄‘以刊評文’”,不能簡單地以SCI 論文相關指標來判斷論文的質量。這意味著在完善同行評議制度之外,需要收集反映論文價值的其他指標,來更加全面地評價學術成果。替代計量指標,通常是指基于網絡可獲取的學術成果交互數(shù)據(jù)構建的非引文指標,主要數(shù)據(jù)來源包括社交媒體、新聞平臺和灰色文獻等,為更加全面地評價學術成果提供支持。
替代計量指標具備多樣性,在實際研究中,既可依據(jù)數(shù)據(jù)來源分類,如推特替代計量指標(Twit‐ter altmetrics);也可依據(jù)活動類型分類,如閱讀替代計量指標(readership altmetrics)。應對這種多樣性,既需要開展指標體系的研究,也需要開展每個指標的縱深研究。 在縱深研究方面,推特[1-2]、Mendeley[3-4]、F1000[5-6]等平臺的研究較為深入,其他數(shù)據(jù)來源也積累了一些研究,例如,新聞平臺[7]、政策文件[8]、學術博客[9]、課程大綱[10]以及一些開源軟件平臺[11]。
臉書用戶占世界人口的近三分之一,約占世界社交媒體在線用戶的二分之一,雖然在中國訪問受限,但是其在國際學術交流中的影響力不可忽視。越來越多的科研工作者傾向于在臉書平臺分享學術信息,并通過點贊、關注、轉發(fā)等方式進行學術交流活動??蒲泄ぷ髡呖梢栽谀槙辖俚膶W術研究社交網絡,成員之間可以實時獲取其他人的學術動態(tài),這極大地提高了學術交流效率[12-13]。隨著科研實力的穩(wěn)步增長,中國需要更加開放的全球視野,因此,研究者在關注國內平臺的同時,關注國際平臺也是十分必要的。并且針對社交媒體平臺的研究具有共通性,臉書數(shù)據(jù)的研究對以后國內平臺數(shù)據(jù)的研究具有參考和啟示價值。
臉書帖子中以某種可被追蹤的形式提及學術成果,構成一種特定的學術交流形式,稱為學術成果的臉書提及量(Facebook mention of scientific prod‐uct),在本文中簡稱為臉書提及量(Facebook men‐tion)。臉書提及量是最基本的臉書替代計量指標(Facebook altmetrics),在此基礎上,可以衍生出其他類型的臉書替代計量指標,如學科標準化的臉書替代計量指標。
在與引文量相關性的測定中,臉書提及量的相關系數(shù)較低[14],表明該指標反映的內涵與引文不盡相同。但是臉書提及量的回歸曲線與引文量的完全相同,這在統(tǒng)計學上證明了臉書提及與引文受到相似的社會環(huán)境和選擇機制的影響,呈現(xiàn)出相同的增長機制[15]。就臉書提及量涉及的影響力類型而言,學者通過研究數(shù)據(jù)生產者在臉書帖子上提及學術成果的動機,來判斷該指標的內涵與價值。基于心理學論文的實證研究表明,對論文的討論與評價占20%,在現(xiàn)實生活實踐中應用占17%,自我宣傳占6%,數(shù)據(jù)來源交換占6%,這傳遞了臉書提及量的社會影響力[16]。基于醫(yī)學領域數(shù)據(jù)的實證研究證實了非學術用戶占較大比例(占58%)[17],并且鏈向學術成果的臉書帖子主要起到溝通非學術界專業(yè)人士與公眾的作用。這些結果表明,臉書能更好地反映普通大眾的態(tài)度或看法,指示綜合學術界和非學術界的關注度情況。
本研究通過測定臉書提及量的分布情況,為理解臉書替代計量指標的性質,開展進一步研究及其應用提供參考。具體而言,基于全量數(shù)據(jù),測定了臉書提及量的相對覆蓋率、及時性分布,以及論文層次、來源層次和學科層次的數(shù)值分布,并通過總結這些分布特征,與其他替代計量指標進行橫向對比,揭示臉書提及量這一指標的特有屬性,探究其研究價值與應用前景。
不同的數(shù)據(jù)平臺采集臉書提及數(shù)據(jù)的方式不同。例如,Altmetric.com 公司采用數(shù)據(jù)挖掘的方法,從公開臉書帖子中識別學術成果的臉書提及;Plumx Analytics 公司利用臉書API (application pro‐gramming interface) 對學術成果的臉書提及量進行檢索和聚合,這就涵蓋了那些私有臉書帖子當中的內容[18]。盡管Altmetric.com 公司的臉書提及量數(shù)據(jù)與真實情況相比存在低估,但是使用公開臉書帖子數(shù)據(jù)進行研究,規(guī)避了侵犯臉書用戶隱私的問題,這是該公司將數(shù)據(jù)采集范圍限定在公開臉書帖子的主要原因。由于Altmetric 數(shù)據(jù)庫是當前國內外開展替代計量研究時較為權威的數(shù)據(jù)庫,因此,本文采用Altmetric 數(shù)據(jù)庫。
經過數(shù)據(jù)抽取,獲得從2018 年7 月至2019 年6 月Altmetric 數(shù)據(jù)庫中所有臉書提及數(shù)據(jù)記錄,共42 萬余條。每條數(shù)據(jù)記錄包括臉書提及時間、學術成果類型、學術成果標題、學術成果出版時間等26 項元數(shù)據(jù),構成本文的數(shù)據(jù)集。經過初步統(tǒng)計,顯示Altmetric.com 公司提供的被臉書提及的學術成果類型包括學術論文(article)、專著(book)、章節(jié)(chap‐ter)、臨床試驗研究記錄(clinical trial study record)、數(shù)據(jù)集(dataset) 和新聞(news) 等共計6 種,其具體分布與相對覆蓋率如表1 所示。其中,學術論文(article) 居絕對主導地位,所占比例高達89.9%。
表1 具有臉書提及量的學術成果類型及其比例
為了系統(tǒng)地揭示臉書提及量的分布特征,本研究從以下五個方面展開計量分析。
(1) 臉書提及量的相對覆蓋率。相對覆蓋率,是指相對于其他類型替代計量數(shù)據(jù)的覆蓋率。臉書提及量的相對覆蓋率計算方式為:在特定時間窗口中,具有臉書提及數(shù)據(jù)的學術成果數(shù)量與具有替代計量數(shù)據(jù)的學術成果總數(shù)的比值,反映臉書提及數(shù)據(jù)的可見度情況,計算方式為
其中,CFacebook代表臉書提及量的相對覆蓋率;NF代表學術成果中有臉書提及量的記錄數(shù)量;NA是具有替代計量指標的學術成果記錄數(shù)量。如果將分母換成該時間窗口中學術成果總數(shù),那么求得的是絕對覆蓋率。
(2) 臉書提及量的及時性分布。及時性反映的是臉書提及數(shù)據(jù)首次出現(xiàn)的速度,可通過計算學術成果首次臉書提及時間與出版時間的時間差得到。計算方式為
其中,IFacebook代表臉書提及量的及時性,指示學術成果出版多久后會被臉書提及;TM是學術成果獲得首次臉書提及的時間;TP是學術成果的出版時間。本研究將及時性在180 天以內視作是及時的,這是相對于引文數(shù)據(jù)首次出現(xiàn)通常在一年以上而言的,關于及時性的判定并沒有明確的標準。本研究認為,若時間差在180 天以內,則該替代計量指標是及時的。
(3) 臉書提及量的成果層次分布。計算每個學術成果所獲得的臉書提及量,繪制臉書提及量的區(qū)間分布,以及隨成果數(shù)量的分布曲線,可以揭示臉書提及量的成果層次分布特征。本文使用學術成果而不是學術論文,是由于其還包括專著、新聞、臨床試驗記錄等其他類型的非論文學術成果。
(4) 臉書提及量的來源層次分布。計算每個來源所獲得的臉書提及量,繪制臉書提及量的區(qū)間分布,并依據(jù)布拉德福集中離散定律,識別核心來源。需要說明的是,此處使用來源而不是期刊,是由于其還包括預印本平臺、新聞平臺等其他類型的非期刊來源。
(5) 臉書提及量的學科層次分布。計算每個學科所獲得的臉書提及量,以理解其學科差異。由于Altmetric 數(shù)據(jù)庫從早期的Scopus 學科分類轉向FoR(fields of research) 分類,所以本文在統(tǒng)計時也采用FoR 的一級學科和二級學科體系。關于FoR 學科分類的更多介紹可以參見Rousseau 教授的論文[19]。
根據(jù)2018 年7 月至2019 年6 月的Altmetric.com 數(shù)據(jù)集(共25195509條,涉及學術成果3379536個)測定發(fā)現(xiàn),共有427030條含有臉書提及數(shù)據(jù),涉及學術成果272728個。由此可以計算出,在2018年7月至2019年6月,臉書提及量的相對覆蓋率CFacebook為8.1%。
將臉書提及量的及時性按照時間節(jié)點-360 天、-180 天、-7 天、-1 天、1 天、7 天、30 天、180 天和360 天進行區(qū)間統(tǒng)計,其具體分布如圖1 所示。從圖1 可以看出,22.9% 的學術成果在1 天內被臉書提及,41.2% 的學術成果在7 天內被臉書提及,57.4% 的學術成果在30 天內被提及。 經過統(tǒng)計可得,180 天內被提及的學術成果高達74%,這表明臉書提及量較為及時。值得注意的是,存在14.3%的學術成果在正式出版之前就在臉書上引發(fā)了關注和討論的情況,這部分學術成果主要由預印本或者優(yōu)先出版的論文構成。
圖1 臉書提及量的及時性分布
本文選取6 個典型案例進行分析,以建立對臉書提及量及時性的初步認識,如表2 所示。表2 中包括及時性最強的3 個案例(#1、#2、#3) 和及時性最弱(#4、#5、#6) 的3 個案例。在案例分析過程中,對每個案例的所有可獲取數(shù)據(jù)進行分析,包括臉書帖子文本、臉書用戶數(shù)據(jù)、學術成果數(shù)據(jù)。
首先,觀察表2 中臉書提及的及時性最好的三條記錄#1、#2、#3。#1 號學術成果涉及學科領域為心理學與認知科學,主要研究跨文化是否會影響人們認知行為的一致性。該論文于2019 年11 月正式發(fā)表于Journal of Personality and Social Psychology,但在紙質印刷之前于2018 年7 月由PubMed 等平臺支 持,以“Epub (Electronic publishing ahead of print)” 類別提前電子出版了,領先于正式出版時間462 天。 提及賬戶為“Usmle Behavioral Sciences”,該賬戶針對的群體主要為學習USMLE (United States Medical Licensing Examination,美國執(zhí)業(yè)醫(yī)師執(zhí)照考試) 行為科學的用戶,出于科普分享或教育的目的提及行為科學相關學術論文。#2 號學術成果所屬學科領域為信息科學與計算機科學,主要研究了在深度卷積網絡中,基于獎賞調制的尖峰時間相關可塑性的仿生數(shù)字識別。該篇論文于2019 年10月正式發(fā)表在Pattern Recognition,但在此之前該文于2018 年4 月發(fā)表于arXiv 上,并于2018 年7 月被在臉書上被提及,所以領先于正式出版時間456天。提及該學術論文的賬號為Deeplearning4j,隸屬于軟件公司,是為Java 或Java 虛擬機編寫的分布式開源深度學習庫。該賬戶通常出于科普或分享的目的提及計算機科學相關前沿學術論文。#3 號學術成果為醫(yī)學相關,主要通過提出一個臨床腦病例,探究劑量計算網格分辨率的選擇對計劃劑量分布是否會產生影響。該篇論文于2019 年12 月發(fā)表于Medi‐cal Dosimetry,但在此之前該文于2018 年8 月提前電子出版,并于2018 年9 月在臉書上首次提及,領先于正式出版時間446 天。 提及賬戶為Sociedad Venezolana de Física Médica,隸 屬于醫(yī)學公司,關注的學科主要為醫(yī)學,該賬戶出于科普分享或宣傳推廣的目的提及醫(yī)學相關前沿學術論文。由此可見,在正式出版之前就在臉書上引發(fā)了關注和討論的學術成果主要由預印本或者優(yōu)先出版的學術論文構成,提及用戶主要是機構賬號,并且提及這類學術成果的動機主要為科普分享、宣傳推廣或出于教育目的。
表2 臉書提及量的及時性分布案例
其次,觀察表2 中臉書提及的及時性最差的三條記錄#4、#5、#6。#4 號學術成果涉及學術領域為生物科學,該成果是由著名瑞士作家Gessner Con‐rad 等于1560 年發(fā)表的德語專著,該專著主要描繪了常見動物圖標,是科普類讀物,被Biodiversity Heritage Library 官方賬號于2018 年8 月提及,臉書關注時間滯后458 年。由于2018 年8 月8 日是國際貓日和木刻星期三,該賬號出于科普和紀念目的,選擇在這一天展示了該書中木刻作品的摘錄——一只木刻小貓,同時,分享了這部首次描述所有已知動物的現(xiàn)代動物學作品。#5 號學術成果所屬學科為法學,該成果是由圣地亞哥德孔波斯特拉大學于1602 年出版的圣提亞哥大學及其學院的皇家憲法,在臉書上被BSUC 官方賬號在2018 年11 月提及,滯后時間長達415 年。 該賬號在臉書上寫道他們在BUSC 的總圖書館發(fā)現(xiàn)了一本1602 年的小冊子,并邀請讀者閱讀這本小冊子的全文,并提及其中某些條款與當代普遍認知截然不同。該賬號出于科普的目的分享了該學術成果,并就學術成果內容與公眾進行探討與交流。#6 號學術成果是由Gessner Con‐rad 等于1604 年發(fā)表的意大利語專著,該專著主要科普了野生動植物,屬于生物學領域,于2018 年10 月被Biodiversity Heritage Library 官方賬號在臉書提及,滯后時間為412 年。該賬號選擇在萬圣節(jié)這天復刻了此書中提及的海蛇,契合節(jié)日氣氛的同時,向讀者分享了這本經典著作。由此可以看出,臉書不僅關注最新發(fā)表的學術成果,也會對經典歷史文獻進行回溯和討論。關注歷史文獻用戶主要為學術官方機構賬號,如圖書館、高等院校等,并且通常在某些特殊節(jié)點出于紀念、科普的目的分享這些經典著作。
由于臉書提及量在成果層次存在絕對提及數(shù)(number of post,NP) 和獨立用戶數(shù)(number of unique users,NUU) 的差異[20],因此,對這兩種數(shù)據(jù)進行分析比對,統(tǒng)計結果如圖2 所示??紤]絕對提及數(shù)時,即提及學術成果的所有臉書帖子數(shù)量,平均每篇成果被臉書提及的頻次為1.72 次,92.7%的成果的臉書提及頻次不超過3 次,而僅有1% 的成果有超過10 條臉書提及。 考慮獨立用戶數(shù)時,即去除一篇學術成果被同一用戶多次提及的情況,篇均臉書提及數(shù)為1.04 次,98.3% 的成果的臉書提及頻次不超過3 次,僅有0.06% 的成果有超過10 條臉書提及。這說明絕大部分學術成果被提及頻次均較少,僅有極小一部分學術成果在臉書平臺上獲得了較高的關注度。
圖2 臉書提及量學術成果頻次分布圖
為了進一步研究臉書提及量的分布特征,對臉書提及量按學術成果的數(shù)量累積分布進行了統(tǒng)計,其累積曲線如圖3 所示。由圖3 可知,整體分布較為均勻,絕對提及數(shù)量分布曲線的集中程度要高于獨立用戶數(shù)量分布曲線。就絕對提及數(shù)量而言,20%的學術成果獲得48% 的臉書提及量,從30% 以后呈直線均勻增長,曲線走勢先陡后平;就獨立用戶數(shù)量而言,20% 的學術成果獲得37% 的臉書提及量,從18% 以后呈直線均勻增長,曲線走勢先陡后平。
圖3 學術成果層次臉書提及量累積分布圖
本文分別選取基于NP 和NUU 的臉書提及頻次最高的10 篇學術成果作為案例,對獲得高臉書提及量的學術成果特點進行初步探究。
基于NP 的高臉書提及量的學術成果案例如表3所示。排名前10 的學術成果的類型主要是論文,其中還包括一篇新聞與一本專著。所涉及的學科領域有醫(yī)學、生物學、統(tǒng)計學、地球科學與歷史科學,其中,以醫(yī)學(#1、#5、#9、#10) 和生物學(#2、#3、#7) 居多。
表3 基于NP的高臉書提及量學術成果案例
基于NUU 的高臉書提及量的學術成果案例如表4 所示。表4 中所列舉的高臉書提及量的學術成果與表3 存在部分重合,學術成果類型同樣幾乎為學術論文。表4 中高提及量學術成果涉及的學科類型僅包含醫(yī)學(#1、#2、#3、#4、#5、#7、#8、#10) 和生物學(#6、#10),并且醫(yī)學相關的學術成果數(shù)量遙遙領先。
基于以上案例分析與解讀,我們發(fā)現(xiàn):①臉書提及量高的成果類型大多為學術論文;②醫(yī)學相關學術成果的臉書提及量較高且占比較大(如表3 中的#1、#5、#9、#10,表4 中的#1、#2、#3、#4、#5、#7、#8、#10),或許由于這類學術成果與生命健康相關,更容易吸引民眾的注意,又或是醫(yī)學領域或醫(yī)療健康行業(yè)的臉書用戶更關注學術成果;③結論新穎的學術論文更容易受到關注,可能由于這類論文更容易激發(fā)民眾的好奇心,從而引發(fā)更多的關注(如表3 中的#2、#5、#7,表4 中的#4、#5、#9);④顛覆固有認知的學術論文的臉書提及量較高的原因,可能是這類論文的結論本身就容易引發(fā)更多的討論(如表3 中的#4,表4 中的#7、#10);⑤發(fā)表在如Science、Nature之類的知名期刊上的學術論文也更容易受到關注(如表3 中的#4、#6、#7)。臉書提及這些學術成果的原因大致分為以下兩點:第一,對學術成果的研究結果進行科普和宣傳;第二,對學術成果的結論進行評論、質疑或肯定。
表4 基于NUU的高臉書提及量的學術成果案例
在本文的數(shù)據(jù)集中,共有234302 條記錄(占比為94.6%) 具有來源數(shù)據(jù),共涉及13507 種來源,平均每種來源被臉書提及17 次。臉書提及量的來源層次區(qū)間分布如圖4 所示。其中,被臉書提及1次的來源占比為32.5%,被臉書提及2 次的來源占比為14.1%,被臉書提及3 次的來源占比為8.6%,被臉書提及10 次及以下的來源占比達到86.5%。由此不難發(fā)現(xiàn),大多數(shù)來源被臉書提及頻次較少。
圖4 學術成果來源被提及頻次分布圖
為了進一步探究臉書提及量的來源分布規(guī)律,識別其中的核心來源,本文對臉書提及學術成果所在來源分布進行布拉德福圖像分析,結果如圖5 所示。該圖像指示臉書提及量來源由核心區(qū)、相關區(qū)和非相關區(qū)三個部分構成,分別呈指數(shù)增長、線性增長以及格魯斯下垂的特性。按照布拉德福定律的公式推算得出,學術成果在三個區(qū)域的來源數(shù)量關系為1∶6∶89,因此,計算得到臉書提及的核心來源為140 個。
圖5 臉書提及學術論文所在來源分布圖
本文按來源成果數(shù)量大小排序,列舉前30 名的來源名稱如表5 所示,所有被臉書提及的學術成果中,有18.4% 屬于這30 種來源。The Conversation排名第一,被臉書提及11678 次,占比為5%,該來源事實上是一個新聞平臺,主要刊載學術界的各類成果及資訊以傳播給更廣泛的公眾,由于該來源具有學術和新聞的雙重屬性,因此,這一平臺發(fā)表的文章更容易吸引民眾的關注。另外,在排名比較靠前的來源中,除了Nature、Science和Scientific Reports三大知名綜合期刊外,還存在PLoS ONE和bioRxiv這樣的開放存取期刊與預印本平臺,表明開放存取已經得到廣泛的認可。同時,在排名前30 位的來源中,共有13 種醫(yī)學期刊,如British Medical Journal、JAMA、BMJ Open、The Lancet等,所 占 比 例高達43.3%,由此可見,醫(yī)學相關的來源更容易受到臉書用戶的關注。
表5 學術成果臉書提及的核心來源列表(前30名)
在所有記錄中,共有316403 條具有學科分類,比例為74.1%。經初步統(tǒng)計,共有22 個一級學科和148 個二級學科。臉書提及量的一級學科分布如圖6 所示。由圖6 可以看出,醫(yī)學與健康科學的學術成果被臉書提及的占比最大,高達60.6%;其次為生物科學(13.4%); 心理學和認知科學(4.5%)、化學(2.7%) 的學術成果也受到臉書較多的關注;其他學科的學術成果占比均不超過2.5%。由此可以發(fā)現(xiàn),相比其他學科領域,醫(yī)學與健康科學遙遙領先,指示醫(yī)學與健康科學是民眾關注的焦點,生物學、心理學同樣受到較多的關注,這三個學科被臉書提及的學術成果占總量的78.5%。
圖6 臉書提及量的一級學科分布
臉書提及量的二級學科分布共有148 個,本文將占比排名前20 位的學科列出如表6 所示,所有被臉書提及的學術成果中,有78.9% 來源于這20 個學科。 排名第一和第二的學科分別是臨床醫(yī)學(18.9%) 和公共衛(wèi)生科學(17.7%),位列第三、第四和第五的學科分別是神經科學(5.9%)、心肺醫(yī)學(4.5%) 和生物化學(4.2%)。這5 個學科相關學術成果占被臉書提及學術成果總量的51.2%。從上述數(shù)據(jù)不難看出,排名前五的二級學科中,醫(yī)學相關學科(#1、#2、#3、#4) 占絕對優(yōu)勢;且涉及學術成果數(shù)量所占百分比高達46.96%,這一數(shù)據(jù)再次佐證了公眾對于醫(yī)學相關學術成果的關注程度。
表6 臉書提及量的二級學科分布(前20位)
推特、新聞等平臺的替代計量指標已經積累了部分研究成果。本文通過比較臉書提及量與其他替代計量指標的特征屬性,總結出臉書提及量這一指標的優(yōu)劣與其特有的分布規(guī)律。需要指出的是,上述比較所采用的數(shù)據(jù)是基于前人研究的結果,與本研究所使用數(shù)據(jù)的時間窗口不同。但是,這些研究的年份相近,所揭示的分布特征是全局性的,具有一定的穩(wěn)定性,因此,這些數(shù)據(jù)仍然具有與臉書數(shù)據(jù)分布特征的可比性。
通過以上研究,可以發(fā)現(xiàn)臉書提及量相較推特提及(CTwitter=65.7%)[21]而言,其相對覆蓋率比較低,僅為8.1%,但是高于新聞提及(CNews=6.3%)[22]、政策文件提及(CPolicy=1.7%)[23]以及新浪微博提及(CWeibo=0.5%)[24]。為了解釋臉書平臺受歡迎程度以及學術成果覆蓋率之間的差異,En‐khbayar 團隊[25]通過收集臉書平臺分享、點贊和評論,包括用戶的私人時間線,與2015 年至2017 年發(fā)表在PLoS ONE上的所有文章數(shù)據(jù);并將收集到的數(shù)據(jù)與Altmetric.com 平臺的數(shù)據(jù)進行比較。結果顯示,在平臺上分享的論文中,有59% 發(fā)生在公眾視野之外卻沒有納入Altmetric.com 數(shù)據(jù)庫之中,這可能導致臉書成果覆蓋率統(tǒng)計結果偏低。
臉書提及的及時率很高,達到74%,優(yōu)于推特提及(ITwitter=64%)、新聞提及(INews=56%)、政策文件提及(IPolicy=12%) 和新浪微博提及(IWeibo=69%)。其中,存在14% 的學術成果在正式發(fā)表之前就在臉書平臺上得到關注和討論,這類學術成果主要由預印本或者優(yōu)先出版的論文構成,且提及這些論文的用戶大多是機構賬號或者學術官方賬號。這與Fang 等[26]發(fā)現(xiàn)的替代計量數(shù)據(jù)積累模式相一致,大眾社交媒體來源的替代計量數(shù)據(jù)積累的速度最快。
臉書提及量的學術成果層次分布相對比較均勻,沒有呈現(xiàn)出非常顯著的離散集中特點。以20%的學術成果對應的累積提及量為參照(基于絕對提及數(shù)的數(shù)據(jù)),臉書提及量的累積百分比是48%,高于政策文件提及(43%),遠低于引文頻次(61%)、新聞提及(74%)、新浪微博提及(72%)和推特提及(76%)。案例分析表明,醫(yī)學相關以及結論新穎或顛覆大眾固有認知的學術成果更容易獲得臉書帖子的關注,這與推特提及、新浪微博提及表現(xiàn)出相似性。
臉書提及量的來源層次分布集中程度較高,識別出140 個核心來源,占來源總數(shù)的1%。將不同替代計量指標的排名前15 位核心來源進行對比,如表7 所 示。 從表7 可 以看 出,Nature、Science和PLoS ONE這三種來源是五種替代計量指標共同的核心來源;臉書提及和新聞提及相同的核心來源數(shù)量最多,前10 位核心來源中有9 個是相同的。臉書提及與新浪微博提及、政策文件提及的核心來源重合率分別為40% 和30%。
表7 若干典型替代計量指標的核心來源(排名前15位)
為進一步比較各個替代計量指標成果來源的相似性以及差異性,本文分別將新聞指標、推特指標以及政策文件指標與臉書指標的成果來源按照提及量由高至低排序進行重疊比對,其結果如圖7~圖9所示。臉書提及量與推特指標來源重疊率最高,達到70%;其次為新聞指標,二者的重疊率穩(wěn)定在65%;臉書提及量與政策文件指標的重疊率隨著成果來源提及量的降低而逐漸升高,最后約為50%??紤]到臉書、推特等平臺相似的社交屬性,其指標核心來源的重疊率可能更高;而政策文件更多地面向于政府部門,這類指標與上述指標類型性質差異較大,因此對于學術成果來源的關注略有別于其他指標;此外,還需考慮新聞的傳播特性,即被新聞關注的學術來源更容易出現(xiàn)于公眾視野之內,這類來源在社交平臺引發(fā)討論的幾率相對更大,這可能是新聞指標來源與臉書指標核心來源高重合的原因之一。
圖7 臉書提及和新聞提及來源期刊重疊率
圖9 臉書提及和政策文件提及來源期刊重疊率
圖8 臉書提及和推特提及來源期刊重疊率
在此基礎上,通過比對各個指標成果來源的JIF (journal impact factor) 平均百位數(shù)分布,識別其來源偏好,如圖10 所示,其中百分數(shù)表示期刊影響因子的排名。臉書提及量、新聞指標、推特指標與政策文件指標來源的平均JIF 百分數(shù)在較高水平上均呈下降趨勢,表明這些指標更關注高影響因子來源。其中,降幅最快的是新聞指標來源,其次為臉書來源以及政策文件來源,降幅最慢的為推特來源,這分別對應著對高影響來源的偏好程度,即新聞指標對高影響來源的偏好程度最高,臉書、政策文件次之,推特指標高影響來源的偏好程度最弱。
圖10 各替代計量指標所關注的來源期刊質量分布圖
在學科分布層面,由于FoR 學科分類和Scopus學科分類存在差異,所以分開來進行比較。表8 對比了臉書提及量與其他指標的前10 名學科分布。通過觀察與比較表8 中羅列的各個指標的學科類別與涉及的成果比例,可發(fā)現(xiàn)替代計量指標在學科分布層面具有相似性,且集中程度均處于較高水平,學科類別分布也比較類似。以臉書指標與新聞指標為例,臉書指標排名前10 位的學科中成果覆蓋率為92.4%,新聞指標中前10 名學科占據(jù)的成果比例為94.6%。兩者排名靠前的學科基本類似,排名前9 位的學科完全相同,只是在排位上略有差異,均涵蓋醫(yī)學與健康科學、生物科學、心理學、工程科學以及自然科學等。在其他指標中,醫(yī)學、生物學等學科均名列前茅。但也存在差異性,各個平臺對于學科領域的關注不盡相同,例如,臉書指標對歷史學給予了相當關注,而其他指標的高提及學科中并不涉及這一學科領域;政策文件、新浪微博中排名靠前的學科包括經濟學,新聞中受到關注較多的學科涵蓋信息與計算科學等。
表8 若干典型替代計量指標的學科分布(前10名)
在科技評價日趨多元化的今天,越來越多的學者意識到在社會網絡傳播學術成果的重要性。臉書作為重要的學術交流媒介之一,是替代計量學研究重要的數(shù)據(jù)來源之一,臉書提及量的分布反映了臉書平臺交流學術成果的基本屬性。本文從相對覆蓋率、及時性分布、成果層次分布、來源層次分布以及學科層次分布五個層面,對臉書提及量進行統(tǒng)計分析,并對其分布特征及規(guī)律進行了總結,可歸納得出以下五點結論。
(1) 基于本研究數(shù)據(jù)集,臉書提及的相對覆蓋率較低,僅為8.1%,低于推特替代計量指標的相對覆蓋率(65.7%),但高于政策文件指標(1.7%)、新浪微博指標(0.5%) 與新聞替代計量指標(6.3%)。
(2) 臉書提及量的及時率高達74%,優(yōu)于政策文件(12%)、新浪微博(69%)、新聞指標(56%)以及推特指標(64%)。臉書主要關注最新發(fā)布的論文,甚至存在14.3% 的學術成果在正式出版之前就在臉書上引發(fā)了關注和討論,這類成果主要由預印本和優(yōu)先出版的論文構成,并且提及這些論文的用戶主要是學術官方賬號。除此之外,臉書還會對經典的歷史文獻進行回溯和討論。
(3) 臉書提及量成果分布相對比較均勻,沒有呈現(xiàn)出非常顯著的離散集中特點。以獨立用戶數(shù)來計算,以20% 的學術成果累積的提及量為參照,臉書的僅為37%,低于政策文件提及(43%),遠低于新聞提及(65%)、推特提及(76%)、新浪微博提及(72%) 以及引文指標(61%)。根據(jù)案例分析顯示,臉書提及量高的成果類型大多為學術論文,醫(yī)學相關、結論新穎、顛覆固有認知或者發(fā)表在知名期刊上的論文更容易引起公眾關注。
(4) 臉書學術成果分布存在來源差異與來源偏好。本文對臉書提及學術成果來源進行了頻次統(tǒng)計與布拉德福圖像分析,并將其來源分布與新聞指標、推特指標與政策文件指標來源進行重疊率比對。通過計算得到核心來源數(shù)量約為140 個。排名前3 位 的The Conversation、 Nature、 Science,共 占比7.69%。大多數(shù)來源被臉書提及頻次較少,存在65.4% 的來源提及頻次不超過5 次,臉書提及10 次以上的來源比例僅為13.5%。臉書學術成果的分布與其他替代計量指標具有相似性。臉書提及量來源與新聞指標來源重疊率高達70%,與推特指標的重疊率為65%,與政策文件的重疊率約為50%,均處于較高水平。臉書成果分布存在來源偏好。臉書用戶更關注高影響來源,這與新聞指標、推特指標以及政策文件指標來源分布類似。
(5) 臉書關注的學術成果存在學科差異。臉書提及量的學科分布與新聞、推特、政策文件和新浪微博具有相似性,醫(yī)學與健康科學以及生物科學在各個指標學科分布中均名列前茅。在二級學科分布中,排名最高的幾個學科分別為臨床醫(yī)學、公共衛(wèi)生科學、神經科學和心肺醫(yī)學,均是醫(yī)學相關學科,這與前文觀察到的醫(yī)學相關成果更容易吸引用戶關注這一結論相一致。
上述結論表明,臉書提及量相對引文指標而言,可以更加及時地反映學術成果獲得關注和傳播的情況,并且在學術成果層次沒有分布過于集中的局限,能夠識別出不同于引文指標的核心學術成果來源。但是,臉書提及量在學科層次的分布很不均衡,對于某些臉書可見度低的學科可能不太適用。值得注意的是,臉書提及量不宜作為學術影響力評價的單一指標,而應視作觀察學術成果傳播過程和測度學術成果影響力的一個新視角,與其他傳統(tǒng)指標和新興指標共同使用,以獲得更加全面的評價結果。同時,臉書提及量的具體使用路徑,還需要更多后續(xù)的研究去揭示。