孫 玨
(上海師范大學學報期刊雜志社,上海200234)
大數據時代中學術期刊的困惑及思維創(chuàng)新
孫玨
(上海師范大學學報期刊雜志社,上海200234)
綜觀目前在出版領域的大數據相關研究成果,可以發(fā)現(xiàn)兩年來相關研究主要集中在出版產業(yè)的宏觀發(fā)展圖景、戰(zhàn)略性政策、應用價值和商業(yè)運作模式上,極少涉及社科類學術期刊。筆者以教育學專業(yè)期刊為例,闡述學術期刊在大數據浪潮沖擊下所產生的困惑,思考大數據思維對學術期刊深層次的影響和啟發(fā)。
大數據;學術期刊;思維
2013年被定義為“大數據元年”[1],兩年來,大數據研究已經從計算機科學“一枝獨秀”到各行各業(yè)“全面開花”。目前,大數據在IT產業(yè)、信息通訊、市場消費及金融貿易等行業(yè)已經產生了一定的規(guī)模效應,由此也引起了公共管理部門及學術領域的高度關注。與大數據相關的社會科學方面的研究呈現(xiàn)出以下的特點和局限。
綜合目前在出版領域的大數據相關研究,可以發(fā)現(xiàn)近年來研究的特點如下:研究主要集中在出版產業(yè)的宏觀發(fā)展圖景以及戰(zhàn)略性政策方針上;介紹西方出版業(yè)大數據運用的成功案例,以此對我國出版業(yè)走向有比較借鑒意義;將大數據作為出版體制改革的技術工具來論述的也比較普遍,主要探討大數據的概念、內涵、特點、出版領域應用價值和商業(yè)運作模式。
出版業(yè)發(fā)展日新月異,責任和使命并行,正在積極把握大數據全球化這一發(fā)展趨勢所帶來的契機和挑戰(zhàn)。而學術期刊也是媒介,離不開媒介發(fā)展的大環(huán)境。因此,身處出版業(yè)之中,遵循出版發(fā)展的規(guī)律,順應出版發(fā)展的趨勢,是學術期刊必須轉變的觀念,2011年,國家新聞出版總署要求學術期刊進行體制轉型改革,目的是為了以改革促發(fā)展。作為學術期刊的編輯,筆者深切地感受到這次轉型的意義重大。而與此同時,大數據正在進入出版業(yè)的方方面面,對這一領域的未來發(fā)展產生著深遠的影響,并已經引起了相關專業(yè)的學者們的關注。目前,出版學界對于大數據的研究仍處于比較初步的階段,關鍵在于操作性的敘述較多,深層次的思考不夠,無論深度還是廣度都十分有限,大數據研究極少涉及學術出版自身來探討,即便有所涉及,將大數據與學術期刊轉型結合起來的研究幾乎沒有深入下去。筆者以教育學專業(yè)期刊為例,闡述學術期刊面臨大數據浪潮的困惑,嘗試讓學術期刊在思維上能有所突破。
按照維基百科的定義,大數據是指利用常用軟件工具捕獲、管理和處理數據所耗時間超過可容忍時間的數據集。大數據具有規(guī)模性、多樣性、高速性和價值性等特點[2]。因此不少學術期刊認為大數據與以市場盈利為目的的大型出版集團有關,主要運用在出版的商業(yè)運作環(huán)節(jié)上,而學術期刊是以產生社會效益為辦刊宗旨,不以盈利為目的,讀者和作者都是小眾群體,因此與大數據關系不大。他們產生這樣的疑問在所難免。以下三點困惑是比較普遍存在的。
2.1困惑一:大數據等同于規(guī)模超大的海量數據嗎?
若是以維基百科定義大數據的標準,可以說能稱得上大數據的數據庫真的非常少,普通的學術期刊編輯部甚至期刊雜志社日常的數據集絕大多數與大數據沾不上邊。其實,大數據的大是相對而言的,不是絕對的大。對于學術期刊來說,能夠盡可能地搜集創(chuàng)刊以來的所有數據和資料,越全面詳細越好。因為所有這些數據就是元數據,即大數據的數據??梢哉f,每一家學術期刊編輯部都應該建立自己的大數據規(guī)劃圖。反過來說,海量數據并不一定能稱其為大數據,因為真正體現(xiàn)大數據能量的是不僅要具備收集數據的能力,還要具備低成本分析數據的能力[3]。學術期刊對于大數據的關注,應該更多地放在對出版資源的獲取與利用方面,因為對信息的獲取和利用也是非常有價值的大數據研究一部分。
2.2困惑二:數據挖掘和分析全部需要技術支持嗎?
大數據本身就是屬于高科技領域的產物,整個大數據的處理流程可以定義為在合適工具的輔助下,對廣泛異構的數據源進行抽取和集成,結果按照一定的標準統(tǒng)一存儲。利用合適的數據分析技術對存儲的數據進行分析,從中提取有益的知識并利用恰當的方式將結果展現(xiàn)給終端用戶[4]。可見大數據的每一個環(huán)節(jié)都離不開計算機技術的支撐,但是大數據發(fā)展的趨勢是,從數據集成到數據分析,直到最后的數據解釋,簡單易用應當貫穿整個流程之中。目前大數據的易用性研究還處在起步階段,易用性表現(xiàn)為易見、易學、易用[4]。這將意味著學術期刊不必在內部開發(fā)或引入所有的大數據技術,可以利用云服務或預先設置好的應用程序來解決數據分析需求從而專注于學術出版業(yè)務。
2.3困惑三:社會科學研究將被大數據分析所取而代之嗎?
大數據與社會科學研究一結合,就遭到了一些社會科學學者的反對和質疑。教育學教授閻光才指出:“在幾乎所有的社會科學實證性研究中,研究問題的確定本身就來自人的意向性……如果沒有研究者對生活世界的體驗、關切、理解和自我偏好甚至價值‘偏見’在先,數據的生成和獲取就成為不可思議的事情?!保?]閻光才一針見血地批判現(xiàn)在的教育研究為了迎合大眾趣味,為了大數據而進行各種缺乏意義深度詮釋的數據分析,完全是徒有形式的計數而已[5]。此番話語不無道理,這樣的大數據研究只是形式上的簡單模仿,根本沒有掌握大數據精髓其中一二。《大數據時代》作者同樣認為:“我們也要繼續(xù)重視那些數據不能解釋的事物:由人類的智慧、獨創(chuàng)性、創(chuàng)造力造就的理念,這是大數據分析無法預測的?!保?]任何將大數據妖魔化的狂熱想法或行為都是有悖于大數據精神的。在大數據出現(xiàn)之前,人類探索世界所使用的科學方法和工具不僅不會被大數據取代,而且會和大數據并存。大數據可以完善和補充社會科學現(xiàn)有的研究體系,使之更加多元多樣、合乎學術規(guī)范以及精確有效。
“因為社會所受到的影響要比技術上的滯后幾十年,真正的革命不會是一個從A點到B點的有序過渡。相反,A點到B點之間可能經過一個長期的混亂。在此混亂時期,舊的體系已經崩潰,而新的體系尚未確立。”[7]筆者認為學術期刊所受到大數據的影響可能還要滯后更長的時間,許多學術期刊人或許不會被要求投入到創(chuàng)新如此之大的體系中,但他們至少需要對大數據有全面和充分的認識,知道在今天這樣的出版環(huán)境下如何更好地運用大數據思維,來應對學術期刊自身的轉型和變革。
什么是思維?杜威對思維作了這樣的定義:“知識僅僅是已經獲得并儲存起來的學問;而智慧(思維)則是運用學問去指導改善生活的各種能力。”[8]為什么我們首先需要啟發(fā)“思維”?因為“(思維能力的各種價值是指)每個人每日、每時、每刻都需要確定他沒有直接觀察到的事實:這不是出于增加他的知識貯存的一般目的,而是因為事實本身對他的興趣或者他的職業(yè)來說是重要的?!保?]所以說“誰在大數據價值鏈中獲益最大呢?應該是那些擁有大數據思維或者說創(chuàng)新性思維的人?!保?]由此可見,數據的價值已經從技術轉移到了數據自身和大數據思維上[6]。筆者以教育學術期刊為例,結合編輯具體實務,闡述學術期刊的大數據思維可以從以下幾個方面進行創(chuàng)新。
3.1相關性思維,即“是什么”的問題研究
大數據時代探求的是“是什么”,而不是“為什么”,也就是關注數據值之間的相關關系。相關關系的核心是量化兩個數據值之間的數理關系,相關關系強是指當一個數據值增加時,另一個數據值很有可能也會隨之增加[6]。而不同于基于假設和推理分析的方法,相關關系分析法是利用數據驅動的方法來分析,它不易受到偏見或傳統(tǒng)觀點的影響,因此這種方法更加精準和高效。
以教育學術論文為例,在一篇教育專業(yè)文章的結論部分,作者通常會總結自己的研究成果,結論通常由兩部分組成:①描述研究結果或調研發(fā)現(xiàn)了某些相關性特征及因果;②推斷兩個或兩個以上研究的變量之間因果關系。此外,期刊編輯或評審常常要求作者在他們文章中來推測其研究對時間和政策的推動作用,因為這樣會使文章體現(xiàn)出實踐意義和應用價值,從而使其更具可讀性和吸引力。不少作者被編輯引導去相信這樣做會增加文章的發(fā)表概率。結果是,每篇文章幾乎都包含有研究的重要性和實踐意義,從而有些研究者會為了顯示研究的意義而刻意設計實踐中存在的問題、難點和挑戰(zhàn),以此來預測本研究潛在地帶來的解決方案和測量。如此完美的設計看似沒有缺陷,其實毫無價值,完全背離科學研究的初衷。
學術論文作者應該嚴格區(qū)別這兩個問題:“是什么”與“可能是什么”。報告研究數據,主要是對某一研究現(xiàn)象盡可能全面的數據進行分析和挖掘,以及研究結論。有關實踐建議應該存在于研究者和那些實踐或政策領域的專家之間對話交流中,思想火花在碰撞中產生真理。這樣的實踐策略公開發(fā)表才合情合理,會受到政策制定的政府部門的關注,社會影響自然也會隨之而來。而編輯應該理解學術刊物的學術生產和再生產之間的關系、尊重和保護學術創(chuàng)作的獨立性與自由性,還需要與作者之間建立起一種新型的真正的學術關系,不以功利目的和固有模式來影響作者寫作。
3.2復雜性思維:即整合跨學科的學術資源
從數據到大數據的演變是一個漸進的過程,它不是大數據時代簡單地代替小數據時代,而是一個由簡單到復雜的各種形式相互包容、不斷完善的過程。在大數據時代,理論并非不重要,而是變得更加重要。我們所指的理論也并非僵化一成不變的固守舊有理論,而是在處理問題的過程中意識到海量數據所帶來的復雜性,堅持分析方法和理論的不斷創(chuàng)新[10]。如今的大數據先行者們通常都有著交叉學科和整合學科的背景,他們會將這些知識與自己所掌握的數據技術相結合,應用于廣泛的領域之中。由此可見,復雜性思維可以影響著學術期刊編輯能夠收集的數據類型以及我們對這些數據的挖掘分析方式,從而影響學術期刊對教育學專業(yè)領域內的學術研究展開全新的理解。
國外學術界主張發(fā)表在學術刊物上的文章,是具有科學規(guī)范的學術論文,不同于單純的個人意見和見解。而這一點,是中國內地的很多社科類期刊,包括教育學術期刊所忽視的[11]。不少教育學論文類似于對教育教學實踐、教育政策的建議,并沒有樣本、環(huán)境、廣泛的條件、大量的調查研究概括而得來。這些建議削弱了政策和實踐結論的復雜性,使建議顯得淺薄而沒有說服力。復雜的政策和教育實踐不可能建立在如此單一的研究調查之上,甚至無論規(guī)模大小,是作者精心設計的隨機干預的研究。這種推理性的建議將作者一己之見與科學依據混為一談,不但沒有任何價值,而且減弱了證據的公正性。因此,單一研究結果經各方面證實是存在缺陷的,即使表面上無缺陷,也不能普及運用[12]。
復雜性思維告訴我們,對研究成果的概括和歸納具有復雜性和艱巨性。教育學術期刊需要關注兩方面的研究:一方面是研究綜述、總和,包括對研究成果轉化為實踐或政策的實際影響的探討等等;另一方面是針對某一項特定研究潛在的實踐意義,由期刊組織評論或者對話形式的欄目,以專業(yè)視野來評估,而不同于僅僅來自于單一論文形式的研究,更多地鼓勵跨學科、多學科、交叉學科以及整合學科的研究能夠不斷涌現(xiàn)。除此之外,復雜性思維還要求對學術期刊的評價也不能簡單地運用某方面的統(tǒng)計數據就可以地進行學術評判等等,一系列的問題將來都將在大數據時代運用人類的思維和技術來得以一一解決。
3.3個性化思維:即挖掘具有巨大潛力的大數據
個性化特別是智能個性化,是大數據思維的核心,個性化技術是大數據時代最重要的技術。在大數據時代,僅僅為客戶提供一個簡單的登錄頁面已遠遠不能滿足客戶的需求,網站的設計還要給人以視覺上的吸引力。此外,網站的內容還應更加翔實,應能發(fā)揮其潛能并能實現(xiàn)客戶的有效轉化。隨著社會化媒體和搜索變化更加側重于有趣的內容及與人類有關的話題,網站的設計也要做出改變。他們需要更加重視數據驅動型設計,以創(chuàng)建吸引人的網站和內容——而不是去適應機器[3]。對于學術期刊來說,用戶就是讀者,而讀者當中有不少都是作者,包括是潛在的作者,因此其個性化思維就是能在網絡時代的海量數據中,挖掘出潛在的研究議題和不斷變化的讀者需求。
大數據時代,用戶的任何一個想法或不經意的舉動都是個性化需求的契機或信號。谷歌公司曾經開發(fā)了一種用戶在線交互的副產品,包括瀏覽的網頁內容、瀏覽的時間、鼠標光標停留的位置、上傳了信息內容等,谷歌對其進行分析并反饋給系統(tǒng)。許多公司因此對系統(tǒng)進行了設計,使自己能夠得到這些數據并循環(huán)利用,以改善現(xiàn)有的服務或開發(fā)新服務[6]。而學術期刊恰恰在這一方面是軟肋,甚至是空白一片。缺少個性是困擾相當數量的教育學術期刊的嚴重問題。打開一些學術期刊的網站,瀏覽其目錄如果不是看刊名,根本就分不清是哪本刊物。千刊一面、毫無特色、內容拼盤已經波及了學術期刊的網站、微博、微信公眾號等數字出版形式,導致大多數學術期刊在新媒體應用方面差強人意,這些應用只是表面熱鬧繁榮,在專業(yè)方面有影響力的微信公眾號里根本找不到學術期刊的聲音,對紙質媒體的照搬做法已經遠遠不能滿足當今讀者的多元化需求。另外,數字發(fā)行的價值也被嚴重低估,很多學術期刊只管埋頭收稿發(fā)稿,根本不問讀者在哪里,他們在思考什么。
筆者曾經和一名資深編審交流過如何辦刊問題,他提出最多的問題就是:“讀者在哪里?”“你們找到讀者了嗎?”由此述及,學術數據庫以及期刊的網站里有哪些讀者在下載或在線瀏覽哪些文章?他們是在有目的地精讀還是無意地略讀?如何能夠找到這些讀者并與他們進行點對點的交流?這些是學術期刊的最大價值來源,而大量的潛在的有價值的數據還沒有被開發(fā)就白白地流失掉了。一旦能夠掌握這些數據,不僅可以挖掘出學術研究的潛在議題,而且還能夠反復利用開發(fā),從中找到真正的讀者群和作者群。
真正的思維必然以認識到新的價值而告終的[8]。對于學術期刊來說,出版業(yè)進入大數據時代已經不再是遙遠的未來,大數據帶來的全新理念和價值也是不可估量。數據的價值最根本還是來自于思維上的創(chuàng)新,文章主要闡述了相關性思維、復雜性思維、個性化思維的內涵以及它們對學術期刊編輯方式和刊物內容的影響,大數據思維遠遠不止上述的這三條。筆者認為在大數據語境下,學術期刊應結合刊物自身特點,積極應對時代所帶給期刊人的挑戰(zhàn)和問題,不斷進行思維創(chuàng)新、觀念的突破,努力與大數據對接。因此,對于這一變革能夠給學術期刊帶來怎么的創(chuàng)新和發(fā)展還值得進一步探討和研究。
[1]馮海超.大數據時代正式到來[J].互聯(lián)網周刊,2012(24):36-38.
[2]Big data [EB/OL].[2015-07-15].http://.en.wikipedia.org/wiki/Big-data.
[3]大衛(wèi)·芬雷布.大數據云圖[M].盛楊燕,譯.杭州:浙江人民出版社,2014:62.
[4]孟小峰,慈祥.大數據管理:概念、技術與挑戰(zhàn)[J].計算機研究與發(fā)展,2013,50(1):151.
[5]閻光才.教育及社會科學研究中的數據——兼議當前的大數據熱潮[J].北京大學教育評論,2013(4):82-83.
[6]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.與大數據同行:學習和教育的未來[M].趙中建,張燕南,譯.上海:華東師范大學出版社,2015:113.
[7]舍基.人人時代:無組織的組織力量[M].胡泳,沈滿琳,譯.北京:中國人民大學出版社,2012:55.
[8]約翰·杜威.我們怎樣思維·經驗與教育[M].姜文閔,譯.北京:人民教育出版社,2005.
[9]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數據時代[M].盛楊燕,周濤譯.杭州:浙江人民出版社,2013.
[10]劉德寰,李雪蓮.大數據的風險和現(xiàn)存問題[J].廣告大觀:理論版,2013(3):70.
[11]李濤.中國教育國際化戰(zhàn)略中的教育學術期刊國際化發(fā)展[J].教育學術月刊,2011(10):12.
[12]Staines G L.The causal generalization paradox: the case of treatment outcome research [J].Review of General Psychology,2008,12:236-252.