謝文亮 鄭添尹
摘? 要:研究大數(shù)據(jù)時代學術期刊如何通過數(shù)據(jù)挖掘構(gòu)建五類學術期刊信息數(shù)據(jù)庫,通過采取數(shù)據(jù)挖掘方法對作者信息相關數(shù)據(jù)進行收集,分析和探討學術期刊五類數(shù)據(jù)庫建設條件和數(shù)據(jù)庫的信息資料來源搜集方法。結(jié)果表明,學術期刊信息數(shù)據(jù)庫建設方法簡單可行,適合一般學術期刊的信息數(shù)據(jù)庫建設,為學術期刊的信息數(shù)據(jù)庫建設和維護管理提供借鑒。
關鍵詞:大數(shù)據(jù);學術期刊;數(shù)據(jù)庫;信息搜集;數(shù)據(jù)挖掘
Abstract:This paper studies how academic journals construct five types of academic journal information database through data mining in the era of big data,collects data related to the authors information by adopting data mining methods,analyzes and discusses the construction conditions of five types of academic journals database and the source collection methods of database information. The results show that the construction method of academic journal information database is simple and feasible,which is suitable for the construction of general academic journal information database,and provides reference for the construction and maintenance of academic journal information database.
Keywords:big data;academic periodicals;database;information searching and collection;data mining
0? 引? 言
學術期刊的發(fā)展依賴各類人員,如期刊的稿源來自作者、讀者和潛在的作者源,期刊的質(zhì)量把握依賴外審專家,期刊發(fā)展后勁除了作者、讀者、專家外,還依賴于潛在作者來源,期刊的宣傳有賴于自媒體群,如QQ群、微信群等??梢哉f,辦刊以人為本,事關刊物成敗的人員分為兩種,一種是編輯部內(nèi)部人員,其重要性不言而喻;另一種是編輯部外部人員,其中,比較重要的是以上列出的五種人員,即專家、作者、讀者、潛在作者以及自媒體群人員。五類人員與期刊休戚相關,對其建立數(shù)據(jù)庫是期刊管理的一個重要組成部分。期刊的信息數(shù)據(jù)庫的建立,既為期刊編輯服務,也為期刊的可持續(xù)發(fā)展服務。計算機技術的信息化和網(wǎng)絡化為信息數(shù)據(jù)庫的建設提供了良好的條件,數(shù)據(jù)挖掘和語義技術為數(shù)據(jù)庫人員信息的完善和擴充提供支持,因此,要善于利用當前的計算機技術來建立和完善信息數(shù)據(jù)庫。然而,目前學術期刊普遍不關注信息數(shù)據(jù)庫的建設與維護,導致學術期刊信息數(shù)據(jù)庫建設嚴重滯后,發(fā)展后勁遇到了瓶頸,探討期刊信息數(shù)據(jù)庫的建設可為期刊提供借鑒。
1? 學術期刊信息數(shù)據(jù)庫的作用
對于期刊來說,最關緊要的是幾類人群是:專家、作者、讀者、潛在作者、自媒體群人員等。如果建立起這幾類人群的數(shù)據(jù)庫,對期刊的發(fā)展有不可估量的作用。因此,期刊要將建設專家數(shù)據(jù)庫、作者數(shù)據(jù)庫、潛在稿源數(shù)據(jù)庫、期刊自媒體群數(shù)據(jù)庫、讀者數(shù)據(jù)庫五類信息數(shù)據(jù)庫[1]作為重要的期刊管理事務。建立數(shù)據(jù)庫的目的是便于聯(lián)系和交流,因此,有了讀者,期刊才能生存下去。建立這五類數(shù)據(jù)庫,可定期給這五類人員發(fā)Email、寄樣刊、發(fā)送最新選題和特色欄目、發(fā)約稿函,每到節(jié)日發(fā)賀卡問候祝福;一回生,二回熟,三回有印象。這樣期刊不愁沒有來稿,不愁沒好稿件,對期刊的影響力、評刊指標、長遠發(fā)展等都有極大的幫助。建立讀者數(shù)據(jù)庫,可定期為庫中讀者提供期刊信息,提供期刊目錄精準推送服務,能加強與讀者的交流,并通過已有讀者發(fā)展讀者,擴大讀者群。建立起作者數(shù)據(jù)庫,便于組稿和約稿;學術期刊并非永遠有優(yōu)質(zhì)的來稿,需要編輯進行策劃和組稿,稿件的來源便有賴于作者數(shù)據(jù)庫。通過潛在稿件數(shù)據(jù)庫容易挖掘出有利于期刊的潛在讀者和潛在的優(yōu)質(zhì)稿源。通過在期刊自媒體群數(shù)據(jù)庫中自媒體群的宣傳,可擴大期刊知名度。
2? 五類數(shù)據(jù)庫的建設
2.1? 專家數(shù)據(jù)庫的建設
專家是期刊質(zhì)量的保障。專家在期刊的辦刊中起到多方面的作用,一是專家為期刊發(fā)展的“軍師”,可為期刊的戰(zhàn)略發(fā)展提供咨詢、策劃期刊的發(fā)展方向等,如期刊的專家顧問團、顧問委員會、期刊智庫等;二是專家稿件效應,一個期刊想要與眾不同或想要有知名度,必須能約到一定數(shù)量的專家級的稿件,專家稿件在質(zhì)量保證、轉(zhuǎn)載、轉(zhuǎn)引、關注度上有明顯優(yōu)勢;三是專家審稿,學術論文由于其專業(yè)性強,編輯無法熟悉每一個領域的內(nèi)容,因此論文的內(nèi)容科學性、選題新穎性、思想性等問題交由專業(yè)領域的外審專家來審定。專家數(shù)據(jù)庫對期刊的長遠發(fā)展有著決定性的意義。建設專家數(shù)據(jù)庫時,專家的信息可從不同的途徑獲取,如官方主頁、高端會議、國家基金項目、國家級成果文庫等[3],如圖1所示。
在官方主頁上,每個高等院校或科研單位都會將本單位的專家資料放在“院士風采”“名家風采”“教授風采”“長江學者”“學科帶頭人”等欄目供人瀏覽;一些博士生導師或碩士生導師等在某一學科有影響力的人物,一般會放在各個二級部門主頁的“師資力量”上,具體的信息還可以從當年的碩士或博士招生目錄中找到;從各種會議、論壇上獲得專家信息,如中國可信計算與信息安全學術會議、IEEE無線通信,網(wǎng)絡技術與信息安全國際會議、圖像與信號處理、生物醫(yī)學工程與信息學國際學術會議、中國經(jīng)濟學年會等,會議舉辦方會將參會人員通訊錄發(fā)放到每個人的電子郵箱里,通訊錄人員信息包括單位、部門、姓名、性別、職務、職稱、手機、電子郵箱、研究領域、研究專長等,通過篩選,將符合條件的人員數(shù)據(jù)直接導入到數(shù)據(jù)庫中。還有其他渠道,如從國家、省、市等公布的自然基金項目獲得者中得到專家的信息。將專家的資料提取出來,建立專家數(shù)據(jù)庫。專家數(shù)據(jù)庫必須定期進行更新和完善,每年都會在學科領域出現(xiàn)新的面孔,要特別重視并將這些新專家加入數(shù)據(jù)庫。建立起專家數(shù)據(jù)庫后,要重視與數(shù)據(jù)庫中專家的聯(lián)系,編輯可通過發(fā)郵件、寄樣刊等方式,與專家建立起良好的關系,再根據(jù)專家的研究領域、研究專業(yè)、研究方向等,試著向?qū)<壹s稿,邀請專家審稿,或就期刊的選題或發(fā)展方向等向?qū)<易稍?。利用學科年會等與專家接觸,建立起良好的合作關系。
2.2? 作者數(shù)據(jù)庫的建設
作者是期刊的生命線,期刊必須尊重作者、善待作者。作者是期刊忠誠的讀者,他們對期刊投稿,意味著他們對期刊質(zhì)量的認可。對于無論是采用或是不采用的來稿作者,都要給予重視。如果一個作者的稿件沒被采用,期刊就對該作者不問不睬,久而久之,作者對期刊的忠誠度也會減弱,優(yōu)質(zhì)稿件再也不會投到期刊來。因此,對作者要重視,建立起作者數(shù)據(jù)庫是為了持之以恒地與作者保持聯(lián)系。
傳統(tǒng)的紙質(zhì)投稿由于速度慢、不便于管理等原因逐漸被信息化投稿方式淘汰。目前,期刊投稿方式基本有兩種,一是電子郵件投稿,一是在線投稿。郵件投稿的作者在來稿中一般會附上自己的相關的信息,如姓名、單位、部門、職稱、研究領域、電子郵箱、手機,這些信息就是作者數(shù)據(jù)庫現(xiàn)成的可用來源。對于在線投稿來說,作者信息更齊全、更詳細,并且系統(tǒng)提供Excel導出功能,可以直接將需要的數(shù)據(jù)導到數(shù)據(jù)庫中。對來稿作者的信息,不是來者必錄,而是要進行嚴格的篩選,標準是研究方向必須符合本刊的選題定位。根據(jù)這個標準,對初審中不符合本刊學科研究方向的作者作不入庫處理。對于符合入庫條件的,無論稿件采用與否,都要將作者資料信息錄入數(shù)據(jù)庫。在網(wǎng)絡化、信息化時代,人性化的交流尤其重要。學術期刊要定期給作者發(fā)郵件,真誠地問候作者,關心作者研究近況、最新研究成果以及最新創(chuàng)作等情況。定期、周期性的交流工作,讓作者意識到期刊一直關注著他的研究工作注,加深了作者對期刊的良好印象;作者一有新稿件問世,在考慮投稿時,會將稿件投往他印象最深刻的期刊。因此,對作者的重視,是對期刊生命線的維持。
2.3? 潛在稿源數(shù)據(jù)庫的建設
拓展稿源是落實學術強刊的關鍵[4]。期刊不僅要保持現(xiàn)有的核心作者源,還要尋找、發(fā)現(xiàn)和挖掘有潛力的作者,獲取途徑如圖2所示。
學術期刊往往忽略了對作者的團隊成員的挖掘,學術研究團隊能提供更寬闊、更廣泛的、有相同研究方向的潛在作者,這是學術期刊必須長期重視并且努力爭取的稿源。學術研究團隊的挖掘有現(xiàn)成的工具可利用:對本刊發(fā)表文章的作者,中國知網(wǎng)上提供了作者的知識網(wǎng)絡,包括作者關注領域、作者的導師、合作作者(包括同機構(gòu)作者、其他機構(gòu)作者,并給出了合作者之間的關系圖)、指導的學生等。由于學術研究團隊具有統(tǒng)一性、連貫性和繼承性,因此學術研究團隊的研究學科、方向基本都適合本刊的要求。由作者形成的知識網(wǎng)絡出發(fā),可以完成作者的學術研究團隊數(shù)據(jù)的收集。另一種潛在作者是通過各種期刊,如在本專業(yè)核心期刊以及一般期刊等發(fā)現(xiàn)人才,其搜索需要花一定的精力以及有一定的判斷力。不過互聯(lián)網(wǎng)本身就是一個無邊際、信息量巨大的數(shù)據(jù)庫,現(xiàn)在的交互性媒介,如微信公眾號、博客(包括微博)、論壇等為學者提供了表達觀點、發(fā)表文章的機會。一些人喜歡在自己的微信公眾號、博客發(fā)表文章,有些作者現(xiàn)在缺乏知名度,但文章有見解、有前瞻性,具有一定的含金量,這些作者具有發(fā)展?jié)摿Γ菍W術期刊爭取的潛在稿件對象。如果學術期刊在他們尚未成名之前就將其作為潛在稿源,經(jīng)常交流,建立起良好的關系,樹立起期刊品牌形象,這些潛在作者一旦成名,會飲水思源,將是優(yōu)質(zhì)的稿件的來源渠道。當然,還有其他發(fā)現(xiàn)潛在稿源的途徑,如參加學術會議并對會議論文集進行研究閱讀,也可以發(fā)現(xiàn)其中有潛力的作者;平時閱讀學術期刊時,對那些有深入見解的作者也要給予高度重視,將他們的信息收集到潛在稿源數(shù)據(jù)庫中,主動跟他們聯(lián)系。總之,潛在的作者源數(shù)據(jù)的建設,是學術期刊可持續(xù)發(fā)展的保障,要勤于挖掘和發(fā)現(xiàn)。
2.4? 期刊自媒體群數(shù)據(jù)庫
互聯(lián)網(wǎng)時代,特別是移動互聯(lián)網(wǎng)時代,自媒體宣傳成為學術期刊自我宣傳的一個窗口。目前QQ和微信是當今我國最流行的即時通訊工具,幾乎每個上網(wǎng)的中國人都人手一個QQ號碼和一個微信號碼,QQ群、微信群也是信息發(fā)布和信息交流的地點之一。讀者都比較喜歡和編輯打好關系,只要編輯主動地在網(wǎng)上提供QQ號碼和微信號碼,讀者會自動地加編輯為好友,這樣就可以組成一個編輯群,可以為讀者答疑、發(fā)布征稿消息和選題信息等。自媒體群的方式主要有兩種,一種是QQ群,另一種是微信群。一些學術期刊建立起了多個自媒體群,如編輯部內(nèi)部群、期刊同行交流群、期刊與作者群等。從某種角度來說,自媒體群也是一種數(shù)據(jù)庫[5]。雖然基于推廣期刊、促進交流的目的建立了QQ群、微信群等,但容易忽略自媒體群數(shù)據(jù)庫的建立。自媒體群處于變動狀態(tài),一旦群解散了,經(jīng)過千辛萬苦建立起來的關系就立刻解除。因此,要防患于未然,建立期刊自媒體群數(shù)據(jù)庫,將群人員的信息,包括QQ號、微信號、工作單位、所在自媒體群等用數(shù)據(jù)庫方式保留起來并定期更新,掌握自媒體群信息主動權(quán);一旦群解散,由于人員信息還在,容易再次組建。
2.5? 讀者數(shù)據(jù)庫的建設
讀者的來源很廣,包括專家、作者、潛在稿源作者、自媒體群人員、高??蒲腥藛T以及期刊同行等。讀者數(shù)據(jù)可以是以上建立的四個數(shù)據(jù)庫的數(shù)據(jù)庫的合總,再加上其他人員的信息合并而成,如圖3所示。
得到讀者數(shù)據(jù)的最簡單的方法是通過在期刊主頁上建立調(diào)查問卷,調(diào)查問卷中要求參與者輸入正確的個人信息,對參加調(diào)查問卷的讀者贈送一點小禮物;在紙質(zhì)期刊上附紙質(zhì)的調(diào)查問卷,讓讀者填完后回寄,也是建立讀者數(shù)據(jù)庫的途徑之一。通過在線系統(tǒng)接收投稿的學術期刊社,其在線系統(tǒng)有提供讀者注冊服務,讀者信息可從系統(tǒng)中直接導出。對于其他類型的讀者,要根據(jù)期刊社的發(fā)展需要以及一些讀者的合理要求,建立起讀者數(shù)據(jù)庫。
3? 學術期刊數(shù)據(jù)庫建設實踐
廣東財經(jīng)大學學報通過數(shù)據(jù)挖掘技術對各類期刊人員信息聚類和分析,建立起了五類人員數(shù)據(jù)庫。每一類數(shù)據(jù)庫都必須仔細記錄了人員信息,包括姓名、單位、部門、性別、職稱、研究領域、手機、電子郵箱,如圖4所示。
使用Microsoft Excel建立數(shù)據(jù)庫。每一張Excel表就是一個數(shù)據(jù)庫,表中的每一個方格就是一個數(shù)據(jù)項。由于Excel具有強大的求和、篩選、排序等功能,可以進行統(tǒng)計分析、分類匯總、查詢檢索等[2],因此在建設的過程中,使用Excel進行重復篩選、去偽存真、分類聚類等,使得數(shù)據(jù)庫簡潔明了,人員分類有條理,能高效地查詢到所需的人員信息。在建立學術期刊信息數(shù)據(jù)庫的過程中,考慮到信息的來源不同,對不同數(shù)據(jù)庫的內(nèi)容采取不同搜集方法,利用大數(shù)據(jù)技術和信息化手段來搜集各個數(shù)據(jù)庫的數(shù)據(jù)項,并時常進行內(nèi)容的更新。
4? 結(jié)? 論
在信息數(shù)據(jù)庫的建設和應用過程中,要注意以下方面的事項:首先,對數(shù)據(jù)庫數(shù)字信息的搜集,要從合法的、公開的途徑,要遵守相關的法律法規(guī),才能做到合法合理;其次,對數(shù)據(jù)庫要做好保密措施,謹慎使用其中數(shù)據(jù),不能隨便將數(shù)據(jù)庫信息透露給其他人,因為很多信息涉及個人隱私,一旦不小心泄露了出去,會給人員造成很多工作和生活上的不便;再次,通過數(shù)據(jù)庫與專家、讀者、作者等聯(lián)系時,要注意時間、節(jié)奏等細節(jié),過于頻繁會讓人誤解為騷擾;第四,數(shù)據(jù)庫要勤于維護和完善,增加新的、刪除過時的、補充原來未全的、去掉被證明為錯誤的,才能使數(shù)據(jù)庫的數(shù)據(jù)趨于完善、精確;最后,建設數(shù)據(jù)庫的過程中,要加強信息甄別能力,學會辨別真假信息,要增強信息辨別素養(yǎng)和學術鑒賞素養(yǎng),才能日益擴充數(shù)據(jù)庫中的數(shù)據(jù)。
參考文獻:
[1] 李明志,鎖志海,趙大良.學術期刊審稿專家數(shù)據(jù)庫的開發(fā)及其使用 [J].編輯學報,2004(4):274-275.
[2] 王寧寧.圖書館QQ群咨詢服務研究 [J].現(xiàn)代情報,2009,29(1):174-177.
[3] 龐富祥,李彥民.學術論文評審專家數(shù)據(jù)庫的建設 [J].科技與出版,2000(3):42-43.
[4] 楊勇.拓展稿源是高校學報學術強刊的關鍵 [J].編輯學報,2009,21(3):245-246.
[6] 梁愛香,梁永忠.Excel報紙數(shù)據(jù)庫的創(chuàng)建及應用 [J].大學圖書情報學刊,2004(4):36-37+62.
作者簡介:謝文亮(1979.10—),男,漢族,廣東潮州人,編輯,副編審,碩士研究生,主要研究方向:數(shù)字出版;鄭添尹(1982.08—),女,漢族,廣東湛江人,學士學位,碩士研究生,研究方向:網(wǎng)絡與新媒體傳播。