數(shù)據(jù)密集型的科學(xué)發(fā)現(xiàn)已成為繼實證范式、理論范式、計算范式后科學(xué)發(fā)現(xiàn)的“第四范式”,其在物理、化學(xué)、生物、天文等自然科學(xué)領(lǐng)域,乃至社會學(xué)、教育學(xué)、新聞傳媒、法律等人文社會科學(xué)領(lǐng)域的研究中,發(fā)揮著越來越大的作用。近年來,人工智能在圖像、視頻、語音識別,以及人機對弈等領(lǐng)域的技術(shù)突破,進一步為數(shù)據(jù)驅(qū)動的科學(xué)研究提供了新的技術(shù)和方法。人工智能技術(shù)作用于科學(xué)研究,可充分發(fā)揮文獻、實驗、仿真結(jié)果等各種類型科學(xué)數(shù)據(jù)的價值:發(fā)現(xiàn)新的科學(xué)現(xiàn)象、揭示新的科學(xué)規(guī)律、驗證科學(xué)假設(shè)、促進不同領(lǐng)域科學(xué)研究的交叉融合、探索科學(xué)研究的新方法和新思路,這對提升科學(xué)研究水平,取得突破性的研究成果,具有重要意義。
本期專輯圍繞“‘智能+與數(shù)據(jù)驅(qū)動的科學(xué)研究”這個主題,在全國范圍內(nèi)征集稿件,受到了學(xué)術(shù)界的廣泛關(guān)注,經(jīng)過專輯編委會專家們的認真評閱,總共收錄16篇高質(zhì)量學(xué)術(shù)論文,分別來自國內(nèi)11個高校和科研院所,包括東北大學(xué)、桂林電子科技大學(xué)、華東理工大學(xué)、華東師范大學(xué)、南京農(nóng)業(yè)大學(xué)、南瑞集團、上海電力大學(xué)、四川大學(xué)、同濟大學(xué)、中國人民大學(xué)、中山大學(xué)等。根據(jù)主題的不同,上述論文被劃分為3個板塊:數(shù)據(jù)驅(qū)動的計算教育學(xué)、新興應(yīng)用中的計算機智能、新時期數(shù)據(jù)管理技術(shù)。
互聯(lián)網(wǎng)在改變世界的同時也深刻地改變著教育,利用信息技術(shù)優(yōu)化教育過程、提升教學(xué)效果顯得非常重要。數(shù)據(jù)驅(qū)動的計算教育學(xué)板塊共收錄5篇稿件:東北大學(xué)劉恒宇等人介紹了知識追蹤及其應(yīng)用背景,回顧了知識追蹤所涉及的教育學(xué)與數(shù)據(jù)挖掘理論,總結(jié)了基于概率圖、矩陣分解、深度學(xué)習(xí)的知識追蹤研究現(xiàn)狀,并展望未來的研究方向;華東師范大學(xué)陳遠哲等人歸納梳理了共指消解的發(fā)展歷程,從技術(shù)層面將共指消解劃分為多個階段,并介紹了各個階段的代表性模型,以及它們的優(yōu)缺點;華東師范大學(xué)楊康等人意識到機器閱讀理解是理解學(xué)生問題和文檔內(nèi)容、快速獲取知識的重要途徑,綜述了新近涌現(xiàn)出來的基于神經(jīng)網(wǎng)絡(luò)的機器閱讀模型;華東師范大學(xué)楊東明等人基于百科語料和遠程監(jiān)督思想提出了基于關(guān)系表示的注意力機制,有效提取知識點間的有向關(guān)系信息;四川大學(xué)申航杰等人提出了一種融合模糊聚類和支持向量回歸的成績預(yù)測方法,即先引入模糊邏輯來計算隸屬度矩陣,再對學(xué)生歷史成績進行聚類,最后對成績軌跡進行擬合建模,從而提高成績預(yù)測的準確率和可解釋性。
除了教育之外,計算機智能也廣泛應(yīng)用在法學(xué)、智慧城市、電子商務(wù)、智能電網(wǎng)等領(lǐng)域。新興應(yīng)用中的計算機智能板塊共收錄6篇稿件:中國人民大學(xué)邵明銳等人意識到FAQ數(shù)據(jù)集規(guī)模有限,給出了數(shù)據(jù)層面和模型層面的解決方案,在數(shù)據(jù)層面,利用百度知道爬取數(shù)據(jù)并挖掘語義等價問題,確保數(shù)據(jù)的相關(guān)性和一致性,在模型層面,提出了面向遷移學(xué)習(xí)的深度神經(jīng)網(wǎng)絡(luò),以計算句子對之間的語義相似度;同濟大學(xué)陳亮等人意識到在法學(xué)理論和法律實踐中缺乏智能決策,采用多種數(shù)據(jù)分析模型研究智能決策算法,嘗試建立法律關(guān)系坐標系,實現(xiàn)法律關(guān)系分析的空間幾何轉(zhuǎn)化;中山大學(xué)江群等人研究了基于用戶偏好的最優(yōu)路徑搜索,從而在預(yù)算約束下尋找滿足用戶偏好的最優(yōu)路徑,所提的新方法可在查詢階段利用索引結(jié)構(gòu)過濾出候選節(jié)點集;桂林電子科技大學(xué)傅裕等人觀察到在電子商務(wù)領(lǐng)域中部分商品的名稱可能包含屬性等冗余信息,導(dǎo)致信息不一致現(xiàn)象,因而提出了一種基于自注意力機制的商品名稱精簡模型,以較小的計算代價精簡商品名稱;南瑞集團黃福興等人認識到保證海量電能量數(shù)據(jù)的準確性、可靠性和完整性對智能電網(wǎng)至關(guān)重要,設(shè)計了一種基于孤立森林的異常檢測算法,可檢測大規(guī)模電能量數(shù)據(jù)中發(fā)生的異常;上海電力大學(xué)趙波等人基于機器學(xué)習(xí)方法,提出了一種優(yōu)化神經(jīng)網(wǎng)絡(luò)的電網(wǎng)穩(wěn)定性預(yù)測模型,并與經(jīng)典機器學(xué)習(xí)方法進行了橫向?qū)Ρ取?/p>
華東師范大學(xué)學(xué)報(自然科學(xué)版)2019年創(chuàng)新的數(shù)據(jù)管理技術(shù)對高效管理海量數(shù)據(jù)非常關(guān)鍵。新時期數(shù)據(jù)管理技術(shù)板塊共收錄5篇稿件,作者均來自華東師范大學(xué):丁國浩等人為了支持負載均衡的數(shù)據(jù)加載,采用選取部分采樣塊和等間隔選取樣本的方式來確定分區(qū)之間的切分點,避免了全局采樣和隨機或頭部樣本選取方式確定切分點帶來的高開銷;劉子豪等人意識到LevelDB數(shù)據(jù)庫具有KeyValue結(jié)構(gòu)的局限性,因而無法有效索引空間數(shù)據(jù),提出了一種基于LevelDB和Rtree的二級索引,從而支持二維數(shù)據(jù)的索引和近鄰查詢,實驗結(jié)果表明該結(jié)構(gòu)效果良好;祝朝凡等人發(fā)現(xiàn)基本的Paxos算法盡管在理論上保證了一致性,但是依然容易產(chǎn)生活鎖問題,而且不易工程化,因而提出了一種改進算法,有效降低了網(wǎng)絡(luò)通信開銷;黃皓等人提出了一種基于GPU的流處理系統(tǒng)Serval,通過充分利用CPUGPU異構(gòu)資源,高效處理了關(guān)系型流查詢;張濤等人意識到標準Benchmark負載固定,較難應(yīng)對用戶多樣的應(yīng)用場景,因而設(shè)計并實現(xiàn)了一個用戶自定義性能測試負載的工具——Woodpecker+,該工具易于使用和可拓展,提供了可高效構(gòu)造測試案例、做測試安排的測試定義語言(TDL),可靈活控制事務(wù)執(zhí)行模式及數(shù)據(jù)訪問分布,實現(xiàn)了輕量級的細粒度統(tǒng)計信息收集與分析,支持多種主流數(shù)據(jù)庫系統(tǒng)DBMS及提供數(shù)據(jù)庫訪問接口的其他數(shù)據(jù)庫。
最后,謹在此感謝各位作者為專輯提供了優(yōu)質(zhì)的稿源,感謝各位評審專家,特別感謝我校學(xué)報編輯部自然科學(xué)版在收稿、審稿、校稿過程中的大力支持和辛勤工作?!爸悄?”與數(shù)據(jù)驅(qū)動的科學(xué)研究在許多領(lǐng)域中都有重要應(yīng)用,希望本期專輯能夠推動相關(guān)領(lǐng)域的研究進展和應(yīng)用實施。