肖紅玉,黃 靜,陳 海
XIAO Hong-yu, HUANG Jing, CHEN Hai
(北京師范大學(xué) 珠海分校 信息技術(shù)學(xué)院 ,珠海 519015)
在高校的科研管理部門中,傳統(tǒng)的管理科學(xué)研究活動的方法是使用微軟的office辦公軟件,在excel中手動輸入、更新、維護(hù)數(shù)據(jù)。這樣的管理辦法,在一定程度上能滿足需求,但是隨著科研活動的日益增多和時(shí)間的延續(xù),數(shù)據(jù)量越來越大,數(shù)據(jù)的復(fù)雜性也在增加,在這種情況下,單純依靠office軟件進(jìn)行科研活動的管理就顯得力不從心了,并且這樣也不利于科研活動的數(shù)據(jù)與學(xué)校其他辦公系統(tǒng)間數(shù)據(jù)的共享。隨著數(shù)據(jù)庫技術(shù)的發(fā)展,大量數(shù)據(jù)的操作、管理、維護(hù)變得容易起來,這就為科研活動的管理提供了良好的技術(shù)支持。本文將簡要講述科研管理系統(tǒng)的需求,并結(jié)合現(xiàn)在成熟的數(shù)據(jù)庫技術(shù),為科研管理系統(tǒng)的實(shí)施進(jìn)行詳細(xì)的講解。
目前的數(shù)據(jù)庫管理系統(tǒng)(RDMS)已發(fā)展的非常成熟,各個(gè)常見的RDMS都具有高性能、多線程、多用戶等特點(diǎn),能夠達(dá)到快查詢數(shù)據(jù)、高可靠性、易用性、靈活的擴(kuò)展性等要求。RDMS通常具有一定的層次結(jié)構(gòu),包括主子系統(tǒng)和輔助部件等。主子系統(tǒng)和輔助部件之間相互配合、讀取、分析數(shù)據(jù)和執(zhí)行查詢,從而完成數(shù)據(jù)管理的任務(wù)。主子系統(tǒng)一般包括以下五個(gè)部分:查詢引擎、存儲管理器、緩沖存儲器、事務(wù)管理器、恢復(fù)管理器等。這五個(gè)部分是RDMS的主體,它們各自完成各自的功能,從而保證了整個(gè)數(shù)據(jù)管理任務(wù)的進(jìn)行。
查詢引擎用于對數(shù)據(jù)進(jìn)行復(fù)雜的查詢檢索,它的工作可分為三個(gè)部分:語法分析、查詢優(yōu)化和執(zhí)行查詢。首先,查詢引擎要對結(jié)構(gòu)化查詢語言(SQL)進(jìn)行分析,講SQL指令解讀成RDMS能識別的形式。接下來,為達(dá)到高效性,RDMS會對查詢語句進(jìn)行優(yōu)化,從而生成最高效的查詢執(zhí)行計(jì)劃。最后,進(jìn)行查詢執(zhí)行,向用戶返回符合條件的記錄。在注意的是,在查詢執(zhí)行時(shí),RDMS還會對用戶的權(quán)限進(jìn)行檢查,以確保用戶具有獲取記錄的權(quán)限,這樣就保證了數(shù)據(jù)的安全性。
數(shù)據(jù)最終都是以文件的形式存儲在文件系統(tǒng)中,將數(shù)據(jù)轉(zhuǎn)化為操作系統(tǒng)能識別的文件形式,就是存儲管理器的工作。
緩沖管理器處理所有在查詢引擎和存儲管理器數(shù)據(jù)請求中引起的內(nèi)存管理問題,用于提高數(shù)據(jù)的查詢速度。在進(jìn)行數(shù)據(jù)查詢時(shí),往往會存在重復(fù)的數(shù)據(jù)查詢,如果每次都對查詢管理器進(jìn)行請求,就浪費(fèi)了資源,同時(shí)效率也不高。在RDMS中,緩沖管理器會將查詢返回的記錄存儲到高速緩沖存儲器中,這樣當(dāng)下次有相同的記錄被查詢時(shí),直接從高速緩沖管理器中讀取數(shù)據(jù),不需要再次進(jìn)行數(shù)據(jù)庫查詢。
當(dāng)多個(gè)用戶同時(shí)讀寫相同的記錄時(shí),往往容易引起混亂。事務(wù)管理器的任務(wù)就是提供一定的機(jī)制,確保多個(gè)用戶有序的訪問、修改同一記錄,從而保證數(shù)據(jù)的一致性。
用戶操作、RDMS、甚至操作系統(tǒng)本身都有可能出現(xiàn)錯(cuò)誤,因此,恢復(fù)管理器的存在就顯得非常必要。當(dāng)出現(xiàn)不當(dāng)操作時(shí),恢復(fù)管理器能數(shù)據(jù)庫回滾到之前正常的狀態(tài)。
數(shù)據(jù)庫管理系統(tǒng)已發(fā)展的非常成熟,對數(shù)據(jù)處理的高效性、穩(wěn)定性、可恢復(fù)性都能得到保障,這就為科研管理系統(tǒng)的部署實(shí)施提供了強(qiáng)有力的技術(shù)支持。
高校的科研管理系統(tǒng)作為涉及到多個(gè)部門、眾多角色的管理系統(tǒng),其功能比較復(fù)雜,模塊比較多,因此,進(jìn)行清晰地模塊劃分就顯得十分必要??蒲泄芾硐到y(tǒng)主要可分為如下幾個(gè)模塊:
公共信息管理模塊。公共信息模塊主要用于管理在網(wǎng)絡(luò)上發(fā)布的新聞、政策、材料文件等。科研管理系統(tǒng)的管理員登錄后,可以進(jìn)行公共信息的發(fā)布、修改、刪除等操作,一般用戶具有閱讀下載的權(quán)限。
管理機(jī)構(gòu)信息模塊??蒲泄芾聿块T作為高校的一個(gè)部門,起部門結(jié)構(gòu)、人員調(diào)整等都會影響到科研活動的進(jìn)行,因此,需要有管理機(jī)構(gòu)信息模塊來更新科研部門的信息。
學(xué)術(shù)活動信息模塊。高??赡芙?jīng)常會有學(xué)術(shù)講座、科技比較等活動信息,學(xué)術(shù)活動信息模塊就是用于發(fā)布、修改這樣的學(xué)術(shù)活動信息。
科研項(xiàng)目信息管理。科研項(xiàng)目是指所有正在計(jì)劃的、正在進(jìn)行的、已經(jīng)完成的項(xiàng)目,在這個(gè)模塊,科研活動人員可以根據(jù)項(xiàng)目的進(jìn)度,及時(shí)的更新項(xiàng)目的信息,從而使項(xiàng)目信息保持在最新狀態(tài),便于科研管理部門對項(xiàng)目進(jìn)行宏觀管理。
科研成果信息管理。有五個(gè)方面的科研成果:論文、著作、鑒定成果、獲獎(jiǎng)成果、其他成果。
科研機(jī)構(gòu)管理??蒲袡C(jī)構(gòu)信息包括科研機(jī)構(gòu)的相關(guān)信息、相關(guān)人員信息等。
科研績效管理。主要是設(shè)定科研績效考核指標(biāo),提供考核成績的查詢和統(tǒng)計(jì)。由科研管理人員依權(quán)限進(jìn)行操作,科研工作人員依權(quán)限查詢。
有了清晰的模塊劃分,就能進(jìn)行詳細(xì)的系統(tǒng)設(shè)計(jì)和數(shù)據(jù)庫設(shè)計(jì)了。
現(xiàn)在應(yīng)用的比較成熟的數(shù)據(jù)庫管理系統(tǒng)是關(guān)系數(shù)據(jù)庫管理系統(tǒng)。在關(guān)系數(shù)據(jù)庫中,數(shù)據(jù)在存儲在數(shù)據(jù)表中的??梢园岩粋€(gè)實(shí)體信息設(shè)計(jì)成一張數(shù)據(jù)表,實(shí)體的唯一性約束可以通過設(shè)定表的主鍵來實(shí)現(xiàn),多個(gè)實(shí)體間的關(guān)聯(lián)可以通過表間的外鍵來聯(lián)系在一起。數(shù)據(jù)庫設(shè)計(jì)需要根據(jù)科研管理系統(tǒng)所設(shè)計(jì)的實(shí)體信息確定所需要的數(shù)據(jù)表,并根據(jù)實(shí)體的屬性,確定數(shù)據(jù)表的主鍵、外鍵。
經(jīng)過詳細(xì)的設(shè)計(jì),可確定科研管理系統(tǒng)設(shè)計(jì)到如下數(shù)據(jù)表:
鑒定專家表,用來描述科研管理部門的科研鑒定人員的信息。包含如下字段:專家編號(主鍵)、性別、出生日期、部門編號、所學(xué)專業(yè)、現(xiàn)從事專業(yè)、職稱編號、備注。
科技著作表,用來描述著作信息。包含如下字段:著作編號(主鍵)、著作名稱、圖書編號、職工號、著者角色、部門、出版社、學(xué)科、出版時(shí)間、版次、備注、審核狀態(tài)。
審批意見表,用來描述對科研活動、著作的審批信息。包含如下字段:序號(主鍵)、記錄序號、審核類別、審核意見。
部門表,包含如下字段:部門編號(主鍵),部門名稱。
新聞表,用來描述發(fā)布的新聞、公告、政策性信息。包含如下字段:序號(主鍵)、新聞?lì)悇e、新聞標(biāo)題、發(fā)布人、發(fā)布日期、新聞內(nèi)容。
科研論文表,用來存儲論文信息。包含如下字段:論文編號(主鍵)、期刊號、論文標(biāo)題、第一作者、其他作者、部門序號、刊物名稱、刊物編號、刊物級別、主辦單位、發(fā)表日期、備注、審核狀態(tài)。
項(xiàng)目表,用來存在所有正在計(jì)劃的、正在進(jìn)行的、已經(jīng)完成的項(xiàng)目信息。包含如下字段:項(xiàng)目編號(主鍵)、項(xiàng)目名稱、項(xiàng)目來源、項(xiàng)目類別、部門名稱、項(xiàng)目負(fù)責(zé)人、參與人員、立項(xiàng)時(shí)間、擬定期限、經(jīng)費(fèi)金額、審核狀態(tài)、審核時(shí)間、審核單位、備注。
項(xiàng)目類別表,用來存儲項(xiàng)目分類信息。包含如下字段:類別編號(主鍵)、類別名稱、備注。
科研成果表,用來存儲科研成果信息。包含如下字段:成果編號(主鍵)、成果名稱、成果類別、成果級別、獲獎(jiǎng)日期、獲獎(jiǎng)人、所在部門、證書號、授獎(jiǎng)單位、備注、審核狀態(tài)。
科研成果類別表,用來存儲科研成果類別信息。包含如下字段:類別編號(主鍵)、類別名稱、備注。
科研人員表,用來存儲科研人員信息。包含如下信息:人員編號(主鍵)、性別、職稱、電話、出生日期、姓名、所學(xué)專業(yè)、現(xiàn)從事專業(yè)、學(xué)歷、部門、備注、審核狀態(tài)。
用戶表,用來存儲科研管理系統(tǒng)所涉及的用戶信息。包含如下字段:用戶編號(主鍵)、姓名、性別、密碼、部門、備注。
存儲在數(shù)據(jù)庫中的信息是結(jié)構(gòu)化的,包含了很多有用的信息,如果對這些信息加以分析、挖掘,就能提煉出更多的有意義的統(tǒng)計(jì)信息。具體到科研管理系統(tǒng),我們更根據(jù)以往的項(xiàng)目規(guī)模、人員編配、項(xiàng)目進(jìn)展情況,分析出正在計(jì)劃中的項(xiàng)目的進(jìn)度安排。正是由于數(shù)據(jù)倉庫帶來的如此有用的信息,有必要對數(shù)據(jù)倉庫進(jìn)行專門的講解。
數(shù)據(jù)倉庫與傳統(tǒng)數(shù)據(jù)庫攢在一定差別,但是他們之間也是有聯(lián)系的。數(shù)據(jù)庫里存放的是結(jié)構(gòu)化的數(shù)據(jù),這些數(shù)據(jù)時(shí)數(shù)據(jù)倉庫的基礎(chǔ)。數(shù)據(jù)倉庫的建立不是對數(shù)據(jù)庫的取代。 數(shù)據(jù)庫和數(shù)據(jù)倉庫是應(yīng)用于不同的層次: 數(shù)據(jù)庫應(yīng)用于日常的數(shù)據(jù)處理、而數(shù)據(jù)倉庫用于高層的決策分析。如果說傳統(tǒng)數(shù)據(jù)庫系統(tǒng)的重點(diǎn)與要求是快速、準(zhǔn)確、安全、可靠地將數(shù)據(jù)存進(jìn)數(shù)據(jù)庫中的話,那么數(shù)據(jù)倉庫就是準(zhǔn)確、安全、可靠的從數(shù)據(jù)庫取出數(shù)據(jù),經(jīng)過加工轉(zhuǎn)換成有規(guī)律信息之后,再供管理人員進(jìn)行分析使用。
數(shù)據(jù)倉庫的設(shè)計(jì)主要確定存儲結(jié)構(gòu)、索引結(jié)構(gòu)、存放位置、存儲分配。
4.2.1 存儲結(jié)構(gòu)
一個(gè)數(shù)據(jù)庫管理系統(tǒng)往往提供了幾種存儲結(jié)構(gòu),這些存儲結(jié)構(gòu)各有不同的特點(diǎn)是使用的方向,可供設(shè)計(jì)人員選擇。數(shù)據(jù)倉庫的數(shù)據(jù)是基于數(shù)據(jù)庫管理系統(tǒng)的,在目前廣泛應(yīng)用的關(guān)系數(shù)據(jù)庫管理系統(tǒng)中,數(shù)據(jù)存儲于相互關(guān)聯(lián)的數(shù)據(jù)表中。設(shè)計(jì)這些數(shù)據(jù)表是數(shù)據(jù)倉庫的關(guān)鍵。設(shè)計(jì)良好的數(shù)據(jù)表、嚴(yán)格的主鍵外鍵關(guān)聯(lián)關(guān)系,能給數(shù)據(jù)倉庫的應(yīng)用帶來極大地便利。有時(shí),為了提高數(shù)據(jù)存儲、檢索的效率,還可以對數(shù)據(jù)量較大的數(shù)據(jù)表進(jìn)行劃分。
具體到科研管理系統(tǒng),我們已經(jīng)在本文的第四個(gè)部分,進(jìn)行了詳細(xì)的數(shù)據(jù)庫設(shè)計(jì)。為了提高數(shù)據(jù)倉庫的效率,我們可以對項(xiàng)目表、科研成果表這些數(shù)據(jù)量較大的數(shù)據(jù)表按照時(shí)間、或者其他劃分策略進(jìn)行劃分。
4.2.2 索引策略
索引能提高數(shù)據(jù)的讀取數(shù)據(jù),也會降低數(shù)據(jù)更新的速度,因此在進(jìn)行索引設(shè)計(jì)時(shí),要格外慎重。數(shù)據(jù)倉庫的數(shù)據(jù)一般不需要維護(hù),因?yàn)楸容^適合于建立索引,來提高查詢速度。
4.2.3 存儲分配
確定存儲分配主要是對數(shù)據(jù)庫管理系統(tǒng)提供的一些存儲分配的參數(shù)進(jìn)行物理優(yōu)化處理,如數(shù)據(jù)塊的尺寸、緩沖區(qū)的大小和個(gè)數(shù)等,一般要在對服務(wù)器和系統(tǒng)軟件進(jìn)行實(shí)際調(diào)試后確定出來。對于科研管理系統(tǒng)來說,如果數(shù)據(jù)量大,可以采用分布式存儲方案,一遍均衡各個(gè)服務(wù)器的負(fù)載。
本文首先接受了目前的數(shù)據(jù)庫管理系統(tǒng)的子系統(tǒng)劃分,說明了數(shù)據(jù)庫管理系統(tǒng)能為科研管理系統(tǒng)提供的服務(wù)。接下來,詳細(xì)的描述了科研管理系統(tǒng)的模塊劃分,在這些模塊劃分的基礎(chǔ)上,抽象出了科研管理系統(tǒng)所涉及的實(shí)體,并根據(jù)這些實(shí)體,完成了系統(tǒng)的數(shù)據(jù)庫設(shè)計(jì)。最后,通過介紹數(shù)據(jù)倉庫的概念和設(shè)計(jì)方法,將數(shù)據(jù)庫的中的信息加以整理、分析,以供高層進(jìn)行決策分析,將科研管理系統(tǒng)的應(yīng)用提供了一個(gè)層次。將數(shù)據(jù)庫技術(shù)應(yīng)用到科研管理系統(tǒng),能為高校的科研活動帶來極大地便利,能促進(jìn)科研活動的高效、順利進(jìn)行,將為學(xué)術(shù)活動注入新的活力。
[1]丁鵬飛.高??蒲泄芾砭W(wǎng)絡(luò)信息平臺設(shè)計(jì)與應(yīng)用.科協(xié)論壇,2008.
[2]Papadias,Dimitris Tao,Indexing spatio-temporal data warehouses,CSE Conference Papers,2002.
[3]Kalnis,Panagiotis,Static and dynamic view selection in distributed data warehouse systems,CSE Doctoral Theses,2002.