邵澤國(guó)
(1.上海師范大學(xué)人文傳播學(xué)院,上海 200234;2.上海電子信息職業(yè)技術(shù)學(xué)院院長(zhǎng)辦公室,上海 201411)
“漢語(yǔ)方言地理信息系統(tǒng)平臺(tái)建設(shè)”是由潘悟云先生主持的一項(xiàng)教育部哲學(xué)社會(huì)科學(xué)研究重大課題攻關(guān)項(xiàng)目,該系統(tǒng)“以地理空間數(shù)據(jù)庫(kù)(Geographical Database)和方言數(shù)據(jù)庫(kù)(Dialectical Database)為基礎(chǔ),通過(guò)程序?qū)Ψ窖詳?shù)據(jù)庫(kù)進(jìn)行處理,真正實(shí)現(xiàn)自動(dòng)提取方言特征,自動(dòng)繪制語(yǔ)言地圖,真正成為方言地理研究和語(yǔ)言政策制定服務(wù)的方言地理信息系統(tǒng)(Geographical Information System of Dialect)[1-6]”。
眾所周知,分類是人類認(rèn)識(shí)客觀世界的一種基本的方法。人類最初對(duì)事物的命名就是一種分類活動(dòng)。從科學(xué)研究的角度說(shuō),之所以要研究一種事物,目的是為了認(rèn)識(shí)這種事物,以便可以能動(dòng)地駕馭和利用這種事物,使之為人類服務(wù)。而所要認(rèn)識(shí)、研究的事物往往是紛繁復(fù)雜的,群體中的個(gè)體從外形到屬性,千差萬(wàn)別,各不相同??梢赃@樣說(shuō),世界上找不到完全相同的兩個(gè)個(gè)體。因此,要研究、認(rèn)識(shí)事物,必須對(duì)所研究的事物進(jìn)行分類,沒(méi)有分類就沒(méi)有科學(xué)[7]。
對(duì)語(yǔ)言的研究、分析、比較,特別是要將語(yǔ)言特征在電子地圖上直觀地描繪出來(lái),往往要按照一定規(guī)則對(duì)語(yǔ)言進(jìn)行分類。而文中所要討論的語(yǔ)言分類系統(tǒng)是漢語(yǔ)方言地理信息系統(tǒng)的一個(gè)子系統(tǒng),它可以幫助語(yǔ)言研究者對(duì)語(yǔ)言進(jìn)行有效、快速的分類。
在漢語(yǔ)方言地理信息系統(tǒng)中,語(yǔ)言特征提取子系統(tǒng)按照用戶設(shè)置的條件自動(dòng)提取出各個(gè)語(yǔ)言點(diǎn)的語(yǔ)言特征數(shù)據(jù)。此時(shí)的語(yǔ)言特征數(shù)據(jù)往往是一個(gè)個(gè)數(shù)據(jù)集。一般來(lái)講,不會(huì)用原始的數(shù)據(jù)集來(lái)作為待分配項(xiàng),而是將數(shù)據(jù)集交給特征主體層提取子系統(tǒng),得到的主體層數(shù)據(jù)歸并后作為待分配項(xiàng)。分類系統(tǒng)通過(guò)系統(tǒng)預(yù)設(shè)的分類規(guī)則或用戶自設(shè)的分類規(guī)則自動(dòng)完成對(duì)待分配項(xiàng)進(jìn)行分類。得到兩級(jí)三層的分類信息,再加上語(yǔ)言點(diǎn)的地理坐標(biāo)值一并提交給地理信息系統(tǒng)(Geographic Information System,GIS),以供GIS處理后畫(huà)出語(yǔ)言分類地圖。
圖1 分類系統(tǒng)功能流程圖
系統(tǒng)前臺(tái)使用Microsoft Visual Studio 2008 C#語(yǔ)言,后臺(tái)使用Microsoft SQL Server2008系統(tǒng)。
由于之前已經(jīng)完成了漢語(yǔ)方言地理信息系統(tǒng)的數(shù)據(jù)庫(kù)設(shè)計(jì),所以這里的DB設(shè)計(jì)只是涉及到與分類系統(tǒng)相關(guān)的幾個(gè)數(shù)據(jù)表設(shè)計(jì)。
2.1.1 主體層特征表lf_mf
該表用來(lái)存儲(chǔ)主體層提取的結(jié)果。在該表上歸并mf指段,取唯一值作為待分配項(xiàng),寫(xiě)入表tb_clas的cf字段。
表1 lf_mf表結(jié)構(gòu)
2.1.2 分類數(shù)據(jù)表lf_clas
該表中id字段由“0”開(kāi)始每寫(xiě)入一個(gè)cf的值自動(dòng)加1,字段c1id、c2id的所有值在分類操作前初始化為“00”。字段 ph_type存儲(chǔ)分類的結(jié)果,其值形如“02-01-01”圖標(biāo)編號(hào)。
表2 lf_clas表結(jié)構(gòu)
2.1.3 特征規(guī)則表lf_ftype
四是著力加強(qiáng)風(fēng)險(xiǎn)管控。統(tǒng)一組織對(duì)大隊(duì)進(jìn)行內(nèi)控制度執(zhí)行情況審計(jì),平時(shí)不定期進(jìn)行抽樣審計(jì)和專項(xiàng)審計(jì),加強(qiáng)農(nóng)業(yè)生產(chǎn)風(fēng)險(xiǎn)管控和防范。嚴(yán)格執(zhí)行《蘇墾農(nóng)發(fā)內(nèi)控制度手冊(cè)》,建立健全農(nóng)業(yè)生產(chǎn)經(jīng)營(yíng)管理責(zé)任追溯追究制度。
在自定義分類時(shí)系統(tǒng)提供了“條件分類”的快捷方法,即對(duì)待分配項(xiàng)按條件自動(dòng)選擇。過(guò)濾條件存儲(chǔ)在特征規(guī)則表lf_ftype中。特征類型指的是語(yǔ)音的發(fā)音方法、發(fā)音部位或發(fā)聲態(tài)等。如聲母特征類型有:鼻音、邊近音、邊閃音、不送氣、擦音、顫音、次清、次濁、近音、清音、全清、全濁、塞擦音、塞音、閃音、送氣、響音、濁音、阻音。sql字段中的SQL語(yǔ)句是生成對(duì)應(yīng)的特征類型在元數(shù)據(jù)表中對(duì)應(yīng)的標(biāo)記。
表3 lf_ftype表結(jié)構(gòu)
通過(guò)用戶界面用戶可以對(duì)待分配項(xiàng)劃分為兩級(jí)3層,即對(duì)待分配項(xiàng)可分為兩個(gè)級(jí)別,大類和小類;同時(shí)為繪制地圖提供顏色、圖例、圖標(biāo)3層標(biāo)識(shí)信息。
A、B、C為L(zhǎng)istBox控件;A用于接收和顯示待分配項(xiàng)數(shù)據(jù);B(從左向右分別稱為B1、B2)用來(lái)接收和顯示分類命名數(shù)據(jù);B1用顏色表示;B2用圖例表示;C(從左向右分別稱為C1、C2)用來(lái)接收和顯示對(duì)應(yīng)類別下的已分配項(xiàng)數(shù)據(jù)。
D為T(mén)extBox控件,用于接收和顯示分類結(jié)果數(shù)據(jù)。
E、F、G、H為Button控件;E為添加分類名;F為刪除分類名;G為添加分配項(xiàng);H為移除已分配項(xiàng)。
I、J為DropDownList控件。I(從左向右分別稱為I1、I2)靜態(tài)獲取Items,第一個(gè)為顏色選擇序列:褐色、藍(lán)色、紅色、綠色、粉色、黑色;第二個(gè)為圖例選擇序列:實(shí)心、空心、上實(shí)下空、上空下實(shí)、左實(shí)右空、左空右實(shí)、中心實(shí)點(diǎn)。
K均為Button控件,“取消”為取消之前所有分類操作,并清空控件B、C、D的顯示信息,同時(shí)改寫(xiě)表lf_clas?!按_定”將分類結(jié)果數(shù)據(jù)寫(xiě)入到表lf_clas,并傳值給GIS系統(tǒng)?!胺祷亍睘榉祷氐健胺窖蕴卣魈崛 表?yè)面。
這里僅介紹功能實(shí)現(xiàn)的幾個(gè)核心函數(shù)。
2.3.1 分類命名函數(shù)
控件E調(diào)用。其功能是將用戶選擇的dr1中的項(xiàng)(text)寫(xiě)入lb2,清除當(dāng)前l(fā)b1的所有項(xiàng)。如做一級(jí)分類時(shí),將用戶選中的控件I1中的項(xiàng)(褐色、藍(lán)色、紅色、綠色、粉色、黑色之一)寫(xiě)入B1,清除C1的內(nèi)容。
2.3.2 刪除分類名函數(shù)
控件F調(diào)用,其功能是刪除一個(gè)已經(jīng)分配的類(大類或小類)。用戶選擇lb1(對(duì)應(yīng)控件B)一些項(xiàng),系統(tǒng)將lb1中選中的項(xiàng)清除,并將清除項(xiàng)(作為類名)下的所有分配項(xiàng)從lb3(對(duì)應(yīng)控件C)移入到lb2(C1或A)。如果該分類名下有子類,同時(shí)刪除子類名(嵌套調(diào)用delname)。一個(gè)lb1的項(xiàng)的value對(duì)應(yīng)一個(gè)cid,這時(shí)將數(shù)據(jù)表lf_clas中值為cid的c1id(或c2id)初始化為“00”。
2.3.3 添加分類項(xiàng)函數(shù)
控件G調(diào)用,用戶先選中l(wèi)b1中的某一項(xiàng)(對(duì)應(yīng)控件B),再選擇lb2(對(duì)應(yīng)控件A或C1)中的一些項(xiàng),系統(tǒng)將lb2中選中的分配項(xiàng)移入lb3(對(duì)應(yīng)控件C1或C2)中,這些分配項(xiàng)歸為一類,用lb1的選中項(xiàng)命名。同時(shí)對(duì)數(shù)據(jù)表lf_clas的操作是將cf與lb2選中項(xiàng)匹配的記錄的c1id(或c2id)字段值改為lb1的選中項(xiàng)的值。
2.3.4 移出分類項(xiàng)函數(shù)
控件H調(diào)用,用戶選擇lb1(對(duì)應(yīng)控件C)中的某些項(xiàng),系統(tǒng)將選中項(xiàng)移入到lb2中(對(duì)應(yīng)控件C1或A)。如選中項(xiàng)中包含一個(gè)類下的所有項(xiàng),則調(diào)用函數(shù)delname將這個(gè)類名刪除。對(duì)數(shù)據(jù)表lf_clas的操作是將cf與lb1選中項(xiàng)匹配的記錄的c1id(或c2id)字段初始化。
2.3.5 條件分類函數(shù)
用戶選擇lb1(對(duì)應(yīng)控件J)中的某一項(xiàng),其值與數(shù)據(jù)表lf_ftype中的type字段匹配,得到相應(yīng)的SQL字段的值,即一個(gè)SQL語(yǔ)句,系統(tǒng)執(zhí)行SQL得到一個(gè)數(shù)據(jù)集,讓后經(jīng)lb2(對(duì)應(yīng)控件A或C1)中出現(xiàn)在這個(gè)數(shù)據(jù)集中的項(xiàng)標(biāo)志為選中狀態(tài)。
從系統(tǒng)的處理機(jī)制看,除了系統(tǒng)開(kāi)始運(yùn)行時(shí)要裝載待分配項(xiàng)數(shù)據(jù)和分類完成后要輸出分類結(jié)果,這兩個(gè)動(dòng)作要訪問(wèn)數(shù)據(jù)庫(kù),其中間運(yùn)行過(guò)程可以避免系統(tǒng)對(duì)數(shù)據(jù)庫(kù)的寫(xiě)操作。所以用一個(gè)DataTable實(shí)例來(lái)存儲(chǔ)據(jù)表lf_clas,同時(shí)該系統(tǒng)與其他系統(tǒng)間數(shù)據(jù)集的傳送借助session實(shí)現(xiàn)。
[1]JOHN C.Introducing speech and langwage processing[M].北京:北京大學(xué)出版社,2010.
[2]曹志耘.漢語(yǔ)方言地圖集[M].上海:商務(wù)印書(shū)館,2008.
[3]CHRISTIAN N.Professional C#(programmer to programmer)[M].北京:清華大學(xué)出版社,2010.
[4]郭鄭州.SQL Server 2008完全學(xué)習(xí)手冊(cè)[M].北京:清華大學(xué)出版社,2011.
[5]陸儉明.現(xiàn)代漢語(yǔ)語(yǔ)法研究教程[M].北京:北京大學(xué)出版社,2003.
[6]潘悟云.教育部哲學(xué)社會(huì)科學(xué)研究重大課題攻關(guān)項(xiàng)目投標(biāo)評(píng)審書(shū)[R].上海:上海師范大學(xué),2009.
[7]林燾.語(yǔ)音學(xué)教程[M].北京:北京大學(xué)出版社,1992.
[8]PETER L.語(yǔ)音學(xué)教程(A course in phonetics)[M].張維佳,譯.北京:北京大學(xué)出版社,2011.
[9]朱曉農(nóng).語(yǔ)音學(xué)[M].上海:商務(wù)印書(shū)館,2010.
[10]趙秀怡,熊慶文,涂建光.GIS應(yīng)用數(shù)據(jù)庫(kù)設(shè)計(jì)二階分析模式[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2003,28(1):98 -101.
[11]雷特.SQL Server 2008 DBA 入門(mén)經(jīng)典[M].張德群,譯.北京:清華大學(xué)出版社,2010.