張 陽,張芮寧
(1.中國科學(xué)院中科建設(shè) 山東東潤清潔能源有限公司,山東 東營 257000;2.山東濰坊醫(yī)學(xué)院 臨床醫(yī)學(xué)院,山東 濰坊 261000)
空間數(shù)據(jù)倉庫[1]技術(shù)是數(shù)字地球、數(shù)字城市建設(shè)中的關(guān)鍵技術(shù)之一.隨著數(shù)據(jù)的積累,在達(dá)到一定規(guī)模時,數(shù)據(jù)庫領(lǐng)域的幾種簡單數(shù)據(jù)模型不能滿足日益增長的數(shù)據(jù)需求,很難支持決策服務(wù).為了分析和處理大量的數(shù)據(jù),就需要多維數(shù)據(jù)庫的模型來組織數(shù)據(jù).在多維數(shù)據(jù)模型中,數(shù)據(jù)可以分為兩部分:第一部分是決策者要分析的對象,通常稱為事實(shí),它包含了一些度量信息;第二部分是決策者分析時的視角,通常稱為維度,它包含了關(guān)于測量的描述性信息.在實(shí)際應(yīng)用中,由于信息的不完全性和不精確性,很難完全劃分出清晰的不相交邊界.針對這些問題,特構(gòu)建出空間多維模型,即在雪花模型中引入空間距離,從而構(gòu)造出空間多維數(shù)據(jù)模型和空間立方體.人們總是希望把各種復(fù)雜空間數(shù)據(jù)所取得的多維數(shù)據(jù)表示在一張圖上,以期從中找出規(guī)律和發(fā)現(xiàn)問題.因?yàn)閳D形表示具有明顯直觀的特點(diǎn),所以它是幫助人們思維和判斷的重要手段.特別在多元統(tǒng)計(jì)中,多維數(shù)據(jù)的圖形表示法起著極重要的作用.過去常用平面圖、剖面圖和三角圖示法來表示兩兩變量和最多三個變量的關(guān)系,而對大于三個變量的表示,幾乎不可能做到.為此,如何用簡化的邏輯數(shù)學(xué)公式表示各種空間多維數(shù)據(jù)結(jié)構(gòu)拓?fù)鋱D是人們長期以來所探討的一個研究課題.
一般認(rèn)為,人工智能網(wǎng)絡(luò)是模仿人腦結(jié)構(gòu)功能而制成的信息處理系統(tǒng),可以應(yīng)用于信號處理、模式識別、知識工程、專家系統(tǒng)、調(diào)校組合、機(jī)器人控制等領(lǐng)域.但隨著科技發(fā)展,海量的數(shù)據(jù)處理需求使數(shù)據(jù)庫和空間多維數(shù)據(jù)處理能力面臨嚴(yán)峻挑戰(zhàn).從腦科學(xué)的角度看,人工智能與大數(shù)據(jù)、區(qū)塊鏈、云計(jì)算[2-5]、工業(yè)互聯(lián)網(wǎng)之間的關(guān)系,可以衍生各種復(fù)雜數(shù)據(jù)計(jì)算,但是大體量的數(shù)據(jù)拓?fù)鋱D線路繁雜不便于觀察[6-10],這些數(shù)據(jù)的內(nèi)容,包括數(shù)量、速度、多樣性等也呈現(xiàn)了不斷增長的復(fù)雜性,而網(wǎng)絡(luò)圖的數(shù)學(xué)模型[11-15]可以給數(shù)據(jù)庫和空間多維數(shù)據(jù)計(jì)算提供清晰的邏輯關(guān)系,故建立數(shù)據(jù)庫和空間多維數(shù)據(jù)架構(gòu)數(shù)學(xué)模型就顯得尤為重要.本文運(yùn)用雪花結(jié)構(gòu)分支分層將數(shù)據(jù)庫和空間多維數(shù)據(jù)架構(gòu)成數(shù)學(xué)模型,將實(shí)際事物中錯綜復(fù)雜而又難以解決的因素進(jìn)行層次降解,形成一個有序的分支層次結(jié)構(gòu).通過數(shù)學(xué)模型將數(shù)據(jù)庫和空間多維數(shù)據(jù)復(fù)雜的數(shù)據(jù)轉(zhuǎn)化為簡單化邏輯化的數(shù)學(xué)公式來表示,并使數(shù)據(jù)庫和空間多維數(shù)據(jù)人工智能化.其特別適合計(jì)算機(jī)架構(gòu)師、需經(jīng)常上課畫網(wǎng)絡(luò)圖的教師、各種管理組織者、科研工作者及規(guī)劃設(shè)計(jì)等人員,并可應(yīng)用于數(shù)據(jù)降維[16]、人臉識別、3D識別、多維計(jì)算、機(jī)器人控制、無人駕駛、人才選拔測評[17]、招聘人才測評等各種定性定量難以確定的工作.
在多維數(shù)據(jù)庫里,多維數(shù)據(jù)模型的邏輯結(jié)構(gòu)可用星型模式表示.星型模式的核心是一個事實(shí)表,圍繞它的是維表.它們的關(guān)系如圖1所示.
圖1 星型模式
將多維數(shù)據(jù)庫星型模式變成星型數(shù)學(xué)模型如圖2所示.
圖2 一層多維數(shù)據(jù)庫星型數(shù)學(xué)模型
得到一層多維數(shù)據(jù)庫星型數(shù)學(xué)模型:
(1)
對于復(fù)雜的多維數(shù)據(jù)維模型來說,星型模式并不夠理想.因?yàn)楹艽蟮木S表對性能是不利的,部分地抵消了聚集數(shù)據(jù)得到的性能.在某些情況下,存蓄維元素的屬性將耗費(fèi)大量空間,當(dāng)維元素很多時,表現(xiàn)將更為突出.將星型模式進(jìn)行拓展,可得到雪花模式如圖3所示.
依據(jù)圖3建立一個多維數(shù)據(jù)庫雪花模式拓?fù)溥壿嫈?shù)學(xué)模型如圖4所示.
圖3 雪花模式圖4 二層多維數(shù)據(jù)庫雪花模式拓?fù)溥壿嫈?shù)學(xué)模型
圖4對應(yīng)的多維數(shù)據(jù)庫數(shù)學(xué)模型為
由上式推導(dǎo)出2層多維數(shù)據(jù)模型數(shù)學(xué)公式為
(2)
由此可推出n層多維數(shù)據(jù)庫數(shù)學(xué)公式為
(3)
公式中:(i,…,i)為n層所有集數(shù).
由公式(3)推導(dǎo)全架構(gòu)多維數(shù)據(jù)庫數(shù)學(xué)公式為
(4)
此公式可反向表述即
雪花模式可使性能提高并節(jié)省磁盤存儲,對于表有很多行、許多屬性存儲在低級別的維等級表中或磁盤容量有限的情況,雪花模式是有效的.
我們的宇宙空間合起來只有一個,幾維空間就是我們用幾個相互關(guān)聯(lián)的變量來描述這個空間.當(dāng)我們用眼睛去看世界時,我們直觀地確定一個物體某一點(diǎn)的空間位置可以用三個參數(shù),只是三維;如果這個物體的位置是個變量,為了描述此物體前后位移,那么我們還應(yīng)引進(jìn)第四個參數(shù)時間,這就是四維;如果這個物體的大小是個變量,我們還引進(jìn)長寬高甚至跟多的東西.其實(shí)四維五維甚至更多的維度都只是數(shù)學(xué)公式里面的東西,四維就是公式里有四個參數(shù),五維就是公式里有五個參數(shù),以此類推六維七維就可想而知了.如果這些參數(shù)遵循一定的規(guī)律,我們可以將這一規(guī)律總結(jié)成一條公式,我們通過這條擁有幾個變量的公式來描述這個空間的物體,可以理解為我們用幾維的思想來認(rèn)識這個世界,我們看到了幾維空間.維數(shù)越多,我們對世界的描述認(rèn)識也就越精確.
數(shù)據(jù)倉庫是在企業(yè)管理和決策中面向主題的、完整的、非易失的、不同時間的、用于支持決策管理的數(shù)據(jù)集合,采用傳統(tǒng)的多維數(shù)據(jù)模型和OLAP技術(shù)處理空間數(shù)據(jù)具有較大的局限性,針對這些問題,特構(gòu)建空間多維模型.即,在雪花模型中引入空間距離,從而構(gòu)造出空間多維數(shù)據(jù)模型和空間立方體.一個空間多維數(shù)據(jù)數(shù)學(xué)模型圖,如圖5所示.
圖5 空間多維數(shù)據(jù)拓?fù)溥壿嫈?shù)學(xué)圖
由上圖得到空間多維數(shù)據(jù)的數(shù)學(xué)模型為
得到一層空間多維數(shù)據(jù)的數(shù)學(xué)模型為
(5)
同理,二層空間多維數(shù)據(jù)的數(shù)學(xué)模型為
(6)
由此可推出n層空間多維數(shù)據(jù)數(shù)學(xué)模型公式為:
(7)
由公式(5)~公式(7)推導(dǎo)全架構(gòu)空間多維數(shù)據(jù)數(shù)學(xué)公式為:
(8)
由公式(8)得到如下球體空間多維數(shù)據(jù)立方體內(nèi)部剖面圖,如圖6所示.
圖6 空間多維數(shù)據(jù)立方體內(nèi)部剖面圖圖7 空間多維數(shù)據(jù)表面立體圖
由公式(8)得到如下球體空間多維數(shù)據(jù)表面立體圖,如圖7所示.
多維數(shù)據(jù)庫經(jīng)常出現(xiàn)需要精簡維表或需要增加維表,單層多維數(shù)據(jù)庫維表發(fā)生減少的拓?fù)鋱D,如圖8所示.
圖8 單層多維數(shù)據(jù)庫維表減少拓?fù)溥壿媹D
多維數(shù)據(jù)庫減少一個維表公式為
公式中:∑y(i) (i=1,2,…,n)為多維數(shù)據(jù)庫變化后新維表的集合.
對應(yīng)的,單層多維數(shù)據(jù)庫增加一個維表推導(dǎo)的網(wǎng)絡(luò)模型結(jié)果為
同理,可推導(dǎo)多層多維數(shù)據(jù)庫的分解和合并模型為
(9)
公式中:(k=1,2,…,n)為所有層可增減多維數(shù)據(jù)庫集數(shù).
同理,由多維數(shù)據(jù)庫的分解和合并模型公式可推導(dǎo)空間多維數(shù)據(jù)的分解和合并模型公式
(10)
多維數(shù)據(jù)庫運(yùn)轉(zhuǎn)效率用比率V來表示,又稱多維數(shù)據(jù)庫縮放比,可建立一個單層縮放比公式,如圖8、圖9所示.
圖9 單層多維數(shù)據(jù)庫維表增加拓?fù)溥壿媹D
n層多維數(shù)據(jù)庫的縮放比公式為
(11)
由多維數(shù)據(jù)庫的縮放比公式可推導(dǎo)空間多維數(shù)據(jù)的縮放比公式為
(12)
從縮放比公式可知,縮放比值越大多維數(shù)據(jù)庫和空間多維數(shù)據(jù)運(yùn)轉(zhuǎn)效率越高,反之亦然.將多維數(shù)據(jù)庫和空間多維數(shù)據(jù)運(yùn)轉(zhuǎn)效率公式運(yùn)用數(shù)據(jù)網(wǎng)絡(luò)上會變成多維數(shù)據(jù)庫和空間多維數(shù)據(jù)實(shí)時動態(tài)圖.
多維數(shù)據(jù)庫和空間多維數(shù)據(jù)的存儲地址現(xiàn)存的尋址方法是比較復(fù)雜的.主要有兩種,一種是以行為主序的順序存儲,另一種是以列為主序的順序存儲,這兩種的排序都很復(fù)雜且數(shù)據(jù)編排不便表示.用多維數(shù)據(jù)庫和空間多維數(shù)據(jù)數(shù)學(xué)模型表示數(shù)學(xué)邏輯地址,比較清晰簡潔.我們把維表用數(shù)學(xué)邏輯地址表示.
如圖4,維表x(2,3)數(shù)學(xué)邏輯表示式為
多維數(shù)據(jù)庫數(shù)學(xué)邏輯地址公式為
(13)
在空間多維數(shù)據(jù)中維表x(4,7)數(shù)學(xué)邏輯表示為(見圖5):
空間多維數(shù)據(jù)數(shù)學(xué)邏輯地址公式為
(14)
本多維數(shù)據(jù)庫和空間多維數(shù)據(jù)的數(shù)學(xué)邏輯地址特點(diǎn)是表示簡單,可以無限擴(kuò)充.
例如:無人駕駛汽車駕駛到某地方點(diǎn)的空間數(shù)學(xué)邏輯地址,高程為754 m,時間為北京時間9點(diǎn)10分,北斗衛(wèi)星定位坐標(biāo)為3 453 798;1 328 923.可以表示這個點(diǎn)的地址為
從上面空間多維數(shù)據(jù)數(shù)學(xué)邏輯地址看空間位置是四維空間,一個高程、一個時間、一個縱向位置、一個橫向位置.
由多維數(shù)據(jù)庫的數(shù)學(xué)模型加減法推導(dǎo)出多維數(shù)據(jù)庫數(shù)學(xué)模型乘法公式為
(15)
由空間多維數(shù)據(jù)的數(shù)學(xué)模型加減法推導(dǎo)出空間多維數(shù)據(jù)數(shù)學(xué)模型乘法公式為
(16)
注:多維數(shù)據(jù)庫和空間數(shù)據(jù)模型數(shù)學(xué)模型加減法及乘法為與對應(yīng)原數(shù)學(xué)模型相加減乘.
先來回顧下我們所熟知的特征向量和特征值.若是存在一個矩陣A,讓這個向量v在線性變換后,方向仍然保持不變,只是拉伸或者壓縮一定倍數(shù),即:Av=λv.那么,這個向量v就是特征向量,λ就是特征值.特征向量和特征值的幾何本質(zhì),其實(shí)就是空間矢量的旋轉(zhuǎn)和縮放.
由于多維數(shù)據(jù)庫和空間多維數(shù)據(jù)數(shù)學(xué)模型乘法公式就是網(wǎng)絡(luò)的空間縮放,公式(15)、公式(16)具有特征向量與特征值性質(zhì),所以特征值λk=∑x(k,…,k).即多維數(shù)據(jù)庫數(shù)學(xué)模型乘法公式變?yōu)?/p>
(17)
將公式(15)、公式(17)代入特征向量與特征公式得
(18)
同理,空間多維數(shù)據(jù)特征向量與特征值公式為
(19)
人工智能網(wǎng)絡(luò)[18]是由大量神經(jīng)元按照大規(guī)模并行的方式通過一定的拓?fù)浣Y(jié)構(gòu)連接而成的網(wǎng)絡(luò).目前使用最廣泛的是(BP)神經(jīng)網(wǎng)絡(luò)和它的變化形式,它由輸入層中間層(隱含層)和輸出層組成,具有三層或三層以上的階層神經(jīng)網(wǎng)絡(luò),相鄰層之間的神經(jīng)元全互聯(lián),同一層內(nèi)的神經(jīng)元無連接.BP網(wǎng)絡(luò)模型如圖4所示.
圖10 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
圖4BP人工智能神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)模型代入公式(4)簡化為
推導(dǎo)出BP人工智能神經(jīng)網(wǎng)絡(luò)數(shù)學(xué)模型公式為
(20)
小結(jié):BP人工智能神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)庫和空間數(shù)據(jù)加密編碼及優(yōu)化數(shù)據(jù)運(yùn)算方面可提高效率.
讓計(jì)算機(jī)能夠自動的從數(shù)據(jù)中“學(xué)習(xí)”規(guī)律,并利用規(guī)律對未知數(shù)據(jù)進(jìn)行預(yù)測,這是計(jì)算機(jī)模擬或?qū)崿F(xiàn)人類的學(xué)習(xí)行為,用以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能.通過從數(shù)據(jù)里提取規(guī)則或模式來把數(shù)據(jù)轉(zhuǎn)換成信息,數(shù)據(jù)首先被預(yù)處理,形成特征,然后根據(jù)特征創(chuàng)建某種模型,之后將收集到的數(shù)據(jù),分配權(quán)重、偏置和其他參數(shù)以達(dá)到學(xué)習(xí)目的.
整個神經(jīng)網(wǎng)絡(luò)的計(jì)算可以用矩陣式給出.我們給出神經(jīng)網(wǎng)絡(luò)單層的式子.每層的神經(jīng)元個數(shù)不一樣,輸入輸出維度也就不一樣,計(jì)算式中的矩陣和向量的行列數(shù)也就不一樣,但形式是一致的.假設(shè)我們考慮的這一層是第i層.它接受m個輸入,那么這一層的計(jì)算如下式所示:
(21)
從多維數(shù)據(jù)庫數(shù)學(xué)模型的特征向量和特征值公式(17)代入公式(21)得到多維數(shù)據(jù)庫深度學(xué)習(xí)數(shù)學(xué)模型為
(22)
由公式(4)代入公式(22)推導(dǎo)多維數(shù)據(jù)庫深度學(xué)習(xí)全架構(gòu)公式
(23)
同理,推理得到空間多維數(shù)據(jù)深度學(xué)習(xí)數(shù)學(xué)模型
(24)
空間多維數(shù)據(jù)深度學(xué)習(xí)全架構(gòu)公式
(25)
綜上所述,多維數(shù)據(jù)庫和空間多維數(shù)據(jù)深度學(xué)習(xí)數(shù)學(xué)模型是將原數(shù)學(xué)模型變換了一種形式,使模型更簡單化,數(shù)學(xué)表述更圖像化,邏輯關(guān)系更清晰化.此模型的優(yōu)點(diǎn)是:
①清晰明確的邏輯關(guān)系,用數(shù)學(xué)公式表示的方法簡單方便;
②用分支分層的方法,把各個分支和各層數(shù)據(jù)一一列出并進(jìn)行計(jì)算,條理清楚,定性準(zhǔn)確,定量分析的結(jié)果符合實(shí)際要求;
③成本低、效率高、可操作性強(qiáng)并且計(jì)算量低.
將事物用邏輯數(shù)學(xué)公式表示出來是人類科技工作者的永恒夢想.本文在已有的多維數(shù)據(jù)庫和空間多維數(shù)據(jù)拓?fù)鋱D上建立新的架構(gòu)數(shù)學(xué)模型,將原拓?fù)鋱D用抽象化數(shù)學(xué)公式來表示,簡化了拓?fù)鋱D繁瑣復(fù)雜的各種線段及空間點(diǎn)的表示方法,公式簡單明了,并可將公式展開為原多維數(shù)據(jù)庫和空間多維數(shù)據(jù)拓?fù)鋱D.通過簡單的數(shù)學(xué)公式節(jié)省了畫圖時間,邏輯關(guān)系清晰,而且便于分析和計(jì)算多維數(shù)據(jù)庫和空間多維數(shù)據(jù)點(diǎn)或線及面的各種數(shù)據(jù),特別是像大數(shù)據(jù)、云計(jì)算等復(fù)雜數(shù)據(jù)的分析和計(jì)算.其具有成本低、效率高、可操作性強(qiáng)且計(jì)算量低等優(yōu)點(diǎn).多維數(shù)據(jù)庫和空間多維數(shù)據(jù)數(shù)學(xué)模型可以使用的結(jié)構(gòu)是星型結(jié)構(gòu)、環(huán)型結(jié)構(gòu)、樹型結(jié)構(gòu)、網(wǎng)狀結(jié)構(gòu)和混合結(jié)構(gòu)等;數(shù)學(xué)公式可以用矩陣計(jì)算各種分析的結(jié)果并用軟件快速出數(shù)據(jù),還可以變成動態(tài)的數(shù)據(jù)圖,從而反映數(shù)據(jù)的實(shí)時運(yùn)行情況.從使用性方面來說,多維數(shù)據(jù)庫和空間多維數(shù)據(jù)數(shù)學(xué)模型也可生成新的數(shù)據(jù)模型,還可解決各種條件下數(shù)據(jù)各單位的排序問題,其可加密數(shù)據(jù)的特點(diǎn),又可以優(yōu)化數(shù)據(jù)并滿足數(shù)據(jù)拓?fù)涔芾淼囊螅瑥亩阌跀?shù)據(jù)的分級管理.以上就形成了一個比較系統(tǒng)、全面的人工智能多維數(shù)據(jù)庫和空間多維數(shù)據(jù)數(shù)學(xué)模型分析體系.