国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

不確定時(shí)態(tài)跨度的語(yǔ)義處理及其粗糙集近似計(jì)算

2015-06-01 10:57:21左亞堯封朝永
關(guān)鍵詞:精確度粗糙集時(shí)態(tài)

左亞堯,陳 磊,封朝永

(廣東工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院, 廣東 廣州 510006)

不確定時(shí)態(tài)跨度的語(yǔ)義處理及其粗糙集近似計(jì)算

左亞堯,陳 磊,封朝永

(廣東工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院, 廣東 廣州 510006)

蘊(yùn)含語(yǔ)義的不確定時(shí)態(tài)的表示及處理是不確定時(shí)態(tài)信息和自然語(yǔ)言處理領(lǐng)域中的重要問(wèn)題,不確定時(shí)態(tài)跨度是不確定時(shí)態(tài)中的重要組成部分,而不確定的語(yǔ)義是造成時(shí)態(tài)跨度不確定性的根源.提出對(duì)不確定語(yǔ)義進(jìn)行轉(zhuǎn)換的思想,將其轉(zhuǎn)換為鄰域或區(qū)間的形式,成為可計(jì)算問(wèn)題;進(jìn)而從粒度層面對(duì)不確定時(shí)態(tài)跨度進(jìn)行了有效刻畫(huà),給出了元組化的模型,使其可以參與運(yùn)算;提出了時(shí)態(tài)粗糙集將時(shí)態(tài)跨度元素在離散狀態(tài)下進(jìn)行劃分,采用下近似和上近似的思想劃分了不確定時(shí)態(tài)跨度中的確定元素和不確定元素;并提出了不確定時(shí)態(tài)跨度的近似精確度計(jì)算方法.

不確定時(shí)態(tài)跨度; 語(yǔ)義; 時(shí)態(tài)粒度; 時(shí)態(tài)粗糙集; 近似計(jì)算

近年來(lái),隨著信息技術(shù)的飛速發(fā)展,大數(shù)據(jù)已普遍存在,能源制造業(yè)、服務(wù)業(yè)、醫(yī)療衛(wèi)生等領(lǐng)域都積累了TB、PB級(jí)乃至EB級(jí)的大數(shù)據(jù)[1].時(shí)態(tài)數(shù)據(jù)是大數(shù)據(jù)中重要的一類,它大量存在于新聞事件、醫(yī)療信息系統(tǒng)、交通系統(tǒng)等應(yīng)用領(lǐng)域,而且在時(shí)態(tài)數(shù)據(jù)挖掘、時(shí)態(tài)知識(shí)以及時(shí)空信息處理等眾多研究領(lǐng)域扮演著越來(lái)越重要的角色[2].不確定時(shí)態(tài)跨度是時(shí)態(tài)信息研究領(lǐng)域中重要而又特殊的一個(gè)組成部分,常見(jiàn)的不確定時(shí)態(tài)跨度,其表征為不確定的時(shí)間介詞,如,“大約/左右”、“至少”、“至多”、“之間”;與被參照的確切時(shí)態(tài)跨度,如,“2個(gè)小時(shí)”、“4個(gè)到5個(gè)小時(shí)”、“5天”,相結(jié)合所構(gòu)成的.例如:“小趙步行了2小時(shí)左右”、 “臺(tái)風(fēng)離去需要至少3天”.不確定時(shí)態(tài)跨度包含了不確定的時(shí)間介詞和被參照的具有粒度屬性的時(shí)間跨度,它們屬于沒(méi)有先驗(yàn)知識(shí)的不精確的概念,如何處理不確定時(shí)態(tài)跨度中的不確定語(yǔ)義并對(duì)其精確度進(jìn)行近似度量,是當(dāng)前不確定時(shí)態(tài)信息研究領(lǐng)域的熱點(diǎn)和難點(diǎn).

近年來(lái),大數(shù)據(jù)的研究如火如荼,人們對(duì)時(shí)態(tài)信息和不確定時(shí)態(tài)信息研究也在不斷地深入, 一些學(xué)者或從時(shí)態(tài)語(yǔ)義的角度出發(fā)探索時(shí)態(tài)的建模和表示問(wèn)題[3-6];或著重以粒度的思想對(duì)時(shí)態(tài)問(wèn)題進(jìn)行刻畫(huà)和演算[7-10];或針對(duì)特殊的時(shí)態(tài)數(shù)據(jù)采用有針對(duì)性的數(shù)學(xué)模型[11-13].

如,文獻(xiàn)[3]提出了一個(gè)集成到Web搜索引擎中的時(shí)態(tài)表達(dá)式識(shí)別和標(biāo)準(zhǔn)化系統(tǒng),能夠同時(shí)考慮用戶查詢和搜索集合中的時(shí)間語(yǔ)義,并獨(dú)立于其表示;文獻(xiàn)[4]研究了時(shí)態(tài)語(yǔ)義數(shù)據(jù)的編碼問(wèn)題;文獻(xiàn)[5]提出了基于注釋的時(shí)態(tài)概念模型,推廣了傳統(tǒng)的概念模型語(yǔ)義;文獻(xiàn)[6]提出一個(gè)概念框架來(lái)獨(dú)立地描述不確定時(shí)態(tài)語(yǔ)義和不完整信息,并且能夠保證不丟失信息及其不確定性;這些學(xué)者在一定程度上研究了時(shí)態(tài)語(yǔ)義,但未解決時(shí)態(tài)語(yǔ)義參與運(yùn)算的問(wèn)題且忽視了時(shí)態(tài)的粒度屬性.

粒度是時(shí)態(tài)的重要屬性,文獻(xiàn)[7- 8]研究了不確定知識(shí)的粒計(jì)算模型;文獻(xiàn)[9]研究了確定時(shí)態(tài)的粒度刻畫(huà)及演算問(wèn)題;文獻(xiàn)[10]探索了確定時(shí)態(tài)粒度層次映射轉(zhuǎn)換的時(shí)態(tài)粒點(diǎn)差運(yùn)算方法.而如何把時(shí)態(tài)粒度和語(yǔ)義相結(jié)合,使其參與運(yùn)算,是時(shí)態(tài)信息處理領(lǐng)域中的一個(gè)難點(diǎn).

針對(duì)時(shí)態(tài)的近似計(jì)算問(wèn)題,文獻(xiàn)[11]提出了一個(gè)框架,通過(guò)隨機(jī)過(guò)程來(lái)計(jì)算可能出現(xiàn)的物體運(yùn)動(dòng)軌跡,可以有效地對(duì)不確定時(shí)空數(shù)據(jù)進(jìn)行建模和查詢;文獻(xiàn)[12]提出一種基于模糊區(qū)間值的模糊區(qū)間關(guān)系模型來(lái)表示不確定的時(shí)態(tài)信息,并且提出了一種基于Allen經(jīng)典區(qū)間代數(shù)[13]新的模糊區(qū)間代數(shù).

本文研究了不確定時(shí)態(tài)跨度的語(yǔ)義,對(duì)其進(jìn)行了轉(zhuǎn)換,結(jié)合時(shí)態(tài)粒度給出了不確定時(shí)態(tài)跨度的形式化描述,使其可以參與運(yùn)算,根據(jù)粗糙集理論[14-15],引入了時(shí)態(tài)粗糙集模型,借助時(shí)態(tài)粗糙集模型對(duì)不確定時(shí)態(tài)跨度進(jìn)行重新劃分,進(jìn)而在此基礎(chǔ)上對(duì)不確定時(shí)態(tài)跨度的精確度進(jìn)行了近似計(jì)算.

1 不確定時(shí)態(tài)跨度的語(yǔ)義轉(zhuǎn)換及粒度化建模

1.1 不確定時(shí)態(tài)跨度的粒度刻畫(huà)及語(yǔ)義轉(zhuǎn)換

時(shí)態(tài)的粒度描述,如時(shí)間測(cè)度、時(shí)態(tài)劃分、時(shí)態(tài)粒度、嵌套粒度等定義參見(jiàn)文獻(xiàn)[9-10].

蘊(yùn)含不確定時(shí)間介詞的不確定時(shí)態(tài)跨度,其不確定性源自于不確定的語(yǔ)義,有4種情形,可對(duì)其進(jìn)行語(yǔ)義轉(zhuǎn)換,使其成為可計(jì)算問(wèn)題.

圖1 不確定時(shí)態(tài)跨度的4種情形Fig.1 4 forms of uncertain temporal span

對(duì)于不確定時(shí)態(tài)跨度的表示,須限定在一定的范圍內(nèi),例如:“大約3個(gè)小時(shí)”,時(shí)間偏移量Δta、Δtb均為0.5GH時(shí),其可能的取值范圍為[2.5GH,3.5GH],語(yǔ)義可信度較高;如果將取值范圍擴(kuò)大至[0,1GD]時(shí),語(yǔ)義可信度較低,無(wú)實(shí)際意義.

1.2 不確定時(shí)態(tài)跨度的粒度模型

結(jié)合不確定時(shí)態(tài)跨度語(yǔ)義轉(zhuǎn)換后的形式并考慮其通用性,建立不確定時(shí)態(tài)跨度的模型,不確定時(shí)態(tài)跨度的模型是一個(gè)六元組:

其中:

(1) 不確定時(shí)態(tài)跨度的名稱標(biāo)識(shí)tus,是符號(hào)化的元組語(yǔ)義;

(2) 不確定時(shí)態(tài)跨度的運(yùn)算粒度Gj,如“3小時(shí)左右”,其一種表示為[2.5GH,3.5GH],即模型tus(3GH,GH,-0.5,+0.5,f)中的運(yùn)算粒度為GH,即為“小時(shí)”;

(4) 不確定時(shí)態(tài)跨度的時(shí)態(tài)近似精確度度量函數(shù)f,是對(duì)不確定時(shí)態(tài)跨度的近似確定程度的描述函數(shù).f的計(jì)算方法將在下文第3節(jié)進(jìn)行詳細(xì)討論.

例如:“3小時(shí)左右”可表示為tus(3GH,GH,Δtl,Δtr,f),其中的一種情況為tus(3GH,GH,-0.5,+0.5,f),表明tus的取值為區(qū)間[2.5GH,3.5GH]中的一個(gè)連續(xù)的時(shí)態(tài)跨度.

“至少3個(gè)小時(shí)”可表示為tus(3GH,GH,Δtl,Δtr,f),其中的一種情況為tus(3GH,GH,0,+2,f),表明tus的取值為區(qū)間[3GH,5GH]中的一個(gè)連續(xù)的時(shí)態(tài)跨度.

2 不確定時(shí)態(tài)跨度的粗糙集劃分

粗糙集[16-17]是對(duì)不確定、不精確概念[18]進(jìn)行定性和定量描述的一種有力的數(shù)學(xué)工具,基于時(shí)態(tài)粒度,對(duì)不確定時(shí)態(tài)跨度進(jìn)行語(yǔ)義轉(zhuǎn)換和粒度建模后,在時(shí)態(tài)元素離散化的前提下,論文借助經(jīng)典粗糙集[19]理論提出了對(duì)不確定時(shí)態(tài)跨度進(jìn)行劃分的思想,區(qū)分出不確定時(shí)態(tài)跨度中確定的元素和不確定的元素,進(jìn)而可對(duì)不確定時(shí)態(tài)跨度的近似精確度進(jìn)行定量的描述.

2.1 時(shí)態(tài)粗糙集

時(shí)態(tài)粗糙集是一種新的集合.其中的元素均為時(shí)態(tài)元素,是一種只有大小而沒(méi)有序關(guān)系的時(shí)態(tài)元素的集合.由于時(shí)態(tài)粒點(diǎn)和時(shí)態(tài)粒區(qū)存在嚴(yán)格的序關(guān)系,嚴(yán)格對(duì)應(yīng)于時(shí)間軸上的點(diǎn)或區(qū)間,所以它并不適用于劃分不確定時(shí)態(tài)粒點(diǎn)和不確定時(shí)態(tài)粒區(qū),但它適合描述不確定時(shí)態(tài)跨度.由于時(shí)態(tài)跨度只有數(shù)量關(guān)系上的大小之分而沒(méi)有時(shí)間軸上序關(guān)系的前后之別,因此,可以將不確定時(shí)態(tài)跨度映射到時(shí)態(tài)粗糙集之中.

基于時(shí)態(tài)粗糙集,可劃分不確定時(shí)態(tài)跨度中確定元素和不確定元素,將離散化的時(shí)態(tài)中確定的元素和不確定的元素重組并分成兩個(gè)部分,由一對(duì)時(shí)態(tài)集合表示,即時(shí)態(tài)上、下近似,形式上時(shí)態(tài)粗糙集有如下定義:

圖2 時(shí)態(tài)粗糙集模型Fig.2 The temporal rough set model

將不確定時(shí)態(tài)跨度離散化,再將確定的元素和不確定的元素分開(kāi)并重組成兩部分(兩個(gè)集合)稱作不確定時(shí)態(tài)跨度的粗糙集劃分,此舉使下文不確定時(shí)態(tài)跨度的近似精確度度量成為可能.

2.2 不確定時(shí)態(tài)跨度的粗糙集劃分

圖3 不確定時(shí)態(tài)跨度的時(shí)態(tài)粗糙集劃分Fig.3 The division of uncertain temporal spans with rough set

3 不確定時(shí)態(tài)跨度的近似精確度計(jì)算

根據(jù)不確定時(shí)態(tài)跨度的粗糙集劃分,可計(jì)算其時(shí)態(tài)近似精確度大小或討論其時(shí)態(tài)近似精確度函數(shù)的變化情況.

3.1 時(shí)態(tài)近似精確度

對(duì)于1.3節(jié)定義的不確定時(shí)態(tài)模型元組中的近似精確度度量函數(shù)f,現(xiàn)給出形式化定義.

定義3(時(shí)態(tài)近似精確度) 對(duì)于不確定的時(shí)態(tài)元素,包括不確定時(shí)態(tài)粒點(diǎn)、不確定時(shí)態(tài)粒區(qū)、不確定時(shí)態(tài)跨度,其可規(guī)劃的確定的程度稱為時(shí)態(tài)近似精確度,記為f∈[0,1],根據(jù)時(shí)態(tài)粗糙集,定義時(shí)態(tài)近似精確度:

(1)

3.2 不確定時(shí)態(tài)跨度的近似精確度計(jì)算

圖4 的粗糙集劃分及細(xì)化等價(jià)形式Fig.4 The division of and its detailing

(2)

(3)

圖5 的粗糙集劃分及等價(jià)形式Fig.5 The division of and its detailing

圖6 的粗糙集劃分及細(xì)化形式Fig.6 The division of and its detailing

(4)

4 結(jié)束語(yǔ)

本文研究了不確定時(shí)態(tài)的語(yǔ)義處理及近似計(jì)算等問(wèn)題.不確定時(shí)態(tài)跨度是一種特殊的時(shí)態(tài)元素,只有數(shù)量關(guān)系上的大小之分而沒(méi)有空間上的前后位置關(guān)系之別,論文提出了將不確定語(yǔ)義進(jìn)行轉(zhuǎn)換的思想,并對(duì)其進(jìn)行粒度刻畫(huà),使蘊(yùn)含不確定語(yǔ)義的時(shí)態(tài)跨度可以參與運(yùn)算,提出了時(shí)態(tài)粗糙集在不確定時(shí)態(tài)跨度離散化的前提下將其中確定的元素和不確定的元素區(qū)分開(kāi)來(lái),并對(duì)其時(shí)態(tài)精確度進(jìn)行了近似計(jì)算.文章下一階段的研究方向是將不確定時(shí)態(tài)跨度進(jìn)行相應(yīng)的綁定操作,賦予其時(shí)間軸上具體的涵義.

[1] 孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.

Meng X F, Ci X. Big data management: Concepts, Techniques and Challenges[J]. Journal of Computer Research and Development,2013, 50(1):146-169.

[2] 李建中,劉顯敏.大數(shù)據(jù)的一個(gè)重要方面數(shù)據(jù)可用性[J].計(jì)算機(jī)研究與發(fā)展,2013,50(6):1147-1162.

Li J Z, Liu X M. An important aspect of big data: data usability[J].Journal of Computer Research and Development,2013, 50(6):1147-1162.

[3] Vicente-Diez M T, Martinez P. Temporal semantics extraction for improving web search[C]∥DEXA’09. 20th International Workshop on Database and Expert Systems Application.Atlanta: IEEE, 2009: 69-73.

[4] Taylor S E, Bernard M L, Verzi S J, et al. Temporal semantics: An adaptive resonance theory approach[C]∥IJCNN 2009. International Joint Conference on Neural Networks.Atlanta: IEEE, 2009: 3111-3117.

[5] Khatri V, Ram S, Snodgrass R, et al. Capturing Telic/Atelic temporal data semantics: Generalizing conventional conceptual models[J].IEEE Transactions on Knowledae and Data Engineering,2012, 26(3):528-548.

[6] Chountas P, Petrounias I. Modelling and representation of uncertain temporal information [J]. Requirements Engineering, 2000, 5(3): 144-156.

[7] 王國(guó)胤,張清華.不同知識(shí)粒度下粗糙集的不確定性研究[J].計(jì)算機(jī)學(xué)報(bào),2008,31:1588-1598.

Wang G Y, Zhang Q H. Uncertainty of rough sets in different knowledge granularities[J]. Chinese Journal of Computers, 2008, 31(9):1588 -1598.

[8] 王國(guó)胤,張清華,馬希驁,等.知識(shí)的不確定性問(wèn)題的粒計(jì)算模型[J].軟件學(xué)報(bào),2011,22(4):676-694.

Wang G Y, Zhang Q H, Ma X A, et al. Granular computing models for knowledge uncertainty[J]. Journal of Software, 2011, 22(4): 676-694.

[9] 左亞堯,湯庸,舒忠梅,等.時(shí)態(tài)的粒度刻畫(huà)及演算問(wèn)題研究[J].計(jì)算機(jī)科學(xué),2010,37(12): 114-119.

Zuo Y Y, Tang Y, Shu Z M, et al. Research on the characterization and the calculus of temporal granularities[J]. Journal of Computer Science,2010, 37 (12) : 114-119.

[10] 左亞堯,湯庸,舒忠梅.基于粒度層次映射轉(zhuǎn)換的時(shí)態(tài)粒點(diǎn)差運(yùn)算方法[J].計(jì)算機(jī)研究與發(fā)展,2012,49(11): 2320-2327.

Zuo Y Y, Tang Y, Shu Z M. Subtraction operation between temporal points with granularities based on granularity hierarchy mapping[J].Journal of Computer Research and Development,2012, 49(11): 2320-2327.

[11] Emrich T, Kriegel H P, Mamoulis N, et al. Querying uncertain spatio-temporal data[C] ∥ 2012 IEEE 28th International Conference on Data Engineering (ICDE).Arlington,Virginia USA: IEEE, 2012: 354-365.

[12] Huang Z Q. Fuzzy temporal interval relationship based on interval-Valued fuzzy sets[C]∥Proceedings of the Fourth International Conference on Fuzzy Systems and Knowledge Discovery.Haikou:IEEE,2007:169-172.

[13] Allen J F. Maintaining knowledge about temporal intervals[J]. Communications of the ACM, 1983, 26(11): 832-843.

[14] Yao Y Y. Interval sets and interval-set algebras[C]∥ICCI’09. 8th IEEE International Conference on Cognitive Informatics.Hong Kong:IEEE, 2009:307-314.

[15] Li H X, Wang M H, Zhou X Z, et al. An interval set model for learning rules from incomplete information table[J]. International Journal of Approximate Reasoning, 2012,53(1):24-37.

[16] Pawlak Z. Rough sets[J]. International Journal of Computer & Information Sciences, 1982,11(5): 341-356.

[17] Pawlak Z. Rough sets:Theoretical aspects of reasoning about data[M].San Francisco:Kluwer Academic Publi shers,1992.

[18] 李嵐,金朝永.一類多變量不確定非線性系統(tǒng)的自適應(yīng)模糊監(jiān)督控制[J].廣東工業(yè)大學(xué)學(xué)報(bào),2012,29(2):79-84.

Li L,Jin C Y.Adaptive fuzzy control for a class of uncertain nonlinear MIMO systems with supervisory control performance[J]. Journal of Guangdong University of Technology,2012, 29(2):79-84.

[19] 呂丹,吳孟達(dá), 張學(xué)志.可拓集合與粗糙集合[J].廣東工業(yè)大學(xué)學(xué)報(bào),2005,22(4):120-123.

Lv D,Wu M D,Zhang X Z.Extension and rough set[J]. Journal of Guangdong University of Technology,2005,22(4):120-123.

Semantic Processing and Approximation Calculation Based on Rough Set of Uncertain Temporal Span

Zuo Ya-yao, Chen Lei, Feng Chao-yong

Presentation and processing of uncertain temporal which contains semantics are important issues in uncertain temporal information processing and natural language processing. Uncertain temporal span is an important part of uncertain temporal, however, the uncertain semantics is the root of uncertainty. This paper proposes the idea of converting the uncertain semantics to the forms existing in neighborhoods or intervals that could be calculated and described on the granularity level. At the same time, a tuple model was given to render uncertain temporal span to join the calculation. Then a temporal rough set is suggested to divide the certain or uncertain elements of temporal span according to lower approximation and upper approximation. Finally, the approximate accuracy calculation of uncertain temporal span is presented.

uncertain temporal span; semantic; temporal granularity; temporal rough set; approximation calculations

2014- 04- 16

國(guó)家自然科學(xué)基金資助項(xiàng)目(60970044);廣東省自然科學(xué)基金資助項(xiàng)目(S2011040004281,S2013010014457)

左亞堯(1974-),男,副教授,博士,碩士生導(dǎo)師,主要研究方向?yàn)闀r(shí)態(tài)信息處理、粒度計(jì)算、數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘.

10.3969/j.issn.1007- 7162.2015.01.020

TP301

A

1007-7162(2015)01- 0098- 05

(School of Computers, Guangdong University of Technology, Guangzhou 510006, China)

猜你喜歡
精確度粗糙集時(shí)態(tài)
基于Pawlak粗糙集模型的集合運(yùn)算關(guān)系
超高清的完成時(shí)態(tài)即將到來(lái) 探討8K超高清系統(tǒng)構(gòu)建難點(diǎn)
研究核心素養(yǎng)呈現(xiàn)特征提高復(fù)習(xí)教學(xué)精確度
“硬核”定位系統(tǒng)入駐兗礦集團(tuán),精確度以厘米計(jì)算
過(guò)去完成時(shí)態(tài)的判定依據(jù)
多?;植诩再|(zhì)的幾個(gè)充分條件
雙論域粗糙集在故障診斷中的應(yīng)用
兩個(gè)域上的覆蓋變精度粗糙集模型
現(xiàn)在進(jìn)行時(shí)
近似數(shù)1.8和1.80相同嗎
沙田区| 家居| 济阳县| 姜堰市| 乐安县| 肇源县| 鹤岗市| 双江| 巫山县| 皮山县| 裕民县| 虞城县| 桂阳县| 长乐市| 荃湾区| 九江市| 盐津县| 会宁县| 垣曲县| 枣庄市| 尼玛县| 汝城县| 中方县| 芮城县| 阿合奇县| 克东县| 昌黎县| 平湖市| 山阴县| SHOW| 屯昌县| 五华县| 锡林浩特市| 绍兴县| 灌阳县| 七台河市| 贡山| 平陆县| 综艺| 汉阴县| 南汇区|