元組
- 基于詞嵌入的元組級數(shù)據(jù)溯源方法
注法的實(shí)現(xiàn)需要為元組保存完整的半環(huán)多項式(即標(biāo)注),由于通過查詢產(chǎn)生的元組依賴于先前查詢的元組,導(dǎo)致半環(huán)多項式的數(shù)量大量增長,存在存儲空間爆炸的問題。因此,國外學(xué)者Leybovich M等[4]提出基于詞嵌入的元組級數(shù)據(jù)溯源方法,該方法有效避免存儲數(shù)據(jù)標(biāo)注。文中主要貢獻(xiàn)如下:(1)在元組向量化編碼機(jī)制的基礎(chǔ)上給出屬性重要性優(yōu)化算法,解決詞嵌入方法中溯源精確率低的問題。(2)引入近似最近鄰搜索算法后又給出元組過濾優(yōu)化策略,解決時間消耗長溯源效率低的問題。1
計算機(jī)技術(shù)與發(fā)展 2023年12期2023-12-30
- 流數(shù)據(jù)實(shí)時接收方案的研究
同,邏輯上相同的元組可能具有不同的值,在數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫時,需要通過關(guān)聯(lián)表進(jìn)行統(tǒng)一,保證數(shù)據(jù)的一致性。為了更具體地理解這種半流連接關(guān)聯(lián)更新操作,圖1 展示了數(shù)據(jù)倉庫中涉及該操作的一個例子。由于數(shù)據(jù)來源的不同或數(shù)據(jù)的延遲到達(dá),系統(tǒng)中同一個id 可能具有不同的名稱,在數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫之前,需要使用一張關(guān)系表將id 轉(zhuǎn)換為系統(tǒng)內(nèi)部的id,對不同的名稱進(jìn)行統(tǒng)一。圖1 數(shù)據(jù)倉庫關(guān)聯(lián)更新示意在真實(shí)的數(shù)據(jù)倉庫系統(tǒng)中,R保存在磁盤上,一般占用空間較大,無法全部放入內(nèi)存;S
通信學(xué)報 2022年4期2022-04-29
- 嵌入式數(shù)據(jù)庫SQLite上多版本并發(fā)控制的設(shè)計與實(shí)現(xiàn)
中,關(guān)系的每個元組都有多個版本(version),每個版本帶有一個時間戳(timestamp),版本越新,其時間戳越大。MVCC 實(shí)現(xiàn)了并發(fā)事務(wù)之間的快照隔離(snapshot isolation),保證每個事務(wù)在讀數(shù)據(jù)庫時讀到的是事務(wù)開始時的數(shù)據(jù)庫實(shí)例(即快照)。因此,在支持MVCC 的RDBMS 中不存在讀寫沖突(read-write conflict),即當(dāng)一個寫事務(wù)和一個讀事務(wù)并發(fā)執(zhí)行時,讀事務(wù)會讀取它應(yīng)該讀的數(shù)據(jù)庫版本,寫事務(wù)會寫入新版本的元組
計算機(jī)應(yīng)用 2022年1期2022-02-26
- Top-k近似否定約束的發(fā)現(xiàn)
級約束指只對單個元組或者單個字段有約束,比如域約束、檢查約束等;表級約束指定義在兩個元組間的多個字段的約束,常見有函數(shù)依賴、條件函數(shù)依賴、次序依賴和差分依賴等。在現(xiàn)實(shí)中,字段級約束與表級約束可以同時存在于同一個數(shù)據(jù)中,且數(shù)據(jù)間的關(guān)系不僅僅有等于或者不等,還有著大于、小于的次序關(guān)系。否定約束[1]是一個表達(dá)能力極強(qiáng)的數(shù)據(jù)依賴的形式,它滿足了以上的需求。常見的域約束、主鍵約束、函數(shù)依賴、條件函數(shù)依賴和次序依賴等都可以轉(zhuǎn)為相應(yīng)的否定約束形式。在數(shù)據(jù)約束的相關(guān)工作
計算機(jī)應(yīng)用與軟件 2021年12期2021-12-14
- 帶有可信度標(biāo)記的增量式數(shù)據(jù)修復(fù)方法研究
組成,分別表示為元組編號、員工編號、辦公室電話、辦公室、所在部門。其中,Employee:D0是由若干空值和正確數(shù)據(jù)組成的原始數(shù)據(jù)集。在員工信息管理的過程中,由于人員的調(diào)動、辦公室的遷移等產(chǎn)生了信息的更新,這些更新處理存放在操作日志(operator log)中,D0在經(jīng)過了七步操作之后形成了Employee:D7,如圖1所示。圖1 中的φ1為數(shù)據(jù)集D7上的函數(shù)依賴,表示辦公室電話唯一決定辦公室的值,用于檢測D7的一致性。D7中的元組t1~t4違反了該約束
計算機(jī)與生活 2021年10期2021-10-12
- 關(guān)系代數(shù)在數(shù)據(jù)庫實(shí)驗(yàn)教學(xué)的實(shí)踐研究
自同一個域,t是元組變量,t∈R表示t是R的一個元組。(1)并運(yùn)算:將R與S合并,并且去掉重復(fù)元組后所構(gòu)成的一個關(guān)系。例1:將Stud與Other合并成SU關(guān)系,關(guān)系代數(shù)運(yùn)算表達(dá)式為:關(guān)系運(yùn)算的結(jié)果如表5所示。因?yàn)镺ther關(guān)系中的“714002”“714004”所對應(yīng)的元組已經(jīng)存在于Stud關(guān)系中,所以合并后的關(guān)系只保留了一份。表5 并運(yùn)算后的SU關(guān)系表6 交運(yùn)算后的SN關(guān)系(2)交運(yùn)算:由既屬于R又屬于S的元組組成的新關(guān)系。例2:將Stud與Other
現(xiàn)代計算機(jī) 2021年18期2021-08-06
- 面向高速亂序流的top-k連續(xù)查詢方法
區(qū)用來緩存到達(dá)的元組,緩沖區(qū)內(nèi)的數(shù)據(jù)最多等待K個時間單位,然后被提交至查詢處理模塊進(jìn)行查詢。MP-K-slack方法[2]是基于流元組延遲的動態(tài)變化來不斷調(diào)整K值,如果延遲不斷增大,會使數(shù)據(jù)越積越多,導(dǎo)致查詢時延的上升和查詢吞吐量的下降。AQ-K-slack方法[3]以用戶給定的結(jié)果精度為目標(biāo),通過聚合函數(shù)與窗口覆蓋率的定值關(guān)系,動態(tài)調(diào)整K值大小。但由于top-k查詢這類聚合函數(shù)過于復(fù)雜,會造成AQ-K-slack方法難以實(shí)施。另外,基于緩存的方法大多會對
鄭州大學(xué)學(xué)報(理學(xué)版) 2021年3期2021-07-26
- 時態(tài)數(shù)據(jù)質(zhì)量規(guī)則的研究及檢測
于R中的任意兩條元組ti和tj,若ti[X]=tj[X],則必有ti[Y]=tj[Y].依照該規(guī)則,不難發(fā)現(xiàn)表1中存在不一致數(shù)據(jù).例1.表1中,關(guān)系模式Accident(ID,TeaID,TeaName,Level,Title,AccidentType,Salary,VT)由8個屬性組成,分別表示為元組編號、教師編號、教師名、等級、職稱、教學(xué)事故類型、工資和發(fā)生教學(xué)事故的有效時間.表1 教學(xué)事故信息表(Accident)Table 1 Teaching a
小型微型計算機(jī)系統(tǒng) 2021年7期2021-07-08
- Python核心語法
表以及和它相似的元組。一、列表1. 列表的定義:我們可以把列表當(dāng)作一種容器,用它來存放數(shù)據(jù)??梢栽谄渲写娣畔嗤愋偷臄?shù)據(jù),也可以存放不同類型的數(shù)據(jù),但是為了提高程序的可讀性,建議在一個列表中存放同一種數(shù)據(jù)類型(圖1)。2. 數(shù)值列表的創(chuàng)建(list()函數(shù)):當(dāng)我們需要創(chuàng)建擁有一定數(shù)值的列表,而又不想手動輸入時,可以用list()函數(shù)嵌套range()函數(shù)直接進(jìn)行創(chuàng)建。但是需要注意range()函數(shù)中遵循左閉右開的規(guī)則(圖2)。3. 刪除列表:可以用del
電腦報 2021年14期2021-06-28
- Witt代數(shù)的r元組交換簇
李代數(shù) g 的r元組交換簇Cr(g) 是 g 中所有互相交換的r元組的集合, 即則Cr(g) 是 gr的閉子簇. 當(dāng) c harF=0 , g 是簡約李代數(shù), 且r=2 時, Richardson[1]證明了C2(g) 是不可約簇. 此結(jié)論被Levi[2]推廣到了素特征域上簡約李代數(shù)的情形. 對于一般線性李代數(shù) g ln, Gerstenhaber[3]證明了當(dāng)n≥4 且r≥5 時,Cr(gln) 是可約的. 進(jìn)一步, Kirillov和Neretin[4
華東師范大學(xué)學(xué)報(自然科學(xué)版) 2021年3期2021-06-03
- 基于約束聚類的k-匿名隱私保護(hù)方法
個簇至少包含k個元組,以滿足生成k-匿名等價類,并要求簇內(nèi)間距總和最小?;诰垲惖膋-匿名問題的最優(yōu)解是劃分完成后的等價類集合E={e1,e2,…,em} 滿足以下條件:(1)?i≠j∈{1,2,…,m},ei∩ej=?;(2)∪i=1,2,…,mei=T;(3)?ei∈E,|ei|≥k;1.2 距離度量函數(shù)在聚類算法中,定義距離函數(shù)用來度量數(shù)據(jù)之間的相似度是衡量聚類結(jié)果的關(guān)鍵因素。由于準(zhǔn)標(biāo)識符屬性中包含數(shù)值型數(shù)據(jù)、二元型數(shù)據(jù)和分類型數(shù)據(jù)3種不同的數(shù)據(jù)類型
計算機(jī)工程與設(shè)計 2021年3期2021-03-23
- 基于區(qū)塊鏈的物聯(lián)網(wǎng)大壩監(jiān)測系統(tǒng)架構(gòu)①
收到了發(fā)票中所有元組的付款.無人機(jī)云:由一組無人機(jī)小云組成,并與無人機(jī)代理進(jìn)行交互.無人機(jī)云可以通過添加更多無人機(jī)提供商來提供可伸縮性,并且可以為許多應(yīng)用程序提供服務(wù).每個小云均由提供商控制,并由一組基站(BS),一組維護(hù)中心和一組無人機(jī)(例如四旋翼飛機(jī))組成.無人機(jī)從CP 收集數(shù)據(jù)并將其傳輸給提供商.無人機(jī)作用有:(1)接收和存儲請求:它從DMC 接收請求,然后將其存儲以供以后驗(yàn)證;(2)選擇將要處理請求的無人機(jī)提供商;(3)發(fā)票的產(chǎn)生:它創(chuàng)建一個發(fā)票,
計算機(jī)系統(tǒng)應(yīng)用 2021年2期2021-02-23
- 一種基于特征的LED晶元自動定位與檢測方法
的特征,確定將晶元組上的銅柱作為特征,選取的特征少,計算速度快。首先用閾值分割和邊緣查找的方法提取這些特征的位置;然后利用晶元組和特征的幾何關(guān)系,實(shí)現(xiàn)晶元組的定位;再利用晶元在晶元組中的幾何位置和圖像分割技術(shù)實(shí)現(xiàn)晶元的提取和檢測。檢測完畢后,利用晶元組的定位關(guān)系,實(shí)現(xiàn)整個圖像的拼接,顯示全部晶元組和各個晶元的檢測結(jié)果,方便最后人工復(fù)核。1 晶元圖像的特征分析我們要檢測的是一整板零件,每個底板包括多個晶元組,每個晶元組上又焊接了多個晶元。典型的零件如圖1,該
中國計量大學(xué)學(xué)報 2020年4期2021-01-28
- 基于語義相似性的選擇題自動生成優(yōu)化方法
方法是基于本體的元組,利用簡單的SPARQL查詢模板來生成問題。對于已生成的問題需要進(jìn)一步進(jìn)行篩選,否則問題的數(shù)量過于龐大、問題不具有代表性,不適合用于測試特定領(lǐng)域的知識。干擾項生成模塊用于生成選擇題的干擾項,使用可能答案減去正確選項的方法生成干擾項,選擇題的質(zhì)量難以保證,難易程度無法估計。通過計算干擾項與正確選項之間的相似性,進(jìn)一步選擇干擾項,可以控制選擇題的質(zhì)量以及難易程度。為了解決上述問題,生成高質(zhì)量的選擇題題庫,應(yīng)用基于圖的最小頂點(diǎn)覆蓋問題的相似性
計算機(jī)與數(shù)字工程 2020年12期2021-01-19
- 基于參數(shù)化排序的不確定Top-k查詢算法
有最大概率的k個元組,U-kRanks[7]返回k個元組的列表,使得第i個排名的元組在所有的可能世界中具有最高的聚合概率.而這兩種查詢算法,由于缺少相應(yīng)的剪枝方法從而增加了需要搜索的可能世界實(shí)例的數(shù)量,所以導(dǎo)致了效率低下.而PT-k查詢返回的是所有可能世界中Top-k概率不低于給定概率閾值的元組集合,使得在不展開可能世界的前提下,提高算法的性能.參數(shù)化排序中的E-score[8]查詢語義返回數(shù)據(jù)概率和屬性分值乘積最大的前k個數(shù)據(jù),由于缺少相應(yīng)的剪枝方法,E
江蘇大學(xué)學(xué)報(自然科學(xué)版) 2020年6期2020-11-23
- PSP:一種高效的偏序域上skyline 查詢處理方法
NL 算法對待測元組建立臨時表,通過將每個待測元組與表內(nèi)元組比較來進(jìn)行輪廓查詢,因此BNL 算法性能受主內(nèi)存大小的限制;D&C 算法是將數(shù)據(jù)集劃分為多個分區(qū),在每個分區(qū)內(nèi)進(jìn)行查詢,計算出局部的skyline 點(diǎn),再將得到的結(jié)果進(jìn)行合并,然后對合并的結(jié)果再進(jìn)行查詢來得到最終結(jié)果.這兩種算法都會產(chǎn)生多次迭代,查詢效率較低.之后,Chomicki 等[6]提出了SFS 算法,該算法是在BNL 的基礎(chǔ)上對數(shù)據(jù)按單調(diào)函數(shù)進(jìn)行預(yù)排序,然后再進(jìn)行skyline 查詢,減
湖南大學(xué)學(xué)報(自然科學(xué)版) 2020年8期2020-09-06
- 針對隱藏Web數(shù)據(jù)庫的Skyline查詢方法研究*
的Skyline元組可以支持眾多基于Web的第三方應(yīng)用,比如在Web信息集成中,通過獲取多個隱藏Web 數(shù)據(jù)庫的Skyline 元組,可以有效地解決滿足用戶偏好的top-k查詢和推薦問題。通過top-k查詢接口來獲取服務(wù)器端“隱藏”數(shù)據(jù)庫的Skyline 面臨著諸多挑戰(zhàn),其中主要包括:(1)受top-k查詢限制,每次查詢結(jié)果最多返回滿足條件的k個元組;(2)用戶選擇的查詢條件受到Web接口類型和屬性類型的限制;(3)用戶端查詢次數(shù)受到Web服務(wù)器的限制等。
計算機(jī)與生活 2020年8期2020-08-12
- QJoin:質(zhì)量驅(qū)動的亂序數(shù)據(jù)流連接處理技術(shù)*
分析處理系統(tǒng)的流元組,si.v表示該流元組的值,si.ts表示該流元組的產(chǎn)生時間,稱為該流元組的時間戳。對數(shù)據(jù)流的分析處理,通常是基于流元組的時間戳語義進(jìn)行的。例如,手機(jī)導(dǎo)航跟蹤用戶移動設(shè)備地理位置數(shù)據(jù)流,就是基于時間順序的最新元組信息,給用戶實(shí)時推薦行進(jìn)的路線。但是,由于網(wǎng)絡(luò)延遲、處理器的并行操作或是異步數(shù)據(jù)流合并等原因[4],使得數(shù)據(jù)流上流元組不能按其時間戳的先后順序到達(dá)后端分析處理系統(tǒng),導(dǎo)致數(shù)據(jù)流出現(xiàn)亂序現(xiàn)象。例如在高速公路上,當(dāng)手機(jī)導(dǎo)航上傳數(shù)據(jù)中心
廣西科學(xué) 2020年3期2020-08-02
- 基于身份的兩方跨域認(rèn)證密鑰協(xié)商協(xié)議
列表LH2中加入元組Corrupt(ID*)A發(fā)送一個身份ID*給C,C查詢列表LH1。如果ID*在列表LH1中,則返回d*作為回答。如果ID*不在列表LH1,C先進(jìn)行H1(ID*,R*)查詢并獲得d*,然后返回d*作為回答。當(dāng)ID*=IDI,則返回⊥作為回答。①如果T=⊥,若IDi∈PKGA,C在列表LH1中找到元組(IDi,Ri,di,hi),在列表LE中找到元組(IDi,ti,Ti),返回(Ti,Ri,PpubA)作為回答。②如果T=(Ti,Ri,P
貴州師范大學(xué)學(xué)報(自然科學(xué)版) 2020年2期2020-03-18
- 擬態(tài)通用運(yùn)行環(huán)境的資源管理與調(diào)度技術(shù)
序的異構(gòu)執(zhí)行體N元組表及全局映像按需調(diào)度具有異構(gòu)性和負(fù)載均衡的N元組,包括運(yùn)行節(jié)點(diǎn)、云容器和虛擬機(jī)。圖4為擬態(tài)資源調(diào)度功能模塊及交互示意圖,反映了擬態(tài)資源調(diào)度(擬態(tài)資源調(diào)度初始化、擬態(tài)資源對象調(diào)度服務(wù))兩個部分的交互和功能。圖4 擬態(tài)資源調(diào)度功能模塊及交互示意圖Fig.4 Mimic resource scheduling function module and interaction diagram4.4 擬態(tài)資源調(diào)度初始化圖5為擬態(tài)資源異構(gòu)執(zhí)行N元組的
計算機(jī)工程 2020年2期2020-02-19
- 一種基于時間戳的簡單表縮減算法?
一種可以動態(tài)維持元組集有效部分的算法.STR 使用一種簡單的數(shù)據(jù)結(jié)構(gòu)sparse set[3,4]表示元組的序號,具有增量維持元組集的有效部分以及單位時間的回溯代價的性質(zhì).STR2[5]對STR 提出兩點(diǎn)改進(jìn):(1)只對相鄰兩次調(diào)用中元組對應(yīng)變量論域發(fā)生改變的位置檢測有效性,實(shí)現(xiàn)了增量檢測元組有效性;(2)當(dāng)變量中所有值均找到支持時,停止為該變量查找支持,避免了無用的支持查找.STR3[6]類似GAC4 是路徑最優(yōu)的,通過查詢dual table,找到并刪
軟件學(xué)報 2019年11期2019-12-11
- 一種改進(jìn)的回溯試探組卷算法*
xn)是一個n 元組,其中si是xi的定義域,且|si|有限[12];定義2:定義一個約束集D={di| i=1,2,……,m},其中,di是對xi的一個約束[13];定理1:如果狀態(tài)空間E 中存在一個n 元組滿足D 的全部約束,稱該n 元組為問題Q 的一個解。定理2:如果一個i 元組(x1,x2,……,xi)滿足約束集D 中僅涉及到x1,x2……,xi的約束,那么對于任意j 元組(x1,x2,……,xj)也滿足約束集D 中僅涉及到x1,x2,……,xj的
火力與指揮控制 2019年9期2019-11-06
- 海量數(shù)據(jù)上有效的top-kSkyline查詢算法*
查詢返回不被其他元組支配的所有元組。確切地說,元組t1支配元組t2,如果t1的所有Skyline準(zhǔn)則中的屬性值都不大于t2的對應(yīng)屬性值,并且在其中至少一個屬性上,t1在該屬性值小于t2在該屬性值。Skyline查詢的優(yōu)點(diǎn)在于,它不需要特定的評分函數(shù),并且不受維度之間不同標(biāo)度的影響。由于其實(shí)際應(yīng)用的重要性,Skyline查詢已經(jīng)引起了研究人員的廣泛關(guān)注。人們提出了一系列的算法來處理Skyline查詢[1-8]。不同于top-k等返回固定數(shù)量結(jié)果的查詢,Sky
計算機(jī)與生活 2019年5期2019-07-18
- 基于功能結(jié)構(gòu)元組的技術(shù)文檔的特征提取研究
始聚集于基于語義元組模型的文檔結(jié)構(gòu)特征提取。一些研究中以SAO(subject-action-object)[3]或AO(action-object)[4]結(jié)構(gòu)表達(dá)功能信息。這種結(jié)構(gòu)可以使用文本挖掘技術(shù)提取。目前,大量研究采用了自然語言處理技術(shù)(NLP)進(jìn)行文本包含功能結(jié)構(gòu)元組(SAO,AO)的挖掘,并對提取的功能結(jié)構(gòu)元組進(jìn)行了廣泛應(yīng)用。如基于(SAO)結(jié)構(gòu)專利挖掘開發(fā)的半自動構(gòu)建客戶作業(yè)圖的方法[5],通過功能結(jié)構(gòu)元組挖掘識別專利技術(shù)發(fā)展趨勢和新興技術(shù)[
計算機(jī)技術(shù)與發(fā)展 2019年5期2019-05-17
- DR-RDC:基于校準(zhǔn)否定約束集的數(shù)據(jù)修復(fù)方法
該方法只考慮錯誤元組對函數(shù)依賴置信度的影響,根據(jù)置信度的大小來判斷函數(shù)依賴對數(shù)據(jù)集的符合程度,并未涉及函數(shù)依賴之間的沖突檢測.文獻(xiàn)[12]通過擴(kuò)展阿姆斯壯定理,開發(fā)規(guī)則推理系統(tǒng)來分析條件函數(shù)依賴之間存在的沖突及其對數(shù)據(jù)集的符合程度.該方法認(rèn)為,如果元組與條件函數(shù)依賴中的常量相匹配,則支持該條件函數(shù)依賴,但否定約束中可能不含常量,所以該方法不適合否定約束之間的沖突檢測.綜上,我們提出了基于校準(zhǔn)否定約束集的數(shù)據(jù)修復(fù)方法,DR-RDC(Data Repair A
小型微型計算機(jī)系統(tǒng) 2019年5期2019-05-10
- 兩兩比較模型的Why-not問題解釋及排序?
整的?為什么這個元組沒有出現(xiàn)在查詢的結(jié)果集?由于在用戶得到結(jié)果之前需要對數(shù)據(jù)進(jìn)行較多步驟的計算,所以這種問題的答案較難尋找.數(shù)據(jù)起源,或者可以叫做一段數(shù)據(jù)的歷史信息,曾經(jīng)被用于研究解釋數(shù)據(jù)從哪里來[1-3]和在原始數(shù)據(jù)變成結(jié)果集的過程中都發(fā)生了什么[4-7].對于這些信息的整合,可以幫助我們理解為什么某些元組并沒有出現(xiàn)在結(jié)果集中[4,7,8].數(shù)據(jù)起源在這些工作中可以幫助人們解釋一些結(jié)果集中非正常的結(jié)果.對于數(shù)據(jù)庫用戶,一個常見的場景是這些編程人員被問為什
軟件學(xué)報 2019年3期2019-04-18
- Mixly開源項目設(shè)計28:秒懂74HC595移位寄存器(三)
一次只能送一個位元組(概念請參考下面的注釋),所以程序4,我們只用了一個shiftOut模塊,因此也只能向移位寄存器里送一個位元組,從結(jié)果來看,送往移位寄存器的位元組只能是從二進(jìn)制最低位開始的8位。注:位元組一般指字節(jié),字節(jié)(Byte)是計算機(jī)信息技術(shù)用于計量存儲容量的一種計量單位,通常情況下一字節(jié)等于有8位。(這是來自百度百科的解釋)位元組是計算機(jī)的一個記憶單元。位元是電腦最小的記憶單元,一個位元只能儲存0或1的資料,將8個位元組合起來稱為位元組。(這是
中國信息技術(shù)教育 2018年21期2018-11-23
- 不確定數(shù)據(jù)的有效查詢處理評估技術(shù)研究
,把不確定關(guān)系中元組分為不相容元組和相互獨(dú)立元組,有效的評估哪線查詢是線性時間內(nèi)可計算,哪些是不可計算的。在表 1 Productp、表 2 Order、表 3 Buyerp三個關(guān)系中,其中右上角的p表示表1、表3為不確定關(guān)系,表1 Productp中name屬性為確定屬性,memory和color兩個屬性為不確定屬性,第1個元組表示產(chǎn)品iphone 6s plus在上取值為的概率為p1=0.21,取值為的概率為 p2=0.19,p1+p2=0.4。 ip
銅陵職業(yè)技術(shù)學(xué)院學(xué)報 2018年3期2018-10-26
- 用于重復(fù)充電運(yùn)營記錄的基于塊采樣的高效聚集查詢算法
示相同實(shí)體的重復(fù)元組。文獻(xiàn)[1-2]概述了近年來實(shí)體識別問題的研究現(xiàn)狀及成果,文獻(xiàn)[3]研究如何提升實(shí)體識別的效率,文獻(xiàn)[4-6]研究了復(fù)雜數(shù)據(jù)上的實(shí)體識別技術(shù),文獻(xiàn)[7-8]致力于提升實(shí)體識別準(zhǔn)確性。這些方法將實(shí)體識別作為線下預(yù)處理過程用來清洗整個數(shù)據(jù)集,找出全部的同一實(shí)體。然而,隨著數(shù)據(jù)規(guī)模的不斷增大,這種高計算復(fù)雜性的線下清洗模式已經(jīng)很難滿足實(shí)時性分析應(yīng)用的需求。文獻(xiàn)[9-17]研究了多種漸進(jìn)式實(shí)體識別方法,旨在通過部分清洗過的數(shù)據(jù)給出較好的查詢結(jié)果
計算機(jī)應(yīng)用 2018年6期2018-08-28
- 數(shù)據(jù)庫中不等式查詢語句的resilience計算
思想,分析表中的元組對某個查詢結(jié)果的因果關(guān)系。在查詢中,如果某些數(shù)據(jù)庫元組被刪除,將會對查詢結(jié)果產(chǎn)生較大影響。resilience[5]是一個將因果關(guān)系與數(shù)據(jù)庫SQL查詢結(jié)合研究的典型應(yīng)用,根據(jù)resilience的定義,在查詢中若刪除最小個數(shù)的元組,查詢將不成立時,此最小元組集合即為resilience解。通過resilience的量化描述,人們可以更充分地理解查詢語句的因果性質(zhì),以及更好地知道在查詢中哪些元組是對查詢成立起決定性作用的元組,透過表象的數(shù)
計算機(jī)應(yīng)用 2018年7期2018-08-27
- 基于減少檢索的負(fù)表約束優(yōu)化算法
種去除遍歷不相關(guān)元組的方式, 達(dá)到減少遍歷次數(shù), 最終提高檢索效率的效果[5]. STR3算法基于該方法, 實(shí)現(xiàn)了對STR和STR2算法的優(yōu)化[6], 但STR3算法不能直接運(yùn)用到負(fù)表中, 當(dāng)約束中支持元組過于龐大時, 其處理元組依然很多. 因此, 受STR3算法的啟發(fā), 本文提出了一種負(fù)表約束算法STRN3, 對STR-N算法進(jìn)行優(yōu)化.在STRN3算法中, 如何準(zhǔn)確、 高效、 快速地尋找值支持的方式成為其最大的難點(diǎn), 在直接對負(fù)表約束進(jìn)行處理的算法STR
吉林大學(xué)學(xué)報(理學(xué)版) 2018年2期2018-03-29
- 基于啟發(fā)式搜索代價的多查詢結(jié)果分類方法
能具有大量的結(jié)果元組,而另外一些目錄下可能就具有少量的結(jié)果元組。為了解決信息過載問題,本文提出一種對查詢結(jié)果進(jìn)行分類的方法。該方法根據(jù)元組內(nèi)容對元組聚類,然后在查詢結(jié)果集上生成一個帶標(biāo)簽的分類樹。該分類樹是在查詢進(jìn)行過程中生成的,所以不會出現(xiàn)預(yù)分類問題。該方法通過鑒定分類空間開始,然后開發(fā)一個探測模型,這樣用戶可以跟著導(dǎo)航層次結(jié)構(gòu)進(jìn)行逐步細(xì)化查詢。1 相關(guān)工作解決Web數(shù)據(jù)庫信息過載的2種方法是對查詢結(jié)果進(jìn)行排序和分類。目前已經(jīng)有大量工作對查詢結(jié)果排序方法
- 使用C# 7元組語言特性優(yōu)化數(shù)據(jù)驅(qū)動軟件研究
簡單靈活的輕量級元組類型。分析了元組的幾個典型應(yīng)用場景,并給出了具體示例,包括多變量初始化、多變量賦值、多變量互換、封裝函數(shù)返回的多變量、作為中間層的數(shù)據(jù)容器、用于LINQ select表達(dá)式獲得語義信息,以及利用析構(gòu)(deconstructing)實(shí)現(xiàn)對象到元組的自動轉(zhuǎn)換等。實(shí)踐表明,元組適合數(shù)據(jù)驅(qū)動領(lǐng)域開發(fā),提高了生產(chǎn)效率,達(dá)到了動態(tài)語言效果。對C# 7 tuple存在的缺陷,如deconstructing的非對稱性、賦值的非傳遞性和可變性(mutab
軟件導(dǎo)刊 2017年9期2017-09-29
- 淺談數(shù)據(jù)庫安全與隱私保護(hù)
據(jù)庫中執(zhí)行的許多元組簽名。在數(shù)據(jù)庫中做委托給DSP,多組控制的簽名也交給DSP。讓Dreq是元組的可靠來源的綜合測試,使用合適的溝通方式,使其高效的公鑰Dreq。在Dreq的DSP中,DSP不返回查詢,只在搜索結(jié)果的要求,但也會返回所有結(jié)果的元組控制簽名,所以Dreq可以使用簽名的驗(yàn)證分析,是否返回的元組接受。如果驗(yàn)證失敗,則意味著可以修改,而不能識別元組Dreq。3.2 基于挑戰(zhàn)-響應(yīng)模式的方法在網(wǎng)絡(luò)中,非集中和復(fù)雜的環(huán)境中,DSP可以實(shí)現(xiàn)被公眾懷疑查詢
中國高新技術(shù)企業(yè) 2017年4期2017-05-06
- TMS:一種新的海量數(shù)據(jù)多維選擇Top-k查詢算法
分,每一個分片的元組以面向列的模式存儲,并且度量屬性的列表根據(jù)其屬性值降序排列.給定多維選擇條件,TMS算法利用選擇屬性網(wǎng)格確定相關(guān)網(wǎng)格單元,有效減少需要讀取的元組數(shù)量,提出雙排序方法執(zhí)行多維選擇的漸進(jìn)評價,并提出有效剪切操作來剪切不滿足多維選擇條件和分?jǐn)?shù)要求的候選元組.實(shí)驗(yàn)結(jié)果表明:TMS算法性能優(yōu)于現(xiàn)有算法.TMS算法;有序列表;選擇屬性網(wǎng)格;漸進(jìn)選擇評價;剪切操作在許多應(yīng)用中,Top-k是一種十分重要的查詢類型,它在潛在的巨大數(shù)據(jù)空間中返回用戶感興趣
計算機(jī)研究與發(fā)展 2017年3期2017-04-20
- 基于游標(biāo)的元組重構(gòu)應(yīng)用研究
00)基于游標(biāo)的元組重構(gòu)應(yīng)用研究許俊(四川職業(yè)技術(shù)學(xué)院計算機(jī)科學(xué)系,四川遂寧629000)抽取數(shù)據(jù)庫關(guān)系模式的多個元組的多個屬性值進(jìn)行重構(gòu),得到單個元組單一屬性的實(shí)體表示.本文以三個模式為實(shí)例,詳細(xì)分析了這類關(guān)系模式的結(jié)構(gòu),設(shè)計元組重構(gòu)算法,并基于游標(biāo)方案實(shí)現(xiàn).數(shù)據(jù)庫;元組;重構(gòu);游標(biāo)1 關(guān)系模式設(shè)計及需求關(guān)系模式Student、Course、ChooseCourse的設(shè)計如下:Student表設(shè)計Course表ChooseCourse表三個模式的關(guān)系圖如
四川職業(yè)技術(shù)學(xué)院學(xué)報 2016年4期2016-12-16
- 概率數(shù)據(jù)庫中元組間關(guān)系的表示
1)概率數(shù)據(jù)庫中元組間關(guān)系的表示張美茹(常州鐵道高等職業(yè)技術(shù)學(xué)校 軌道交通系,江蘇 常州 213011)文章從介紹概率數(shù)據(jù)庫的概念入手,分析了在實(shí)際應(yīng)用中為了更靈活地操作關(guān)系中的元組,在原來的概率數(shù)據(jù)庫基礎(chǔ)上增加對元組之間存在的關(guān)系操作的必要性。文章提出在概率數(shù)據(jù)庫中表示元組間存在的各種關(guān)系的方法,并且對這種改進(jìn)進(jìn)行了可行性分析。概率數(shù)據(jù)庫;元組;關(guān)系表示;模型1 概率數(shù)據(jù)庫的概念傳統(tǒng)的關(guān)系數(shù)據(jù)庫處理的是確定的精確的數(shù)據(jù),對不確定的非精確數(shù)據(jù)無能為力,描述
無線互聯(lián)科技 2016年21期2016-12-10
- 一個高效可完全模擬的n取1茫然傳輸協(xié)議
2.2 批量DH元組的知識的零知識證明給定一個q階群G,其生成元是g,h,且q為素數(shù).我們說群G上的一個四元組(g,h,u,v)是一個DH元組,當(dāng)且僅當(dāng)存在一個值w滿足u=gw且v=hw;反之,則稱該元組為非DH元組.DH元組知識的零知識證明旨在證明給定一個元組是DH元組,換言之,即證明關(guān)系RDH={(G,q,g0,g1,h0,h1)},其中,G,q如上所述;g0,g1是生成元,且存在一個證據(jù)w滿足h0=(g0)w,h1=(g1)w.上述單一DH元組知識的
計算機(jī)研究與發(fā)展 2016年11期2016-11-25
- 基于聚類分析的數(shù)據(jù)流隱私保護(hù)算法
為,且新數(shù)據(jù)流中元組的輸出時延不超過δ)定義1:匿名數(shù)據(jù)流,設(shè)數(shù)據(jù)流的屬性序列為(pid,a,a,…,a,q,q,…,q,ts),其中pid為用戶身份標(biāo)識,q,q,…,q為準(zhǔn)標(biāo)識符屬性,a,a,…,a為其他屬性,為元組到達(dá)時刻,為由生成的匿名數(shù)據(jù)流,其中屬性id和被隱去,映射,若滿足:1)對任意t∈,存在與對應(yīng);2)對任意,|DP(EQ)|≥,EP=·q·q,i=1,…,n},DP(EQ)為EQ(t')中元組對應(yīng)的pid屬性不同的用戶組成的集合,則稱為匿名
重慶三峽學(xué)院學(xué)報 2016年3期2016-10-14
- 高效可證明安全的無證書代理簽名方案*
:最后攻擊者輸出元組(mw,A,PKA,θ)或(m,mw,A,PKA,B,PKB,σ)作為它的偽造。若能滿足下列情況之一,說攻擊者贏得了這個游戲。情況1元組(mw,A,PKA,θ)滿足:(1)(params,mw,A,PKA,θ)是有效的部分代理鑰;(2)若攻擊者為α1,不曾詢問原始簽名人A的部分私鑰,若攻擊者為α2,不曾詢問A的秘密值;(3)(mw,A,PKA)沒有進(jìn)行過部分代理鑰詢問。情況2元組(m,mw,A,PKA,B,PKB,σ)滿足:(1)(pa
計算機(jī)與生活 2016年9期2016-09-20
- 大數(shù)據(jù)集成中確定數(shù)據(jù)準(zhǔn)確屬性值的WR方法
在數(shù)據(jù)庫中的不同元組確定其準(zhǔn)確屬性值.最新的R-topK方法在數(shù)據(jù)上實(shí)施人工設(shè)計的規(guī)則確定屬性值間的準(zhǔn)確程度,得到了相對準(zhǔn)確的屬性值.然而這種方法在處理多個可能的準(zhǔn)確值或設(shè)計的規(guī)則存在沖突等情況下需要較多人工交互.為此提出基于權(quán)重規(guī)則的WR(weighted-rule)方法確定大數(shù)據(jù)集成中數(shù)據(jù)的準(zhǔn)確屬性值.該方法為屬性值間準(zhǔn)確程度的判斷規(guī)則擴(kuò)充了權(quán)重,在準(zhǔn)確值發(fā)生沖突時避免了R-topK方法中人工交互干預(yù).基于追逐過程設(shè)計了約束條件推理算法,并證明它能夠在
計算機(jī)研究與發(fā)展 2016年2期2016-07-31
- 面向數(shù)據(jù)融合的半環(huán)溯源計算方法
止,通過分析結(jié)果元組的半環(huán)多項式溯源的特點(diǎn),證明這2種近似算法最壞可在n次迭代后終止.最后,通過實(shí)驗(yàn)說明了本文提出的方法是可行和有效的.?dāng)?shù)據(jù)融合;半環(huán)溯源;多項式系統(tǒng);派生樹;遞歸查詢隨著網(wǎng)絡(luò)的飛速發(fā)展,Web技術(shù)以其廣泛性、交互性、快捷性和開放性等特點(diǎn)迅速風(fēng)靡全球,并且已經(jīng)滲入到社會的各個領(lǐng)域,網(wǎng)站及網(wǎng)頁數(shù)量正以指數(shù)級飛速增長.如何準(zhǔn)確、有效地集成海量高價值的Web信息,對于諸如市場情報分析、輿情分析、商業(yè)智能等分析型應(yīng)用尤為重要,具有非常重要的應(yīng)用價值
計算機(jī)研究與發(fā)展 2016年2期2016-07-31
- 條件函數(shù)依賴的增量計算
s,而且針對插入元組采用增量方法計算FDs,但基于刪除元組采用非增量方法計算FDs。文獻(xiàn)[8]介紹了CFDs在違例元組的增量檢測方面的應(yīng)用,即在CFDs集保持不變的情況下,針對插入、刪除、修改元組增量檢查是否有違例元組出現(xiàn)。本文主要創(chuàng)新點(diǎn)如下:①基于非增量計算算法CTane,針對數(shù)據(jù)表的增加、刪除、修改元組等不同操作,分別分析了在相應(yīng)情況下CFDs變化規(guī)律;②提出了增量計算CFDs算法CTane-IncProc,且分析并驗(yàn)證了此算法的正確性與高效性。該研究
系統(tǒng)工程與電子技術(shù) 2015年11期2015-06-05
- k匿名數(shù)據(jù)上的聚集查詢及其性質(zhì)*-
年,文獻(xiàn)[6]對元組間有約束的不確定數(shù)據(jù)OLAP進(jìn)行了研究,基于元組間約束,構(gòu)造約束超圖,提出了新的擴(kuò)展數(shù)據(jù)庫分配策略。文獻(xiàn)[5]給出了計算擴(kuò)展數(shù)據(jù)庫更加有效的分配策略。針對不確定數(shù)據(jù)的OLAP查詢,研究者的技術(shù)路線是將不確定數(shù)據(jù)庫展開成可能世界,然后為可能世界中的元組進(jìn)行概率分配,將已經(jīng)分配的可能世界合并得到擴(kuò)展數(shù)據(jù)庫,在擴(kuò)展數(shù)據(jù)庫上執(zhí)行OLAP查詢。其中概率分配算法是指數(shù)級時間復(fù)雜度,雖然文獻(xiàn)[6]對算法進(jìn)行了優(yōu)化,但仍然是指數(shù)級的時間復(fù)雜度,查詢的時
計算機(jī)工程與科學(xué) 2014年1期2014-09-05
- 基于集合運(yùn)算的房屋共有建筑面積普適分?jǐn)偰P脱芯?/a>
相同、確定的建筑元組之間的服務(wù)關(guān)系,從建筑元組之間的聯(lián)系中確定共有建筑面積的分?jǐn)側(cè)ハ?,依文獻(xiàn)[1]規(guī)定的共有建筑面積處理原則,實(shí)施共有建筑面積分?jǐn)偺幚?,進(jìn)而得出房屋相關(guān)建筑元組分?jǐn)偹妹娣e和分戶建筑面積的數(shù)值處理工作。建筑元組包括共有建筑元組和分戶建筑元組。建筑元組由確定的相關(guān)建筑元構(gòu)成。建筑元是指建筑面積最小計算單元,包括共有建筑元和分戶建筑元。共有建筑面積分?jǐn)偺幚硎欠慨a(chǎn)測量中重要的數(shù)值處理環(huán)節(jié),共有建筑面積分?jǐn)偰P褪欠慨a(chǎn)測量不可或缺的數(shù)值處理工具。房屋
測繪通報 2014年3期2014-08-16
- 實(shí)時數(shù)據(jù)倉庫中一種改進(jìn)的數(shù)據(jù)流更新算法
,合理調(diào)度了實(shí)時元組和準(zhǔn)實(shí)時元組的執(zhí)行。文獻(xiàn)[11]提出一種支持服務(wù)質(zhì)量的更新和查詢的調(diào)度算法,實(shí)現(xiàn)了更新和查詢的實(shí)時調(diào)度。雖然MESHJOIN算法能有效地分?jǐn)偪焖俚妮斎肓鲙淼拇疟PI/O開銷,但它不能適應(yīng)實(shí)際應(yīng)用中的一般特征,比如在許多市場上少數(shù)產(chǎn)品具有較高的購買頻率[12]。本文針對實(shí)際中常見的數(shù)據(jù)偏斜分布情況,提出一種改進(jìn)的數(shù)據(jù)流更新算法:擴(kuò)展混合連接算法(EH-JOIN)。EH-JOIN的關(guān)鍵特征是將存儲在磁盤的關(guān)系集使用最多的部分存在內(nèi)存中,使其
計算機(jī)工程 2014年10期2014-06-07
- 基于差異化聚類的分級隱私保護(hù)數(shù)據(jù)發(fā)布方法
出每個簇中的敏感元組的分布應(yīng)該接近于該屬性的全局分布.楊曉春[5]等在2008年提出了多維桶模型,并設(shè)計了三種優(yōu)先算法來解決了非單一敏感屬性隱私泄露等相關(guān)問題.Tiancheng Li[6]在2012年初提出了Slicing模型,其沒有明確區(qū)分準(zhǔn)標(biāo)識符屬性和敏感屬性,而是依據(jù)屬性之間的關(guān)系先行切片,切片內(nèi)屬性間關(guān)系保持,切片外屬性間關(guān)系打亂,通過這種方式來處理隱私保護(hù)數(shù)據(jù)發(fā)布.以上的這些模型在一定的領(lǐng)域或范圍內(nèi)也取得了良好的使用效果.本文提出的方法是通過分
海南師范大學(xué)學(xué)報(自然科學(xué)版) 2014年1期2014-03-22
- 關(guān)系數(shù)據(jù)庫對象級別檢索結(jié)果相關(guān)性排序算法研究
點(diǎn)針對關(guān)系數(shù)據(jù)庫元組檢索、對象構(gòu)建以及相關(guān)性評估等,對相關(guān)性排序算法的實(shí)現(xiàn)進(jìn)行了簡要說明。1 關(guān)系數(shù)據(jù)庫分析關(guān)系數(shù)據(jù)庫是一種應(yīng)用數(shù)學(xué)集合概念的數(shù)據(jù)庫模型,并且用集合的方法來處理數(shù)據(jù)庫中的數(shù)據(jù)。從構(gòu)成結(jié)構(gòu)上看,可以將關(guān)系數(shù)據(jù)庫看成是一個具備描述性功能的表格,在這個表格中每一列代表一種數(shù)據(jù)種類,而每一行則包含著這類數(shù)據(jù)的唯一實(shí)體,總結(jié)起來關(guān)系數(shù)據(jù)庫就是由數(shù)據(jù)實(shí)體集合而構(gòu)成的一個應(yīng)用領(lǐng)域。與網(wǎng)絡(luò)相比關(guān)系數(shù)據(jù)庫有其獨(dú)特之處:(1)關(guān)系數(shù)據(jù)庫中由數(shù)據(jù)實(shí)體組成的元組之
河北水利電力學(xué)院學(xué)報 2014年4期2014-03-13
- 數(shù)字圖書館聯(lián)盟中概率數(shù)據(jù)集成系統(tǒng)上的top-k查詢
這樣結(jié)果中的每個元組都會具有不同的概率,我們可以采用 top-k算法來獲得最近似的k個結(jié)果。在一個DLF中,最終用戶會希望獲得結(jié)果中最符合其偏好且概率最高的結(jié)果。這樣,在傳統(tǒng)的 top-k算法中,需要同時考慮依據(jù)偏好形成的得分函數(shù)與概率直接的關(guān)系。1 數(shù)字圖書館聯(lián)盟DLF的概率的信息集成模型Lenzerini 等[3]提出了一種數(shù)據(jù)集成的理論模型,基于該模型,本文定義了概率性的數(shù)據(jù)集成模型,其形式化描述如下:一個數(shù)據(jù)集成系統(tǒng)Δ 是一個四元組 ,其中G是全局
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用 2014年4期2014-02-27
- 基于MHBT的數(shù)據(jù)庫隔離與恢復(fù)模型
改[4],對單獨(dú)元組的屬性值建立MHT,從而在驗(yàn)證時能夠精確到數(shù)據(jù)元組,提升了驗(yàn)證精度和效率。Pang H 等人從查詢結(jié)果的完整性和可靠性兩個方面對文獻(xiàn)[3]中提出的方法作了實(shí)驗(yàn)性驗(yàn)證[5],內(nèi)容涵蓋了查詢、查詢投影、多點(diǎn)查詢等數(shù)據(jù)庫常用服務(wù)功能,并從通信代價、數(shù)據(jù)庫升級代價等角度對模型進(jìn)行了量化分析,具有很強(qiáng)的現(xiàn)實(shí)意義。以上基于MHT的方法都是建立在第三方(外包)數(shù)據(jù)庫服務(wù)方靜態(tài)環(huán)境條件下(許多是基于理想化模型條件),解決的問題為數(shù)據(jù)庫查詢的正確性和完整
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用 2013年10期2013-10-17
- 面向數(shù)據(jù)流處理的元組跟蹤方法
節(jié)點(diǎn)的算子相同的元組。也就是說,當(dāng)主節(jié)點(diǎn)的算子出現(xiàn)故障時,可以使用這個備份節(jié)點(diǎn)的算子替換它。這種容錯技術(shù)會帶來較高的開銷,其中主要的開銷是保存副本的空間開銷,因?yàn)樗鼈冊跀?shù)據(jù)處理的大部分時間中并沒有被利用。此外,元組必須發(fā)送到多個節(jié)點(diǎn),這也會帶來額外的時間開銷。最后,備份節(jié)點(diǎn)的算子必須和主節(jié)點(diǎn)的算子保持相同的元組處理順序,這會產(chǎn)生額外的時間開銷。此外,當(dāng)主節(jié)點(diǎn)出現(xiàn)故障時,主動備份技術(shù)需要把主節(jié)點(diǎn)的輸出流切換到備份節(jié)點(diǎn),因此故障恢復(fù)的時間也較長。被動備份技術(shù)把
電信科學(xué) 2013年10期2013-08-10
- 基于敏感元組的聚類匿名數(shù)據(jù)發(fā)布
劉 海?基于敏感元組的聚類匿名數(shù)據(jù)發(fā)布劉 海*(浙江金融職業(yè)學(xué)院 經(jīng)營管理系, 浙江 杭州, 310018)在數(shù)據(jù)發(fā)布的過程中, 為了保護(hù)個人隱私常需對所有準(zhǔn)標(biāo)識符進(jìn)行泛化操作, 而實(shí)際涉及到個人隱私相關(guān)敏感屬性元組是非常少的. 據(jù)此, 從這些涉及個人隱私的敏感屬性的元組出發(fā), 將剩余大量僅涉及非敏感屬性元組依據(jù)敏感屬性值不同進(jìn)行分組, 最后對分組中元組以計算與個人隱私屬性相關(guān)敏感屬性距離的方式, 選取距離最短的元組進(jìn)行泛化, 其余元組并不進(jìn)行泛化, 通過
湖南文理學(xué)院學(xué)報(自然科學(xué)版) 2013年4期2013-05-13
- 關(guān)系代數(shù)中除法運(yùn)算相交算法的探討*
。其結(jié)果由 R中元組到唯一于R的屬性名字(就是說只在R表頭中而不在S表頭中的屬性)的限制構(gòu)成,并且它們與S中的元組的所有組合都存在于 R中[1]。在關(guān)系運(yùn)算中,除法運(yùn)算可理解為笛卡爾積的逆運(yùn)算。設(shè)被除關(guān)系R為r元關(guān)系,除關(guān)系S為s元關(guān)系,那么它們的商為r-s元關(guān)系,記為R÷S。商的構(gòu)成原則是:將被除關(guān)系R中的r-s列,按其值分成若干組,檢查每一組的s列值的集合是否包含除關(guān)系S,若包含則取r-s列的值作為商的一個元組,否則不?。?]。2 除法定義的理解除運(yùn)算
河南工學(xué)院學(xué)報 2012年6期2012-11-11
- 基于灰關(guān)聯(lián)的k匿名數(shù)據(jù)流隱私保護(hù)算法
連續(xù)聚類過程.當(dāng)元組的到達(dá)時間超過一個時延閾值時,它們將以連續(xù)的方式被發(fā)布.B-CASTLE算法[16]通過設(shè)置簇大小上限解決CASTLE算法生成不平衡簇的問題.筆者提出一種基于灰關(guān)聯(lián)分析的數(shù)據(jù)流匿名算法(DSAoGRA),采用灰色關(guān)聯(lián)度描述元組間的相似度并結(jié)合聚類思想,將元組劃分成k匿名簇,得到滿足k匿名準(zhǔn)則的隱私保護(hù)數(shù)據(jù)流.通過在真實(shí)數(shù)據(jù)集上與CASTLE算法的對比實(shí)驗(yàn),表明新算法能夠?qū)崿F(xiàn)數(shù)據(jù)流的快速匿名化,并保證匿名后數(shù)據(jù)的高可用性.1 數(shù)據(jù)流匿名數(shù)
東北石油大學(xué)學(xué)報 2012年6期2012-10-12
- 基于似然的航跡關(guān)聯(lián)算法研究*
,定義一個集合量元組T,假設(shè)每個元組由來自同一個目標(biāo)的狀態(tài)估計組成,這樣所有元組的組合就構(gòu)成了一個全局的關(guān)聯(lián)假設(shè)H,一個元組對于一個傳感器最多只能包含它的一條航跡,且元組必須是非空的,所以每個元組的大小一定是限制在0<NT≤Ns之間。fi是來自傳感器i的航跡,如果一個元組中沒有航跡來自傳感器i,那么fi=0,傳感器上報的每一條航跡都是一個元組的成員,且一條航跡只能在一個元組中,因此,在一個全局假設(shè)H中,所有元組的大小之和一定等于所有傳感器上報的航跡數(shù)之和,
艦船電子工程 2012年9期2012-07-11
- 用于關(guān)系數(shù)據(jù)庫關(guān)鍵詞查詢的基于劃分的候選網(wǎng)絡(luò)生成算法
詞的查詢分為相關(guān)元組獲取、候選網(wǎng)絡(luò)(candidate network,CN)[1]生成和候選網(wǎng)絡(luò)執(zhí)行3個階段.由于候選網(wǎng)絡(luò)執(zhí)行階段是整個系統(tǒng)的性能瓶頸,所以一直是重點(diǎn)關(guān)注的對象[1-6],而對前2個階段算法的改進(jìn)很少.文獻(xiàn)[7-8]最先提出通過廣度優(yōu)先查詢方法生成所有組合關(guān)鍵詞的候選網(wǎng)絡(luò).但是組合關(guān)鍵詞的候選網(wǎng)絡(luò)數(shù)量會隨著網(wǎng)絡(luò)大小成指數(shù)增長,執(zhí)行時間急劇上升[1,9].Markowetz等[10]提出了減少中間結(jié)果和避免同構(gòu)檢查的算法.文獻(xiàn)[11]利用半
東南大學(xué)學(xué)報(自然科學(xué)版) 2012年4期2012-06-28
- 關(guān)系數(shù)據(jù)庫中近似查詢的自動采樣改進(jìn)方法研究
,然后根據(jù)每一個元組在樣本關(guān)系表中出現(xiàn)的次數(shù),將每個元組需要的存儲信息作為元組的屬性添加進(jìn)數(shù)據(jù)表中,并通過DBMS在整個自動抽樣過程對它們進(jìn)行管理,對所得的結(jié)果進(jìn)行分類并統(tǒng)計,得出每次采樣過程中某個元組出現(xiàn)的次數(shù),實(shí)驗(yàn)表明方法是有效的。關(guān)系數(shù)據(jù)庫;自動采樣;SQL采用傳統(tǒng)精確查詢技術(shù)處理海量數(shù)據(jù),查詢?nèi)蝿?wù)將顯得極其繁重,從而導(dǎo)致整個查詢的響應(yīng)時間超出用戶可以接受的限度。因而往往采用近似匹配,通過對部分或采樣數(shù)據(jù)的查詢,而不是整個數(shù)據(jù)集本身進(jìn)行的查詢,此外,
湖南人文科技學(xué)院學(xué)報 2011年2期2011-12-20
- 時間序列不確定數(shù)據(jù)流中異常數(shù)據(jù)檢測方法
包含的不確定離散元組以數(shù)據(jù)點(diǎn)概率模型描述。在該模型中,元組的屬性值確定,而存在性不確定,用一個[0,1]之間的概率值表示[4]。由于不確定數(shù)據(jù)流具有非線性及強(qiáng)繞動性,文中采用小波變換來滿足自適應(yīng)時變信號分析的要求,從而可聚焦到信號的任意細(xì)節(jié)以識別不確定數(shù)據(jù)流中異常數(shù)據(jù)。定義1.1時間序列不確定數(shù)據(jù)流是一個由相互獨(dú)立的k維不確定元組構(gòu)成的序列,S (t)={(w1(t),p1),(w2(t),p2),……,(wn(t),pn)},其中 wi(t)為 t時刻第
電子設(shè)計工程 2011年19期2011-10-09
- 半監(jiān)督聚類的匿名數(shù)據(jù)發(fā)布
k個元素,且簇內(nèi)元組有相同的屬性值.為使相同的簇內(nèi)元組有相同的屬性值,需要對元組進(jìn)行概化/隱匿處理,該方法建立在預(yù)定義的域概化層次樹結(jié)構(gòu)和值概化層次樹結(jié)構(gòu)之上,因此會帶來不必要的信息損失.為減少信息發(fā)布時的信息損失,不少學(xué)者研究使用聚類方法實(shí)現(xiàn)k-匿名[4-5].隨著對k-匿名模型的研究深入,研究者發(fā)現(xiàn)k-匿名模型可以有效的抵御連接(link)攻擊,但是不能抵御背景知識攻擊和同質(zhì)攻擊[6].為防御背景知識攻擊和同質(zhì)攻擊,學(xué)者研究了各種方法[6-8].其中l(wèi)
哈爾濱工程大學(xué)學(xué)報 2011年11期2011-06-06
- 一種模糊級別的多級安全關(guān)系數(shù)據(jù)模型研究*
ation)和偽元組(Cover Story)的概念,使得真實(shí)世界的單個實(shí)體在一個多級關(guān)系表中會產(chǎn)生多個元組,每個元組對應(yīng)著不同密級的實(shí)例,并為每個字段設(shè)置相應(yīng)的密級附加字段,以記錄各數(shù)據(jù)項的密級信息。當(dāng)不同實(shí)例間的數(shù)據(jù)差異很大時,這樣的設(shè)計是合理的。然而,研究表明實(shí)際應(yīng)用時,數(shù)據(jù)庫中敏感數(shù)據(jù)(即需要對低許可級主體隱藏的數(shù)據(jù))所占的比例通常僅僅只有約5%[2],這意味著多實(shí)例間的數(shù)據(jù)差異通常非常小,高密級的元組除個別字段外,絕大部分?jǐn)?shù)據(jù)(90%以上)與低密
網(wǎng)絡(luò)安全與數(shù)據(jù)管理 2010年17期2010-07-25