国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

農(nóng)經(jīng)權(quán)中數(shù)據(jù)缺省的技術(shù)彌補(bǔ)與緩解機(jī)制研究
——以福建省廈門(mén)市某區(qū)為例

2018-05-15 12:17
關(guān)鍵詞:缺省遺失身份證

柴 旭

(福建省地質(zhì)測(cè)繪院,福建 廈門(mén) 361012)

在農(nóng)村土地承包經(jīng)營(yíng)權(quán)外業(yè)確權(quán)登記活動(dòng)中,受到調(diào)查對(duì)象遺漏、調(diào)查對(duì)象認(rèn)知能力約束以及調(diào)查員自身思維縝密性的限制,往往造成外業(yè)調(diào)查表中數(shù)據(jù)的缺省,對(duì)于這一部分?jǐn)?shù)據(jù)不彌補(bǔ)又通常耗費(fèi)大量的人力、物力、財(cái)力進(jìn)行補(bǔ)充調(diào)查,耗時(shí)長(zhǎng),效率較低,對(duì)于這一問(wèn)題的優(yōu)化處理往往采用技術(shù)彌補(bǔ)與社會(huì)性補(bǔ)充調(diào)查相結(jié)合的方法。當(dāng)前對(duì)于數(shù)據(jù)缺省重構(gòu)普遍采用均值法或最大頻率法,然而這些方法往往造成彌補(bǔ)數(shù)據(jù)失真的問(wèn)題。鄂旭等(2005)基于斷點(diǎn)屬性值加以探索;趙飛等(2011)基于最小計(jì)數(shù)概要提出最小頻率概要而實(shí)現(xiàn)缺省數(shù)據(jù)的填補(bǔ);張其文等(2006)基于粗集理論思想,以相似關(guān)系替代粗集理論中的不可分辨關(guān)系,從而提出基于相似關(guān)系的填充算法,以實(shí)現(xiàn)數(shù)據(jù)重構(gòu)精度;武森等(2012)則基于不完備數(shù)據(jù)聚類(lèi)的缺失數(shù)據(jù)填補(bǔ)方法來(lái)針對(duì)非類(lèi)變量不完備數(shù)據(jù)集定義約束容差機(jī)和差異度,從而直接計(jì)算研究對(duì)象的總體相異程度以實(shí)現(xiàn)數(shù)據(jù)填補(bǔ);谷峪等(2010)通過(guò)動(dòng)態(tài)概率路徑實(shí)踐模擬,基于挖掘已知的區(qū)域之間的順序相關(guān)性來(lái)對(duì)后續(xù)發(fā)生的時(shí)間進(jìn)行判斷和填補(bǔ);張偉(2003)則基于Rough集理論加以探究,其不需要附加信息,具有計(jì)算簡(jiǎn)單、直觀等優(yōu)勢(shì);郭景峰等(2002),文碩頻等(2003)從數(shù)據(jù)間的關(guān)系入手,引入相似性概念,基于決策樹(shù)來(lái)實(shí)現(xiàn)遺失數(shù)據(jù)的填補(bǔ);盧娟等(2012)基于規(guī)范變量分析以實(shí)現(xiàn)數(shù)據(jù)的重構(gòu)。通過(guò)對(duì)前人研究的梳理,本文將詳述三種適宜彌補(bǔ)農(nóng)村土地承包經(jīng)營(yíng)權(quán)確權(quán)頒證中的數(shù)據(jù)缺省方法,再通過(guò)社會(huì)性緩解機(jī)制來(lái)緩解因數(shù)據(jù)缺省而引發(fā)的農(nóng)戶與政府及技術(shù)施工方的矛盾,從而促進(jìn)項(xiàng)目高效、高質(zhì)推進(jìn),服務(wù)于農(nóng)村社會(huì)經(jīng)濟(jì)發(fā)展。

1 研究區(qū)域與數(shù)據(jù)特征

研究區(qū)域?yàn)楦=ㄊB門(mén)市某標(biāo)段位于福建省東南部沿海地區(qū),亞熱帶海洋性氣候,全年氣候溫潤(rùn),地形較平坦,區(qū)內(nèi)工業(yè)、文教發(fā)達(dá),有新建高鐵車(chē)站一座,常住人口3.8萬(wàn)人,流動(dòng)人口4.5萬(wàn)人,農(nóng)業(yè)現(xiàn)代化水平高,新型農(nóng)業(yè)經(jīng)營(yíng)主體發(fā)育較為完善,農(nóng)地利用效率高。

研究區(qū)域數(shù)據(jù)整體完整性在96%以上,主要數(shù)據(jù)缺省在身份證號(hào)碼、地塊合同面積等兩方面。身份證號(hào)碼數(shù)據(jù)缺省存在兩個(gè)方面,其一是身份證號(hào)碼數(shù)據(jù)缺失,其二是身份證號(hào)碼錯(cuò)誤,前者必須通過(guò)二次調(diào)查獲取,后者可通過(guò)身份證驗(yàn)證程序加以修正。而地塊合同面積缺省直接指數(shù)據(jù)缺失,該數(shù)據(jù)能夠經(jīng)由數(shù)據(jù)重構(gòu)獲取。

2 數(shù)據(jù)重構(gòu)方法

本文中著重于對(duì)基于遺失數(shù)據(jù)重構(gòu)的軟測(cè)量方法、基于決策樹(shù)的不完全決策表的數(shù)據(jù)補(bǔ)充方法以及一種身份證信息驗(yàn)證與補(bǔ)遺算法實(shí)現(xiàn)數(shù)據(jù)重構(gòu)。

2.1 基于遺失數(shù)據(jù)重構(gòu)的軟測(cè)量方法

…,yl]T+[x1,x2,…,xm,y1,…,yl]

U[0,0,…,1,0,…,0]T

=0

(1)

聯(lián)合上述l個(gè)等式可得到:

(2)

由此可得遺失數(shù)據(jù)的重構(gòu)值表達(dá)式(趙京梅等,2010):

(3)

2.2 基于決策樹(shù)的不完全決策表的數(shù)據(jù)補(bǔ)充方法

2.2.1 決策樹(shù)構(gòu)建

根據(jù)前文,對(duì)象集為X,決策樹(shù)生成算法為以下形式(圖1)。

圖1 決策樹(shù)生成流程Fig.1 Creative processes of decision trees

基于信息理論,可得到一棵決策樹(shù)能對(duì)樣本做出不完全正確劃分的期望熵D(X),即

(4)

以y為節(jié)點(diǎn)所需的期望信息E(y),即

(5)

表1 身份證信息驗(yàn)證與補(bǔ)遺表

2.2.2 遺失數(shù)據(jù)彌補(bǔ)

首先,應(yīng)將該節(jié)點(diǎn)所有ai*在y的取值確定為該節(jié)點(diǎn)其他不含“*”對(duì)象在y的取值,再修改ai*為ai且從其他節(jié)點(diǎn)中去掉ai*。

再次,取與ai具有最大相似度的F中的對(duì)象aj,y(ai)=y(aj),在含有aj的子節(jié)點(diǎn)修改ai*→ai,且同時(shí)從其他節(jié)點(diǎn)中去掉ai*。若節(jié)點(diǎn)中仍存“*”,重復(fù)前述過(guò)程直到“*”不存在為止。

最后,停止對(duì)屬性值的修正,轉(zhuǎn)到?jīng)Q策樹(shù)構(gòu)造中,對(duì)新產(chǎn)生的節(jié)點(diǎn)重復(fù)上述操作(郭景峰等,2002;文碩頻等,2003)。

2.3 身份證信息驗(yàn)證與補(bǔ)遺算法

身份證信息驗(yàn)證與補(bǔ)遺算法基于Excel平臺(tái)而開(kāi)發(fā),具體算法結(jié)構(gòu)如下:

首先,構(gòu)建身份證信息驗(yàn)證與補(bǔ)遺表,該表分為兩大模塊,即身份證號(hào)碼輸入模塊與審核結(jié)果輸出模塊。審核結(jié)果輸出模塊又包含數(shù)位驗(yàn)證、地址碼驗(yàn)證、出生日期碼驗(yàn)證、順序碼驗(yàn)證、校驗(yàn)碼驗(yàn)證、統(tǒng)計(jì)驗(yàn)證值、驗(yàn)證結(jié)果等七個(gè)子模塊構(gòu)成(表1)。

其次,設(shè)計(jì)數(shù)位驗(yàn)證、地址碼驗(yàn)證、出生日期碼驗(yàn)證、順序碼驗(yàn)證、校驗(yàn)碼驗(yàn)證、統(tǒng)計(jì)驗(yàn)證值、驗(yàn)證結(jié)果等七個(gè)子模塊的算法。

最后,在“身份證號(hào)碼”對(duì)應(yīng)的表格中填入身份證號(hào)碼即可得到驗(yàn)證信息與修正信息。

3 外業(yè)數(shù)據(jù)補(bǔ)遺的實(shí)證研究

3.1 基于遺失數(shù)據(jù)重構(gòu)軟測(cè)量方法的實(shí)證分析

由此可得遺失數(shù)據(jù)的重構(gòu)值:

補(bǔ)遺獲取的31對(duì)數(shù)據(jù)異常值為2對(duì)(即實(shí)測(cè)面積與合同面積的絕對(duì)值大于等于0.2畝),因此再將上述實(shí)驗(yàn)重復(fù)而獲取得到數(shù)據(jù)重構(gòu)值為:

通過(guò)檢驗(yàn),此兩組數(shù)據(jù)符合數(shù)據(jù)精度要求(盧娟等,2012;李慶華,2011)。

3.2 基于決策樹(shù)的不完全決策表的數(shù)據(jù)補(bǔ)充方法的實(shí)證分析

3.3 身份證信息驗(yàn)證與補(bǔ)遺算法的實(shí)證分析

表2 身份證信息驗(yàn)證結(jié)果

基于前述算法可以得到表2的計(jì)算結(jié)果。1963項(xiàng)數(shù)據(jù)中有24個(gè)數(shù)據(jù)身份證信息存在問(wèn)題,其中存在2個(gè)身份號(hào)碼錯(cuò)誤(算法可以識(shí)別更正),22個(gè)身份證號(hào)碼缺失,需要二次調(diào)查。

研究顯示,第1102條數(shù)據(jù)中,身份證號(hào)末尾應(yīng)更正為8;第1261條數(shù)據(jù)中,身份證號(hào)末尾應(yīng)更正為6。與此同時(shí),修正后數(shù)據(jù)仍需在公示時(shí)請(qǐng)農(nóng)戶查驗(yàn),以確保數(shù)據(jù)精準(zhǔn)性。而22條缺省數(shù)據(jù)則需要公示后二次調(diào)查。

4 社會(huì)性數(shù)據(jù)補(bǔ)遺緩解機(jī)制

農(nóng)村土地承包經(jīng)營(yíng)權(quán)確權(quán)登記頒證是一項(xiàng)關(guān)系國(guó)計(jì)民生的重要普查性工作,因此其有高度的精度要求,故而通過(guò)算法補(bǔ)遺之后需要再次到農(nóng)村進(jìn)行公示及公示后的再次補(bǔ)充調(diào)查。對(duì)于農(nóng)村土地承包經(jīng)營(yíng)權(quán)確權(quán)登記頒證外業(yè)數(shù)據(jù)完善后的公示及公示后的再次補(bǔ)充調(diào)查,為避免數(shù)據(jù)嚴(yán)重缺失和高度失真而引發(fā)農(nóng)戶負(fù)面情緒,因此文章前述部分對(duì)數(shù)據(jù)缺省問(wèn)題做了一系列修正處理,而如何在緩和二次調(diào)查所引發(fā)的農(nóng)戶情緒沖突,文章對(duì)此做了以下一系列探討。

4.1 具有針對(duì)性的二次調(diào)查

研究區(qū)域數(shù)據(jù)整體完整性在96%以上,而在補(bǔ)遺之后,數(shù)據(jù)精度達(dá)到99%左右,經(jīng)過(guò)公示后可根據(jù)農(nóng)戶確認(rèn)表知曉何者為存在問(wèn)題的數(shù)據(jù),基于此可以采取有針對(duì)性的二次調(diào)查。在公示過(guò)程中,不宜出現(xiàn)聚眾現(xiàn)象(農(nóng)民人數(shù)>5人),以規(guī)避農(nóng)戶間相互的負(fù)面信息傳遞而產(chǎn)生的數(shù)據(jù)夸大現(xiàn)象。在二次調(diào)查中,應(yīng)采用1對(duì)1的調(diào)查模式,規(guī)避其他農(nóng)戶對(duì)調(diào)查農(nóng)戶的信息干擾,從而保障數(shù)據(jù)精度。

4.2 權(quán)威文本資料核查

農(nóng)戶受到教育水平、認(rèn)知能力等約束而不能夠清晰知曉證件信息、耕地信息,因此在對(duì)農(nóng)戶進(jìn)行訪談法調(diào)查時(shí)應(yīng)請(qǐng)農(nóng)戶出示相關(guān)證件,以保障數(shù)據(jù)質(zhì)量。訪談法調(diào)查之后應(yīng)通過(guò)地方農(nóng)業(yè)部門(mén)、村委會(huì)協(xié)助,查閱文件資料以實(shí)現(xiàn)調(diào)查信息的驗(yàn)證,倘若存在差異則應(yīng)與農(nóng)戶再次確認(rèn),從而避免數(shù)據(jù)的再次錯(cuò)誤。

4.3 農(nóng)戶參與性緩解方法

確權(quán)工作人員多非本地人,在語(yǔ)言、行為偏好等方面與農(nóng)戶存在差異,從而在溝通上存在一定障礙。對(duì)此,應(yīng)邀請(qǐng)標(biāo)段所在村組知識(shí)水平、人際交往能力、語(yǔ)言能力、權(quán)威性高的長(zhǎng)者予以協(xié)助,參與調(diào)查,從而實(shí)現(xiàn)農(nóng)戶參與,緩解被調(diào)查農(nóng)戶的心理壓力,降低溝通成本,提升數(shù)據(jù)精度質(zhì)量。

5 結(jié)論

本輪農(nóng)村土地承包經(jīng)營(yíng)權(quán)確權(quán)登記頒證是我國(guó)土地制度改革中一項(xiàng)具有里程碑意義的工作,其明確農(nóng)村土地權(quán)屬,將長(zhǎng)期以來(lái)積壓下來(lái)的土地權(quán)屬問(wèn)題有效解決,為土地流轉(zhuǎn)、土地規(guī)模經(jīng)營(yíng)、培育新型農(nóng)業(yè)經(jīng)營(yíng)主體奠定了良好的基礎(chǔ)。當(dāng)前,本輪農(nóng)村土地承包經(jīng)營(yíng)權(quán)確權(quán)登記頒證工作是在試驗(yàn)中進(jìn)行,工程實(shí)施標(biāo)準(zhǔn)不斷根據(jù)實(shí)際發(fā)生的問(wèn)題的變化,數(shù)據(jù)精度、農(nóng)戶認(rèn)可度等方面仍在不斷探索緩解的契合點(diǎn),因此本文就確權(quán)活動(dòng)中數(shù)據(jù)缺省問(wèn)題加以探討,不僅僅支持技術(shù)性彌補(bǔ),更注意到社會(huì)性緩解方案的建立,基于上述研究,本文可凝聚以下兩點(diǎn)主要結(jié)論:

(1)數(shù)據(jù)缺省能夠通過(guò)技術(shù)手段加以彌補(bǔ),這種手段并非簡(jiǎn)單的數(shù)據(jù)重構(gòu),而需要經(jīng)過(guò)一些列數(shù)理理論加以支撐。本文對(duì)地塊信息的彌補(bǔ)采用了基于遺失數(shù)據(jù)重構(gòu)的軟測(cè)量方法、基于決策樹(shù)的不完全決策表的數(shù)據(jù)補(bǔ)充方法,對(duì)身份證信息缺失采用了身份證信息驗(yàn)證與補(bǔ)遺算法加以實(shí)現(xiàn)。

(2)在前人的研究的成果與數(shù)據(jù)運(yùn)行實(shí)踐基礎(chǔ)上表明,基于遺失數(shù)據(jù)重構(gòu)軟測(cè)量方法相比傳統(tǒng)方法更為靈活,而基于決策樹(shù)的不完全決策表的數(shù)據(jù)補(bǔ)充方法則大大提高了數(shù)據(jù)補(bǔ)遺精度。

(3)確權(quán)數(shù)據(jù)經(jīng)過(guò)技術(shù)性補(bǔ)遺之后必須進(jìn)行公示及公示后的再次補(bǔ)充調(diào)查,同時(shí)應(yīng)使農(nóng)戶積極參

與,共同完成數(shù)據(jù)彌補(bǔ)。公示及公示后的再次補(bǔ)充調(diào)查必須是具有針對(duì)性的二次調(diào)查,在調(diào)查之后應(yīng)進(jìn)行權(quán)威文本資料核查,在調(diào)查過(guò)程中積極采用農(nóng)戶參與性緩解方法提高調(diào)查效率。

參考文獻(xiàn)

鄂旭, 高學(xué)東, 武森. 2005. 一種新的遺失數(shù)據(jù)填補(bǔ)方法[J]. 計(jì)算機(jī)工程, 31(20): 6-7.

谷峪, 于戈, 李曉靜, 等. 2010. 基于動(dòng)態(tài)概率路徑事件模型的 RFID 數(shù)據(jù)填補(bǔ)算法[J]. 軟件學(xué)報(bào), 21(3): 438-451.

郭景峰, 米浦波, 劉國(guó)華. 2002. 基于決策樹(shù)的數(shù)據(jù)遺失值填充方法的研究[J]. 計(jì)算機(jī)工程與科學(xué), 24(5): 8-10.

李慶華. 2011. 1 種基于遺失數(shù)據(jù)重構(gòu)的軟測(cè)量方法[J]. 計(jì)算機(jī)與應(yīng)用化學(xué), 28(5): 545-548.

李如平. 2010. 數(shù)據(jù)挖掘中決策樹(shù)分類(lèi)算法的研究[J]. 東華理工大學(xué)學(xué)報(bào):自然科學(xué)版, 33(2): 192-196.

盧娟, 龔晶, 許鳳慧. 2012. 基于規(guī)范變量分析的數(shù)據(jù)重構(gòu)方法及應(yīng)用[J]. 微計(jì)算機(jī)信息, (9): 71-73.

文碩頻, 喬勝勇, 陳彩云, 等. 2003. 基于決策樹(shù)的不完全決策表的數(shù)據(jù)補(bǔ)充及規(guī)則提取[J]. 計(jì)算機(jī)應(yīng)用, 23(11): 17-19.

武森, 馮小東, 單志廣. 2012. 基于不完備數(shù)據(jù)聚類(lèi)的缺失數(shù)據(jù)填補(bǔ)方法[J]. 計(jì)算機(jī)學(xué)報(bào), 35(8): 1726-1738.

張其文, 李明. 2006. 一種缺失數(shù)據(jù)的填補(bǔ)方法[J]. 蘭州理工大學(xué)學(xué)報(bào), 32(2): 102-104.

張偉, 廖曉峰, 吳中福. 2003. 一種基于 Rough 集理論的不完備數(shù)據(jù)分析方法[J]. 模式識(shí)別與人工智能, 16(2): 158-163.

趙飛, 劉奇志, 張剡, 等. 2011. 一種大域數(shù)據(jù)流中缺失值的填充方法[J]. 南京大學(xué)學(xué)報(bào): 自然科學(xué)版, 47(1): 32-39.

趙京梅, 楊志輝. 2010. 模糊多屬性群決策在鐵路系統(tǒng)評(píng)價(jià)中的應(yīng)用[J]. 東華理工大學(xué)學(xué)報(bào):自然科學(xué)版, 33(2): 187-191.

猜你喜歡
缺省遺失身份證
都有身份證
基于“缺省模式”設(shè)計(jì)平臺(tái)的控制系統(tǒng)研發(fā)模式重塑
遺失的靈魂
辣椒也有身份證
遺失的魚(yú)鱗
趣說(shuō)古人的“身份證”
缺省語(yǔ)義模式下話語(yǔ)交際意義研究
尋找遺失的美好
關(guān)聯(lián)期待與缺省推理下缺省語(yǔ)境的生成模式
遺失的愛(ài)