国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于大數(shù)據(jù)的企業(yè)集團(tuán)稅收數(shù)據(jù)采集系統(tǒng)建設(shè)研究

2020-12-14 03:28
長(zhǎng)沙大學(xué)學(xué)報(bào) 2020年2期

劉 靜

(長(zhǎng)沙學(xué)院經(jīng)濟(jì)與管理學(xué)院,湖南 長(zhǎng)沙 410022)

“大數(shù)據(jù)”一詞最早出現(xiàn)在上世紀(jì)80 年代,當(dāng)時(shí)是指涉及的信息資料規(guī)模龐大到技術(shù)條件無(wú)法有效收集、儲(chǔ)存和利用,數(shù)據(jù)瀕于爆炸的情況.隨著區(qū)塊鏈等技術(shù)的發(fā)展,數(shù)據(jù)科技的快速進(jìn)步和數(shù)據(jù)價(jià)值的深度應(yīng)用,步入二十一世紀(jì)后,“大數(shù)據(jù)”已從過(guò)去無(wú)法有效開發(fā)的狀態(tài),轉(zhuǎn)成為推動(dòng)國(guó)家戰(zhàn)略及區(qū)域經(jīng)濟(jì)發(fā)展,促進(jìn)智慧城市建設(shè),企業(yè)轉(zhuǎn)型升級(jí),社會(huì)管理及個(gè)人工作、生活等各領(lǐng)域創(chuàng)新和變革的重要工具.企業(yè)集團(tuán)稅收風(fēng)險(xiǎn)是稅收管理的重點(diǎn),對(duì)提升稅收征管效能和經(jīng)濟(jì)運(yùn)行質(zhì)量具有重要意義.利用大數(shù)據(jù)技術(shù)對(duì)企業(yè)集團(tuán)不同來(lái)源的稅收數(shù)據(jù)進(jìn)行有效處理,已成為當(dāng)前促進(jìn)企業(yè)集團(tuán)稅收信息采集能力提升,推進(jìn)稅收管理現(xiàn)代化的客觀要求和必然選項(xiàng).囿于研究問(wèn)題的實(shí)踐前沿性,關(guān)于企業(yè)集團(tuán)稅收數(shù)據(jù)收集的研究資料較為缺乏,目前仍以企業(yè)界和稅務(wù)界的具體實(shí)踐為主.自2009年國(guó)家稅務(wù)總局成立大企業(yè)司以來(lái),企業(yè)集團(tuán)的稅收管理經(jīng)歷了從稅收風(fēng)險(xiǎn)為主向以內(nèi)控風(fēng)險(xiǎn)管理為主的轉(zhuǎn)變,企業(yè)集團(tuán)稅收數(shù)據(jù)采集系統(tǒng)建設(shè)的研究,正是基于這一轉(zhuǎn)變的需要.

1 企業(yè)集團(tuán)稅收數(shù)據(jù)的來(lái)源及存在不足

1.1 數(shù)據(jù)采集來(lái)源

企業(yè)集團(tuán)稅收風(fēng)險(xiǎn)分析指的是依托現(xiàn)代信息技術(shù)手段和分析平臺(tái),把登記、申報(bào)、征收、退稅、發(fā)票管理、情報(bào)交報(bào)等過(guò)程中產(chǎn)生的與企業(yè)集團(tuán)有關(guān)的信息進(jìn)行綜合匯總和分類,運(yùn)用數(shù)據(jù)清洗、去軌跡等操作方法,從海量的稅收經(jīng)濟(jì)數(shù)據(jù)中獲得企業(yè)集團(tuán)稅收風(fēng)險(xiǎn)的分析數(shù)據(jù).這采用了多種分析技術(shù)和分析模型,對(duì)企業(yè)集團(tuán)及其成員單位的涉稅數(shù)據(jù)進(jìn)行整合分析,從中了解企業(yè)集團(tuán)內(nèi)部控制和稅收遵從的狀況,將稅務(wù)機(jī)關(guān)擁有的大數(shù)據(jù)優(yōu)勢(shì)演變成稅收征管的信息優(yōu)勢(shì),并提醒企業(yè)集團(tuán)其潛在的稅收風(fēng)險(xiǎn),進(jìn)而提升企業(yè)集團(tuán)稅收遵從意愿,實(shí)現(xiàn)征管資源的合理配置和風(fēng)險(xiǎn)應(yīng)對(duì)的精確指導(dǎo).其中,準(zhǔn)確全面采集企業(yè)集團(tuán)涉稅數(shù)據(jù)是對(duì)其進(jìn)行有效稅收風(fēng)險(xiǎn)分析工作的基礎(chǔ).

1.1.1 稅務(wù)征管系統(tǒng)數(shù)據(jù)

稅務(wù)管理各個(gè)環(huán)節(jié)產(chǎn)生的涉稅信息資源,構(gòu)成了稅務(wù)機(jī)關(guān)征管信息系統(tǒng)的主體數(shù)據(jù).隨著金稅三期在全國(guó)的正式運(yùn)行,全國(guó)稅務(wù)系統(tǒng)已經(jīng)建設(shè)形成了總局、省局、地市局、區(qū)縣局的四級(jí)廣域網(wǎng),財(cái)稅庫(kù)銀橫向聯(lián)網(wǎng)實(shí)現(xiàn)全國(guó)范圍的覆蓋.企業(yè)集團(tuán)信息都被納入管理,每天都有大量的數(shù)據(jù)產(chǎn)生并沉淀.

1.1.2 企業(yè)集團(tuán)申報(bào)數(shù)據(jù)

納稅人報(bào)送的信息屬于基礎(chǔ)信息.企業(yè)集團(tuán)由于存在多法人、多層級(jí)的組織結(jié)構(gòu),除了日常的申報(bào)數(shù)據(jù)外,還有其集團(tuán)內(nèi)部各層級(jí)在加強(qiáng)稅收管理、各層級(jí)財(cái)務(wù)部門日常管理中等產(chǎn)生的大量涉稅數(shù)據(jù),以及企業(yè)集團(tuán)開展涉稅自查、涉稅申報(bào)等產(chǎn)生的數(shù)據(jù),以及企業(yè)集團(tuán)內(nèi)控管理產(chǎn)生的調(diào)查數(shù)據(jù)等.

1.1.3 第三方涉稅數(shù)據(jù)

第三方數(shù)據(jù)是指獨(dú)立于稅務(wù)機(jī)關(guān)和納稅人之外的其他政府部門、金融、銀行等服務(wù)部門或銀監(jiān)會(huì)、證監(jiān)會(huì)等監(jiān)管機(jī)構(gòu)掌握的涉稅相關(guān)數(shù)據(jù).第三方涉稅數(shù)據(jù)既是政府各部門的公共資源,又是稅務(wù)部門寶貴且急需的征管資源.2008 年5 月1 日實(shí)施的《中華人民共和國(guó)政府信息公開條例》,已從制度層面為數(shù)據(jù)共享掃清了障礙.目前,湖南省14個(gè)市州均已建立政府綜合治稅平臺(tái),稅務(wù)部門可以通過(guò)該平臺(tái)采集與納稅人生產(chǎn)經(jīng)營(yíng)有關(guān)的來(lái)自于發(fā)改委、商務(wù)、建交、工商、統(tǒng)計(jì)、金融和國(guó)土房管等第三方部門的各類涉稅數(shù)據(jù),基本實(shí)現(xiàn)了政務(wù)數(shù)據(jù)的共享共通,提高了稅收治理的社會(huì)參與度和征管效能.

1.1.4 互聯(lián)網(wǎng)稅收數(shù)據(jù)

互聯(lián)網(wǎng)是一個(gè)無(wú)限的信息寶庫(kù),從企業(yè)集團(tuán)掌握涉稅數(shù)據(jù)的情況來(lái)看,既有格式數(shù)據(jù),也有難以整理的圖片數(shù)據(jù).數(shù)據(jù)的內(nèi)容涉及企業(yè)集團(tuán)公開的財(cái)務(wù)稅收,重大經(jīng)營(yíng)事項(xiàng)、股權(quán)轉(zhuǎn)讓等方面數(shù)據(jù).行業(yè)協(xié)會(huì)網(wǎng)站公布的行業(yè)主要經(jīng)營(yíng)指標(biāo)、價(jià)格數(shù)據(jù)、發(fā)展趨勢(shì).各大新聞?wù)军c(diǎn)、論壇、博客和微信等提供的搜索數(shù)據(jù),以及對(duì)稅收政策、稅收征管、稅收法制的討論數(shù)據(jù)等.隨著我國(guó)企業(yè)工商數(shù)據(jù)公示制度的落地執(zhí)行,任何一家企業(yè)的基本情況與基本信息都可以在企業(yè)工商官網(wǎng)上查到,企業(yè)集團(tuán)的經(jīng)營(yíng)信息也能夠被及時(shí)了解.這種外部涉稅數(shù)據(jù)和公開信息有力地節(jié)約了稅務(wù)機(jī)關(guān)的征管成本.

1.1.5 其他相關(guān)數(shù)據(jù)

為便于科學(xué)研究,Wind、Osiris、BVD等商業(yè)數(shù)據(jù)庫(kù)保持了企業(yè)集團(tuán)數(shù)據(jù)的及時(shí)更新,上市公司特別是跨境企業(yè)的經(jīng)營(yíng)季報(bào)、年報(bào),同行業(yè)企業(yè)經(jīng)營(yíng)、財(cái)務(wù)數(shù)據(jù)及其他相關(guān)的稅收數(shù)據(jù)一應(yīng)俱全.此外,企業(yè)問(wèn)卷調(diào)查、國(guó)際稅收情報(bào)交換等也是采集企業(yè)集團(tuán)涉稅信息的有效方式.

1.2 存在不足

數(shù)據(jù)采集質(zhì)量的高低直接影響企業(yè)集團(tuán)稅收風(fēng)險(xiǎn)分析的質(zhì)效,就目前企業(yè)集團(tuán)采集的數(shù)據(jù)情況而言,與“大數(shù)據(jù)”要求的效率和精度還有一定差距.

1.2.1 數(shù)據(jù)采集的完整性需要加強(qiáng)

納稅人作為一個(gè)“理性的經(jīng)濟(jì)人”,在納稅操作當(dāng)中考慮更多的是如何使自身利益最大化,在這一先決條件下很可能會(huì)隱藏一些對(duì)自己不利的涉稅信息.企業(yè)集團(tuán)納稅申報(bào)數(shù)據(jù)采集表經(jīng)常只填寫必填項(xiàng)目,不是關(guān)鍵的項(xiàng)目往往會(huì)被忽略掉.許多數(shù)據(jù)欄要么是空白要么填零,導(dǎo)致數(shù)據(jù)缺漏現(xiàn)象存在.而且,稅務(wù)部門對(duì)企業(yè)集團(tuán)的稅收管理,仍以統(tǒng)計(jì)整理的紙質(zhì)材料為主,對(duì)于企業(yè)集團(tuán)的日常經(jīng)營(yíng)數(shù)據(jù)并沒有接入管理端口,及時(shí)掌握動(dòng)態(tài)信息.此外,對(duì)于銀行、海關(guān)、房產(chǎn)管理、車輛管理等部門提供企業(yè)集團(tuán)下屬公司的注冊(cè)登記、經(jīng)營(yíng)等涉稅信息,還沒有有效的采集辦法.目前,對(duì)于企業(yè)集團(tuán)的非結(jié)構(gòu)化數(shù)據(jù)處理還處于起步階段,網(wǎng)絡(luò)搜索的全面性和精確度都有待提高.

1.2.2 數(shù)據(jù)采集的及時(shí)性需要加快

近年來(lái),稅務(wù)系統(tǒng)在信息化建設(shè)方面投入了非常多的人力、財(cái)力,構(gòu)建了諸多系統(tǒng),開發(fā)了很多軟件,但未能將大量可用的信息及時(shí)進(jìn)行整理共享,事實(shí)上形成了“信息孤島”,使稅務(wù)機(jī)關(guān)很難根據(jù)征管情況的變化作出反應(yīng).

同時(shí),第三方數(shù)據(jù)公開體系缺失,即使一些數(shù)據(jù)的開放并未違反《中華人民共和國(guó)保守國(guó)家秘密法》,但是封閉的條塊管理使得某些政府部門需要向上級(jí)部門匯報(bào)及領(lǐng)導(dǎo)層層審批,待上級(jí)相互協(xié)商、審批同意后,還要履行如填寫各級(jí)審批表、向數(shù)據(jù)所在部門征求意見等各種程序,之后數(shù)據(jù)才能向相關(guān)單位和公眾開放.公開數(shù)據(jù)也大多數(shù)都以再加工的信息為主,原始數(shù)據(jù)較少,一些政府的門戶網(wǎng)站信息更新嚴(yán)重滯后,基礎(chǔ)數(shù)據(jù)匱乏.由于審批程序的紛繁復(fù)雜加上缺乏從多個(gè)政府機(jī)構(gòu)的離散數(shù)據(jù)庫(kù)中提取有用信息的跨機(jī)構(gòu)解決方法,導(dǎo)致稅務(wù)部門無(wú)法及時(shí)獲取有關(guān)數(shù)據(jù).而《稅收征管法》及其實(shí)施細(xì)則僅規(guī)定政府各有關(guān)部門和單位應(yīng)當(dāng)支持、協(xié)助稅務(wù)機(jī)關(guān)依法履行職責(zé),但對(duì)具體采取的方式和程序、違反規(guī)定應(yīng)如何追究和處罰等均沒有具體規(guī)定和處理措施.

1.2.3 數(shù)據(jù)采集的真實(shí)性需要改進(jìn)

稅務(wù)系統(tǒng)內(nèi)部的金稅三期系統(tǒng)和企業(yè)集團(tuán)的外網(wǎng)申報(bào)平臺(tái)雖然是不同的平臺(tái),但來(lái)自與其中的數(shù)據(jù)彼此之間卻存在著重復(fù)或者交叉,這種同一項(xiàng)目數(shù)據(jù)的多樣性使得稅務(wù)部門在數(shù)據(jù)采集時(shí)面臨對(duì)其真實(shí)性的判斷與篩選.有些企業(yè)在報(bào)送財(cái)務(wù)會(huì)計(jì)報(bào)表和納稅申報(bào)表時(shí)隱匿收入、少報(bào)收入,甚至造假帳,反映的稅源狀況虛假不真實(shí),如果稅務(wù)部門不加以區(qū)別而按照虛假稅源信息征稅勢(shì)必會(huì)造成稅收收入流失.如BVD數(shù)據(jù)庫(kù)提供的中國(guó)企業(yè)財(cái)務(wù)信息分析庫(kù),收錄了30余萬(wàn)家中國(guó)內(nèi)地上市與非上市公司、企業(yè)的財(cái)務(wù)分析數(shù)據(jù),這與稅務(wù)部門所掌握的企業(yè)集團(tuán)有限征管數(shù)據(jù)相比,還存在一定程度的差距.

2 企業(yè)集團(tuán)稅收數(shù)據(jù)采集的國(guó)外借鑒

2.1 注重大數(shù)據(jù)的完整性

2.1.1 重視大數(shù)據(jù)的規(guī)劃管理

英國(guó)政府是最早推進(jìn)大數(shù)據(jù)規(guī)劃的國(guó)家,為提高處理跨部門信息交換的能力,英國(guó)政府2004 年就啟動(dòng)了水平掃描中心項(xiàng)目.英國(guó)皇家稅務(wù)與海關(guān)總署利用涵蓋了23個(gè)資源系統(tǒng)和81種文件格式,共儲(chǔ)存了8億多個(gè)記錄的高端軟件程序來(lái)識(shí)別和顯示風(fēng)險(xiǎn),以達(dá)到排除地方差異影響的目的.英國(guó)政府重點(diǎn)分析了企業(yè)運(yùn)營(yíng)過(guò)程中整體性的趨勢(shì)與規(guī)律,并給予了識(shí)別和排序.

2.1.2 加強(qiáng)企業(yè)數(shù)據(jù)倉(cāng)庫(kù)建設(shè)

澳大利亞國(guó)家稅務(wù)局2007年開發(fā)了企業(yè)數(shù)據(jù)倉(cāng)庫(kù).2010年,澳大利亞政府推出了電子密鑰供澳大利亞政府部門使用.該稅源監(jiān)控平臺(tái)與海關(guān)、銀行等部門進(jìn)行了聯(lián)網(wǎng),在法律許可的范圍內(nèi)可以隨時(shí)跨庫(kù)查詢調(diào)閱所需資料.

2.1.3 重視網(wǎng)絡(luò)爬蟲技術(shù)應(yīng)用

德國(guó)、荷蘭、瑞典等國(guó)稅務(wù)部門,較早利用網(wǎng)絡(luò)爬蟲技術(shù),自動(dòng)采集來(lái)自于twitter、facebook、互動(dòng)類論壇等社交媒體的涉稅數(shù)據(jù)信息.通過(guò)對(duì)網(wǎng)絡(luò)涉稅信息和稅收管理信息的比對(duì)分析,用于稅務(wù)管理和稅收政策的制定.

2.2 重視大數(shù)據(jù)的開放性

2.2.1 及早做好大數(shù)據(jù)管理的立法

美國(guó)是世界上第一個(gè)制定法律法規(guī)體系保障政府公共數(shù)據(jù)開放的國(guó)家.美國(guó)各政府部門根據(jù)法律要求,將數(shù)據(jù)以及數(shù)據(jù)庫(kù)上傳至美國(guó)政府?dāng)?shù)據(jù)網(wǎng)站,再將所有的政府?dāng)?shù)據(jù)分類整理并匯總,分門別類供公眾使用.2009年美國(guó)頒布了《開放政府指令》,確立了“透明”“參與”和“協(xié)同”原則,是美國(guó)政府在公共數(shù)據(jù)開放方面的最新進(jìn)展.該法案鼓勵(lì)美國(guó)政府不斷豐富公共數(shù)據(jù)開放網(wǎng)站的內(nèi)容,及時(shí)更新技術(shù)工具.此后,美國(guó)政府又相繼添加了數(shù)據(jù)分級(jí)評(píng)定、高級(jí)搜索、在線交流以及社交網(wǎng)絡(luò)互動(dòng)等新功能,通過(guò)瀏覽美國(guó)政府?dāng)?shù)據(jù)網(wǎng)站,社會(huì)公眾能夠獲取所有公布的美國(guó)政府?dāng)?shù)據(jù),也能夠?yàn)槎悇?wù)部門查找所需的公共數(shù)據(jù)提供充分的便利條件.

2.2.2 制定大數(shù)據(jù)開放的國(guó)家戰(zhàn)略

英國(guó)在2012年11月推出政府?dāng)?shù)字化戰(zhàn)略,數(shù)據(jù)開放被上升到國(guó)家戰(zhàn)略層面,最終的目標(biāo)是真正實(shí)現(xiàn)任何一個(gè)有權(quán)使用的用戶都會(huì)選擇簡(jiǎn)單方便的數(shù)字化服務(wù),并且將投資近千萬(wàn)英鎊打造世界上第一個(gè)“開放數(shù)據(jù)研究所”.

2.2.3 加強(qiáng)政府公共信息的共享交流

澳大利亞政府從2009年開始積極推廣公共數(shù)據(jù)開放的理念,將Data.gov.au作為澳政府信息目錄.澳政府為該網(wǎng)站提供了114個(gè)部門的1120個(gè)數(shù)據(jù)庫(kù)和10余個(gè)應(yīng)用軟件供用戶數(shù)據(jù)下載,提倡用戶通過(guò)對(duì)工具和應(yīng)用程序進(jìn)行更新來(lái)提升滿意度,并提供該網(wǎng)站以外其他數(shù)據(jù)的目錄和資源的鏈接.

2.3 確保大數(shù)據(jù)的真實(shí)性

2.3.1 確保稅收數(shù)據(jù)輸入的真實(shí)性

德國(guó)、日本等國(guó)規(guī)定,稅收數(shù)據(jù)必須經(jīng)過(guò)會(huì)計(jì)師等專業(yè)從業(yè)人員的審核后才能錄入稅收信息系統(tǒng),這有效保障了稅收信息系統(tǒng)中輸入數(shù)據(jù)的真實(shí)性.

2.3.2 加強(qiáng)稅收數(shù)據(jù)輸入的事后審查

英國(guó)在稅收信息系統(tǒng)中插入了一個(gè)“事后檢查程序”,針對(duì)企業(yè)納稅申報(bào)的數(shù)據(jù)開展稅收分析,如果出現(xiàn)納稅申報(bào)比對(duì)異常,該納稅人將作為重點(diǎn)風(fēng)險(xiǎn)排查對(duì)象.

2.3.3 對(duì)輸入稅收數(shù)據(jù)進(jìn)行交叉稽核

澳大利亞稅務(wù)部門利用龐大的信息系統(tǒng)和可以跨庫(kù)查閱數(shù)據(jù)的便利,對(duì)企業(yè)集團(tuán)申報(bào)的情況進(jìn)行對(duì)比分析,實(shí)現(xiàn)交叉稽核,并自動(dòng)使用風(fēng)險(xiǎn)過(guò)濾器對(duì)所有企業(yè)集團(tuán)的稅收數(shù)據(jù)進(jìn)行一年兩次的篩選.風(fēng)險(xiǎn)過(guò)濾器篩選出數(shù)據(jù)比對(duì)出存在潛在高風(fēng)險(xiǎn)的納稅企業(yè)之后,由高級(jí)技術(shù)專家將對(duì)其進(jìn)行人工分析.

3 企業(yè)集團(tuán)稅收數(shù)據(jù)采集系統(tǒng)的構(gòu)建

3.1 稅收數(shù)據(jù)采集的模式比較

與傳統(tǒng)模式下的稅收數(shù)據(jù)采集所不同,大數(shù)據(jù)模式下的稅收數(shù)據(jù)采集更具有海量的數(shù)據(jù)采集規(guī)模、高速的數(shù)據(jù)采集流轉(zhuǎn)、多樣的數(shù)據(jù)采集類型和低密度的數(shù)據(jù)采集價(jià)值等特點(diǎn).

從采集規(guī)模上看,大數(shù)據(jù)模式下的稅收數(shù)據(jù)采集更注重原始數(shù)據(jù)的直接采集,與傳統(tǒng)模式下的稅收數(shù)據(jù)整理傳輸存在本質(zhì)上的區(qū)別.由于企業(yè)集團(tuán)多層級(jí)、跨區(qū)域、較分散的經(jīng)營(yíng)屬性,其內(nèi)部產(chǎn)生的諸如生產(chǎn)、銷售、庫(kù)存等即時(shí)數(shù)據(jù)是海量的.從采集速度上看,傳統(tǒng)模式下的稅收數(shù)據(jù)一般要經(jīng)過(guò)企業(yè)集團(tuán)各級(jí)財(cái)務(wù)部門整理匯總、分類分析、歸口報(bào)送等過(guò)程,速度和反應(yīng)能力上明顯不足.大數(shù)據(jù)模式下憑借數(shù)據(jù)中心的集中處理能力,稅收數(shù)據(jù)采集在量級(jí)上有大幅度提升,更注重的是數(shù)據(jù)采集和傳輸速度.從采集類型上看,大數(shù)據(jù)模式下的稅收數(shù)據(jù)采集也借助遍布于企業(yè)集團(tuán)各單位的控制器、控制系統(tǒng)、計(jì)量?jī)x表等進(jìn)行非結(jié)構(gòu)化數(shù)據(jù)的即時(shí)轉(zhuǎn)化,數(shù)據(jù)的來(lái)源和廣度較傳統(tǒng)的采集方式有了極大拓展.從采集利用上看,大數(shù)據(jù)的稅收數(shù)據(jù)采集分析更多的是一種原始數(shù)據(jù)基礎(chǔ)上的比對(duì)加工,進(jìn)而驗(yàn)證稅收數(shù)據(jù)來(lái)源的真實(shí)準(zhǔn)確性.相比較稅收數(shù)據(jù)的采集數(shù)量,大數(shù)據(jù)稅收數(shù)據(jù)采集是一個(gè)密度較低的采集模式,單個(gè)稅收數(shù)據(jù)的采集價(jià)值相對(duì)較低.隨著企業(yè)集團(tuán)涉稅數(shù)據(jù)規(guī)模的急劇擴(kuò)大和對(duì)企業(yè)集團(tuán)稅收管理要求的不斷提升,加強(qiáng)大數(shù)據(jù)在企業(yè)集團(tuán)稅收管理中的應(yīng)用也是大勢(shì)所趨.表1列舉了傳統(tǒng)模式下稅收數(shù)據(jù)采集模式和大數(shù)據(jù)模式下稅收數(shù)據(jù)的采集模式的區(qū)別.

3.2 企業(yè)集團(tuán)稅收數(shù)據(jù)采集系統(tǒng)的基本架構(gòu)

構(gòu)建企業(yè)集團(tuán)稅收數(shù)據(jù)采集系統(tǒng)的設(shè)計(jì),需要借鑒各國(guó)加強(qiáng)稅收數(shù)據(jù)采集經(jīng)驗(yàn),將大數(shù)據(jù)及數(shù)據(jù)挖掘技術(shù)應(yīng)用到稅收采集工作中.一般而言,企業(yè)集團(tuán)的大數(shù)據(jù)采集系統(tǒng)從架構(gòu)上分為應(yīng)用區(qū)和數(shù)據(jù)庫(kù)區(qū)兩塊.應(yīng)用區(qū)直接與企業(yè)集團(tuán)下屬公司財(cái)務(wù)、經(jīng)營(yíng)端口連接,用于存儲(chǔ)企業(yè)集團(tuán)各下屬公司上傳的稅收數(shù)據(jù)并進(jìn)行非格式稅收數(shù)據(jù)的清洗、各類稅收數(shù)據(jù)上傳等操作,包括數(shù)據(jù)抽取、清洗轉(zhuǎn)換、數(shù)據(jù)傳輸?shù)裙ぷ鳎饕蝿?wù)是實(shí)現(xiàn)稅收數(shù)據(jù)采集的全網(wǎng)搜索,采集數(shù)據(jù)的清晰轉(zhuǎn)換、大規(guī)模稅收數(shù)據(jù)的格式化儲(chǔ)存,以及各類稅收數(shù)據(jù)的整理歸集等.數(shù)據(jù)庫(kù)區(qū)用于接收大數(shù)據(jù)采集系統(tǒng)應(yīng)用層的稅收數(shù)據(jù)整合,整合之后上傳數(shù)據(jù)信息平臺(tái),以及稅收數(shù)據(jù)的監(jiān)控、分析和統(tǒng)計(jì)匯總等建立標(biāo)準(zhǔn)數(shù)據(jù)庫(kù)的工作.整體上為便于企業(yè)集團(tuán)稅收數(shù)據(jù)管理架構(gòu)的擴(kuò)展,稅收數(shù)據(jù)采集體系應(yīng)采取SOA架構(gòu),以便于稅收數(shù)據(jù)管理架構(gòu)根據(jù)應(yīng)用需要進(jìn)行分布式部署、組合和使用.

3.2.1 企業(yè)集團(tuán)稅收數(shù)據(jù)的數(shù)據(jù)抽取

稅收數(shù)據(jù)抽取模塊是通過(guò)企業(yè)集團(tuán)各級(jí)單位的財(cái)務(wù)、經(jīng)營(yíng)投資和資產(chǎn)管理等信息系統(tǒng),以及相關(guān)部門監(jiān)管企業(yè)集團(tuán)的信息系統(tǒng),定期抽取數(shù)據(jù)歸集至稅收數(shù)據(jù)采集應(yīng)用區(qū).稅收數(shù)據(jù)集接口可以采取中間庫(kù)或者視圖兩種方式,由稅收數(shù)據(jù)抽取模塊定期從各接口讀取稅收數(shù)據(jù),并且對(duì)稅收數(shù)據(jù)采集應(yīng)用區(qū)中數(shù)據(jù)表和表中的字段選擇性讀取.稅收數(shù)據(jù)抽取模塊分為結(jié)構(gòu)化數(shù)據(jù)庫(kù)的連接、非結(jié)構(gòu)化數(shù)據(jù)庫(kù)連接和接口管理三個(gè)部分功能.其中,數(shù)據(jù)庫(kù)連接數(shù)據(jù)讀取設(shè)置和實(shí)時(shí)調(diào)度功能,接口管理包括接口連接和接口配置功能.而稅收數(shù)據(jù)抽取模塊系統(tǒng)的處理流程為:一是數(shù)據(jù)抽取模塊對(duì)數(shù)據(jù)庫(kù)進(jìn)行查詢操作,讀取企業(yè)集團(tuán)各級(jí)單位的中間庫(kù)或者視圖數(shù)據(jù)信息;二是稅收數(shù)據(jù)抽取模塊通過(guò)抽取時(shí)間的比對(duì),集中對(duì)增量稅收數(shù)據(jù)進(jìn)行抽取和重點(diǎn)比對(duì).

3.2.2 企業(yè)集團(tuán)稅收數(shù)據(jù)的清洗轉(zhuǎn)化

數(shù)據(jù)清洗轉(zhuǎn)換是加強(qiáng)企業(yè)集團(tuán)稅收數(shù)據(jù)管理和利用的關(guān)鍵環(huán)節(jié).由于大數(shù)據(jù)的低密度價(jià)值屬性,企業(yè)集團(tuán)數(shù)據(jù)特別是非結(jié)構(gòu)化數(shù)據(jù)在轉(zhuǎn)化過(guò)程中存在海量的數(shù)據(jù)量和數(shù)據(jù)流,提升轉(zhuǎn)化的效率和抓住關(guān)鍵字句,就成為了做好企業(yè)集團(tuán)稅收數(shù)據(jù)轉(zhuǎn)化的關(guān)鍵.其中,及早著手起草《企業(yè)集團(tuán)數(shù)據(jù)信息平臺(tái)稅收數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范》最為重要,這是做好稅收數(shù)據(jù)清洗轉(zhuǎn)換的基礎(chǔ)和依據(jù).要依據(jù)企業(yè)集團(tuán)所在行業(yè)和經(jīng)營(yíng)特點(diǎn),明確規(guī)范稅收數(shù)據(jù)的字段名、類型、大小和數(shù)據(jù)字典的定義和標(biāo)準(zhǔn).稅務(wù)部門對(duì)企業(yè)集團(tuán)輔導(dǎo)建立稅收數(shù)據(jù)規(guī)范時(shí),要注意做好數(shù)據(jù)關(guān)鍵詞的調(diào)試,并在企業(yè)集團(tuán)各單位的各財(cái)務(wù)、經(jīng)營(yíng)端口建立起前置機(jī)數(shù)據(jù)庫(kù).

企業(yè)集團(tuán)稅收數(shù)據(jù)清晰轉(zhuǎn)化的處理流程為:一是對(duì)稅收數(shù)據(jù)進(jìn)行校驗(yàn),對(duì)被抽取的稅收數(shù)據(jù)做好清洗、轉(zhuǎn)化操作.在過(guò)濾掉多余的表字段的同時(shí),補(bǔ)充缺少的表字段,并將不合格的稅收數(shù)據(jù)轉(zhuǎn)化為合格的稅收數(shù)據(jù).二是在企業(yè)集團(tuán)各單位的每個(gè)財(cái)務(wù)、經(jīng)營(yíng)端口配置前置機(jī),將各端口產(chǎn)生的數(shù)據(jù)全部轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),并傳入各自的前置機(jī)數(shù)據(jù)庫(kù).三是做好前置機(jī)數(shù)據(jù)庫(kù)的稅收數(shù)據(jù)調(diào)度和管理.做好稅收數(shù)據(jù)的輸入、轉(zhuǎn)化、過(guò)濾和輸出,加強(qiáng)企業(yè)集團(tuán)各單位前置機(jī)數(shù)據(jù)庫(kù)的稅收數(shù)據(jù)增加、刪除、修改和查詢等工作.

3.2.3 企業(yè)集團(tuán)稅收數(shù)據(jù)的即時(shí)傳輸

企業(yè)集團(tuán)稅收數(shù)據(jù)的傳輸實(shí)現(xiàn)著應(yīng)用區(qū)和數(shù)據(jù)庫(kù)區(qū)之間的數(shù)據(jù)傳送,可以將存放于企業(yè)集團(tuán)各單位財(cái)務(wù)、經(jīng)營(yíng)前置機(jī)數(shù)據(jù)庫(kù)的稅收數(shù)據(jù),經(jīng)過(guò)相應(yīng)轉(zhuǎn)換后變成存放于數(shù)據(jù)庫(kù)區(qū)的整合數(shù)據(jù),并最終按照要求實(shí)現(xiàn)稅收數(shù)據(jù)的即時(shí)整合上傳.企業(yè)集團(tuán)稅收數(shù)據(jù)的即時(shí)傳輸包括以下流程:一是企業(yè)集團(tuán)各單位財(cái)務(wù)、經(jīng)營(yíng)端口稅收數(shù)據(jù)同步到稅收數(shù)據(jù)傳輸模塊的應(yīng)用區(qū)臨時(shí)數(shù)據(jù)庫(kù);二是應(yīng)用區(qū)數(shù)據(jù)庫(kù)將稅收數(shù)據(jù)按照項(xiàng)目、時(shí)間等方式進(jìn)行整理合并,然后同步到稅收數(shù)據(jù)庫(kù)的數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)區(qū).三是通過(guò)設(shè)置權(quán)限和傳輸要求,實(shí)現(xiàn)數(shù)據(jù)庫(kù)區(qū)稅收數(shù)據(jù)的即時(shí)上傳至企業(yè)集團(tuán)稅收數(shù)據(jù)信息平臺(tái)數(shù)據(jù)庫(kù).

3.2.4 企業(yè)集團(tuán)稅收數(shù)據(jù)的實(shí)時(shí)監(jiān)控

企業(yè)集團(tuán)稅收數(shù)據(jù)監(jiān)控模塊發(fā)揮著對(duì)稅收數(shù)據(jù)的抽取、轉(zhuǎn)換和傳輸情況的監(jiān)控作用.企業(yè)集團(tuán)各單位財(cái)務(wù)、經(jīng)營(yíng)端口通過(guò)專網(wǎng)與企業(yè)集團(tuán)稅收數(shù)據(jù)平臺(tái)聯(lián)通,對(duì)網(wǎng)絡(luò)進(jìn)行實(shí)時(shí)監(jiān)控,并及時(shí)顯示上傳過(guò)程中出現(xiàn)的問(wèn)題顯示并預(yù)警.企業(yè)集團(tuán)稅收數(shù)據(jù)的實(shí)時(shí)監(jiān)控包括以下流程:一是對(duì)稅收數(shù)據(jù)抽取、轉(zhuǎn)換和傳輸模塊配置的ETL、ssh、vpn等服務(wù)的節(jié)點(diǎn)予以監(jiān)控;二是定期對(duì)節(jié)點(diǎn)的相關(guān)服務(wù)進(jìn)行掃描監(jiān)控,對(duì)發(fā)現(xiàn)問(wèn)題的監(jiān)控節(jié)點(diǎn)采取郵件、短信等方式的報(bào)警;三是自動(dòng)記錄各運(yùn)行節(jié)點(diǎn)的工作狀況,并自動(dòng)保存記錄.

3.3 企業(yè)集團(tuán)稅收數(shù)據(jù)采集體系的技術(shù)維護(hù)

在構(gòu)建企業(yè)集團(tuán)稅收數(shù)據(jù)采集體系的同時(shí),考慮到大數(shù)據(jù)對(duì)數(shù)據(jù)管理的技術(shù)要求,還應(yīng)當(dāng)做好相應(yīng)的技術(shù)維護(hù),具體有.

3.3.1 做好標(biāo)準(zhǔn)化稅收數(shù)據(jù)接口的技術(shù)維護(hù)

根據(jù)企業(yè)集團(tuán)稅收數(shù)據(jù)采集的SOA架構(gòu),對(duì)企業(yè)集團(tuán)已有的稅收數(shù)據(jù)應(yīng)用系統(tǒng)最大程度復(fù)用和廣泛兼容,做好標(biāo)準(zhǔn)化接口的服務(wù)和業(yè)務(wù)流程編制.通過(guò)建立相應(yīng)的編碼規(guī)則,結(jié)構(gòu)規(guī)范、數(shù)據(jù)整合等實(shí)現(xiàn)高度靈活性和擴(kuò)展性.

3.3.2 做好稅收數(shù)據(jù)安全性加密的技術(shù)維護(hù)

采用加密技術(shù)、訪問(wèn)控制技術(shù)、認(rèn)證技術(shù)和安全審計(jì)技術(shù)等多種技術(shù),保證稅收數(shù)據(jù)安全不受侵犯.其中,稅收數(shù)據(jù)采集可在各端口添加消息認(rèn)證,數(shù)據(jù)傳輸可采用SSL技術(shù)在通信雙方建立加密通道,以保證數(shù)據(jù)傳輸機(jī)密性.數(shù)據(jù)監(jiān)控可采用審計(jì)技術(shù)自動(dòng)記錄系統(tǒng)運(yùn)行情況,并監(jiān)控其中的違規(guī)操作.

3.3.3 滿足稅收數(shù)據(jù)傳輸和儲(chǔ)存的技術(shù)要求

信息系統(tǒng)的硬軟件安全是保證稅收數(shù)據(jù)安全性的基礎(chǔ).為保證稅收數(shù)據(jù)的安全,企業(yè)集團(tuán)各單位歸集端口和運(yùn)行環(huán)境應(yīng)當(dāng)采用國(guó)產(chǎn)服務(wù)器操作系統(tǒng),各數(shù)據(jù)庫(kù)軟件也應(yīng)當(dāng)采用國(guó)產(chǎn)數(shù)據(jù)庫(kù)軟件進(jìn)行數(shù)據(jù)儲(chǔ)存,并做好定期備份.

4 做好企業(yè)集團(tuán)稅收數(shù)據(jù)采集的重點(diǎn)

企業(yè)集團(tuán)涉稅數(shù)據(jù)采集質(zhì)量的高低以及廣度,直接決定著數(shù)據(jù)應(yīng)用分析工作的結(jié)果.我們可以從以下方面提高企業(yè)集團(tuán)稅收數(shù)據(jù)采集的質(zhì)量和廣度.

4.1 高度重視稅收數(shù)據(jù)采集的頂層設(shè)計(jì)

當(dāng)大數(shù)據(jù)上升為國(guó)家資源時(shí),尤其是企業(yè)集團(tuán)稅收數(shù)據(jù)安全,必然要求中央政府從國(guó)家層面做出統(tǒng)一的制度或政策安排,提供必要法律約束與保障.制訂統(tǒng)一的規(guī)范技術(shù)和第三方數(shù)據(jù)采集標(biāo)準(zhǔn),將住建、工商、銀行、海關(guān)等部門掌握的宏觀經(jīng)濟(jì)指標(biāo)和涉及企業(yè)集團(tuán)的稅收信息納入數(shù)據(jù)倉(cāng)庫(kù),以金稅三期運(yùn)行為契機(jī),統(tǒng)一全國(guó)稅收征管數(shù)據(jù)標(biāo)準(zhǔn)和口徑,構(gòu)建全國(guó)統(tǒng)一的稅收外部信息管理系統(tǒng)和交換通道,努力提高數(shù)據(jù)交換的制度化和標(biāo)準(zhǔn)化水平.實(shí)現(xiàn)各部門之間的信息共享,提升稅收數(shù)據(jù)的使用效能.同時(shí),明確第三方部門提供涉稅信息的法律責(zé)任與義務(wù),為構(gòu)建部門之間稅收信息交換的長(zhǎng)效機(jī)制提供可靠的法律支撐.

4.2 實(shí)時(shí)掌握稅收數(shù)據(jù)采集的動(dòng)態(tài)走勢(shì)

從整個(gè)稅務(wù)工作流程及監(jiān)控的角度系統(tǒng)考慮數(shù)據(jù)的采集廣度,全面搜集并整合企業(yè)集團(tuán)集團(tuán)的基礎(chǔ)信息、財(cái)務(wù)核算與生產(chǎn)經(jīng)營(yíng)數(shù)據(jù)以及銷售的商品名稱、單價(jià)、數(shù)量等發(fā)票明細(xì)數(shù)據(jù),對(duì)遺漏數(shù)據(jù)補(bǔ)充采集,加強(qiáng)數(shù)據(jù)動(dòng)態(tài)采集,強(qiáng)化稅源監(jiān)控,引入搜索引擎、圖形識(shí)別技術(shù)等,替換傳統(tǒng)數(shù)據(jù)采集方法,在海量的數(shù)據(jù)里及時(shí)將所有非涉密涉稅信息按照內(nèi)容與性質(zhì)的不同進(jìn)行分類、綜合后予以發(fā)布,實(shí)現(xiàn)從多渠道自動(dòng)采集涉稅信息的目標(biāo),提高數(shù)據(jù)完整率和及時(shí)性.

4.3 強(qiáng)化稅收數(shù)據(jù)采集的真實(shí)性管理

深化數(shù)據(jù)庫(kù)表內(nèi)、表間數(shù)據(jù)邏輯審核,加強(qiáng)稅務(wù)登記、納稅申報(bào)環(huán)節(jié)的數(shù)據(jù)審核,排查清理錯(cuò)誤數(shù)據(jù).建立互聯(lián)網(wǎng)信息抓取的規(guī)范,運(yùn)用數(shù)據(jù)爬蟲軟件定期采集包括不同行業(yè)的公告信息、通過(guò)關(guān)鍵詞搜索和語(yǔ)義分析等大數(shù)據(jù)技術(shù),對(duì)相關(guān)信息進(jìn)行分類管理,加強(qiáng)對(duì)各類系統(tǒng)導(dǎo)出的數(shù)據(jù)、稅源分析系統(tǒng)內(nèi)數(shù)據(jù)以及第三方獲取數(shù)據(jù)的核對(duì)和審核.通過(guò)數(shù)據(jù)優(yōu)化整合,實(shí)現(xiàn)各類涉稅數(shù)據(jù)的互聯(lián)互通、邏輯關(guān)聯(lián)和比對(duì)分析,最大限度地減少數(shù)據(jù)誤差,確保數(shù)據(jù)的真實(shí)性.