国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

挑戰(zhàn)2 數(shù)據(jù)質(zhì)量

2016-06-06 06:07王左利
中國(guó)教育網(wǎng)絡(luò) 2016年4期
關(guān)鍵詞:數(shù)據(jù)服務(wù)時(shí)效性一致性

?

挑戰(zhàn)2 數(shù)據(jù)質(zhì)量

數(shù)據(jù)質(zhì)量與數(shù)據(jù)服務(wù)息息相關(guān)。數(shù)據(jù)質(zhì)量不高,數(shù)據(jù)應(yīng)用的有效性不高,導(dǎo)致有數(shù)據(jù)卻用不起來(lái)。

高校數(shù)據(jù)質(zhì)量不高的現(xiàn)象一直存在。雖然目前數(shù)據(jù)應(yīng)用的項(xiàng)目非常多,但真正取得預(yù)期效果的項(xiàng)目少之又少,而且開(kāi)發(fā)過(guò)程困難重重,其中的一個(gè)重要原因就是數(shù)據(jù)質(zhì)量問(wèn)題導(dǎo)致許多預(yù)期需求無(wú)法實(shí)現(xiàn)。

數(shù)據(jù)治理是一個(gè)有效提升數(shù)據(jù)質(zhì)量的行動(dòng)。數(shù)據(jù)治理的范疇更廣,所以人們認(rèn)為它是“一個(gè)系統(tǒng)的、大型的、長(zhǎng)期的工程”。目前高校在數(shù)據(jù)治理方面還沒(méi)有開(kāi)始真正意義上的實(shí)踐,究其原因,一方面高校還沒(méi)有把數(shù)據(jù)治理的重要性提升到戰(zhàn)略高度,另一方面沒(méi)有將數(shù)據(jù)治理單獨(dú)作為課題研究,沒(méi)有形成系統(tǒng)的實(shí)施方法論。

觀(guān)點(diǎn)

數(shù)據(jù)服務(wù)中涉及到的數(shù)據(jù)質(zhì)量問(wèn)題,目前主要存在哪些問(wèn)題?有哪些解決方案?

陸以勤

眾所周知,大數(shù)據(jù)并不等同于“大量數(shù)據(jù)”,對(duì)大數(shù)據(jù)進(jìn)行有效分析的前提是必須要保證數(shù)據(jù)的質(zhì)量, 數(shù)據(jù)的質(zhì)量決定了數(shù)據(jù)的可用性和易用性,大量不可用的數(shù)據(jù)垃圾不僅提煉不出有價(jià)值的分析結(jié)果,還占用了數(shù)據(jù)存儲(chǔ)資源。

一般面向大數(shù)據(jù)分析的數(shù)據(jù)質(zhì)量可以體現(xiàn)在數(shù)據(jù)的完整性、真實(shí)性、精確度、一致性、時(shí)效性、容量、面向大規(guī)模分析的存儲(chǔ)方式等。由于大數(shù)據(jù)的來(lái)源復(fù)雜、數(shù)據(jù)量大、產(chǎn)生速度快、處理過(guò)程多樣等,目前對(duì)大數(shù)據(jù)分析的可用性而言質(zhì)量普遍存在問(wèn)題。

為了保證數(shù)據(jù)的質(zhì)量,在數(shù)據(jù)的整個(gè)生命過(guò)程要統(tǒng)一規(guī)劃、有效采集、合理存儲(chǔ)。首先要制定統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),對(duì)于采集的新數(shù)據(jù),應(yīng)采用新的標(biāo)準(zhǔn)進(jìn)行采集、清洗和轉(zhuǎn)換,對(duì)于現(xiàn)存的數(shù)據(jù),要進(jìn)行一致性校驗(yàn)、清洗、信息補(bǔ)充等,未來(lái)保證數(shù)據(jù)時(shí)效性,要保證數(shù)據(jù)采集、傳輸過(guò)程的時(shí)效性,另外,目前很多大數(shù)據(jù)采用普通云架構(gòu)的存儲(chǔ)方式,這種存儲(chǔ)方式是面向應(yīng)用程序運(yùn)行的,對(duì)于數(shù)據(jù)分析,應(yīng)該采取分布式的存儲(chǔ)方式,以便采取分布式的算法提供分析效率。

宓詠

數(shù)據(jù)質(zhì)量的完善很難一蹴而就,有一個(gè)逐步完善的過(guò)程,需要改變數(shù)據(jù)屬性的觀(guān)念,逐步從“我的數(shù)據(jù)”到“部門(mén)的數(shù)據(jù)”再到“學(xué)校的數(shù)據(jù)”,把數(shù)據(jù)從“私有”變?yōu)椤肮小保餐瑏?lái)維護(hù)數(shù)據(jù)質(zhì)量;

需要完善管理機(jī)制和數(shù)據(jù)標(biāo)準(zhǔn),科學(xué)規(guī)劃,重構(gòu)數(shù)據(jù)基礎(chǔ),以“面向?qū)ο蟆狈绞接袡C(jī)組織教學(xué)、科研、財(cái)務(wù)、人事、生活等各類(lèi)數(shù)據(jù)資源;

關(guān)注數(shù)據(jù)生命周期的四個(gè)要素:從哪來(lái)?怎么來(lái)?到哪去?如何用?

技術(shù)手段上下功夫,降低數(shù)據(jù)收集的成本、盡量能自動(dòng)從系統(tǒng)中定時(shí)獲取數(shù)據(jù);

數(shù)據(jù)管理后端和前端服務(wù)分離,實(shí)現(xiàn)“松耦合”化:數(shù)據(jù)的交換、保管等過(guò)程,由信息化部門(mén)統(tǒng)一操作,數(shù)據(jù)產(chǎn)生(收集)和校驗(yàn)由用戶(hù)與二級(jí)單位共同承擔(dān);

由于每個(gè)人對(duì)自己的數(shù)據(jù)是最清楚的,可以通過(guò)向用戶(hù)個(gè)人開(kāi)放屬于其本人數(shù)據(jù)的方式,形成倒逼機(jī)制來(lái)督促業(yè)務(wù)部門(mén)修正錯(cuò)誤數(shù)據(jù)、改善數(shù)據(jù)質(zhì)量。

陳云

數(shù)據(jù)質(zhì)量管理,是指對(duì)數(shù)據(jù)采集、存儲(chǔ)、共享、維護(hù)、應(yīng)用、消亡生命周期中可能引發(fā)的各類(lèi)數(shù)據(jù)質(zhì)量問(wèn)題,進(jìn)行識(shí)別、度量、監(jiān)控、整改等一系列管理活動(dòng),保證數(shù)據(jù)質(zhì)量不斷提高。因此從系統(tǒng)建設(shè)階段到運(yùn)維階段都涉及到數(shù)據(jù)質(zhì)量的管理工作,建立數(shù)據(jù)從采集、處理到維護(hù)的全過(guò)程監(jiān)控體系,確保數(shù)據(jù)的完整性、有效性、準(zhǔn)確性、惟一性、一致性。

猜你喜歡
數(shù)據(jù)服務(wù)時(shí)效性一致性
大數(shù)據(jù)時(shí)代高校圖書(shū)館數(shù)據(jù)服務(wù)的困境及優(yōu)化路徑
地理空間大數(shù)據(jù)服務(wù)自然資源調(diào)查監(jiān)測(cè)的方向分析
關(guān)注減污降碳協(xié)同的一致性和整體性
注重教、學(xué)、評(píng)一致性 提高一輪復(fù)習(xí)效率
基于數(shù)據(jù)中臺(tái)的數(shù)據(jù)服務(wù)建設(shè)規(guī)范研究
IOl-master 700和Pentacam測(cè)量Kappa角一致性分析
基于時(shí)效性分析的草莓種苗脫病毒技術(shù)
《????》???? ?????? ????? ???如何提高“數(shù)學(xué)廣角”課堂的時(shí)效性
數(shù)據(jù)服務(wù)依賴(lài)圖模型及自動(dòng)組合方法研究
基于事件觸發(fā)的多智能體輸入飽和一致性控制