国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

科研大數(shù)據(jù)迷霧模型的建構(gòu)與解構(gòu)

2023-07-20 17:36豐佰恒杜寶貴
現(xiàn)代情報(bào) 2023年7期
關(guān)鍵詞:數(shù)據(jù)治理生態(tài)系統(tǒng)模型

豐佰恒 杜寶貴

關(guān)鍵詞:科研大數(shù)據(jù);科研大數(shù)據(jù)迷霧;模型;生態(tài)系統(tǒng);數(shù)據(jù)治理

DOI:10.3969/j.issn.1008-0821.2023.07.001

[中圖分類(lèi)號(hào)]G203 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1008-0821(2023)07-0003-11

科研大數(shù)據(jù)是隸屬于大數(shù)據(jù),產(chǎn)生于科研,輔助于科研,具有規(guī)模性、高速性、價(jià)值性、多樣性、高維性、錯(cuò)綜性等特征,反映自然與社會(huì)現(xiàn)象的一種數(shù)據(jù)類(lèi)型。在數(shù)據(jù)價(jià)比黃金的時(shí)代,科研大數(shù)據(jù)作為國(guó)家基礎(chǔ)性戰(zhàn)略資源引起多國(guó)(地區(qū))關(guān)注。美國(guó)以《大數(shù)據(jù)研究發(fā)展倡議》等率先拉開(kāi)科研數(shù)據(jù)治理的序幕,并在《大數(shù)據(jù)研究與發(fā)展計(jì)劃》中提及醫(yī)療、航天等眾多領(lǐng)域的科研數(shù)據(jù)管理,英國(guó)在《把握數(shù)據(jù)帶來(lái)的機(jī)遇:英國(guó)數(shù)據(jù)能力戰(zhàn)略》中警醒數(shù)據(jù)機(jī)遇,日本在《大數(shù)據(jù)時(shí)代的人才培養(yǎng)》中倡議培養(yǎng)專(zhuān)業(yè)化人才,中國(guó)亦在《科學(xué)數(shù)據(jù)管理辦法》中制定科研大數(shù)據(jù)管理規(guī)范。各國(guó)(地區(qū))均聚焦于科研大數(shù)據(jù)的發(fā)展,使得數(shù)據(jù)量激增的同時(shí),也帶來(lái)了科研大數(shù)據(jù)造假、科研大數(shù)據(jù)維度錯(cuò)亂、科研大數(shù)據(jù)冗余等一系列“迷霧”問(wèn)題,影響數(shù)據(jù)質(zhì)量,危害數(shù)據(jù)安全。現(xiàn)有研究多集中在科研大數(shù)據(jù)共享、科研大數(shù)據(jù)時(shí)效、科研大數(shù)據(jù)質(zhì)量管控模型、科研大數(shù)據(jù)維度災(zāi)難、科研大數(shù)據(jù)安全等方面,對(duì)科研大數(shù)據(jù)迷霧的專(zhuān)項(xiàng)探析還存在些許不足。此外,在各國(guó)(地區(qū))的科學(xué)數(shù)據(jù)交流愈加頻繁、數(shù)據(jù)維度急劇攀升的今天,科研人員的迷霧甄別能力愈發(fā)關(guān)鍵。在構(gòu)建科研大數(shù)據(jù)迷霧模型基礎(chǔ)上,進(jìn)一步了解科研大數(shù)據(jù)迷霧的類(lèi)型、路徑及機(jī)理有助于科研人員走出“迷霧叢林”,維護(hù)科研大數(shù)據(jù)生態(tài)系統(tǒng)的和諧穩(wěn)定。因此,本文以識(shí)別迷霧數(shù)據(jù)、規(guī)避科研風(fēng)險(xiǎn)為主要研究目的,以科研大數(shù)據(jù)生態(tài)系統(tǒng)中不斷演化的迷霧型科研大數(shù)據(jù)為主要研究對(duì)象,以科研大數(shù)據(jù)庫(kù)建設(shè)、科研決策、科研大數(shù)據(jù)政策制定為主要應(yīng)用場(chǎng)景,創(chuàng)造性地建構(gòu)了科研大數(shù)據(jù)迷霧模型,以期在豐富科研大數(shù)據(jù)相關(guān)理論的同時(shí),對(duì)解決科研大數(shù)據(jù)冗余、科研大數(shù)據(jù)造假、劣質(zhì)科研大數(shù)據(jù)傳播管控、科技政策制定等現(xiàn)實(shí)問(wèn)題提供有益啟示。

1科研大數(shù)據(jù)迷霧概念的提出

“迷霧”的概念緣起于氣象學(xué),后廣泛運(yùn)用于其他領(lǐng)域。在經(jīng)濟(jì)學(xué)領(lǐng)域,迷霧指干擾經(jīng)濟(jì)發(fā)展方向、阻礙經(jīng)濟(jì)發(fā)展的不穩(wěn)定性因素;在政治學(xué)領(lǐng)域,迷霧指與本質(zhì)相悖、掩蓋目的、迷惑敵方?jīng)Q策的一種政治行為;在新聞學(xué)領(lǐng)域,迷霧指脫離事實(shí)真相甚至與事實(shí)相反的扭曲報(bào)道等;在情報(bào)學(xué)領(lǐng)域,信息迷霧是信息戰(zhàn)的重要手段,指不真實(shí)、政治相關(guān)、隱藏目的、精心設(shè)計(jì)、以進(jìn)攻為目標(biāo)的虛假情報(bào)。數(shù)據(jù)迷霧是指用于誘騙、隱真的虛假、有毒、垃圾數(shù)據(jù)。與“信息迷霧”相比較,“科研大數(shù)據(jù)迷霧”是“信息迷霧”的重要核心內(nèi)容;信息迷霧是數(shù)據(jù)迷霧的“外殼”,為“科研大數(shù)據(jù)迷霧”的產(chǎn)生提供了環(huán)境。信息迷霧越多,其產(chǎn)生科研大數(shù)據(jù)迷霧的可能性越大,反之,科研大數(shù)據(jù)迷霧越多,并經(jīng)加工后產(chǎn)生信息迷霧的程度越大,故二者是相輔相成、相互促進(jìn)的關(guān)系?!靶畔⒚造F”與“科研大數(shù)據(jù)迷霧”兩者之間又存在區(qū)別:首先是本質(zhì)屬性不同,科研大數(shù)據(jù)作為一種特殊的數(shù)據(jù)類(lèi)型,本質(zhì)上仍是具有即時(shí)高價(jià)值性的數(shù)據(jù),而信息是對(duì)數(shù)據(jù)的反映,是對(duì)數(shù)據(jù)所記錄事實(shí)的傳遞;其次是人為干預(yù)程度不同,單一數(shù)據(jù)誕生初期并不具有迷惑性,當(dāng)人員將數(shù)據(jù)應(yīng)用于某一目的時(shí),多重屬性的疊加,使其具有特殊含義,迷惑性逐漸顯現(xiàn),而信息迷霧的迷惑性從信息產(chǎn)生初期便有大量的人為干預(yù);最后是應(yīng)用領(lǐng)域不同,信息迷霧最早出現(xiàn)于軍事領(lǐng)域,而科研大數(shù)據(jù)迷霧往往伴隨科研活動(dòng)產(chǎn)生。由于數(shù)據(jù)包含著科研大數(shù)據(jù)這一種特殊類(lèi)型,因此,數(shù)據(jù)迷霧與科研大數(shù)據(jù)迷霧緊密相關(guān),是科研大數(shù)據(jù)迷霧的外延和上位集;換言之,科研大數(shù)據(jù)迷霧包含于數(shù)據(jù)迷霧,是數(shù)據(jù)迷霧的子集。與數(shù)據(jù)迷霧相比,科研大數(shù)據(jù)迷霧服務(wù)于技術(shù)壁壘,專(zhuān)指在不同科研大數(shù)據(jù)機(jī)構(gòu)數(shù)據(jù)交流過(guò)程中,導(dǎo)致科研大數(shù)據(jù)質(zhì)量與安全性降低,以及干擾科研人員決策的各類(lèi)數(shù)據(jù),其更集中體現(xiàn)科研域尺度,是“迷霧”在科研域的“直接而具體”的表現(xiàn)形式。

從空間角度看,“迷霧”入侵至科研大數(shù)據(jù)鏈后,以鏈帶狀在科研大數(shù)據(jù)生態(tài)系統(tǒng)中傳播,可新生、流通于科研大數(shù)據(jù)生態(tài)鏈的任意節(jié)點(diǎn),由此可見(jiàn)其具有全鏈性;從時(shí)間角度看,其出現(xiàn)可大致劃分為濃淡兩期,隨時(shí)間而波動(dòng),在一定趨勢(shì)線(xiàn)上重復(fù)可預(yù)測(cè),但迷霧數(shù)據(jù)的催生因素復(fù)雜,有時(shí)亦會(huì)出現(xiàn)突變情況,因此可認(rèn)為其具有不嚴(yán)格波動(dòng)性;從形態(tài)角度看,當(dāng)出現(xiàn)相互引用錯(cuò)誤、失效等數(shù)據(jù)時(shí),迷惑性數(shù)據(jù)彌散形成迷霧,在科研大數(shù)據(jù)生態(tài)系統(tǒng)中久久不能消散,處于縹緲懸浮、動(dòng)態(tài)演化的狀態(tài),因此其具有霧化性特征;從人員分布角度看,學(xué)者間相互的數(shù)據(jù)引用使其擴(kuò)散,但學(xué)科間存在一定的壁壘,對(duì)數(shù)據(jù)的引用也存在強(qiáng)弱關(guān)系的差異,因此迷霧數(shù)據(jù)的出現(xiàn)往往聚焦于特定的學(xué)科,各學(xué)科或主題間存在派系的關(guān)聯(lián),可見(jiàn)其具有派系性特征;科研活動(dòng)有著高精確度的要求,迷霧數(shù)據(jù)迷惑科研工作人員行為、加大實(shí)驗(yàn)誤差、使指標(biāo)失真、影響科研進(jìn)程,甚至導(dǎo)致災(zāi)難性后果,因此其具有災(zāi)難性。

綜合以上分析,本文認(rèn)為科研大數(shù)據(jù)迷霧( Sci-entific Research Big Data Fog,SRBDF)是指衍生于數(shù)據(jù)迷霧,以科研域虛假、有毒、垃圾、冗余數(shù)據(jù)為基本組成,以全鏈性、不嚴(yán)格波動(dòng)性、派系性、霧化性、災(zāi)難性為基本特征,在利益驅(qū)動(dòng)下流轉(zhuǎn)于科研大數(shù)據(jù)生命周期,降低科研大數(shù)據(jù)質(zhì)量、干擾科研決策、引發(fā)數(shù)據(jù)災(zāi)難進(jìn)而擾亂科研大數(shù)據(jù)生態(tài)穩(wěn)定的一類(lèi)數(shù)據(jù)的集合。2科研大數(shù)據(jù)迷霧模型的建構(gòu)

科研大數(shù)據(jù)作為基礎(chǔ)性科技資源,引起諸多學(xué)者關(guān)注,并從數(shù)據(jù)共享與數(shù)據(jù)治理等不同角度構(gòu)建了科研大數(shù)據(jù)相關(guān)模型。例如聚焦于科研大數(shù)據(jù)再生、科研大數(shù)據(jù)共生、科研大數(shù)據(jù)變異的科研大數(shù)據(jù)生態(tài)模型,以生態(tài)學(xué)的視角介紹了科研大數(shù)據(jù)復(fù)雜的生命周期;基于尖點(diǎn)突變理論、病毒傳播理論有科研大數(shù)據(jù)治理模型,側(cè)重于對(duì)科研大數(shù)據(jù)的宏觀(guān)治理;從數(shù)據(jù)倫理、科研誠(chéng)信等不同視角出發(fā)的科研大數(shù)據(jù)共享模型,則致力于促進(jìn)科研大數(shù)據(jù)的共享,以及關(guān)注科研大數(shù)據(jù)服務(wù)模式、服務(wù)系統(tǒng)的科研大數(shù)據(jù)服務(wù)模型等。綜上可以看出,以往的模型較多關(guān)注科研大數(shù)據(jù)生態(tài)系統(tǒng)的宏觀(guān)治理,鮮有迷霧型科研大數(shù)據(jù)的專(zhuān)項(xiàng)研究,針對(duì)“迷霧”問(wèn)題的深度探索仍略顯不足。

科研大數(shù)據(jù)迷霧在科研大數(shù)據(jù)生態(tài)系統(tǒng)中逐漸演化生成,從“科研大數(shù)據(jù)生態(tài)系統(tǒng)”對(duì)“科研大數(shù)據(jù)迷霧”的作用角度看:在科研大數(shù)據(jù)生態(tài)失調(diào)下(即發(fā)生異常時(shí))產(chǎn)生科研大數(shù)據(jù)迷霧,科研大數(shù)據(jù)生態(tài)系統(tǒng)是科研大數(shù)據(jù)迷霧的客觀(guān)環(huán)境,迷霧的生消都必須在系統(tǒng)內(nèi)發(fā)生。科研大數(shù)據(jù)量激增使數(shù)據(jù)庫(kù)得以豐富的同時(shí),也為“科研大數(shù)據(jù)迷霧”的產(chǎn)生提供了“土壤”。從“科研大數(shù)據(jù)迷霧”對(duì)“科研大數(shù)據(jù)生態(tài)系統(tǒng)”的影響角度看:“科研大數(shù)據(jù)迷霧”作為一種獨(dú)特的風(fēng)險(xiǎn),是科研大數(shù)據(jù)生態(tài)系統(tǒng)的高危域。迷霧濃度影響系統(tǒng)穩(wěn)定性,當(dāng)迷霧濃度越大時(shí)生態(tài)系統(tǒng)越不穩(wěn)定??蒲写髷?shù)據(jù)迷霧與科研大數(shù)據(jù)生態(tài)系統(tǒng)息息相關(guān)。

科研大數(shù)據(jù)迷霧作為干擾科研大數(shù)據(jù)生態(tài)穩(wěn)定的一類(lèi)數(shù)據(jù)的集合,本質(zhì)依然是數(shù)據(jù),仍具有數(shù)據(jù)的周期性生命特征,數(shù)據(jù)生命周期模型將數(shù)據(jù)管理劃分為生產(chǎn)、傳播、消費(fèi)、分解等階段,同樣,科研大數(shù)據(jù)迷霧亦會(huì)經(jīng)歷初生、激增、消散等過(guò)程。由此可見(jiàn),數(shù)據(jù)生命周期理論對(duì)科研大數(shù)據(jù)迷霧的階段劃分具有較強(qiáng)的適用性。

因此,本文基于科研大數(shù)據(jù)生態(tài)系統(tǒng)理論與數(shù)據(jù)生命周期理論,將科研大數(shù)據(jù)迷霧模型劃分為初生期、激增期、衰退期,并將模型內(nèi)相關(guān)人員劃分為生產(chǎn)者、消費(fèi)者、監(jiān)管者、傳遞者,以建構(gòu)科研大數(shù)據(jù)迷霧三階段模型,如圖1所示。

1)階段一:SRBDF初生期

此階段是科研大數(shù)據(jù)迷霧的計(jì)劃階段,迷霧生產(chǎn)者在利益驅(qū)動(dòng)下生產(chǎn)迷霧數(shù)據(jù),初生期科研大數(shù)據(jù)迷霧樣本較少,“迷霧”還沒(méi)有大范圍傳播,此時(shí)的科研大數(shù)據(jù)迷霧聚集現(xiàn)象較為明顯,即在初生期科研大數(shù)據(jù)迷霧往往集中在單一學(xué)科領(lǐng)域,因此階段一的迷霧較弱。

2)階段二:SRBDF激增期

在激增期迷霧數(shù)據(jù)量急劇增加,已擴(kuò)散至相關(guān)領(lǐng)域,影響范圍逐漸增大,因此這一時(shí)期的科研大數(shù)據(jù)迷霧多呈彌散型狀態(tài)。此時(shí)迷霧強(qiáng)度將會(huì)出現(xiàn)峰值且短期內(nèi)迷霧型數(shù)據(jù)會(huì)有爆發(fā)式增長(zhǎng)的可能,對(duì)科研人員與政府來(lái)說(shuō)最難控制,危害性也最大。對(duì)于迷霧生產(chǎn)者而言此階段獲益頗豐。

3)階段三:SRBDF衰退期

在第三階段,科研大數(shù)據(jù)監(jiān)管者嚴(yán)格監(jiān)管,科研大數(shù)據(jù)迷霧強(qiáng)度逐漸降低。對(duì)科研大數(shù)據(jù)消費(fèi)者來(lái)說(shuō),此階段科研大數(shù)據(jù)迷霧災(zāi)害性逐漸減弱。對(duì)于迷霧生產(chǎn)者而言,科研大數(shù)據(jù)迷霧的得益將會(huì)反饋,為下一步的科研大數(shù)據(jù)迷霧計(jì)劃提供參考。

科研大數(shù)據(jù)迷霧的存在給科研大數(shù)據(jù)生態(tài)系統(tǒng)帶來(lái)極大的安全隱患,其不僅僅會(huì)影響科研結(jié)果,還會(huì)影響政府決策,導(dǎo)致科技政策的制定出現(xiàn)偏差,甚至影響公眾對(duì)科研結(jié)果以及科技政策的認(rèn)同感。與已有模型不同的是,科研大數(shù)據(jù)迷霧模型(Scientific Research Big Data Fog Model, SRBDF-M)以迷霧型科研大數(shù)據(jù)為主要研究對(duì)象,以幫助相關(guān)人員認(rèn)識(shí)迷霧、了解迷霧、走出迷霧、科學(xué)決策進(jìn)而維護(hù)科研大數(shù)據(jù)生態(tài)穩(wěn)定為目的,以初生期、激增期、衰退期為主要?jiǎng)澐蛛A段,專(zhuān)注于迷霧型數(shù)據(jù)的溯源與演化分析,側(cè)重于深入剖析科研大數(shù)據(jù)迷霧的生成、類(lèi)型、作用路徑等,是科研大數(shù)據(jù)治理模型中對(duì)虛假、有毒、垃圾、冗余數(shù)據(jù)專(zhuān)項(xiàng)研究的子模型。

3科研大數(shù)據(jù)迷霧模型的解構(gòu)

3.1科研大數(shù)據(jù)迷霧的組成類(lèi)型分析

基于前文對(duì)SRBDF-M建構(gòu)的基礎(chǔ),在時(shí)間、空間、強(qiáng)度、利益、繁育等維度,對(duì)科研大數(shù)據(jù)迷霧的組成類(lèi)型進(jìn)一步闡述分析。

3.1.1時(shí)間維

結(jié)合科研大數(shù)據(jù)迷霧的波動(dòng)性特征,在時(shí)間維度上,可分為“初生型”“激增型”“衰退型”3種類(lèi)型,如圖2所示:

1)初生型(Primary Type)是指在初生期SRB-DF覆蓋范圍較小、影響力度較弱,此時(shí)其具有可辨、可減、可祛除的特點(diǎn),科研大數(shù)據(jù)工作者可根據(jù)多年工作經(jīng)驗(yàn)及積累的技術(shù)辨別SRBDF,并采用相應(yīng)措施祛除迷霧,減少其危害,例如《數(shù)據(jù)管理能力成熟度評(píng)估模型》定義的8個(gè)能力域中就包含了“數(shù)據(jù)質(zhì)量”,并明確指出通過(guò)數(shù)據(jù)質(zhì)量檢查來(lái)促進(jìn)數(shù)據(jù)質(zhì)量提升[38]。

2)激增型(Surge Type)是指在SRBDF初生期并未得到有效的控制,以致后續(xù)仍有大量相關(guān)的科研活動(dòng)直接引用此部分?jǐn)?shù)據(jù),或是對(duì)此類(lèi)數(shù)據(jù)次級(jí)引用,造成大范圍高強(qiáng)度的影響,此時(shí)其有范圍廣、強(qiáng)度高、難控制的特點(diǎn),相關(guān)科研工作者除了需要投入大量的時(shí)間與精力來(lái)辨別迷霧,還需要掌握專(zhuān)業(yè)的技術(shù),例如《土壤水分自動(dòng)站逐小時(shí)資料質(zhì)量控制方案》為甄別疑誤數(shù)據(jù)增加內(nèi)部一致性檢驗(yàn)。

3)衰退型(Recession Type)是指SRBDF在數(shù)據(jù)質(zhì)量控制下其影響范圍與影響力度逐漸減小,呈現(xiàn)衰敗的特點(diǎn),但仍具有死灰復(fù)燃的可能性,此類(lèi)數(shù)據(jù)流轉(zhuǎn)至科研大數(shù)據(jù)流中易成為新一輪迷霧的催生動(dòng)力。從SRBDF的“初生”到“激增”再至“衰退”體現(xiàn)了其周期性與波動(dòng)性特征。

3.1.2空間維

結(jié)合SRBDF的派系性與全鏈性特征,在空間維上,可分為焦聚型迷霧和彌散型迷霧,如圖3所示:

1)焦聚型( Focus Type)是指SRBDF往往聚集于某一的領(lǐng)域,科研人員在自己所屬學(xué)科領(lǐng)域進(jìn)行數(shù)據(jù)引用,生成迷霧的現(xiàn)象,本屬學(xué)科間的數(shù)據(jù)引用情況遠(yuǎn)高于跨學(xué)科引用,如圖3(a)所示。焦聚型迷霧具有集中性(數(shù)據(jù)集中、領(lǐng)域集中、人員集中)的特征。例如,隨生物學(xué)領(lǐng)域的“丁香實(shí)驗(yàn)”、醫(yī)學(xué)領(lǐng)域的“梅斯醫(yī)學(xué)”、經(jīng)濟(jì)管理領(lǐng)域的“經(jīng)管之家”等交流平臺(tái)的興起,產(chǎn)生的迷霧更為聚集,這是其派系性的典型體現(xiàn)。隨時(shí)間演化焦聚型迷霧在科研大數(shù)據(jù)生態(tài)系統(tǒng)中擴(kuò)散開(kāi)來(lái),逐漸轉(zhuǎn)變?yōu)榱硪环N類(lèi)型。

2)彌散型(Diffuse Type)是指SRBDF逐漸擴(kuò)散影響相鄰學(xué)科,造成跨學(xué)科影響的現(xiàn)象。如圖3(b)所示,彌散性迷霧以現(xiàn)代信息技術(shù)與相關(guān)政策漏洞為滋生土壤,在多機(jī)構(gòu)、多平臺(tái)、多學(xué)科內(nèi)傳播,具有范圍廣、速度快、災(zāi)害性強(qiáng)的特點(diǎn)。在當(dāng)今《科協(xié)系統(tǒng)深化改革實(shí)施方案》等鼓勵(lì)跨學(xué)科合作相關(guān)文件頒布的背景下,跨學(xué)科合作迸發(fā)出前所未有的新活力,但與此同時(shí),彌散型迷霧也廣泛分散在了科研大數(shù)據(jù)生態(tài)鏈。其縹緲難以捕獲,體現(xiàn)了SRBDF的全鏈性特性。

3.1.3強(qiáng)度維

結(jié)合SRBDF波動(dòng)性特征,在強(qiáng)度維度其可分為強(qiáng)迷霧與弱迷霧,如圖4所示:

1)弱迷霧(Infirm Fog)指“迷霧”影響范圍相對(duì)較小,迷霧濃度較低,對(duì)數(shù)據(jù)接收者的危害程度較淺的一種數(shù)據(jù)形態(tài)。對(duì)于釋放者來(lái)說(shuō),盡管其濃度及影響范圍較小,但對(duì)于錯(cuò)誤數(shù)據(jù)接收者而言,弱迷霧型數(shù)據(jù)與可用科研數(shù)據(jù)更相近,因此在面對(duì)弱迷霧時(shí)更容易受其迷惑。但是因其影響范圍有限、危害程度較小,相對(duì)而言也較容易處理。

2)強(qiáng)迷霧(Strong Fog)指在科研大數(shù)據(jù)生態(tài)系統(tǒng)中影響范圍大、作用時(shí)間持久、危害程度較深的一種數(shù)據(jù)形態(tài),此形態(tài)多出于濃霧期。對(duì)于釋放者來(lái)說(shuō),強(qiáng)“迷霧”的釋放能夠更加有效地干擾競(jìng)爭(zhēng)對(duì)手,削減其實(shí)力。對(duì)于接收者來(lái)說(shuō),強(qiáng)迷霧難以防控,迷霧中處處存在風(fēng)險(xiǎn),接收者長(zhǎng)時(shí)間面對(duì)大量魚(yú)龍混雜的科研數(shù)據(jù),易造成學(xué)科發(fā)展停滯。

3.1.4利益維

結(jié)合SRBDF災(zāi)難性特征,在利益維度可分為趨利型和趨害型,如圖5所示:

1)趨利型(Profit Type)是指在科研個(gè)體(微觀(guān))、科研機(jī)構(gòu)或企業(yè)(中觀(guān))、國(guó)家或地區(qū)(宏觀(guān))等競(jìng)爭(zhēng)的驅(qū)動(dòng)下,以迷惑競(jìng)爭(zhēng)對(duì)手提高自身競(jìng)爭(zhēng)力為目的,以故意加大實(shí)驗(yàn)誤差生產(chǎn)錯(cuò)誤數(shù)據(jù)為手段,對(duì)于釋放者來(lái)說(shuō),造成的最終結(jié)果是有利的一種數(shù)據(jù)形態(tài)。如圖5(a)所示,迷霧釋放者通過(guò)釋放科研大數(shù)據(jù)迷霧干擾競(jìng)爭(zhēng)對(duì)手,提高自身競(jìng)爭(zhēng)力。趨利型迷霧對(duì)于釋放者來(lái)說(shuō)具有可見(jiàn)、可防、可控的特點(diǎn)。

2)趨害型(Hasten to Harm Type)是指同是在競(jìng)爭(zhēng)驅(qū)動(dòng)下產(chǎn)生的,與趨利型相對(duì)的,對(duì)數(shù)據(jù)接受者來(lái)說(shuō)可造成傷害的一種數(shù)據(jù)形態(tài)。如圖5(b)所示,趨害型相對(duì)于趨利型來(lái)說(shuō),只是接受主體不同,對(duì)于自身來(lái)說(shuō)是趨害型的對(duì)于競(jìng)爭(zhēng)對(duì)手來(lái)說(shuō)有可能是趨利型的,但將會(huì)影響接收方自身決策分析,造成決策失誤。趨害型迷霧對(duì)數(shù)據(jù)接收者來(lái)說(shuō)具有難捕捉、難評(píng)估、難控制的特點(diǎn),繼而可造成災(zāi)難性后果。

3.1.5繁育維

結(jié)合SRBDF派系性特征,在繁育維度科研大數(shù)據(jù)“迷霧”現(xiàn)象可分為雜育型和寡育型,如圖6所示:

1)寡育型( Oligonucleotides Type)是指只在特定的領(lǐng)域內(nèi)出現(xiàn)的,易切斷阻隔的SRBDF類(lèi)型。如圖6(a)所示,此類(lèi)型具有學(xué)科單一(往往出現(xiàn)在高精尖領(lǐng)域亦或是冷門(mén)學(xué)科)、主體單一(在特定的科研人員范圍間傳播)、類(lèi)型單一(數(shù)據(jù)類(lèi)型單一,很少存在結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化數(shù)據(jù)混雜的情況)、數(shù)據(jù)一脈相承(科研大數(shù)據(jù)迷霧易溯源)、易控制的特點(diǎn)。

2)雜育型(Mixed Type)是指多學(xué)科、多領(lǐng)域、多人員、多地域的各類(lèi)科研數(shù)據(jù)相互引用而出現(xiàn)的SRBDF。如圖6(b)所示,跨學(xué)科、跨地域、跨時(shí)空的科研人員在方法論、知識(shí)論、價(jià)值判斷等方面存在一定的差異,導(dǎo)致學(xué)科交流不通暢,從而產(chǎn)生SRBDF,此類(lèi)迷霧更具有縹緲、懸浮的霧化性特征,且涵蓋知識(shí)范圍較廣,因此往往較難控制,易引發(fā)數(shù)據(jù)災(zāi)難。

綜合以上分析知SRBDF組成類(lèi)型多樣,在時(shí)間維可劃分為初生型、激增型、衰退型,在空間維可劃分為焦聚型、彌散型,在強(qiáng)度維可劃分為強(qiáng)迷霧、弱迷霧,在利益維可劃分為趨利型、趨害型,在繁育維可劃分為雜育型、寡育型。

3.2科研大數(shù)據(jù)迷霧的演化路徑分析

SRBDF在科研大數(shù)據(jù)生態(tài)系統(tǒng)中逐漸演化生成,如圖7所示,基于數(shù)據(jù)生命周期理論,以A機(jī)構(gòu)醫(yī)療科研數(shù)據(jù)造假事件為例,以時(shí)間維度為主路徑綜合考慮利益維度、空間維度、強(qiáng)度維度、繁育維度對(duì)SRBDF的演化路徑進(jìn)行分析。

3.2.1路徑節(jié)點(diǎn)一

1)從空間維看初生期SRBDF,其多以焦聚型呈現(xiàn)。例如在A機(jī)構(gòu)注冊(cè)初期,科研數(shù)據(jù)樣本較少,“迷霧”還沒(méi)有大范圍傳播,此時(shí)的SRBDF焦聚現(xiàn)象較為明顯,即在初生期SRBDF往往是集中在醫(yī)療健康學(xué)科領(lǐng)域。盡管彌散現(xiàn)象在這一時(shí)期也會(huì)出現(xiàn),但僅限于大規(guī)模的急性突發(fā)事件,但是這類(lèi)情況爆發(fā)速度較快,初生期轉(zhuǎn)瞬即逝,將會(huì)很快步入下一時(shí)期——激增期。

2)從強(qiáng)度維看初生期SRBDF,因?yàn)槠浯蟛糠痔幱诿妊繒r(shí)期,所以此時(shí)的迷霧較弱,如果短期內(nèi)爆發(fā)高強(qiáng)度的迷霧,此時(shí)的迷霧數(shù)量定會(huì)發(fā)生激增,因此將此類(lèi)型劃分至激增期,即研究認(rèn)為科研大數(shù)據(jù)迷霧初生期強(qiáng)度較弱。

3)從利益維看初生期SRBDF,此階段是迷霧的計(jì)劃階段,A機(jī)構(gòu)注冊(cè)便以盈利為主要目的,利益維充滿(mǎn)了人的主觀(guān)能動(dòng)色彩,在迷霧誕生初期早已被人為籠罩上了利益的面紗,即便是A機(jī)構(gòu)最終受到了自己釋放的迷霧的影響,但在迷霧釋放初期對(duì)釋放者來(lái)說(shuō)是趨于有利的,并且在整個(gè)過(guò)程都是趨利向演化的。同理對(duì)科研人員及政府來(lái)說(shuō),在迷霧初生期便伴隨著擾亂其決策的目的,在整個(gè)演化過(guò)程都是趨害的。

4)從繁育維看初生期SRBDF,A機(jī)構(gòu)的虛假科研數(shù)據(jù)還并未進(jìn)行大量的傳播繁育,故很難直接判斷出此時(shí)的迷霧究竟是雜育型還是寡育型,對(duì)于前期多類(lèi)型、多機(jī)構(gòu)、多學(xué)科交叉產(chǎn)生的SRBDF可以將其直接劃分為雜育型,但現(xiàn)實(shí)情況中不乏在中期乃至后期才出現(xiàn)跨學(xué)科的科研數(shù)據(jù),此時(shí)便需要將其重新分類(lèi)。

3.2.2路徑節(jié)點(diǎn)二

1)從空間維看激增期SRBDF,在激增期極易出現(xiàn)迷霧大規(guī)模擴(kuò)散的情況,此時(shí)A機(jī)構(gòu)已與“北京煥一醫(yī)學(xué)檢驗(yàn)實(shí)驗(yàn)室”“北京普通醫(yī)學(xué)檢驗(yàn)實(shí)驗(yàn)室”成為房山區(qū)三大機(jī)構(gòu),科研數(shù)據(jù)量急劇增加,影響范圍逐漸增大,此時(shí)期的科研大數(shù)據(jù)迷霧多呈彌散型狀態(tài),已擴(kuò)散至醫(yī)療健康相關(guān)領(lǐng)域,即在短期迷霧數(shù)據(jù)會(huì)有突然爆發(fā)式增長(zhǎng)的可能。

2)從強(qiáng)度維看激增期SRBDF,隨著該機(jī)構(gòu)核酸檢測(cè)數(shù)量增加,與之產(chǎn)生的科研大數(shù)據(jù)數(shù)量勢(shì)必進(jìn)一步增加,因此在激增期迷霧強(qiáng)度將會(huì)達(dá)到第一個(gè)峰值,此時(shí)的科研大數(shù)據(jù)迷霧最難控制,對(duì)科研人員與政府決策的危害性也最大。

3)從利益維看激增期SRBDF,此階段是干擾對(duì)手的主要時(shí)期,在激增期SRBDF的意圖已經(jīng)基本暴露,對(duì)何種機(jī)構(gòu)有利或是有害極易判斷,此時(shí)的A機(jī)構(gòu)獲益頗豐,對(duì)于政府與科研機(jī)構(gòu)而言,其決策判斷已受影響。

4)從繁育維看激增期SRBDF,隨A機(jī)構(gòu)規(guī)模擴(kuò)大,實(shí)驗(yàn)員等崗位大規(guī)模招聘,此時(shí)的科研大數(shù)據(jù)已影響至監(jiān)管部門(mén)、藥物生產(chǎn)商等,隨之產(chǎn)生的迷霧以雜育型為主。迷霧的爆發(fā)式增長(zhǎng),大部分迷霧形態(tài)逐漸明確,此階段的中后期迷霧是雜育型還是寡欲型已經(jīng)基本確定。

3.2.3路徑節(jié)點(diǎn)三

1)從空間維看衰退期SRBDF,隨北京市公安局通報(bào),衛(wèi)健部門(mén)已吊銷(xiāo)A機(jī)構(gòu)《醫(yī)療機(jī)構(gòu)執(zhí)業(yè)許可證》,彌散在整個(gè)科研大數(shù)據(jù)生態(tài)系統(tǒng)的迷霧逐漸回籠,彌散在邊緣學(xué)科或是弱相關(guān)學(xué)科的迷霧逐漸淡化直至消失,再次呈現(xiàn)焦聚的狀態(tài)(可聚集特定的學(xué)科、機(jī)構(gòu)、地區(qū)),因此從空間維度看衰退期的迷霧,此時(shí)期的迷霧以焦聚型為主。

2)從強(qiáng)度維看衰退期SRBDF,因市場(chǎng)監(jiān)管部門(mén)已立案查處,在此時(shí)期非核心迷霧逐漸消散,此時(shí)的迷霧空間覆蓋范圍逐漸縮小,在數(shù)據(jù)治理的作用下迷霧的災(zāi)害性逐漸減弱,因此迷霧在衰退期強(qiáng)度逐漸降低。

3)從利益維看衰退期SRBDF,衰退期屬最終時(shí)期,是否提高了自身的核心競(jìng)爭(zhēng)力、干擾了對(duì)手的決策,或者是否受迷霧影響造成決策失誤,從而影響了自己的競(jìng)爭(zhēng)地位,其利益目的早已明確。科研大數(shù)據(jù)人員可準(zhǔn)確判斷此時(shí)的“迷霧”是趨利型的還是趨害型,但在競(jìng)爭(zhēng)雙方的僵持作用效果下,衰退期的迷霧盡管在逐漸變?nèi)?,但還未完全消失,因此在科研大數(shù)據(jù)迷霧衰退期仍是趨利型與趨害型兩種“迷霧”混雜。

4)從繁育維看衰退期SRBDF,此時(shí)期迷霧繁育能力降低,很少出現(xiàn)大范圍繁殖的情況,但前期因跨學(xué)科、跨機(jī)構(gòu)、跨地域引用而產(chǎn)生了多種雜育型迷霧,并伴隨多代寡育型迷霧,科研大數(shù)據(jù)生態(tài)系統(tǒng)中雜育型與寡育型迷霧并存,在短期內(nèi)難以完全消除。

3.3科研大數(shù)據(jù)迷霧機(jī)理分析

3.3.1生成機(jī)理

由SRBDF-M知,“迷霧”的生成需經(jīng)歷初生期、激增期、衰退期3個(gè)階段,迷霧的生成機(jī)理是一個(gè)整體化的機(jī)體,其過(guò)程是一個(gè)動(dòng)態(tài)復(fù)雜的過(guò)程,在迷霧生命周期內(nèi),生產(chǎn)者、傳播者、消費(fèi)者、監(jiān)管者等主體均有參與。對(duì)迷霧的生成機(jī)理進(jìn)行闡述,有助于科研人員掌握其演化規(guī)律,走出“迷霧叢林”。因此,本文主要從利益機(jī)理(催生)、擴(kuò)散機(jī)理(傳播)、管控機(jī)理(阻隔)3個(gè)維度結(jié)合迷霧生命周期,對(duì)其內(nèi)在邏輯進(jìn)行剖析,如圖8所示。

1)利益機(jī)理:科研大數(shù)據(jù)生態(tài)系統(tǒng)內(nèi)部存在優(yōu)質(zhì)與劣質(zhì)兩種類(lèi)型數(shù)據(jù),優(yōu)質(zhì)科研大數(shù)據(jù)可信度高、生產(chǎn)成本高、可利用價(jià)值高;劣質(zhì)科研大數(shù)據(jù)(迷霧數(shù)據(jù))可信度低、生產(chǎn)成本低、可利用價(jià)值低。初生期迷霧生產(chǎn)者(以營(yíng)利性企業(yè)或數(shù)據(jù)生產(chǎn)商為代表)受利益驅(qū)使計(jì)劃制造大量的迷霧數(shù)據(jù),此時(shí)數(shù)據(jù)類(lèi)型單一,呈現(xiàn)為焦聚型的弱迷霧,在迷霧型數(shù)據(jù)流出且獲益后會(huì)進(jìn)一步刺激迷霧的生產(chǎn)。監(jiān)管者為保護(hù)消費(fèi)者利益在迷霧出現(xiàn)后會(huì)介入進(jìn)行監(jiān)管。

2)擴(kuò)散機(jī)理:激增期迷霧傳播者(數(shù)據(jù)共享平臺(tái)、數(shù)據(jù)中介組織、數(shù)據(jù)產(chǎn)商等)對(duì)迷霧進(jìn)行擴(kuò)散,消費(fèi)者(高校、企業(yè)、科研機(jī)構(gòu)等)對(duì)迷霧數(shù)據(jù)進(jìn)行引用,此時(shí)的傳播者一部分來(lái)自于先前趨利的生產(chǎn)者,另一部分則是受擴(kuò)散機(jī)理影響自發(fā)地?cái)U(kuò)散迷霧的消費(fèi)者,迷霧擴(kuò)散機(jī)理指的是受大量的迷霧數(shù)據(jù)的反復(fù)刺激,消費(fèi)者對(duì)迷霧數(shù)據(jù)的鑒別產(chǎn)生自我懷疑,開(kāi)始引用高迷惑性迷霧數(shù)據(jù),使得迷霧數(shù)據(jù)量激增,此階段的科研大數(shù)據(jù)迷霧為數(shù)據(jù)類(lèi)型復(fù)雜的彌散型強(qiáng)迷霧,隨數(shù)據(jù)量的激增,生產(chǎn)者收益增加,進(jìn)一步刺激劣質(zhì)數(shù)據(jù)產(chǎn)出。

3)管控機(jī)理:大量的迷霧數(shù)據(jù)流入科研大數(shù)據(jù)生態(tài)系統(tǒng)中引起監(jiān)管者(政府監(jiān)管部門(mén)等)注意,開(kāi)始干預(yù)生產(chǎn)者行為,對(duì)迷霧數(shù)據(jù)進(jìn)行管控,隨科研經(jīng)歷的增加,科研工作者數(shù)據(jù)鑒別能力逐步提升,開(kāi)始對(duì)迷霧數(shù)據(jù)進(jìn)行剔除與舉報(bào),生產(chǎn)者利益受阻,迷霧數(shù)據(jù)量逐漸減少,此時(shí)的迷霧呈現(xiàn)數(shù)據(jù)類(lèi)型趨于單一的焦聚型弱迷霧特點(diǎn)。

3.3.2機(jī)理間的內(nèi)在聯(lián)系

科研大數(shù)據(jù)迷霧催生因素多樣、生成過(guò)程復(fù)雜,但利益機(jī)理、擴(kuò)散機(jī)理、管控機(jī)理并不是孤立存在的,內(nèi)部具有一定的邏輯聯(lián)系,如圖9所示。

擴(kuò)散機(jī)理與利益機(jī)理的關(guān)聯(lián)關(guān)系。消費(fèi)者的策略選擇通常有消費(fèi)與不消費(fèi)兩種。生產(chǎn)者對(duì)高品質(zhì)科研大數(shù)據(jù)通常有保留和流出兩種策略,對(duì)科研大數(shù)據(jù)迷霧通常有保留和流出兩種策略。因此在科研大數(shù)據(jù)生態(tài)系統(tǒng)中存在的4種數(shù)據(jù)流轉(zhuǎn)策略:第一種是高價(jià)優(yōu)質(zhì)科研大數(shù)據(jù);第二種是低價(jià)優(yōu)質(zhì)科研大數(shù)據(jù);第三種是高價(jià)迷霧數(shù)據(jù);第四種是低價(jià)迷霧數(shù)據(jù)。在利益機(jī)理下,科研大數(shù)據(jù)生產(chǎn)者會(huì)向消費(fèi)者索要高回報(bào)。當(dāng)消費(fèi)者選擇消費(fèi)時(shí),可能高價(jià)買(mǎi)到優(yōu)質(zhì)數(shù)據(jù)或迷霧數(shù)據(jù),也可能低價(jià)買(mǎi)到優(yōu)質(zhì)數(shù)據(jù)或迷霧數(shù)據(jù),此時(shí)存在迷霧擴(kuò)散的可能;消費(fèi)者的收益為數(shù)據(jù)價(jià)值與獲取數(shù)據(jù)成本的差值;當(dāng)選擇不消費(fèi)時(shí),消費(fèi)者的得益為0,此時(shí)不存在迷霧擴(kuò)散的可能。

管控機(jī)理與利益機(jī)理的關(guān)聯(lián)關(guān)系。監(jiān)管者對(duì)于生產(chǎn)者的各種行為存在監(jiān)管與不監(jiān)管兩種策略。當(dāng)監(jiān)管者在利益機(jī)理作用下,為降低監(jiān)管成本,即松懈檢測(cè)時(shí),存在優(yōu)劣科研大數(shù)據(jù)混合。消費(fèi)者在明確要付出較大成本獲取數(shù)據(jù)時(shí)的得益應(yīng)該不小于不獲取數(shù)據(jù)的得益。由管控機(jī)理知,當(dāng)監(jiān)管者選擇監(jiān)管松懈時(shí),生產(chǎn)者流出迷霧數(shù)據(jù),但當(dāng)流出迷霧數(shù)據(jù)加大時(shí),監(jiān)管者會(huì)再次選擇監(jiān)管?chē)?yán)厲。當(dāng)生產(chǎn)者提供優(yōu)質(zhì)數(shù)據(jù)時(shí),監(jiān)管者又會(huì)選擇監(jiān)管松懈以減低監(jiān)管的成本支出。

擴(kuò)散機(jī)理與管控機(jī)理的關(guān)聯(lián)關(guān)系。監(jiān)管者對(duì)數(shù)據(jù)質(zhì)量嚴(yán)格監(jiān)管時(shí),生產(chǎn)者減少迷霧型數(shù)據(jù)的生產(chǎn),消費(fèi)者獲取迷霧數(shù)據(jù)的可能性降低,迷霧擴(kuò)散的概率隨之降低。監(jiān)管者對(duì)數(shù)據(jù)質(zhì)量監(jiān)管松懈時(shí),生產(chǎn)者加大迷霧型數(shù)據(jù)的生產(chǎn),更多的迷霧數(shù)據(jù)流轉(zhuǎn)到消費(fèi)者的手中,加大了迷霧的擴(kuò)散。

利益機(jī)理、擴(kuò)散機(jī)理與管控機(jī)理的關(guān)聯(lián)關(guān)系。如果監(jiān)管者嚴(yán)格監(jiān)管科研大數(shù)據(jù)生態(tài)系統(tǒng)中數(shù)據(jù)流通行為,生產(chǎn)者會(huì)向消費(fèi)者索要較低的報(bào)酬,消費(fèi)者得益大于0時(shí)會(huì)選擇接受科研大數(shù)據(jù)迷霧;否則生產(chǎn)者索要高報(bào)酬,生產(chǎn)者高低報(bào)酬比例使消費(fèi)者接受的得益大于不接受得益。在管控機(jī)理作用下,生產(chǎn)者若仍選擇流出迷霧數(shù)據(jù),此時(shí)監(jiān)管者將會(huì)實(shí)施系統(tǒng)內(nèi)部混合策略。當(dāng)監(jiān)管者對(duì)于生產(chǎn)者所產(chǎn)數(shù)據(jù)檢測(cè)不到位時(shí),消費(fèi)者無(wú)法根據(jù)生產(chǎn)者對(duì)所放出的報(bào)酬要求來(lái)判斷科研大數(shù)據(jù)的優(yōu)劣,此時(shí)迷霧擴(kuò)散的概率加大。利益機(jī)理、擴(kuò)散機(jī)理與管控機(jī)理分別發(fā)揮著催生、傳播、阻隔的作用,維持著科研大數(shù)據(jù)生態(tài)系統(tǒng)內(nèi)部的動(dòng)態(tài)平衡。

3.4科研大數(shù)據(jù)迷霧模型的應(yīng)用分析

1)應(yīng)用過(guò)程。第一步,確定對(duì)象。確定科研大數(shù)據(jù)所屬的領(lǐng)域及模型的運(yùn)用者。不同領(lǐng)域甚至同一領(lǐng)域的科研決策者、一線(xiàn)人員以及科技政策制定者的關(guān)注側(cè)重點(diǎn)各有不同。第二步,從科研大數(shù)據(jù)庫(kù)中獲取相關(guān)數(shù)據(jù)。此步驟應(yīng)注意科研大數(shù)據(jù)迷霧發(fā)現(xiàn)機(jī)制的實(shí)現(xiàn)問(wèn)題(是對(duì)已知數(shù)據(jù)的判斷還是對(duì)未知數(shù)據(jù)的挖掘)。第三步,開(kāi)展綜合分析。對(duì)科研大數(shù)據(jù)迷霧的類(lèi)型、路徑、機(jī)理進(jìn)行分析。從不同維度對(duì)科研大數(shù)據(jù)迷霧進(jìn)行類(lèi)型劃分,并探索其作用路徑及所處階段,為后續(xù)數(shù)據(jù)治理提供啟示。同時(shí)還應(yīng)注意數(shù)據(jù)的格式問(wèn)題以及人員間、人員與模型間的協(xié)同性問(wèn)題。第四步,形成結(jié)論,即對(duì)科研大數(shù)據(jù)的評(píng)價(jià)結(jié)果。第五步,將結(jié)論反饋決策者,提交數(shù)據(jù)質(zhì)量報(bào)告,為科研大數(shù)據(jù)治理提供合理化建議。

2)應(yīng)用場(chǎng)景。SRBDF-M具有較強(qiáng)的實(shí)用性,在科研大數(shù)據(jù)庫(kù)建設(shè)、科研決策、科研大數(shù)據(jù)政策制定等場(chǎng)景中均可使用,具體分析如下:①應(yīng)用場(chǎng)景一:科研大數(shù)據(jù)庫(kù)建設(shè)。隨著科技發(fā)展,科研人員對(duì)科研大數(shù)據(jù)的需求日益增加,科研大數(shù)據(jù)庫(kù)逐漸興起。將SRBDF-M引入到科研大數(shù)據(jù)庫(kù)建設(shè),可起到優(yōu)化數(shù)據(jù)存儲(chǔ)(通過(guò)SRBDF-M進(jìn)行數(shù)據(jù)篩選分類(lèi),剔除劣質(zhì)數(shù)據(jù)、無(wú)效數(shù)據(jù)、冗余數(shù)據(jù))、加強(qiáng)數(shù)據(jù)保護(hù)(通過(guò)SRBDF-M進(jìn)行迷霧型數(shù)據(jù)生產(chǎn)者溯源,減少劣質(zhì)數(shù)據(jù)的產(chǎn)出,如已有的科技資源標(biāo)識(shí)符與數(shù)字對(duì)象唯一標(biāo)識(shí)符)、促進(jìn)數(shù)據(jù)共享(數(shù)據(jù)共享成為科研大數(shù)據(jù)治理的重要任務(wù)之一,SRBDF-M可控制劣質(zhì)數(shù)據(jù)的流入,提高科研效率,加快科研大數(shù)據(jù)流轉(zhuǎn),同時(shí)保障數(shù)據(jù)權(quán)益使更多的科研成果參與共享)的作用;②應(yīng)用場(chǎng)景二:科研決策。SRBDF-M有助于實(shí)時(shí)、全面、準(zhǔn)確、專(zhuān)一的科研大數(shù)據(jù)清洗平臺(tái)的建設(shè),科研人員通過(guò)SRBDF-M獲取高精度數(shù)據(jù)使科研決策更加科學(xué)。大數(shù)據(jù)時(shí)代背景下大量冗余數(shù)據(jù)使得科研決策環(huán)境發(fā)生變化,SRBDF-M可有效評(píng)價(jià)數(shù)據(jù)優(yōu)劣、剔除冗余數(shù)據(jù),更好滿(mǎn)足管理者決策需求,為領(lǐng)導(dǎo)層的決策制定提供高價(jià)值、高精度的支撐數(shù)據(jù);③應(yīng)用場(chǎng)景三:科研大數(shù)據(jù)政策制定。從2008年的《中華人民共和國(guó)科技進(jìn)步法》到2015年的《促進(jìn)大數(shù)據(jù)發(fā)展的行動(dòng)綱要》,再至2018年的《科學(xué)數(shù)據(jù)管理辦法》,科研大數(shù)據(jù)的共享與利用不斷推進(jìn),然而由前文機(jī)理分析知科研大數(shù)據(jù)政策的制定過(guò)程是一個(gè)博弈行為,SRBDF-M可幫助政府分析系統(tǒng)內(nèi)部其他主體的選擇行為,了解科研大數(shù)據(jù)發(fā)展態(tài)勢(shì),提高科研大數(shù)據(jù)政策科學(xué)性。

4結(jié)語(yǔ)

1)科研大數(shù)據(jù)迷霧模型較好地描述了科研域迷霧數(shù)據(jù)出現(xiàn)、聚集、消散的演化過(guò)程。本研究提出了“科研大數(shù)據(jù)迷霧”的概念,并在科研大數(shù)據(jù)迷霧模型的建構(gòu)與解構(gòu)的過(guò)程中,從時(shí)間、空間、強(qiáng)度、利益、繁育等維度對(duì)科研大數(shù)據(jù)迷霧的類(lèi)型、路徑與生成機(jī)理進(jìn)行了詳盡剖析。研究得出科研大數(shù)據(jù)迷霧是指衍生于數(shù)據(jù)迷霧、貫穿于科研大數(shù)據(jù)生命周期,以科研域虛假、有毒、垃圾數(shù)據(jù)為重要組成部分,以全鏈性、不嚴(yán)格波動(dòng)性、派系性、霧化性、災(zāi)難性為基本特征,以初生型、激增型、衰退型、焦聚型、彌散型、強(qiáng)迷霧、弱迷霧、趨利型、趨害型、雜育型、寡育型為基本類(lèi)型,降低科研大數(shù)據(jù)質(zhì)量、干擾科研人員決策、引發(fā)數(shù)據(jù)災(zāi)難進(jìn)而擾亂科研大數(shù)據(jù)生態(tài)穩(wěn)定的一類(lèi)數(shù)據(jù)的總稱(chēng)。

2)科研大數(shù)據(jù)迷霧模型的建構(gòu)與解構(gòu)對(duì)于科研大數(shù)據(jù)治理具有重要的理論價(jià)值與實(shí)踐價(jià)值,主要體現(xiàn)在以下幾個(gè)方面:

①對(duì)科研大數(shù)據(jù)治理目標(biāo)的新安排??蒲写髷?shù)據(jù)迷霧概念的提出要求構(gòu)建科研大數(shù)據(jù)治理優(yōu)勢(shì)互補(bǔ)新布局,發(fā)現(xiàn)新優(yōu)勢(shì)、發(fā)掘新動(dòng)能、制定新規(guī)制、應(yīng)對(duì)“迷霧”新問(wèn)題,穩(wěn)科技研究預(yù)期、利創(chuàng)新發(fā)展長(zhǎng)遠(yuǎn),堅(jiān)持科研大數(shù)據(jù)良性轉(zhuǎn)化,健全科研大數(shù)據(jù)治理體制,優(yōu)化科研大數(shù)據(jù)資源配置,提升科研大數(shù)據(jù)創(chuàng)新效能,擴(kuò)大國(guó)際科研大數(shù)據(jù)共享,以完成開(kāi)放、共享、創(chuàng)新、多樣、穩(wěn)定、持續(xù)的科研大數(shù)據(jù)生態(tài)系統(tǒng)建設(shè)新目標(biāo)。

②對(duì)科研大數(shù)據(jù)內(nèi)涵的新豐富??蒲写髷?shù)據(jù)迷霧生成模型是對(duì)科研域虛假、有毒、垃圾數(shù)據(jù)運(yùn)行機(jī)理的深度闡釋。研究提出的“科研大數(shù)據(jù)迷霧”的概念具有整體性、原創(chuàng)性、前瞻性、引導(dǎo)性,以全局性的眼光看待整個(gè)科學(xué)研究過(guò)程中出現(xiàn)的迷霧數(shù)據(jù),并第一次系統(tǒng)地對(duì)科研域虛假的、有毒的垃圾數(shù)據(jù)進(jìn)行歸納與總結(jié),豐富了科研大數(shù)據(jù)理論,可為后續(xù)相關(guān)研究提供理論依據(jù)。

③對(duì)科研大數(shù)據(jù)治理價(jià)值旨?xì)w的新構(gòu)造。宏觀(guān)層面:在科研大數(shù)據(jù)蓬勃發(fā)展的時(shí)代背景下,厘清“迷霧”生成機(jī)理,是大數(shù)據(jù)發(fā)展中至關(guān)重要的一環(huán),有利于打破數(shù)據(jù)壁壘、加強(qiáng)科研數(shù)據(jù)共享、鞏固科研大數(shù)據(jù)生態(tài)系統(tǒng)的和諧穩(wěn)定,是對(duì)國(guó)家大數(shù)據(jù)戰(zhàn)略的積極響應(yīng)。中觀(guān)層面:在科學(xué)發(fā)展過(guò)程中,“迷霧”的存在將會(huì)成為科研進(jìn)步的絆腳石,揭露其存在是科學(xué)發(fā)展的“清朗”行動(dòng)。微觀(guān)層面:有助于幫助科研機(jī)構(gòu)、科研人員、企業(yè)更好地了解科研大數(shù)據(jù)迷霧,有效規(guī)避風(fēng)險(xiǎn),提高決策效率,從而增強(qiáng)自身核心競(jìng)爭(zhēng)力。

④對(duì)科研大數(shù)據(jù)治理風(fēng)險(xiǎn)的新研判。以生態(tài)系統(tǒng)的眼光探究“迷霧”,具有系統(tǒng)性、整體性、協(xié)同性、時(shí)效性的特點(diǎn)。在當(dāng)今安全赤字與治理赤字的大背景下,科研合作筑墻設(shè)壘、數(shù)據(jù)共享脫鉤斷鏈,是對(duì)治理體系、治理能力、治理水平的新挑戰(zhàn)??蒲写髷?shù)據(jù)共享過(guò)程中應(yīng)兼顧外部風(fēng)險(xiǎn)與內(nèi)部風(fēng)險(xiǎn)、傳統(tǒng)風(fēng)險(xiǎn)與非傳統(tǒng)風(fēng)險(xiǎn)、自身風(fēng)險(xiǎn)與共同風(fēng)險(xiǎn)。多階段、多主體、多維度分析迷霧類(lèi)型及演化,為整體有序地開(kāi)展科研大數(shù)據(jù)治理提供了新思路。

⑤對(duì)科研大數(shù)據(jù)治理舉措的新闡述??蒲写髷?shù)據(jù)迷霧概念的提出不僅要求健全科研大數(shù)據(jù)治理體系、增強(qiáng)科研大數(shù)據(jù)治理能力、提高科研大數(shù)據(jù)治理水平,還要求革新科研大數(shù)據(jù)治理舉措,夯實(shí)科研大數(shù)據(jù)生態(tài)穩(wěn)定基礎(chǔ)。主要包括治理框架的革新:構(gòu)建科研大數(shù)據(jù)安全應(yīng)急框架,實(shí)現(xiàn)全科研域數(shù)據(jù)、人才、環(huán)境聯(lián)動(dòng),立體高效地應(yīng)對(duì)科研大數(shù)據(jù)迷霧。治理體系的革新:對(duì)科研大數(shù)據(jù)生態(tài)進(jìn)行一體化保護(hù)、系統(tǒng)化治理,構(gòu)建面向“迷霧”特性的全局化、整體化的應(yīng)對(duì)性的科研大數(shù)據(jù)治理體系。治理過(guò)程的革新:以科研大數(shù)據(jù)生態(tài)系統(tǒng)內(nèi)外雙循環(huán)為輔助,遵循“迷霧”生命周期規(guī)律,多階段、多主體協(xié)同治理,注重迷霧治理過(guò)程的規(guī)范化、程序化,增強(qiáng)科研大數(shù)據(jù)生態(tài)鏈韌性。

3)盡管本文構(gòu)建了科研大數(shù)據(jù)迷霧模型,提出了科研大數(shù)據(jù)迷霧的概念,并對(duì)其特性、類(lèi)型、路徑、機(jī)理進(jìn)行了詳盡的剖析,但如何應(yīng)對(duì)科研大數(shù)據(jù)迷霧問(wèn)題、維持科研大數(shù)據(jù)生態(tài)的和諧穩(wěn)定,后續(xù)仍需深入討論。

猜你喜歡
數(shù)據(jù)治理生態(tài)系統(tǒng)模型
重要模型『一線(xiàn)三等角』
重尾非線(xiàn)性自回歸模型自加權(quán)M-估計(jì)的漸近分布
生態(tài)系統(tǒng)理論視角下醫(yī)院志愿者角色和功能的研究
生態(tài)系統(tǒng)視角下:農(nóng)村留守幼兒情緒問(wèn)題的形成
3D打印中的模型分割與打包
大數(shù)據(jù)治理模型與治理成熟度評(píng)估研究
FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
大數(shù)據(jù)時(shí)代城市治理:數(shù)據(jù)異化與數(shù)據(jù)治理