劉艷華秦士忠韓玥閆嵩馬奔徐吉
(1.北京出入境檢驗(yàn)檢疫局 北京 100026;2.中云智慧(北京)科技有限公司)
大數(shù)據(jù)實(shí)驗(yàn)室質(zhì)量控制的研究方向
劉艷華1秦士忠1韓玥1閆嵩2馬奔2徐吉2
(1.北京出入境檢驗(yàn)檢疫局 北京 100026;2.中云智慧(北京)科技有限公司)
實(shí)驗(yàn)室的管理者和質(zhì)量保證人員通過(guò)觀察質(zhì)量控制測(cè)試的數(shù)據(jù)變化趨勢(shì),可以發(fā)現(xiàn)某些檢測(cè)項(xiàng)目存在的變化趨勢(shì)和可能的風(fēng)險(xiǎn)。利用大數(shù)據(jù)分析技術(shù),對(duì)實(shí)驗(yàn)室數(shù)據(jù)進(jìn)行質(zhì)量控制,把大數(shù)據(jù)分析誤差控制在允許限度內(nèi)。在數(shù)據(jù)收集與統(tǒng)計(jì)分析的基礎(chǔ)上,可以進(jìn)行商業(yè)智能與趨勢(shì)預(yù)測(cè)方面的應(yīng)用,可以進(jìn)行實(shí)驗(yàn)數(shù)據(jù)異常點(diǎn)校驗(yàn)與關(guān)聯(lián)分析等方面的數(shù)據(jù)挖掘工作等。
大數(shù)據(jù);云計(jì)算;實(shí)驗(yàn)室;質(zhì)量控制
隨著人類(lèi)的進(jìn)步和科技的發(fā)展,計(jì)算機(jī)已經(jīng)成為人們生活和工作中必用的工具。計(jì)算機(jī)應(yīng)用的增多帶動(dòng)了數(shù)據(jù)量的增長(zhǎng),并且?guī)?dòng)了互聯(lián)網(wǎng)產(chǎn)業(yè)的發(fā)展,這次發(fā)展又帶來(lái)了一次數(shù)據(jù)增長(zhǎng)的高潮。在互聯(lián)網(wǎng)時(shí)代下,每個(gè)人都是數(shù)據(jù)的制造者。近年來(lái),物聯(lián)網(wǎng)、云計(jì)算、移動(dòng)互聯(lián)網(wǎng)的進(jìn)一步應(yīng)用,使數(shù)據(jù)呈指數(shù)級(jí)增長(zhǎng)。正是因?yàn)閿?shù)據(jù)瘋狂式增長(zhǎng),“大數(shù)據(jù)”才慢慢地被各界所研究。
大數(shù)據(jù)是指在不可承受的時(shí)間范圍內(nèi)用常規(guī)軟件工具進(jìn)行獲取、管理和處理的數(shù)據(jù)集合。大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對(duì)這些含有意義的數(shù)據(jù)進(jìn)行專(zhuān)業(yè)化處理。從技術(shù)上看,大數(shù)據(jù)與云計(jì)算的關(guān)系就像一枚硬幣的正反面一樣密不可分,大數(shù)據(jù)無(wú)法用單臺(tái)的計(jì)算機(jī)進(jìn)行處理,必須采用分布式架構(gòu)。它的特色在于對(duì)海量數(shù)據(jù)進(jìn)行分布式數(shù)據(jù)挖掘,但它必須依托云計(jì)算的分布式處理、分布式數(shù)據(jù)庫(kù)和云存儲(chǔ)、虛擬化技術(shù)。
2.1 國(guó)外發(fā)展?fàn)顩r
2.1.1 國(guó)家啟動(dòng)大數(shù)據(jù)布局
2012年3月,奧巴馬政府投資2億美元啟動(dòng)“大數(shù)據(jù)研究和發(fā)展計(jì)劃”;2012年7月,日本發(fā)布“新ICT計(jì)劃”,重點(diǎn)關(guān)注大數(shù)據(jù)研究和應(yīng)用。
2.1.2 跨國(guó) IT企業(yè)進(jìn)入大數(shù)據(jù)領(lǐng)域
谷歌、Facebook等大數(shù)據(jù)資源企業(yè)優(yōu)勢(shì)顯現(xiàn);甲骨文、IBM、 微軟、SYBASE、 EMC、Intel等企業(yè)陸續(xù)推出大數(shù)據(jù)產(chǎn)品和方案,如甲骨文公司的Oracle NoSQL數(shù)據(jù)庫(kù)、IBM公司的InfoSphereBigInsights數(shù)據(jù)分析平臺(tái)、微軟公司W(wǎng)indows Azure上的HDInsight大數(shù)據(jù)解決方案、EMC公司的Greenplum UAP大數(shù)據(jù)引擎等。
2.1.3 大數(shù)據(jù)技術(shù)發(fā)展迅猛
以 HDFS、GFS、MapReduce、Hadoop、Storm、HBase、MongoDB為代表的一批大數(shù)據(jù)通用技術(shù)和開(kāi)源項(xiàng)目迅猛發(fā)展。
2.1.4 數(shù)據(jù)科學(xué)研究不斷壯大
美國(guó)哥倫比亞大學(xué)和紐約大學(xué)、澳大利亞悉尼科技大學(xué)、日本名古屋大學(xué)、韓國(guó)釜山國(guó)立大學(xué)等紛紛成立數(shù)據(jù)科學(xué)研究機(jī)構(gòu);美國(guó)加州大學(xué)伯克利分校和伊利諾伊大學(xué)香檳分校、英國(guó)鄧迪大學(xué)、中國(guó)香港中文大學(xué)等一大批高校開(kāi)設(shè)了數(shù)據(jù)科學(xué)課程。
2.2 國(guó)內(nèi)發(fā)展?fàn)顩r我國(guó)國(guó)內(nèi)發(fā)展的狀況見(jiàn)表1。
表1 國(guó)內(nèi)發(fā)展?fàn)顩r
當(dāng)前對(duì)大數(shù)據(jù)的研究大致可以分為專(zhuān)注于研究大數(shù)據(jù)的復(fù)雜性和計(jì)算模型的基礎(chǔ)理論,以及著眼于大數(shù)據(jù)的感知與表示、內(nèi)容建模與語(yǔ)義理解,和大數(shù)據(jù)計(jì)算架構(gòu)體系的關(guān)鍵技術(shù)這樣兩個(gè)層面。下面簡(jiǎn)要介紹相應(yīng)的研究現(xiàn)狀。
3.1 基礎(chǔ)理論方面
針對(duì)大數(shù)據(jù)的復(fù)雜性,前期的研究主要是對(duì)網(wǎng)絡(luò)上多種來(lái)源的數(shù)據(jù)進(jìn)行性質(zhì)分析和規(guī)律探索,很多學(xué)者嘗試運(yùn)用圖論和統(tǒng)計(jì)分析等方法對(duì)數(shù)據(jù)進(jìn)行定量分析。特別值得注意的是,人們已經(jīng)發(fā)現(xiàn)了復(fù)雜的網(wǎng)絡(luò)大數(shù)據(jù)之中存在一些統(tǒng)計(jì)規(guī)律性。面對(duì)大數(shù)據(jù)的復(fù)雜性,還有一些學(xué)者嘗試使用統(tǒng)計(jì)方法和復(fù)雜網(wǎng)絡(luò)方法來(lái)研究如何對(duì)大數(shù)據(jù)進(jìn)行按需約簡(jiǎn)。但這類(lèi)基于統(tǒng)計(jì)的方法在處理大數(shù)據(jù)時(shí)其時(shí)效性難以保證。
針對(duì)大數(shù)據(jù)的計(jì)算理論和算法的研究目前主要集中在大數(shù)據(jù)機(jī)器學(xué)習(xí)的基礎(chǔ)理論、參數(shù)估計(jì)方法、優(yōu)化算法等方面,形成的一系列成果為大數(shù)據(jù)高效計(jì)算提供了理論支持。
3.2 關(guān)鍵技術(shù)方面
爬蟲(chóng)是當(dāng)前大數(shù)據(jù)感知和獲取的基本技術(shù),已得到迅速發(fā)展和廣泛應(yīng)用,但仍不能有效應(yīng)對(duì)被稱(chēng)為Web2.0的新一代互聯(lián)網(wǎng)數(shù)據(jù)[1]。為了有效利用網(wǎng)絡(luò)大數(shù)據(jù),需要將異構(gòu)、低質(zhì)量的網(wǎng)絡(luò)數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)統(tǒng)一的高質(zhì)量數(shù)據(jù),因此業(yè)界提出了一系列數(shù)據(jù)抽取算法。但總的來(lái)說(shuō),將這些技術(shù)直接用于大數(shù)據(jù)處理,在數(shù)據(jù)處理的規(guī)模和得到的數(shù)據(jù)質(zhì)量方面還不能令人滿意。另一方面,人們很早就認(rèn)識(shí)到了動(dòng)態(tài)性和時(shí)效性是大數(shù)據(jù)的重要特性[2],數(shù)據(jù)流(data stream)[3,4]和時(shí)間序列(time series)[5]是表示和處理數(shù)據(jù)動(dòng)態(tài)性和時(shí)效性的主要技術(shù)。同樣,從數(shù)據(jù)的可處理規(guī)模和功能上,傳統(tǒng)數(shù)據(jù)流和時(shí)間序列技術(shù)還無(wú)法滿足大數(shù)據(jù)處理的需求。
大數(shù)據(jù)的架構(gòu)體系研究首先需要關(guān)注的問(wèn)題就是大數(shù)據(jù)如何存儲(chǔ),大數(shù)據(jù)存儲(chǔ)的形式包括分布式的文件系統(tǒng)、分布式的鍵值對(duì)存儲(chǔ)以及分布式數(shù)據(jù)庫(kù)存儲(chǔ)。當(dāng)前的研究也集中在這3個(gè)方面,并依據(jù)應(yīng)用的需求進(jìn)行相關(guān)優(yōu)化。在分布式文件系統(tǒng)研究方面,傳統(tǒng)的分布式文件系統(tǒng)NFS應(yīng)用最為廣泛[6]。
近年來(lái),數(shù)據(jù)管理系統(tǒng)以及大數(shù)據(jù)在實(shí)驗(yàn)室管理研究中的應(yīng)用日益增高。
2012年,韓深等[7]將科學(xué)數(shù)據(jù)管理系統(tǒng)應(yīng)用在出入境檢驗(yàn)檢疫中,以實(shí)驗(yàn)室數(shù)據(jù)管理過(guò)程中的重要結(jié)點(diǎn)為研究對(duì)象,比較了傳統(tǒng)數(shù)據(jù)管理方式和實(shí)驗(yàn)室科學(xué)數(shù)據(jù)管理系統(tǒng)各自的特點(diǎn)及優(yōu)勢(shì),并通過(guò)研究和引進(jìn)對(duì)接,建立了適用于檢驗(yàn)檢疫實(shí)驗(yàn)室的數(shù)據(jù)管理系統(tǒng)。該系統(tǒng)將實(shí)驗(yàn)室分析儀器與數(shù)據(jù)庫(kù)對(duì)接,使儀器生成的原始數(shù)據(jù)能夠在線上傳到服務(wù)器中并保存,避免了原始數(shù)據(jù)的丟失和被修改。同時(shí),通過(guò)數(shù)據(jù)管理系統(tǒng)可以方便地對(duì)檢測(cè)報(bào)告進(jìn)行調(diào)閱,大大提高了各級(jí)審核的效率。利用實(shí)驗(yàn)室科學(xué)數(shù)據(jù)管理系統(tǒng)與實(shí)驗(yàn)室LIMS系統(tǒng)、財(cái)務(wù)預(yù)算管理系統(tǒng)、試劑耗材管理系統(tǒng)、CIQ2000等系統(tǒng)進(jìn)行對(duì)接,搭建了實(shí)驗(yàn)室數(shù)據(jù)交互平臺(tái),實(shí)現(xiàn)了現(xiàn)代實(shí)驗(yàn)室數(shù)據(jù)科學(xué)、高效、安全。
2014年,吳梅[8]以貴州地質(zhì)礦產(chǎn)中心實(shí)驗(yàn)室為例,闡述了大數(shù)據(jù)及其對(duì)地礦分析測(cè)試工作的啟示。在介紹大數(shù)據(jù)的內(nèi)涵基礎(chǔ)上,分析大數(shù)據(jù)的特征和時(shí)代價(jià)值,探討其帶給社會(huì)經(jīng)濟(jì)發(fā)展的意義,結(jié)果顯示大數(shù)據(jù)時(shí)代對(duì)地質(zhì)礦產(chǎn)實(shí)驗(yàn)室的分析測(cè)試數(shù)據(jù)庫(kù)建設(shè)和管理工作帶來(lái)了新的機(jī)遇。
2014年,梁祥炎等[9]在大數(shù)據(jù)下的實(shí)驗(yàn)室研究中闡明,大數(shù)據(jù)近年來(lái)引起各領(lǐng)域的廣泛關(guān)注,大數(shù)據(jù)毋庸置疑將對(duì)各方面產(chǎn)生重大影響。實(shí)驗(yàn)室作為科學(xué)研究的陣地現(xiàn)有諸多不足,必定會(huì)受大數(shù)據(jù)沖擊。大數(shù)據(jù)是實(shí)驗(yàn)室研究工具的創(chuàng)新,能有效反映實(shí)驗(yàn)室研究動(dòng)態(tài),尋找內(nèi)部深層次規(guī)律,對(duì)實(shí)驗(yàn)室研究進(jìn)行有效感知。大數(shù)據(jù)打破人認(rèn)識(shí)及思維局限,實(shí)現(xiàn)實(shí)驗(yàn)室研究的協(xié)同創(chuàng)新及社會(huì)化,使實(shí)驗(yàn)室研究減少不必要的實(shí)驗(yàn),實(shí)現(xiàn)實(shí)驗(yàn)的可預(yù)測(cè)。鑒于大數(shù)據(jù)對(duì)實(shí)驗(yàn)室研究的重要性,應(yīng)提高實(shí)驗(yàn)研究人員對(duì)信息數(shù)據(jù)的主動(dòng)性和敏感性,創(chuàng)新實(shí)驗(yàn)室研究方式和方法,培養(yǎng)實(shí)驗(yàn)室大數(shù)據(jù)人才,增強(qiáng)實(shí)驗(yàn)室研究的合作,加強(qiáng)實(shí)驗(yàn)室大數(shù)據(jù)的硬件設(shè)施建設(shè),完善相關(guān)制度。
2014年,梁祥炎[10]在基于現(xiàn)象學(xué)方法的大數(shù)據(jù)實(shí)驗(yàn)室研究中表示,在大數(shù)據(jù)背景下,實(shí)驗(yàn)室研究的思維方法和方式都會(huì)產(chǎn)生重大變革。用現(xiàn)象學(xué)方法中的先驗(yàn)、解釋以及體驗(yàn)等研究方法看待大數(shù)據(jù)下的實(shí)驗(yàn)室研究,以及探明實(shí)驗(yàn)室研究在大數(shù)據(jù)背景下的具體作用機(jī)理。
2015年,吳明念[11]開(kāi)展了基于應(yīng)用型本科院校的大數(shù)據(jù)實(shí)驗(yàn)室建設(shè)探究,從闡釋大數(shù)據(jù)的內(nèi)涵出發(fā),探討大數(shù)據(jù)應(yīng)用型技術(shù)人才的需求、組建大數(shù)據(jù)實(shí)驗(yàn)室的意義和目標(biāo)、大數(shù)據(jù)實(shí)驗(yàn)室建設(shè)方案及內(nèi)容。
2015年,王定珠等[12]詳細(xì)介紹了電子病歷、手持移動(dòng)終端、大數(shù)據(jù)采集與分析、數(shù)據(jù)安全在醫(yī)療質(zhì)控中的應(yīng)用。
5.1 大數(shù)據(jù)實(shí)驗(yàn)室質(zhì)量控制的作用
實(shí)驗(yàn)室的質(zhì)量管理架構(gòu)中,檢測(cè)結(jié)果的質(zhì)量保證是關(guān)鍵的一環(huán)。實(shí)驗(yàn)室通過(guò)內(nèi)部和外部質(zhì)量控制了解分析檢測(cè)結(jié)果偏差情況,采集和分析質(zhì)量控制數(shù)據(jù),然后采取糾正和糾正措施,從而保證檢測(cè)結(jié)果的可靠性和準(zhǔn)確性,并在具備條件的檢測(cè)設(shè)備上將質(zhì)量控制數(shù)據(jù)實(shí)時(shí)上傳,形成動(dòng)態(tài)的質(zhì)量控制圖,以便更有針對(duì)性地改進(jìn)檢測(cè)工作。
為保證檢測(cè)質(zhì)量的可靠性,實(shí)驗(yàn)室需要采用統(tǒng)計(jì)技術(shù)對(duì)實(shí)驗(yàn)室進(jìn)行實(shí)驗(yàn)室內(nèi)部和外部質(zhì)量控制。在實(shí)驗(yàn)室制訂質(zhì)量控制計(jì)劃的時(shí)候需要考慮的數(shù)據(jù)來(lái)源有:特定時(shí)間內(nèi)的檢測(cè)項(xiàng)目數(shù)、不同檢測(cè)項(xiàng)目匹配的基質(zhì)數(shù)、檢測(cè)方法覆蓋的領(lǐng)域范圍、歷年質(zhì)量控制計(jì)劃的結(jié)果、可重復(fù)性檢測(cè)結(jié)果的數(shù)量、客戶投訴的檢測(cè)項(xiàng)目、內(nèi)審中發(fā)現(xiàn)問(wèn)題的檢測(cè)項(xiàng)目以及實(shí)驗(yàn)室管理機(jī)構(gòu)規(guī)范性要求等。實(shí)驗(yàn)室的管理者和質(zhì)量保證人員通過(guò)觀察質(zhì)量控制測(cè)試的數(shù)據(jù)變化趨勢(shì),可以發(fā)現(xiàn)某些檢測(cè)項(xiàng)目存在的變化趨勢(shì)和可能的風(fēng)險(xiǎn)。
質(zhì)量控制的方式包括定期使用有證標(biāo)準(zhǔn)物質(zhì)進(jìn)行監(jiān)控或使用次級(jí)標(biāo)準(zhǔn)物質(zhì)開(kāi)展內(nèi)部質(zhì)量控制;參加實(shí)驗(yàn)室間比對(duì)或能力驗(yàn)證計(jì)劃;使用方法比對(duì);留樣再測(cè);一個(gè)物品不同特性結(jié)果的相關(guān)性分析。實(shí)驗(yàn)室將上述質(zhì)控方式產(chǎn)生的結(jié)果,與實(shí)驗(yàn)室的自我質(zhì)量要求納入大數(shù)據(jù)分析,篩查出有必要進(jìn)行質(zhì)量控制的項(xiàng)目數(shù)據(jù),避免人為確定質(zhì)量控制項(xiàng)目的盲目性,使得實(shí)驗(yàn)室質(zhì)量控制更加科學(xué)合理,降低實(shí)驗(yàn)室質(zhì)量控制運(yùn)行成本。
當(dāng)實(shí)驗(yàn)室數(shù)據(jù)采用大數(shù)據(jù)分析技術(shù),具有較完善基礎(chǔ)及分析工作者具有一定素質(zhì)之后,實(shí)驗(yàn)室使用內(nèi)部和外部質(zhì)量控制是科學(xué)管理實(shí)驗(yàn)室的主要方式和組成部分。
5.2 大數(shù)據(jù)實(shí)驗(yàn)室質(zhì)量控制應(yīng)與技術(shù)發(fā)展對(duì)接
(1)大數(shù)據(jù)與互聯(lián)網(wǎng)的發(fā)明一樣,絕不僅僅是信息技術(shù)領(lǐng)域的革命,更是在全球范圍加速企業(yè)創(chuàng)新、引領(lǐng)社會(huì)變革的利器。
現(xiàn)代關(guān)系學(xué)之父德魯克有言,預(yù)測(cè)未來(lái)最好的方法,就是去創(chuàng)造未來(lái)。而大數(shù)據(jù)戰(zhàn)略,則是當(dāng)下領(lǐng)航全球的先機(jī)。各類(lèi)實(shí)驗(yàn)室作為創(chuàng)新基點(diǎn),應(yīng)該充分吸納大數(shù)據(jù)技術(shù)帶來(lái)的便利,更好地與技術(shù)發(fā)展對(duì)接。
(2)及時(shí)判斷、分析實(shí)驗(yàn)結(jié)果發(fā)展和應(yīng)用趨勢(shì)。
大數(shù)據(jù)需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力,成為海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)。從數(shù)據(jù)的類(lèi)別上看,大數(shù)據(jù)指的是無(wú)法使用傳統(tǒng)流程或工具處理或分析的信息。它定義了那些超出正常處理范圍和大小、迫使用戶采用非傳統(tǒng)處理方法的數(shù)據(jù)集。而實(shí)驗(yàn)室數(shù)據(jù)龐大且冗雜,雖有一定規(guī)律性,但很容易產(chǎn)生數(shù)據(jù)變異。實(shí)驗(yàn)室數(shù)據(jù)分析與大數(shù)據(jù)技術(shù)相結(jié)合,利用并行運(yùn)算和開(kāi)源的大數(shù)據(jù)分析工具(如Hadoop),通過(guò)大量實(shí)驗(yàn)大數(shù)據(jù)應(yīng)用狀況,可以分析、預(yù)測(cè)實(shí)驗(yàn)最終結(jié)果的趨勢(shì),便于研究人員解決他們的難題,靈活、快速、高效地響應(yīng)。
(3)可對(duì)實(shí)驗(yàn)室進(jìn)行有效考核。
利用大數(shù)據(jù)分析技術(shù),對(duì)實(shí)驗(yàn)室數(shù)據(jù)進(jìn)行質(zhì)量控制,把大數(shù)據(jù)分析誤差控制在允許限度內(nèi),從而保證分析結(jié)果具有一定精密度和準(zhǔn)確度,使分析數(shù)據(jù)在規(guī)定的置信水平內(nèi),達(dá)到所要求的質(zhì)量。同時(shí),也是對(duì)新方法、新技術(shù)可靠性有效考核的一種方式。
5.3 商業(yè)智能與趨勢(shì)預(yù)測(cè)方面的應(yīng)用
(1)在數(shù)據(jù)收集與統(tǒng)計(jì)分析的基礎(chǔ)上,進(jìn)行商業(yè)智能與趨勢(shì)預(yù)測(cè)方面的應(yīng)用。
實(shí)驗(yàn)數(shù)據(jù)經(jīng)過(guò)處理之后進(jìn)行入庫(kù)處理,建立歷史數(shù)據(jù)庫(kù),然后進(jìn)行統(tǒng)計(jì)分析與商業(yè)智能分析。商業(yè)智能又稱(chēng)商業(yè)智慧或商務(wù)智能,指用現(xiàn)代數(shù)據(jù)倉(cāng)庫(kù)技術(shù)、線上分析處理技術(shù)、數(shù)據(jù)挖掘和數(shù)據(jù)展現(xiàn)技術(shù)進(jìn)行數(shù)據(jù)分析以實(shí)現(xiàn)商業(yè)價(jià)值,在有歷史數(shù)據(jù)的支持下,可以使用商業(yè)智能技術(shù)做出豐富的報(bào)表統(tǒng)計(jì),同時(shí)使用arima模型進(jìn)行趨勢(shì)分析和預(yù)測(cè),得出未來(lái)可能的實(shí)驗(yàn)數(shù)據(jù)。
(2)在數(shù)據(jù)收集與統(tǒng)計(jì)分析的基礎(chǔ)上,進(jìn)行實(shí)驗(yàn)數(shù)據(jù)異常點(diǎn)校驗(yàn)與關(guān)聯(lián)分析等方面的數(shù)據(jù)挖掘工作。
實(shí)驗(yàn)數(shù)據(jù)檢測(cè)結(jié)果可以使用樸素貝葉斯模型進(jìn)行異常點(diǎn)校驗(yàn),將不符合常見(jiàn)歷史數(shù)據(jù)的異常點(diǎn)篩選出來(lái),再進(jìn)行人工比對(duì)確定該實(shí)驗(yàn)數(shù)據(jù)的正確性;同時(shí)可以使用fptree等算法進(jìn)行關(guān)聯(lián)挖掘,分析歷史數(shù)據(jù)間的關(guān)聯(lián)關(guān)系。
借助大數(shù)據(jù)的統(tǒng)計(jì)結(jié)果可以幫助實(shí)驗(yàn)室質(zhì)量保證工作擺脫滯后和被動(dòng)的角色,避免人為確定質(zhì)量控制項(xiàng)目的盲目性,成為預(yù)判和主動(dòng)改進(jìn)的工具。基于大數(shù)據(jù)分析的實(shí)驗(yàn)室質(zhì)量控制應(yīng)與技術(shù)發(fā)展緊密對(duì)接,當(dāng)采用大數(shù)據(jù)分析技術(shù)具有較完善基礎(chǔ)及分析工作者具有一定素質(zhì)之后,實(shí)驗(yàn)室的內(nèi)部和外部質(zhì)量控制應(yīng)是科學(xué)管理實(shí)驗(yàn)室的主要方式和組成部分。在數(shù)據(jù)收集與統(tǒng)計(jì)分析的基礎(chǔ)上,實(shí)驗(yàn)數(shù)據(jù)在商業(yè)智能與趨勢(shì)預(yù)測(cè)方面有著廣泛應(yīng)用前景。
[1]Cho J,Garcia-Molina Hector,Page Lawrence.Efficientcrawling through url ordering[C].WWW 1998,April14-18,Brisbane,Australia.
[2]Fetterly Dennis,Manasse Mark,Najork Marc,et al.Alarge-scale study of the evolution of Web pages[J].Software:Practice and Experience,Special Issue:Web Technologies,2004,34(2):213-237.
[3]Motwani R,Widom J,Arasu A,et al.Query Processing,Resource Management,and Approximationin a Data Stream Management System[R].CIDR 2003.
[4]Chen Yixin,Dong Guozhu,Han Jiawei,et al.Multidimensionalregression analysis of time-series datastreams[C]//VLDB 2002:323-334.
[5]James D Hamilton.Time Series Analysis[M].Princeton University Press,1994.
[6]Shepler S,Callaghan B,Robinson D,et al.NFSv4.Request for Comments,2003,3530.
[7]韓深,劉巖,馮騫,等.科學(xué)數(shù)據(jù)管理系統(tǒng)在進(jìn)出境檢驗(yàn)檢疫中的應(yīng)用[J].檢驗(yàn)檢疫學(xué)刊,2012,22(2):51-53,57.
[8]吳梅.大數(shù)據(jù)及其對(duì)地礦分析測(cè)試工作的啟示——以貴州地質(zhì)礦產(chǎn)中心實(shí)驗(yàn)室為例[J].價(jià)值工程,2014,(17):234-235.
[9]梁祥炎,莫曉靜.大數(shù)據(jù)下的實(shí)驗(yàn)室研究 [J].技術(shù)與市場(chǎng),2014,21(7):7-10.
[10]梁祥炎.基于現(xiàn)象學(xué)方法的大數(shù)據(jù)實(shí)驗(yàn)室研究 [J].科技廣場(chǎng),2014,(5):6-11.
[11]吳明念.基于應(yīng)用型本科院校的大數(shù)據(jù)實(shí)驗(yàn)室建設(shè)探究[J].電腦知識(shí)與技術(shù),2015,11(16):6-7.
[12]王定珠,周凡漪.電子病歷、手持移動(dòng)終端、大數(shù)據(jù)采集與分析、數(shù)據(jù)安全在醫(yī)療質(zhì)控中的應(yīng)用 [J].中華醫(yī)學(xué)圖書(shū)情報(bào)雜志,2015,24(12):56-58.
The Research Orientation of Quality Control in Big Data Labs
LIU Yanhua1, QIN Shizhong1, HAN Yue1, YAN Song2,MA Ben2, XU Ji2
(1.Beijing Entry-Exit Inspection and Quarantine Bureau, Beijing, 100026;2.Sinocloud Wisdom(Beijing)Technology Co.,Ltd)
Laboratory management and quality assurance technician can identify the variation trend and possible risk of some test items by observing the data variation tendency of quality control test.The big data analysis technology can be used to the quality control on laboratory data,which ensures the big data analysis error control within the allowable limit.Based on the data collection and statistical analysis,big data technology can be used not only for the application of business intelligence and trend forecast,but also for the abnormal point calibration of experiment data and the correlation analysis of datamining,etc.
Big Data;Cloud Computing;Laboratory;Quality Control
G482
E-mail:liuyh@bjciq.gov.cn
國(guó)家認(rèn)監(jiān)委認(rèn)證認(rèn)可科技支撐計(jì)劃(2016RJWKJ015)
2017-02-24