侯利勤
摘要:隨著信息化在現(xiàn)代化廣播發(fā)射電臺(tái)科學(xué)發(fā)展中的地位和作用越發(fā)重要,信息化已經(jīng)是廣播發(fā)射電臺(tái)推進(jìn)管理創(chuàng)新的迫切需要,是廣播發(fā)射電臺(tái)全面可持續(xù)發(fā)展的不竭動(dòng)力。數(shù)據(jù)挖掘技術(shù)對(duì)信息化的現(xiàn)代化廣播發(fā)射電臺(tái)的管理、運(yùn)行和維護(hù)工作有十分的現(xiàn)實(shí)意義。
關(guān)鍵詞:數(shù)據(jù)挖掘 運(yùn)行 維護(hù)
中圖分類號(hào):TN913.33 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2014)10-0043-01
隨著各類信息化系統(tǒng)在廣播發(fā)射電臺(tái)的大量普及和應(yīng)用,積累和產(chǎn)生了大量的信息數(shù)據(jù),這些信息數(shù)據(jù)包含著很多對(duì)我們有用的數(shù)據(jù)。深入的分析和利用這些數(shù)據(jù)對(duì)我們了解和掌握發(fā)射機(jī)的參數(shù)有著很大作用。數(shù)據(jù)挖掘概念的引入無疑對(duì)廣播發(fā)射電臺(tái)的科學(xué)維護(hù)、規(guī)范運(yùn)行具有重要的意義。
1 數(shù)據(jù)挖掘的定義
所謂的數(shù)據(jù)挖掘就是從大量隨機(jī)的,繁雜的,有噪聲的數(shù)據(jù)中提取隱含在其中我們事先不知道,但是對(duì)我們有作用的信息和數(shù)據(jù)的過程。近年來,各行業(yè)信息量的激增,引發(fā)了諸多學(xué)者對(duì)數(shù)據(jù)挖掘方法的探索。
我們所說的數(shù)據(jù)融合、數(shù)據(jù)分析以及決策支持都屬于數(shù)據(jù)挖掘。數(shù)據(jù)挖掘要求數(shù)據(jù)源必須是大量真實(shí)包含噪聲的;通過挖掘產(chǎn)生的對(duì)于我們可以接受的有用數(shù)據(jù)必須是我們需要的,他不需要是定理式的通用數(shù)據(jù),關(guān)鍵是為我們的決策產(chǎn)生作用。原始數(shù)據(jù)的呈現(xiàn)可以是結(jié)構(gòu)化像關(guān)系數(shù)據(jù)庫(kù)中的數(shù)據(jù);或者是半結(jié)構(gòu)化的文本、圖形和圖像數(shù)據(jù);甚至還有分布在網(wǎng)絡(luò)上的異構(gòu)型數(shù)據(jù)等多種存在的形式。發(fā)掘數(shù)據(jù)的方式也是多樣的??梢允茄堇[的,也可以是歸納的。發(fā)現(xiàn)的數(shù)據(jù)我們可以用來優(yōu)化我們的查詢數(shù)據(jù),也可以支撐我們的決策或者是對(duì)數(shù)據(jù)自身的維護(hù)。因此,數(shù)據(jù)挖掘是一門交叉學(xué)科,他為我們對(duì)數(shù)據(jù)低層次的查詢應(yīng)用,提升到挖掘內(nèi)容,為我們的決定提供支撐。這里所說的知識(shí)發(fā)現(xiàn),不是傳統(tǒng)意義上的科學(xué)定理和科學(xué)的公式,實(shí)際上,所有發(fā)現(xiàn)的知識(shí)都是相對(duì)的,是有特定前提和約束條件,面向特定領(lǐng)域的,同時(shí)還要能夠易于被用戶理解。最好能用自然語言表達(dá)所發(fā)現(xiàn)的結(jié)果,這無疑對(duì)我們提高設(shè)備運(yùn)維的科學(xué)化、針對(duì)性和實(shí)用性有著非凡的意義。
數(shù)據(jù)挖掘技術(shù)的意義是可以幫助我們從繁雜冗余的數(shù)據(jù)庫(kù)里,快速的找的可以為我們所用的隱含的的有價(jià)值的信息。數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘都是決策支持新技術(shù),但他們有著完全不同的輔助決策方式。數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)著大量的輔助決策的數(shù)據(jù),為不同的用戶隨時(shí)提供各種輔助決策的隨機(jī)查詢、綜合信息或趨勢(shì)分析信息。數(shù)據(jù)挖掘是利用一系列算法挖掘數(shù)據(jù)中隱含的信息和知識(shí),讓用戶在決策中使用。
因此,可以簡(jiǎn)單地說,數(shù)據(jù)挖掘主要目的是從大量的信息數(shù)據(jù)里面挖掘的我們可以用的信息。
2 數(shù)據(jù)挖掘系統(tǒng)的主要組成
采用數(shù)據(jù)挖掘的廣義觀點(diǎn):數(shù)據(jù)挖掘是從存放在數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)或其它信息庫(kù)中的大量數(shù)據(jù)挖掘有趣知識(shí)的過程?;谶@種觀點(diǎn),典型的數(shù)據(jù)挖掘系統(tǒng)具有以下主要成分:
知識(shí)庫(kù):這是領(lǐng)域知識(shí),用于指導(dǎo)搜索,或評(píng)估結(jié)果模式的興趣度。這種知識(shí)可能包括概念分層,用于將屬性或?qū)傩灾到M織成不同的抽象層。用戶確信方面的知識(shí)也可以包含在內(nèi)??梢允褂眠@種知識(shí),根據(jù)非期望性評(píng)估模式的興趣度。領(lǐng)域知識(shí)的其它例子有興趣度限制或閾值和元數(shù)據(jù)。
數(shù)據(jù)挖掘引擎:這是構(gòu)建數(shù)據(jù)挖掘系統(tǒng)的基礎(chǔ)組成部分,有計(jì)算的功能模塊組成,可以為我們提供像事物關(guān)聯(lián),分類,演變和偏差之類的分析過程。
模式評(píng)估模塊:通常,該部分使用興趣度度量,并與挖掘模塊交互,以便將搜索聚焦在有趣的模式上。它可能使用興趣度閾值過濾發(fā)現(xiàn)的模式。模式評(píng)估模塊也可以與挖掘模塊集成在一起,這依賴于所用的數(shù)據(jù)挖掘方法的實(shí)現(xiàn)。對(duì)于有效的數(shù)據(jù)挖掘,建議盡可能地將模式評(píng)估推進(jìn)到挖掘過程之中,以便將搜索限制在有興趣的模式上。
圖形用戶界面:該模塊在用戶和挖掘系統(tǒng)之間通訊,允許用戶與系統(tǒng)交互,指定數(shù)據(jù)挖掘查詢或任務(wù),提供信息、幫助搜索聚焦,根據(jù)數(shù)據(jù)挖掘的中間結(jié)果進(jìn)行探索式數(shù)據(jù)挖掘。此外,該成分還允許用戶瀏覽數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)模式或數(shù)據(jù)結(jié)構(gòu),評(píng)估挖掘的模式,以不同的形式對(duì)模式可視化。數(shù)據(jù)挖掘涉及多學(xué)科技術(shù)的集成,包括數(shù)據(jù)庫(kù)技術(shù)、統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、高性能計(jì)算、模式識(shí)別、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)可視化、信息提取、圖象與信號(hào)處理和空間數(shù)據(jù)分析。通過數(shù)據(jù)挖掘,可以從數(shù)據(jù)庫(kù)提取有趣的知識(shí)、規(guī)律、或高層信息,并可以從不同角度觀察或?yàn)g覽。發(fā)現(xiàn)的知識(shí)可以用于決策、過程控制、信息管理、查詢處理等等。因此,數(shù)據(jù)挖掘被信息產(chǎn)業(yè)界認(rèn)為是數(shù)據(jù)庫(kù)系統(tǒng)最重要的前沿之一,是信息產(chǎn)業(yè)最有前途的交叉學(xué)科。
3 數(shù)據(jù)挖掘的主要任務(wù)
數(shù)據(jù)挖掘的任務(wù)主要對(duì)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析以及聚類,預(yù)測(cè),偏差等一些分析以此來得出對(duì)自己有幫助的數(shù)據(jù)。
3.1 關(guān)聯(lián)分析
關(guān)聯(lián)規(guī)則:兩個(gè)或兩個(gè)以上變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中存在的一類重要的、可被發(fā)現(xiàn)的知識(shí)。關(guān)聯(lián)一般分為簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)和因果關(guān)聯(lián)三種。對(duì)關(guān)聯(lián)分析為的是找到事物內(nèi)部存在的關(guān)系。常用支持度和可信度兩個(gè)閥值來衡量關(guān)聯(lián)規(guī)則的相關(guān)性,并且同時(shí)輔助以興趣度、相關(guān)性等參數(shù),從而使得所挖掘的規(guī)則更符合我們需求。
3.2 聚類分析
聚類是把數(shù)據(jù)按照相似性歸納成若干類別,同一類中的數(shù)據(jù)彼此相似,不同類中的數(shù)據(jù)相異。聚類分析可以建立宏觀的概念,發(fā)現(xiàn)數(shù)據(jù)的分布模式,以及可能的數(shù)據(jù)屬性之間的相互關(guān)系。
3.3 分類
分類就是找出一個(gè)類別的概念描述,它代表了這類數(shù)據(jù)的整體信息,即該類的內(nèi)涵描述,并用這種描述來構(gòu)造模型,一般用規(guī)則或決策樹模式表示。分類是利用訓(xùn)練數(shù)據(jù)集通過一定的算法而求得分類規(guī)則。分類可被用于規(guī)則描述和預(yù)測(cè)。
3.4 預(yù)測(cè)
預(yù)測(cè)是通過以往存在的歷史數(shù)據(jù)對(duì)事件的方向進(jìn)行預(yù)估,通常會(huì)先建立模型,并有模型來對(duì)未來數(shù)據(jù)特征進(jìn)行預(yù)測(cè),預(yù)測(cè)的結(jié)果追求精度和不確定性,統(tǒng)計(jì)結(jié)果采用方差來度量。
3.5 時(shí)序模式
時(shí)序模式是指通過時(shí)間序列搜索出的重復(fù)發(fā)生概率較高的模式。與回歸一樣,它也是用己知的數(shù)據(jù)預(yù)測(cè)未來的值,但這些數(shù)據(jù)的區(qū)別是變量所處時(shí)間的不同。
3.6 偏差分析
偏差的數(shù)據(jù)中也包含著很多對(duì)我們有用的信息。發(fā)現(xiàn)這些異常對(duì)我們判斷事件非常有價(jià)值。分析這些偏差最簡(jiǎn)練的方法就是尋找數(shù)據(jù)和設(shè)定的參照之間所存在的差別。
4 實(shí)踐嘗試
在我們的實(shí)際設(shè)備運(yùn)行維護(hù)中,根據(jù)設(shè)備器件的壽命、故障次數(shù)和時(shí)間、每天的動(dòng)作次數(shù)、經(jīng)驗(yàn)的更換周期(磨損情況)等情況計(jì)算決策出更換該器件的具體時(shí)間或時(shí)間段。該功能可以很好的解決器件損壞的不確定性、未知性,在損壞之前更換淘汰該器件,為器件的更新提供科學(xué)的決策服務(wù),減少更換的隨意性和盲目性,提高決策的科學(xué)性,用科學(xué)的手段和方法來確保不間斷播出;同時(shí)根據(jù)器件的故障率、更換頻次、器件的使用率、備用個(gè)數(shù)、實(shí)際每年消耗數(shù)等情況,科學(xué)的、智能的生成每年的備件采購(gòu)計(jì)劃,可以收獲很好的經(jīng)濟(jì)效益。
備件的科學(xué)制定,對(duì)發(fā)射臺(tái)的資金優(yōu)化使用有很大的幫助,完全靠人工、經(jīng)驗(yàn)的定備件,容易造成:有的備件幾乎不損壞,而庫(kù)房又有大量的儲(chǔ)備,造成資源、資金的浪費(fèi);有的備件損壞率高,有時(shí)可能被使用殆盡,要臨時(shí)訂購(gòu),不利于安全播音等情況的發(fā)生,所以以科學(xué)的需求為基礎(chǔ),科學(xué)的制定備件采購(gòu)計(jì)劃是必要的,對(duì)維護(hù)工作、電臺(tái)的運(yùn)行有很大的好處。
現(xiàn)行的檢修工作,多數(shù)靠的是經(jīng)驗(yàn)的總結(jié),缺少更多的科學(xué)根據(jù)和數(shù)據(jù)支持,發(fā)射機(jī)的維護(hù)工作是變化的,不是一成不變的,不同的季度,不同的時(shí)間段,不同的發(fā)射機(jī),有不同的情況和特點(diǎn),都應(yīng)有不同的檢修策略,通過對(duì)現(xiàn)有數(shù)據(jù)采用合適的算法,統(tǒng)籌結(jié)合多種因素,可以形成動(dòng)態(tài)變化的檢修項(xiàng)目和時(shí)間,更具科學(xué)性、規(guī)范性、針對(duì)性。提供科學(xué)的檢修周期安排,根據(jù)積累的故障點(diǎn)、一年里不同時(shí)間故障部位的不同、同一類型故障出現(xiàn)的頻率、經(jīng)驗(yàn)的檢修周期、器件的損壞更換周期等情況科學(xué)的分析出檢修的周期,什么器件在什么時(shí)間需要檢修、檢查,提出科學(xué)的決策建議,維護(hù)人員根據(jù)決策建議可以更合理的安排檢修工作。實(shí)現(xiàn)檢修記錄的無紙化,把檢修發(fā)現(xiàn)的問題,都詳細(xì)的記錄,這些檢修信息不僅可以用來優(yōu)化檢修周期,也優(yōu)化備件的智能提醒更換功能、故障的預(yù)警預(yù)報(bào)功能,使這些功能更加精準(zhǔn)。
5 結(jié)語
數(shù)據(jù)挖掘涉是及多學(xué)科技術(shù)的集成,包括數(shù)據(jù)庫(kù)技術(shù)、統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、高性能計(jì)算、模式識(shí)別、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)可視化、信息提取、圖象與信號(hào)處理和空間數(shù)據(jù)分析。通過數(shù)據(jù)挖掘,可以從發(fā)射臺(tái)站日常運(yùn)行產(chǎn)生的大量數(shù)據(jù)中提取對(duì)我們需要的科學(xué)維護(hù)和運(yùn)行管理的有用的知識(shí)或是規(guī)律等信息,并能幫助我們?cè)诓煌嵌扔^察和挖掘,用發(fā)現(xiàn)的知識(shí)來協(xié)助我們來進(jìn)行信息管理,運(yùn)行控制,故障判斷查詢處理等。鑒于此,做好數(shù)據(jù)挖掘?qū)π畔⒒尘跋碌默F(xiàn)代化廣播發(fā)射電臺(tái)的管理、運(yùn)行和維護(hù)工作有十分的現(xiàn)實(shí)意義。
數(shù)字技術(shù)與應(yīng)用2014年10期