尹文婷
【摘要】 本文主要以大數(shù)據(jù)相關(guān)概述作為出發(fā)點(diǎn),分析了電力信息大數(shù)據(jù)高速存儲(chǔ)方案和技術(shù),以及檢索關(guān)鍵技術(shù),以期為提高電力企業(yè)信息技術(shù)水平提供一些參考和意見(jiàn)。
【關(guān)鍵詞】 電力信息 大數(shù)據(jù) 高速存儲(chǔ) 檢索
隨著網(wǎng)絡(luò)信息技術(shù)的不斷發(fā)展,電力企業(yè)涉及的數(shù)據(jù)信息更加廣泛、數(shù)據(jù)形式更加多元化。這就需要電力企業(yè)根據(jù)數(shù)據(jù)信息的發(fā)展規(guī)模,加快智能電網(wǎng)的建設(shè)進(jìn)程,提高數(shù)據(jù)檢索關(guān)鍵技術(shù)和數(shù)據(jù)存儲(chǔ)技術(shù)。
一、大數(shù)據(jù)相關(guān)概述
所謂大數(shù)據(jù)是指在一個(gè)數(shù)的幾何體對(duì)各項(xiàng)數(shù)據(jù)以及信息進(jìn)行儲(chǔ)存、查詢(xún)、計(jì)算、整合等。大數(shù)據(jù)具有4V特征:其一,容量大(Volume)。數(shù)據(jù)規(guī)模從TB級(jí)別躍升到EB級(jí)別,新數(shù)據(jù)以每天2.5EB的量級(jí)高速增長(zhǎng)。其二,類(lèi)型眾多(Variety)。大數(shù)據(jù)的結(jié)構(gòu)形式具有多樣化特點(diǎn),不僅能涵蓋了文本形式,還涵蓋了圖片、音頻、視頻、網(wǎng)絡(luò)日記和地理位置等多種半結(jié)構(gòu)化形式、數(shù)據(jù)結(jié)構(gòu)形式和非結(jié)構(gòu)化形式。就結(jié)構(gòu)化數(shù)據(jù)而言,在數(shù)據(jù)結(jié)構(gòu)體系中占據(jù)的比例為15%;就非結(jié)構(gòu)化數(shù)據(jù)而言,非結(jié)構(gòu)化數(shù)據(jù)在數(shù)據(jù)結(jié)構(gòu)體系中占據(jù)85%。其三,速度更快(Velocity)。由于大數(shù)據(jù)具有規(guī)模大、容量信息較大等特點(diǎn),這就要求數(shù)據(jù)處理的效率要高。一旦數(shù)據(jù)信息沒(méi)有得到及時(shí)有效的處理,就會(huì)失去數(shù)據(jù)原本的價(jià)值,還會(huì)導(dǎo)致大量有效數(shù)據(jù)信息淹沒(méi)在海量數(shù)據(jù)規(guī)模體系中。其四,價(jià)值密度低(Value)。由于大數(shù)據(jù)規(guī)模巨大,信息容量大,因此數(shù)據(jù)價(jià)值容易被隱藏。因此需要通過(guò)綜合的分析方法在海量數(shù)據(jù)中體驗(yàn)具有價(jià)值的數(shù)據(jù)信息。
二、基于電力信息大數(shù)據(jù)高速存儲(chǔ)方案和技術(shù)
第一,“先進(jìn)先出”緩存形式。這類(lèi)緩存形式應(yīng)用的核心設(shè)備是FIFO存儲(chǔ)器。資料由儲(chǔ)存器的開(kāi)端輸入存儲(chǔ)器的末端,資料輸出的時(shí)間與資料送入儲(chǔ)存器的時(shí)間成正比。這套緩存方法主要包含兩套數(shù)據(jù)線,無(wú)論是數(shù)據(jù)資料還是其他信息都可以在存儲(chǔ)器中進(jìn)行順序運(yùn)用。因該類(lèi)型數(shù)據(jù)緩存方法具有信息傳遞效率高、節(jié)約時(shí)間等優(yōu)勢(shì)。此種技術(shù)的缺點(diǎn)在于過(guò)于死板。一旦出現(xiàn)容量較大的數(shù)據(jù)信息或者資料,就容易導(dǎo)致數(shù)據(jù)讀取時(shí)間過(guò)慢。第二,“雙口PAM”緩存形式。該技術(shù)擁有兩套相互獨(dú)立的地址、數(shù)據(jù)總線。因此在讀取容量較大的數(shù)據(jù)信息時(shí),可以在控制器的兩端同時(shí)讀取數(shù)據(jù)、采集信息等。該技術(shù)具有信息傳遞速度快、可以同時(shí)讀取和采集信息等優(yōu)勢(shì)。但是雙口PAM控制器價(jià)格較貴。第三,“高速SRAM”切換緩存形式。該技術(shù)只有一套數(shù)據(jù)總線,可以以三態(tài)緩沖門(mén)作為數(shù)據(jù)傳輸?shù)目刂破鳎?shí)現(xiàn)ADC轉(zhuǎn)換器與緩沖門(mén)之間的數(shù)據(jù)切換和數(shù)據(jù)自由傳遞。完成數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)傳遞、數(shù)據(jù)讀取之后,就可以在ADC控制器中展開(kāi)數(shù)據(jù)讀寫(xiě)程序。該技術(shù)具有隨著隨地操作與讀取數(shù)據(jù)的優(yōu)勢(shì),其缺點(diǎn)在于數(shù)據(jù)集成化水平相對(duì)較低。且占用內(nèi)存的面積大。
三、基于電力信息大數(shù)據(jù)高速檢索技術(shù)
1、對(duì)內(nèi)容進(jìn)行檢索。搜索引擎需要對(duì)用戶輸送的關(guān)鍵信息進(jìn)行檢驗(yàn)、細(xì)致分析與歸類(lèi)。一般來(lái)說(shuō),對(duì)搜索內(nèi)容進(jìn)行檢測(cè)的形式主要包含以下三種:?字符串檢索與分析。借助字符串可以正向分析、逆向分析、切分分析用戶檢索的關(guān)鍵詞類(lèi)別。?先理解、再匹配分析。搜索引擎模擬人們的思考模式,人們總是對(duì)檢索信息或者詞匯進(jìn)行歸類(lèi)之后再進(jìn)行信息的還原與匹配?;驹硎且恢碌?。即在分詞過(guò)程中把語(yǔ)言歧義部分進(jìn)行分類(lèi)整理,主要以語(yǔ)法、語(yǔ)義體系和總控制體系三部分構(gòu)成。?先統(tǒng)計(jì),再匹配分析。根據(jù)調(diào)查得知,鄰近字在搜索引擎中出現(xiàn)的頻率較高,對(duì)鄰近詞進(jìn)行統(tǒng)計(jì)后再分詞、匹配。需要注意的是,在檢索期間,類(lèi)似“的”、“嗎”等詞語(yǔ)在分詞時(shí)會(huì)被去除。
2、并行采樣技術(shù)。對(duì)于高速數(shù)據(jù)采集體系來(lái)講,是系統(tǒng)最核心的指標(biāo)。要想實(shí)現(xiàn)高采樣頻率這一目的,可以借助單片高度數(shù)據(jù)轉(zhuǎn)化其芯片。該芯片具有分辨率低、價(jià)格高等特點(diǎn)。因此可以通過(guò)交叉時(shí)間采樣方法提高數(shù)據(jù)收集效率,達(dá)到采集效果。ADC是并行采用技術(shù)的一種主要轉(zhuǎn)換器,其主要形式有閃電式的ADC轉(zhuǎn)換器,以及逐次逼近形式的轉(zhuǎn)換器,這兩類(lèi)轉(zhuǎn)換器的優(yōu)缺點(diǎn)見(jiàn)表1。
3、搜索請(qǐng)求進(jìn)行檢索與匹配。對(duì)用戶搜索請(qǐng)求進(jìn)行細(xì)致分析與匹配是在搜索引擎接受到檢索內(nèi)容之后展開(kāi)的主要任務(wù)。分析完用戶輸入的檢索內(nèi)容之后,對(duì)名稱(chēng)進(jìn)行匹配,并在系統(tǒng)中顯示匹配的內(nèi)容。這就需要遵照匹配程度對(duì)其進(jìn)行排序。如此一來(lái),用戶就可以減少搜索等待的時(shí)間,從而達(dá)到提高信息檢索效率和工作質(zhì)量的目的。結(jié)束語(yǔ):隨著市場(chǎng)競(jìng)爭(zhēng)的日趨激烈,電力企業(yè)要想在殘酷的市場(chǎng)競(jìng)爭(zhēng)中站穩(wěn)腳跟,就需要改進(jìn)傳統(tǒng)管理方法和管理技術(shù),不斷借鑒發(fā)達(dá)國(guó)家的智能化管理技術(shù)和管理方法,提高大數(shù)據(jù)的存儲(chǔ)和檢索效率,從而更好地為社會(huì)服務(wù)。
參 考 文 獻(xiàn)
[1]馬義松,武志剛.基于Neo4j的電力大數(shù)據(jù)建模及分析[J].電工電能新技術(shù),2016,02:24-30.
[2]周文瓊.大數(shù)據(jù)環(huán)境下的電力客戶服務(wù)數(shù)據(jù)分析系統(tǒng)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2015,04:51-57.
[3]祝恩國(guó),竇健.用電信息采集系統(tǒng)雙向互動(dòng)功能設(shè)計(jì)及關(guān)鍵技術(shù)[J].電力系統(tǒng)自動(dòng)化,2015,17:62-67.