張卓凡 徐榮鑫
摘要:從軟件工程的實際情況來看,軟件技術主要具有兩個特征,即一明顯的復雜性以及系統(tǒng)化,因此如果對數(shù)據(jù)挖掘技術進行了大規(guī)模應用,那么軟件開發(fā)就會收到很多幫助。在現(xiàn)階段,從數(shù)據(jù)挖掘技術的發(fā)展現(xiàn)狀來看,雖然其已經(jīng)發(fā)展了很多年,但是該技術還是不夠成熟,因此,學者們也就必須對該技術進行更深入的研究,因為這樣不僅能提高數(shù)據(jù)挖掘技術的應用率,而且也能促進數(shù)據(jù)挖掘技術的發(fā)展。
關鍵詞:數(shù)據(jù)挖掘技術;軟件工程;應用率;發(fā)展現(xiàn)狀
在現(xiàn)階段,信息技術已經(jīng)發(fā)展到了很高的水準,因此,就算是在其他行業(yè)中,數(shù)據(jù)挖掘技術也得到了廣泛的應用,并且其主要的優(yōu)勢也得到了充分的展現(xiàn),而這就為諸多行業(yè)的快速發(fā)展打下了堅實的基礎。在當前,不管是在生產(chǎn)還是在生活當中,計算機技術都已經(jīng)成為了人們必不可少的工具,而在計算機軟件工程中,數(shù)據(jù)挖掘技術又有著非常重要的現(xiàn)實意義??偟膩碚f,現(xiàn)在這個時代是信息化時代,因此,如果繼續(xù)使用之前的信息處理技術,那么海量信息的處理以及存儲需求就得不到滿足,但是如果對數(shù)據(jù)挖掘技術進行了應用,那么這個問題就能得到很好的解決。這是因為在軟件工程中,如果應用了的數(shù)據(jù)挖掘技術,那么該技術的優(yōu)勢就能得到充分展現(xiàn),進而就不僅能提高軟件工程研發(fā)效率,而且也能使管理成本得到有效降低。
一、在軟件工程中應用數(shù)據(jù)挖掘技術的優(yōu)勢
(一)數(shù)據(jù)信息正確錄入
數(shù)據(jù)挖掘技術擁有非常高的運算水平,而從常規(guī)數(shù)據(jù)信息系統(tǒng)來看,在運算的過程中,該系統(tǒng)往往會耗費較長的時間,并且在很多情況下,由于數(shù)據(jù)的處理量過高,運算系統(tǒng)還可能會出現(xiàn)崩潰等問題。但是,如果對數(shù)據(jù)挖掘技術進行了應用,那么這個問題就能得到有效解決,因為這不僅極大提高了運算效率,而且在實際運算期間,數(shù)據(jù)丟失或運算混亂等問題也不會出現(xiàn)。在大規(guī)模的數(shù)據(jù)運算中,一些垃圾數(shù)據(jù)并沒有利用的價值,但是因為其存儲在數(shù)據(jù)處理系統(tǒng)中,所以這些垃圾數(shù)據(jù)就會對系統(tǒng)的運作效率造成影響,在這時,如果應用了數(shù)據(jù)挖掘技術,那么這些垃圾數(shù)據(jù)就會得到處理,在這種情況下,錄入到系統(tǒng)中的信息就都是有價值的信息。
(二)有效改善數(shù)據(jù)運算的效率與質量
從實際情況來看,數(shù)據(jù)挖掘技術最主要的一個優(yōu)勢就是數(shù)據(jù)轉換,即該技術能夠有效地整合混亂的數(shù)據(jù)信息,并使這些信息成為可以使用的形式。而且在數(shù)據(jù)的挖掘過程中,該技術也會自動選擇合理的分析模式來對模糊數(shù)據(jù)進行及時處理,這樣就能使最終的數(shù)據(jù)結果得到全方位的利用。以獲取到的數(shù)據(jù)為基礎,對于數(shù)據(jù)的真實性與價值進行全方位考查,如果數(shù)據(jù)真實,那么就將這些數(shù)據(jù)整合到一起,這樣就實現(xiàn)了數(shù)據(jù)的可讀化。除此之外,數(shù)據(jù)的分析過程通常都非常繁瑣,如果想要獲得準確的運算結果,那么就必須要多次驗證不同的過程,而如果將數(shù)據(jù)挖掘技術應用在了軟件工程中,那么數(shù)據(jù)運算的效率與質量就能得到有效的保障。
二、關于數(shù)據(jù)挖掘技術在軟件工程中的應用對策
(一)將漏洞檢測技術應用在軟件工程中,為軟件開發(fā)質量與系統(tǒng)安全運行提供保障
在軟件工程中,一個必不可少的工作內(nèi)容就是漏洞檢測,如果將該工作做好了,那么軟件開發(fā)的質量以及系統(tǒng)的安全運作就有了保障,在這個過程中,如果發(fā)現(xiàn)了隱患,那么就要將隱患及時排除。不僅如此,如果快速修復了軟件漏洞,那么用戶就能獲得更加穩(wěn)定的保障。在應用數(shù)據(jù)挖掘技術的過程中,在對漏洞進行檢測時,相關工作人員不僅要對軟件進行基本的測試,而且還要進行相關性檢測,總的來說,只要是與軟件漏洞有關的項目,那么內(nèi)工作人員都必須要進行全方位檢測,因為只有這樣才能使軟件開發(fā)的現(xiàn)實需求得到滿足。除此之外,如果應用了數(shù)據(jù)挖掘技術,那么系統(tǒng)就能夠結合記錄的內(nèi)容來對數(shù)據(jù)進行分析,并且還能以分析結果為依據(jù)來進行相應的改進,之后再基于此來選擇測試模式,這樣就能實現(xiàn)測試模式與軟件工程實際需求的高度契合。在處理漏洞數(shù)據(jù)的過程中,數(shù)據(jù)挖掘技術會先把數(shù)據(jù)清理掉,之后再借助相關的數(shù)據(jù)來進行分析與提取,如果是沒有應用價值的數(shù)據(jù),那么就會被系統(tǒng)清除掉,對于缺失的部分內(nèi)容,系統(tǒng)就會進行補充,并且會通過數(shù)據(jù)的形式呈現(xiàn)出來。
(二)在軟件工程中應用開源軟件的數(shù)據(jù)挖掘技術,快速進行數(shù)據(jù)的拷貝與復制
在軟件工程中,最主要的數(shù)據(jù)挖掘目標就是開源軟件,而在開源軟件中,克隆代碼的檢測又具有極其重要的意義,另外,在源文件的開發(fā)工作中,克隆代碼的檢測也得到了大規(guī)模運用,而這就能實現(xiàn)數(shù)據(jù)的快速拷貝與復制。不僅如此,克隆代碼技術還能有效提高代碼拷貝與粘貼的效率,而且還能提高代碼檢測工作的效率,這樣就將代碼漏洞對軟件工程系統(tǒng)的影響降到了最低,與此同時,這也能使軟件系統(tǒng)的后期維護工作得到優(yōu)化,從而就為其提供了更好的工作條件。但是,也有很多因素會影響到開源軟件的數(shù)據(jù)挖掘項目,如環(huán)境的開放型以及動態(tài)性特征,特別是軟件的開發(fā)與管理,都與傳統(tǒng)的軟件開發(fā)有著明顯的差別。而部分技術完善的開源軟件,通常都會記錄錯誤報告和軟件應用情況等信息,因為這樣就能為開發(fā)人員快速建立典型社會網(wǎng)絡提供幫助
結束語
總的來說,在大數(shù)據(jù)分析行業(yè)中,數(shù)據(jù)挖掘就一個新概念,而其主要作用就是對數(shù)據(jù)量大且價值低的數(shù)據(jù)進行高效分析,并將其中具有應用價值以及研究價值的信息提取出來,進而使數(shù)據(jù)應用率得到進一步提高。
參考文獻
[1]張欲豐,儲小勤.探析數(shù)據(jù)挖掘技術在軟件工程中的應用[J].信息記錄材料,2020,21(03):189-190.
[2]賈淑滟.試論數(shù)據(jù)挖掘技術在軟件工程中的應用[J].山西廣播電視大學學報,2019,24(04):79-82.