王廷 王博
摘要:數(shù)據(jù)挖掘是根據(jù)需求從大量混亂數(shù)據(jù)信息中搜索、尋找數(shù)據(jù)信息的過(guò)程,在大數(shù)據(jù)時(shí)代背景下,這項(xiàng)技術(shù)被廣泛應(yīng)用于軟件工程開(kāi)發(fā)、企業(yè)財(cái)務(wù)管理、人力資源管理等領(lǐng)域。在新形勢(shì)下,受到計(jì)算機(jī)技術(shù)、互聯(lián)網(wǎng)技術(shù)的影響,軟件工程發(fā)展迅速,在軟件開(kāi)發(fā)中,應(yīng)用數(shù)據(jù)挖掘技術(shù),可提升工作效率,節(jié)省人力和時(shí)間成本,而且,軟件工程的進(jìn)步,推動(dòng)數(shù)據(jù)挖掘技朝著自動(dòng)化、智能化的方向發(fā)展,二者相互促進(jìn),相互影響。
關(guān)鍵詞:數(shù)據(jù)挖掘;驅(qū)動(dòng);軟件工程;發(fā)展
所謂數(shù)據(jù)挖掘,是指目的性從大量數(shù)據(jù)中搜索、尋找數(shù)據(jù)信息的過(guò)程,在這項(xiàng)技術(shù)中,需將驗(yàn)證驅(qū)動(dòng)法作用于數(shù)據(jù)中,并默認(rèn)想要搜尋的信息是存在的。從目前社會(huì)的發(fā)展形勢(shì)來(lái)看,數(shù)據(jù)挖掘技術(shù)在軟件工程中的重要性會(huì)越來(lái)越高,而且,隨著軟件工程的發(fā)展,這項(xiàng)技術(shù)會(huì)逐步朝著自動(dòng)化、智能化的方向發(fā)展。
1.數(shù)據(jù)挖掘概述
數(shù)據(jù)挖掘是從數(shù)量大、種類(lèi)繁雜的海量數(shù)據(jù)資源中,根據(jù)需求尋找相對(duì)應(yīng)數(shù)據(jù)信息的過(guò)程。數(shù)據(jù)挖掘是按照業(yè)務(wù)需求理解、數(shù)據(jù)理解、數(shù)據(jù)搜集、建模、模型測(cè)評(píng)、部署的流程展開(kāi)的,而且這一流程是迭代式進(jìn)行的。在這項(xiàng)技術(shù)中,工作人員會(huì)將分類(lèi)后的幾個(gè)樣本作為模板,來(lái)制作模型,并將未分類(lèi)數(shù)據(jù)按照規(guī)定數(shù)目進(jìn)行分類(lèi),建模后,進(jìn)行數(shù)據(jù)挖掘,分類(lèi)輸出值是非連續(xù)的,然后,再尋找不同數(shù)據(jù)間的聯(lián)系,對(duì)數(shù)據(jù)進(jìn)行分組,將相似數(shù)據(jù)分在同一組。
基于數(shù)據(jù)挖掘的技術(shù)優(yōu)勢(shì),以及軟件工程開(kāi)發(fā)、企業(yè)財(cái)務(wù)管理、人力資源管理在數(shù)據(jù)處理上的需求,這項(xiàng)技術(shù)在上述領(lǐng)域有著廣闊的發(fā)展前景。科學(xué)技術(shù)是第一生產(chǎn)力,在信息爆炸的現(xiàn)階段,單純依靠人工進(jìn)行數(shù)據(jù)的采集、整理、分析,工作效率高,且工作質(zhì)量得不到保障,而依靠數(shù)據(jù)挖掘從海量混亂信息中尋找所需求的信息,可大大提升工作成效,節(jié)省大量的人力、時(shí)間成本,這對(duì)于提升社會(huì)生產(chǎn)效益有著積極意義。
數(shù)據(jù)挖掘流程大致如下:
數(shù)據(jù)挖掘是一項(xiàng)較為先進(jìn)的技術(shù),國(guó)外對(duì)于這項(xiàng)技術(shù)的研究起步較早,最初將之應(yīng)用于人工智能領(lǐng)域。不過(guò),隨著大數(shù)據(jù)時(shí)代的到來(lái),目前這項(xiàng)技術(shù)已經(jīng)被應(yīng)用于軟件工程、金融、保險(xiǎn)、零售、財(cái)務(wù)信息處理等各個(gè)領(lǐng)域。基于科技水平的差異,我國(guó)對(duì)于數(shù)據(jù)挖掘的研究比國(guó)外晚了很多年,所以,理論研究基礎(chǔ)薄弱,技術(shù)體系相較不完善。在近些年,受到計(jì)算機(jī)技術(shù)、數(shù)據(jù)庫(kù)技術(shù)、信息技術(shù)發(fā)展的推動(dòng),我國(guó)在數(shù)據(jù)挖掘這方面的研究取得了十足的進(jìn)展,有關(guān)于這項(xiàng)技術(shù)的論文數(shù)量顯著增加,論文引用次數(shù)大幅增長(zhǎng),這促進(jìn)了數(shù)據(jù)挖掘在我國(guó)工業(yè)生產(chǎn)、公共管理等領(lǐng)域的應(yīng)用。基于數(shù)據(jù)挖掘的重要性,國(guó)家對(duì)于這項(xiàng)技術(shù)研發(fā)的重視度較高,也投入了較大的資金,但是,在實(shí)踐過(guò)程中,仍然遇到了不少的阻礙,比如說(shuō)無(wú)統(tǒng)一評(píng)測(cè)標(biāo)準(zhǔn)等,仍需進(jìn)一步解決。
2.現(xiàn)代數(shù)據(jù)挖掘驅(qū)動(dòng)的軟件工程發(fā)展
軟件開(kāi)發(fā)是一個(gè)如同循序漸進(jìn)的過(guò)程,包括設(shè)計(jì)、運(yùn)行、維護(hù)等多道工序。在軟件工程開(kāi)發(fā)時(shí),工作流程如下:
互聯(lián)網(wǎng)時(shí)代的到來(lái),為軟件工程的發(fā)展提供了良好的環(huán)境,而大數(shù)據(jù)時(shí)代的進(jìn)入,則預(yù)示著數(shù)據(jù)挖掘的重要性會(huì)越來(lái)越高。目前,人們所使用的計(jì)算機(jī)、智能手機(jī)軟件中,有不少都需要用到數(shù)據(jù)挖掘技術(shù),比如說(shuō)百度、360瀏覽器、知網(wǎng)、淘寶等,這些軟件能夠根據(jù)用戶的個(gè)人信息、瀏覽記錄等,為其推送相關(guān)內(nèi)容,這樣能夠讓用戶在短時(shí)間內(nèi)迅速查找到所需信息,提升人們的生活效率。
在軟件工程開(kāi)發(fā)過(guò)程中,迭代式循環(huán)會(huì)產(chǎn)生大量運(yùn)行數(shù)據(jù),儲(chǔ)存在軟件工程數(shù)據(jù)庫(kù)中,如果硬要數(shù)據(jù)挖掘技術(shù),能夠充分高效地利用上述信息,為軟件開(kāi)發(fā)人員提供精準(zhǔn)的信息支持,從而提升軟件開(kāi)發(fā)效率。目前,數(shù)據(jù)挖掘技術(shù)包含關(guān)聯(lián)技術(shù)、聚類(lèi)技術(shù)、人工神經(jīng)網(wǎng)絡(luò)等技術(shù)類(lèi)型,在軟件工程中,被應(yīng)用于以下幾個(gè)方面:
①檢查漏洞。數(shù)據(jù)挖掘技術(shù)能夠在短時(shí)間內(nèi)進(jìn)行漏洞檢查,將相關(guān)數(shù)據(jù)進(jìn)行整合分析,提供給軟件開(kāi)發(fā)人員,讓其明確軟件設(shè)計(jì)中的不足,再按照客戶需求進(jìn)行修改;
②執(zhí)行記錄。數(shù)據(jù)挖掘技術(shù)能夠記錄軟件程序的執(zhí)行路徑,加以分析,尋找相關(guān)聯(lián)的代碼關(guān)系,進(jìn)行跟蹤與檢驗(yàn),這樣能夠利用數(shù)據(jù)的相關(guān)性進(jìn)行編程,提升工作效率。
3.結(jié)語(yǔ)
隨著社會(huì)的發(fā)展,智能手機(jī)、計(jì)算機(jī)等移動(dòng)終端逐步普及,為軟件工程的發(fā)展提供了推廣基礎(chǔ)。數(shù)據(jù)挖掘技術(shù)是軟件工程領(lǐng)域中應(yīng)用較為廣泛的一項(xiàng)技術(shù),在大數(shù)據(jù)時(shí)代背景下,這項(xiàng)技術(shù)的重要性愈發(fā)重要,所以,從發(fā)展角度來(lái)看,現(xiàn)代數(shù)據(jù)挖掘驅(qū)動(dòng)的軟件工程發(fā)展前景是較為廣闊的。
參考文獻(xiàn):
[1]喬偉軒.淺析現(xiàn)代數(shù)據(jù)挖掘驅(qū)動(dòng)的軟件工程發(fā)展[J].中國(guó)新通信,2018,20(24):154.
[2]李曉晨. 面向軟件倉(cāng)庫(kù)挖掘的數(shù)據(jù)驅(qū)動(dòng)特征構(gòu)建方法[D].大連理工大學(xué),2015.
[3]喬偉軒.淺析現(xiàn)代數(shù)據(jù)挖掘驅(qū)動(dòng)的軟件工程發(fā)展[J].中國(guó)新通信,2018,20(24):154.
[4]劉芬.數(shù)據(jù)挖掘在中國(guó)的現(xiàn)狀和發(fā)展研究[J].山東工業(yè)技術(shù),2018(17):123.
[5]黃鋒.軟件工程數(shù)據(jù)挖掘的發(fā)展趨勢(shì)[J].電子技術(shù)與軟件工程,2017(21):165.
[6]謝怡文.探討數(shù)據(jù)挖掘技術(shù)的研究現(xiàn)狀及發(fā)展方向[J].通訊世界,2016(17):30.
作者簡(jiǎn)介:
王廷(1996—).男.漢族.福建省福州市.本科.研究方向:軟件工程
王博(1995—).男.漢族.陜西省西安市.本科.研究方向:應(yīng)用物理學(xué)