門汝熹
南寧市勘測設(shè)計院集團(tuán)有限公司 廣西 南寧 530022
伴隨計算機(jī)軟件工程的發(fā)展,各種軟件設(shè)備廣泛應(yīng)用到行業(yè)工作中,在很大程度上推動了各領(lǐng)域的發(fā)展與進(jìn)步。對于企業(yè)而言,從海量數(shù)據(jù)中挖掘具有價值的信息,對企業(yè)管理水平的提升有著極為積極的作用。企業(yè)對各類軟件的使用也為其管理、經(jīng)營工作帶來了便利,正因如此,數(shù)據(jù)挖掘技術(shù)對于計算機(jī)軟件工程而言,越發(fā)重要。眾所周知,軟件需要借助各類算法從海量數(shù)據(jù)中提取、分析價值數(shù)據(jù),以幫助企業(yè)高效利用數(shù)據(jù)信息。而軟件開發(fā)過程中,數(shù)據(jù)收集是此工作的核心,只有科學(xué)開展數(shù)據(jù)收集與抽取工作,才能構(gòu)建出科學(xué)、可行的軟件數(shù)據(jù)信息庫,至于軟件在各行業(yè)工作中的作用才能最大限度地發(fā)揮。
數(shù)據(jù)挖掘是基于海量的數(shù)據(jù)信息篩選具有價值的數(shù)據(jù),以此提高數(shù)據(jù)的利用效率。所以將數(shù)據(jù)挖掘技術(shù)應(yīng)用到計算機(jī)軟件工程中,不僅能提高數(shù)據(jù)使用的質(zhì)量和有效性,還能增強(qiáng)工作人員的工作效率[1]。正因如此,如何充分發(fā)揮數(shù)據(jù)挖掘技術(shù)的作用并將其高效、全面地應(yīng)用到計算機(jī)軟件工程中,是我國科技工作者亟須探討并解決的問題。
在互聯(lián)網(wǎng)時代,數(shù)據(jù)挖掘技術(shù)作為先進(jìn)、高效的信息處理技術(shù),因其自身優(yōu)勢而被廣泛應(yīng)用到各行業(yè)工作中。以往開展的計算機(jī)軟件工程建設(shè)工作的數(shù)據(jù)處理的質(zhì)量、效率得不到有效保障,而數(shù)據(jù)挖掘技術(shù)因各功能存在一定的聯(lián)系,所以可確保評價結(jié)果的精準(zhǔn)性、合理性。應(yīng)用這一技術(shù)方法不僅能實現(xiàn)數(shù)據(jù)處理效率的最大化,還能從源頭解決數(shù)據(jù)損失的問題,這不僅有利于企業(yè)持續(xù)、穩(wěn)定的發(fā)展,還能提高企業(yè)整體的技術(shù)水平。
隨著計算機(jī)與互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘技術(shù)受到社會各界的關(guān)注,同時日常生產(chǎn)過程中很多企業(yè)都已應(yīng)用數(shù)據(jù)挖掘技術(shù)輔助工作[2]。隨著互聯(lián)網(wǎng)的迅猛發(fā)展,它已經(jīng)深刻影響了人們的日常生活和工作,從而產(chǎn)生了大量的數(shù)據(jù)信息。即便在今天,網(wǎng)絡(luò)上的數(shù)據(jù)依然在以驚人的速度增加。因此,有效地開發(fā)和利用這些數(shù)據(jù)資源,將有助于企業(yè)的運營和發(fā)展,也將成為社會持續(xù)進(jìn)步的重要推動力。隨著科技的發(fā)展,計算機(jī)軟件工程的數(shù)據(jù)挖掘性能已經(jīng)達(dá)到了一個新的水平,它既要滿足大規(guī)模數(shù)據(jù)處理的需求,又要具備良好的可靠性,以便有效地實現(xiàn)各種任務(wù)和目標(biāo)。
就目前來看,數(shù)據(jù)挖掘方式包括驗證性分析方式、發(fā)現(xiàn)性驅(qū)動方式,同時數(shù)據(jù)挖掘正由驗證性分析方式向著發(fā)現(xiàn)性驅(qū)動方式不斷轉(zhuǎn)變。對于數(shù)據(jù)挖掘驗證性分析方式而言,其是基于用戶需求搜集需要的數(shù)據(jù)內(nèi)容,并重復(fù)驗證其假設(shè)的成立性,然而因海量數(shù)據(jù)不斷堆積,所以該分析方式無法科學(xué)分類各種數(shù)據(jù),更難以靈活、高效地利用數(shù)據(jù)資源。而數(shù)據(jù)挖掘工作需借助最優(yōu)集合、分類樹等關(guān)鍵技術(shù)才能在實踐操作中找到高效的數(shù)據(jù)挖掘方法,才能順利完成數(shù)據(jù)挖掘工作。至于軟件開發(fā),主要基于軟件控制角度明確并細(xì)化工作量化指標(biāo),以便用戶可在軟件開發(fā)前期便了解開發(fā)可能存在的問題。如今,人們更加重視質(zhì)量數(shù)據(jù),但因系統(tǒng)功能、數(shù)據(jù)分析仍待改進(jìn),所以還有很多問題需要解決。在此背景下,將數(shù)據(jù)收集與軟件開發(fā)工作置于相同水平,再促進(jìn)二者的共同發(fā)展,結(jié)合動態(tài)變化、靜態(tài)表述可將數(shù)據(jù)質(zhì)量大幅提高。
2.2.1 可以幫助人們正確理解數(shù)據(jù)信息。由于不同人的知識儲備、社會閱歷都不相同,所以對于數(shù)據(jù)信息的理解也存在明顯差異。在此背景下,人們在采集、理解數(shù)據(jù)信息的過程中不僅會增加數(shù)據(jù)的采集時間成本、理解時間成本,還易使數(shù)據(jù)信息處理成本呈不斷上升趨勢。人們都有自己的主觀意識,所以在采集與理解信息的過程中很容易降低數(shù)據(jù)處理的權(quán)威性。而將數(shù)據(jù)挖掘技術(shù)合理應(yīng)用到計算機(jī)軟件工程中,不但能依據(jù)設(shè)置好的數(shù)據(jù)分析目標(biāo)科學(xué)分析并整理數(shù)據(jù)信息,還能全面整合采集好的數(shù)據(jù)資源,構(gòu)建高效、系統(tǒng)的查詢體系,不僅能將數(shù)據(jù)信息的權(quán)威性、精準(zhǔn)性大幅提高,還能為后續(xù)軟件開發(fā)與管理提供數(shù)據(jù)保障。在此背景下,工作人員可以精準(zhǔn)、深入地理解數(shù)據(jù)信息,還能最大限度地發(fā)揮其作用、價值。
2.2.2 可以提高數(shù)據(jù)處理的質(zhì)量與效率。計算機(jī)軟件工程中,合理應(yīng)用數(shù)據(jù)挖掘技術(shù)能對海量數(shù)據(jù)進(jìn)行大規(guī)模的計算,這可最大限度提高數(shù)據(jù)信息的處理質(zhì)量。隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展,數(shù)據(jù)功能不斷強(qiáng)大,不僅有利于提升數(shù)據(jù)的計算效率,還能確保計算結(jié)果的精準(zhǔn)性,可以幫助工作人員在短時間內(nèi)合理篩選并處理混亂數(shù)據(jù),從而進(jìn)一步保障數(shù)據(jù)信息的處理質(zhì)量[3]。除此之外,應(yīng)用數(shù)據(jù)挖掘技術(shù)還能實現(xiàn)對無用數(shù)據(jù)、混亂數(shù)據(jù)的合理分類,也能深入挖掘價值數(shù)據(jù)。在此過程中,工作人員可將獲得的數(shù)據(jù)信息應(yīng)用到實際工作中,還要依據(jù)事件處理需求選擇最佳的數(shù)據(jù)信息,以便提高數(shù)據(jù)信息的利用率。另外,借助數(shù)據(jù)挖掘技術(shù)將抽象、晦澀難懂的數(shù)據(jù)信息轉(zhuǎn)化成易于人們理解的信息資料,這可強(qiáng)化人們對數(shù)據(jù)信息的理解,日常生活與工作中也可高效利用數(shù)據(jù)解決實際問題。
3.1.1 分類法。在應(yīng)用數(shù)據(jù)挖掘技術(shù)的過程中,為了更好地分析和預(yù)測相關(guān)行為,需要根據(jù)分類標(biāo)志構(gòu)建數(shù)據(jù)分析模型,以便更好地實現(xiàn)預(yù)測目標(biāo)。為此,判別樹方法是一種常用的數(shù)據(jù)挖掘技術(shù),它基于神經(jīng)網(wǎng)絡(luò)分類和最接近分類,可以更有效地提取出有價值的信息,并且可以更好地滿足工作人員的需求。在使用分類法時,工作人員應(yīng)該正確地理解和分析不同類型的數(shù)據(jù),并合理選擇適當(dāng)?shù)姆椒ê褪侄?,以確保數(shù)據(jù)處理結(jié)果的準(zhǔn)確性和可靠性。
3.1.2 關(guān)聯(lián)法與聚類法。關(guān)聯(lián)法是一種可以研究不同事物關(guān)系的一般方法,基于數(shù)據(jù)挖掘技術(shù)的使用,關(guān)聯(lián)法明確了高效數(shù)據(jù)處理與收集方法[4]。同時應(yīng)用關(guān)聯(lián)法時應(yīng)遵循興趣關(guān)聯(lián)相關(guān)原理,將計算機(jī)軟件工程與數(shù)據(jù)挖掘技術(shù)有機(jī)結(jié)合,這可提高數(shù)據(jù)信息的可信度。在聚類法的應(yīng)用中,需要嚴(yán)格遵守設(shè)定的分類準(zhǔn)則,將科研工作相關(guān)的數(shù)據(jù)對象劃分為不同的類別,并確保同類資料物件之間的相似度。然而,由于不同類型間的數(shù)據(jù)差異較小,采用聚類技術(shù)進(jìn)行綜合分析和歸類,不僅可以提高聚類算法的有效性和可行性,還能夠有效地處理數(shù)據(jù)信息,從而幫助工作人員更快、更有效地完成任務(wù)。
3.2.1 在信息挖掘工作中的應(yīng)用。計算機(jī)軟件工程中,合理應(yīng)用數(shù)據(jù)挖掘技術(shù)可以全方位管控數(shù)據(jù)信息,因軟件工程涉及面廣,所以涵蓋的數(shù)據(jù)信息類型十分復(fù)雜。而應(yīng)用計算機(jī)軟件工程可以統(tǒng)一、集中化管理各類數(shù)據(jù),軟件開發(fā)中也能實時更新并處理數(shù)據(jù)資源,這不僅能提高軟件的開發(fā)質(zhì)量,還能優(yōu)化數(shù)據(jù)處理工作。而且數(shù)據(jù)挖掘包含很多數(shù)據(jù)信息,可以幫助工作人員系統(tǒng)分析并區(qū)分軟件的內(nèi)部結(jié)構(gòu),所以發(fā)揮數(shù)據(jù)挖掘技術(shù)的優(yōu)勢可為后期工作人員的分析問題、解決方案提供有力的保障,至于軟件開發(fā)工作也可高效、順利地進(jìn)行。實際工作中,為進(jìn)一步分析并挖掘內(nèi)部員工的關(guān)系,應(yīng)根據(jù)軟件開發(fā)要求做好人力資源的統(tǒng)籌配置,再基于軟件模塊化設(shè)計原理,可以實現(xiàn)軟件的大規(guī)模開發(fā)。如今,越來越多的人參與到軟件系統(tǒng)建設(shè)中,參加會議的人常會談?wù)撐募鬟f、電子郵件發(fā)送等,這一過程中企業(yè)需要深入分析并挖掘各部分關(guān)系,以便可以合理配置人員并細(xì)化分工。另外,軟件企業(yè)的工作人員與軟件使用者需要構(gòu)建相對穩(wěn)定、可靠的關(guān)系網(wǎng)絡(luò),隨著網(wǎng)絡(luò)環(huán)境的日益復(fù)雜,深入分析并挖掘網(wǎng)絡(luò)內(nèi)部關(guān)系,有利于軟件工程順利、有序地發(fā)展。如挖掘人事關(guān)系時需要應(yīng)用版本管理系統(tǒng),統(tǒng)一修改系統(tǒng)流程并深入分析軟件變更后的歷史數(shù)據(jù),再結(jié)合各程序模塊的聯(lián)系,可以將內(nèi)部結(jié)構(gòu)清晰、直觀地呈現(xiàn)在系統(tǒng)上。
3.2.2 在軟件漏洞檢測中的應(yīng)用。軟件漏洞檢測在計算機(jī)軟件工程中起著至關(guān)重要的作用,它不僅可以加快軟件的開發(fā)進(jìn)程,還能夠有效地防止系統(tǒng)出現(xiàn)故障,確保軟件的穩(wěn)定性和安全性,為后續(xù)的安全管理提供有力的支持。此外,通過對軟件漏洞的全面修復(fù),也能夠極大地提升用戶的安全感。隨著數(shù)據(jù)挖掘技術(shù)的不斷發(fā)展,軟件漏洞檢測已經(jīng)成為一種必不可少的步驟。通過對軟件漏洞的內(nèi)在特征進(jìn)行深入分析和測試,可以更好地了解和控制軟件的質(zhì)量,從而確保軟件的開發(fā)符合相關(guān)的標(biāo)準(zhǔn)和要求。應(yīng)用數(shù)據(jù)挖掘技術(shù)的過程中,應(yīng)做好數(shù)據(jù)分析工作,還要不斷優(yōu)化、完善數(shù)據(jù)分析結(jié)果。再采用科學(xué)、可行的測試方法,測試工作的合理性、有效性可以得到保障,還能最大限度滿足軟件工程的發(fā)展需要。此外,數(shù)據(jù)處理環(huán)節(jié)還應(yīng)借助數(shù)據(jù)挖掘技術(shù)綜合分析并抽取數(shù)據(jù)資源,采用數(shù)據(jù)形式將輔助數(shù)據(jù)內(nèi)容直觀呈現(xiàn)在使用者面前。
3.2.3 在軟件執(zhí)行記錄方面的應(yīng)用。應(yīng)用數(shù)據(jù)挖掘技術(shù)的過程中,為了確保軟件能夠有效地分析和挖掘記錄數(shù)據(jù),應(yīng)該全面分析和處理軟件,并盡可能優(yōu)化和改進(jìn)軟件的運行性能,以達(dá)到預(yù)期的判斷標(biāo)準(zhǔn)[5]。在深入分析和挖掘執(zhí)行記錄的過程中,首先應(yīng)該查詢已經(jīng)設(shè)定好的安裝路徑,然后采用逆向建模技術(shù)來完整地分析數(shù)據(jù)結(jié)構(gòu),這樣可以有效地幫助后續(xù)軟件維護(hù)工作。另外,工作人員還需要及時發(fā)現(xiàn)和解決軟件運行中出現(xiàn)的漏洞,從而提升軟件運行的效率。為了更有效地實施程序規(guī)約,應(yīng)進(jìn)行系統(tǒng)性的分析和挖掘,以便及時發(fā)現(xiàn)程序代碼中的潛在協(xié)議,并采取有效的措施來解決問題。同時,為了確保跟蹤信息的準(zhǔn)確性,還應(yīng)該運用逆向建模技術(shù)進(jìn)行有效的分析、驗證和維護(hù)。
軟件開發(fā)、應(yīng)用的過程中,開源軟件是一個重要且具有研究價值的課題。其中克隆碼檢測十分關(guān)鍵,在開源軟件開發(fā)中也得到了廣泛的運用。借助克隆碼檢測工作人員可以快速完成數(shù)據(jù)的復(fù)制和粘貼[6]。而隨著信息化時代的發(fā)展,為滿足市場發(fā)展需求,軟件工程的生產(chǎn)也面臨著革新,因傳統(tǒng)軟件工程項目存在歷史遺留問題,無法最大限度地滿足社會發(fā)展需要,所以隨著數(shù)據(jù)技術(shù)的迅猛發(fā)展,人們對信息的需求已轉(zhuǎn)化為大量的數(shù)據(jù),科學(xué)采用數(shù)據(jù)技術(shù)篩選并修正數(shù)據(jù)結(jié)果,不僅能降低企業(yè)的經(jīng)營管理風(fēng)險,還能提高整體工作的質(zhì)量與水平。
總而言之,我國在計算機(jī)軟件工程數(shù)據(jù)挖掘方面的研究時間相對較短,很多企業(yè)雖已構(gòu)建數(shù)據(jù)框架,但計算機(jī)軟件工程數(shù)據(jù)挖掘的商業(yè)化應(yīng)用仍需較長時間的發(fā)展。而且計算機(jī)軟件工程人員作為軟件開發(fā)的主體,他們的主觀能動性、技術(shù)能力等直接影響著工程建設(shè)效果,為加快軟件開發(fā)與利用的進(jìn)程,工作人員需要調(diào)動自身的主觀能動性,秉持精益求精的精神,加大對數(shù)據(jù)挖掘技術(shù)的應(yīng)用力度,勢必會推動計算機(jī)軟件工程的發(fā)展,更多的軟件系統(tǒng)也可應(yīng)用到人們的生活與工作中。