国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向商業(yè)的網(wǎng)絡(luò)調(diào)研數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)

2009-05-23 11:05劉祎洋郝麗麗瞿彭志
經(jīng)濟(jì)師 2009年3期
關(guān)鍵詞:數(shù)據(jù)挖掘調(diào)研問(wèn)卷

劉祎洋 郝麗麗 瞿彭志

摘要:文章設(shè)計(jì)通過(guò)兩個(gè)數(shù)據(jù)庫(kù)的協(xié)作實(shí)現(xiàn)了面向商業(yè)的網(wǎng)絡(luò)調(diào)研和挖掘數(shù)據(jù)的數(shù)據(jù)存儲(chǔ)與交換,構(gòu)建了一個(gè)面向商業(yè)的網(wǎng)絡(luò)調(diào)研教據(jù)挖掘系統(tǒng),它使當(dāng)前的商業(yè)網(wǎng)絡(luò)調(diào)研模式與數(shù)據(jù)挖掘良好地整合在一起,初步解決了面向商業(yè)的網(wǎng)絡(luò)調(diào)研與數(shù)據(jù)挖掘結(jié)合的難題,針對(duì)本系統(tǒng)的特點(diǎn)提出了特有的分層次理論。使系統(tǒng)具備了優(yōu)良的擴(kuò)展性和可維護(hù)性,應(yīng)用領(lǐng)域廣泛。

關(guān)鍵詞:網(wǎng)絡(luò)調(diào)研數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)系統(tǒng)

中圖分類號(hào):F062.4文獻(xiàn)標(biāo)識(shí)碼:A

文章編號(hào):1004-4914(2009)03-016-02

一、研究意義

隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和上網(wǎng)用戶的迅速增加,網(wǎng)絡(luò)調(diào)研成為企業(yè)決策的一種重要工具,調(diào)研數(shù)據(jù)的深入挖掘可以廣泛應(yīng)用于市場(chǎng)營(yíng)銷、金融銀行、電信交通、政府防衛(wèi)等部門(mén),有助于決策的民主性與科學(xué)性,可為社會(huì)帶來(lái)巨大的經(jīng)濟(jì)效益,但對(duì)于面向商業(yè)網(wǎng)絡(luò)調(diào)研的數(shù)據(jù)挖掘上并沒(méi)有一個(gè)很好的解決方式,本文根據(jù)面向商業(yè)的網(wǎng)絡(luò)調(diào)研和數(shù)據(jù)庫(kù)的特點(diǎn)來(lái)探討若干適合的挖掘模型扣方法,并據(jù)此設(shè)計(jì)一個(gè)專門(mén)服務(wù)于面向商業(yè)的網(wǎng)絡(luò)調(diào)研的智能挖掘系統(tǒng)。

二、網(wǎng)絡(luò)調(diào)研和數(shù)據(jù)挖掘庫(kù)的協(xié)作模型

在面向商業(yè)的網(wǎng)絡(luò)調(diào)研系統(tǒng)中,網(wǎng)絡(luò)調(diào)研數(shù)據(jù)庫(kù)的重點(diǎn)主要是放在簡(jiǎn)單的統(tǒng)計(jì)分析和問(wèn)卷的功能上。因此,在數(shù)據(jù)庫(kù)的查詢檢索度處理上,并沒(méi)有以數(shù)據(jù)挖掘?yàn)閷?duì)象建立,數(shù)據(jù)挖掘在以調(diào)研為主的數(shù)據(jù)庫(kù)上并不能直接高效地運(yùn)行。其原因主要在于,數(shù)據(jù)挖掘項(xiàng)目需要合并所有待挖掘的數(shù)據(jù)應(yīng)用于數(shù)據(jù)庫(kù)或者數(shù)據(jù)集市,并且需要對(duì)這些數(shù)據(jù)進(jìn)行清理和轉(zhuǎn)換,因此要進(jìn)行數(shù)據(jù)挖掘,就必須首先把數(shù)據(jù)按照數(shù)據(jù)挖掘算法和模型的要求,對(duì)調(diào)研數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行預(yù)處理,將處理后的數(shù)據(jù)轉(zhuǎn)移到挖掘數(shù)據(jù)庫(kù)中,由于設(shè)計(jì)的系統(tǒng)中存在兩類不同的任務(wù)———調(diào)研與挖掘,因此,面向商業(yè)的網(wǎng)絡(luò)調(diào)研數(shù)據(jù)挖掘系統(tǒng)數(shù)據(jù)庫(kù)需要建立兩類基本數(shù)據(jù)庫(kù),即面向商業(yè)的網(wǎng)絡(luò)調(diào)研數(shù)據(jù)庫(kù)和數(shù)據(jù)挖掘數(shù)據(jù)庫(kù),調(diào)研與挖掘數(shù)據(jù)庫(kù)的協(xié)作過(guò)程需要在一個(gè)共同的管理系統(tǒng)中部署。

本文建立數(shù)據(jù)庫(kù)協(xié)作模型來(lái)描述兩類數(shù)據(jù)庫(kù)的協(xié)作過(guò)程,建立的模型為左邊調(diào)研數(shù)據(jù)庫(kù)和右邊挖掘數(shù)據(jù)庫(kù),這兩個(gè)庫(kù)是圍繞調(diào)研與挖掘的過(guò)程展開(kāi)協(xié)作。模型說(shuō)明完整的調(diào)研與挖掘協(xié)作的過(guò)程分別經(jīng)歷7個(gè)和8個(gè)階段。在調(diào)研過(guò)程中,創(chuàng)建問(wèn)卷和回答問(wèn)卷階段首先會(huì)與調(diào)研數(shù)據(jù)庫(kù)自動(dòng)連接,實(shí)現(xiàn)讀取問(wèn)卷與寫(xiě)入調(diào)研結(jié)果的行為,在回答問(wèn)卷階段,反饋的數(shù)據(jù)套提交到調(diào)研數(shù)據(jù)庫(kù)中作為調(diào)研反饋的原始數(shù)據(jù)。在結(jié)果處理階段,一方面可以對(duì)調(diào)研數(shù)據(jù)庫(kù)的原始數(shù)據(jù)進(jìn)行潛度的分析處理,另一方面也可以與其他數(shù)據(jù)源的數(shù)據(jù)(可以是數(shù)據(jù)倉(cāng)庫(kù)或者某個(gè)小型數(shù)據(jù)庫(kù))一道轉(zhuǎn)移到數(shù)據(jù)挖掘的過(guò)程中為挖掘目標(biāo)進(jìn)行深度數(shù)據(jù)預(yù)處理。該挖掘過(guò)程從確定挖掘目標(biāo)階段開(kāi)始,在數(shù)據(jù)準(zhǔn)備階段得到預(yù)處理數(shù)據(jù),處理后的數(shù)據(jù)會(huì)提交到挖掘數(shù)據(jù)庫(kù)中儲(chǔ)存作為挖掘階段的原始訓(xùn)練數(shù)據(jù)或原始預(yù)測(cè)數(shù)據(jù)。訓(xùn)練數(shù)據(jù)和預(yù)測(cè)模型階段套從挖掘數(shù)據(jù)庫(kù)中讀取相應(yīng)的原始數(shù)據(jù)進(jìn)行訓(xùn)練和預(yù)測(cè),結(jié)果評(píng)估階段會(huì)對(duì)挖掘出來(lái)的結(jié)果提取知識(shí)并保存到知識(shí)庫(kù)中,到此兩類數(shù)據(jù)庫(kù)的完整協(xié)作過(guò)程圓滿結(jié)束。誼模型可以具有兩類數(shù)據(jù)庫(kù)角色明確、數(shù)據(jù)存儲(chǔ)開(kāi)銷小、數(shù)據(jù)處理速度快的特點(diǎn),面向商業(yè)的網(wǎng)絡(luò)調(diào)研和數(shù)據(jù)挖掘的效率有顯著提高。

三、兩類數(shù)據(jù)庫(kù)的設(shè)計(jì)方案

(一)網(wǎng)絡(luò)調(diào)研數(shù)據(jù)庫(kù)設(shè)計(jì)

1統(tǒng)一問(wèn)卷類型設(shè)計(jì)。該方案關(guān)鍵在于設(shè)計(jì)一個(gè)問(wèn)卷類型表,問(wèn)題表和問(wèn)卷回答表設(shè)計(jì)有問(wèn)卷類型的外鍵,各種形式的問(wèn)題都集中在一個(gè)問(wèn)題表中,在回答表中,也是將所有答案存在一個(gè)表中,這種設(shè)計(jì)方式的優(yōu)勢(shì)在于問(wèn)卷統(tǒng)一管理,整體性強(qiáng),不足之處則是由于數(shù)據(jù)都集中在一個(gè)表里,后期管理不是很方便。設(shè)計(jì)數(shù)據(jù)表包括問(wèn)卷編號(hào)(Questionnaire),問(wèn)卷類型表(Quesdon Type),問(wèn)題表(Question),矩陣列表(RecColumn),矩陣行表(RecRow),邏輯跳轉(zhuǎn)表(QuestionJump),用戶表(Users)以及問(wèn)卷回答表(Answers)。Answers可以記錄非注冊(cè)用戶提交的有效信息。

2獨(dú)立問(wèn)卷類型設(shè)計(jì)。該方案是預(yù)先設(shè)計(jì)好問(wèn)卷回答的各個(gè)類型表,分為單選回答表。多選回答表,矩陣回答表以及其他類型的表。而問(wèn)題袁則保持與方案一一致,只設(shè)計(jì)一個(gè)問(wèn)題表就可以。之所以這樣設(shè)計(jì),是由于問(wèn)卷回復(fù)的數(shù)據(jù)量要遠(yuǎn)遠(yuǎn)大于題目本身,考慮到調(diào)研數(shù)據(jù)的存儲(chǔ)方式,使不同類型的回答表獨(dú)立出來(lái),這樣有利于大數(shù)據(jù)量的管理和檢索。設(shè)計(jì)數(shù)據(jù)表包括設(shè)計(jì)問(wèn)卷鳊號(hào)表(wjb),問(wèn)題表(wtb),問(wèn)題類型表(wtlxb),選項(xiàng)表(xxb),用戶表(yhb),單選答案表(dxb),多選答案表(mxb),矩陣答案表(jzxb),其他答案表(qtxb),回答用戶表(hduser)。

(二)數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)設(shè)計(jì)

數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)是用來(lái)存儲(chǔ)記錄挖掘信息的表以及事例表和預(yù)測(cè)表的數(shù)據(jù)庫(kù),而事例表則包括了各種嵌套表,通過(guò)對(duì)事例表的挖掘模型訓(xùn)練,可以對(duì)預(yù)測(cè)表數(shù)據(jù)進(jìn)行預(yù)測(cè)。建立數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)的優(yōu)勢(shì)在于,對(duì)數(shù)據(jù)的管理和資源的分配上可以更加快速、高效、合理地進(jìn)行挖掘,不用再通過(guò)復(fù)雜的視圖檢索訪問(wèn)調(diào)研數(shù)據(jù)庫(kù),避免增加調(diào)研數(shù)據(jù)庫(kù)額外的自擔(dān)。

1挖掘教據(jù)庫(kù)的事例表設(shè)計(jì)。在大型數(shù)據(jù)倉(cāng)庫(kù)中,星型模式和雪花模式的應(yīng)用非常流行。在實(shí)際的商業(yè)網(wǎng)絡(luò)調(diào)研的數(shù)據(jù)挖掘中,常常需要復(fù)雜的SQL查詢操作來(lái)檢索調(diào)研數(shù)據(jù)庫(kù),再構(gòu)造出視圖,從而產(chǎn)生一個(gè)虛擬的事例表,如果表中有嵌套關(guān)系,則又會(huì)進(jìn)行一次復(fù)雜的SQL查詢。筆者在實(shí)際操作中發(fā)現(xiàn),在數(shù)據(jù)庫(kù)數(shù)據(jù)量龐大的情況下,通用調(diào)研數(shù)據(jù)庫(kù)的某個(gè)挖掘的事例表在構(gòu)造時(shí)往往會(huì)非常慢,如果在調(diào)研數(shù)據(jù)庫(kù)中進(jìn)行操作,會(huì)嚴(yán)重影響數(shù)據(jù)庫(kù)的效率,并增加服務(wù)器的開(kāi)銷。因此,需要將需要挖掘的大數(shù)據(jù)集轉(zhuǎn)移到挖掘數(shù)據(jù)庫(kù)中,把挖掘教據(jù)庫(kù)構(gòu)建為若干個(gè)星型模式或者雪花模式,每一個(gè)這種模式都代表某次挖掘的數(shù)據(jù)。位于最中間的表為事例表,擴(kuò)展表像雪花狀圍繞著中心表,這些表構(gòu)成嵌套表,這樣設(shè)計(jì)可以符合挖掘引擎對(duì)數(shù)據(jù)的挖掘要求。在應(yīng)用程序中創(chuàng)建,訓(xùn)練和預(yù)測(cè)模型也非常容易。

2挖掘數(shù)據(jù)庫(kù)的信息表設(shè)計(jì)。挖掘數(shù)據(jù)庫(kù)設(shè)計(jì)兩個(gè)信息表,用戶事例表(yhslb)和模型信息表(modeltable),分別存儲(chǔ)用戶的挖掘事例表的信息和對(duì)應(yīng)的模型信息。

四、面向商業(yè)的網(wǎng)絡(luò)調(diào)研數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)

(一)系統(tǒng)設(shè)計(jì)模式

ASP.NET的企業(yè)級(jí)四層架構(gòu)的方式。系統(tǒng)設(shè)計(jì)成分布式應(yīng)用結(jié)構(gòu),分布式應(yīng)用程序的主要設(shè)計(jì)原則是將應(yīng)用程序邏輯地分為表示、業(yè)務(wù)邏輯和數(shù)據(jù)訪問(wèn)三個(gè)基本層,根據(jù)本系統(tǒng)的挖掘特點(diǎn)精心設(shè)計(jì)了挖掘模型層。

1界面表現(xiàn)層。界面表現(xiàn)層(VviewPresentationLayer)也稱表示層,主要是由

用戶看到并與之交互的各種界面構(gòu)成。用戶所進(jìn)行的所有請(qǐng)求的界面和結(jié)果的呈現(xiàn)都在界面表現(xiàn)層。界面表現(xiàn)層不涉及具體的業(yè)務(wù)邏輯和數(shù)據(jù)訪問(wèn)過(guò)程,它傳遞用戶輸入和操作的參數(shù)給其他層,由其他層負(fù)責(zé)相應(yīng)的處理,處理完畢套將蛄果返回到界面表現(xiàn)層。界面表現(xiàn)層通過(guò)由HTML元素構(gòu)成的.aspx和.htm文件瀏覽囂展示給用戶,有時(shí)為了提高表現(xiàn)力會(huì)使用一些新技術(shù),如MacromediaFlash時(shí)象xHTML.XML/XSL,WML等一些標(biāo)識(shí)語(yǔ)言和Webservices。

2業(yè)務(wù)邏輯層。業(yè)務(wù)邏輯層(BusinessLogicalLayer)在體系架構(gòu)中的位置很關(guān)鍵,它負(fù)責(zé)了面向商業(yè)的網(wǎng)絡(luò)調(diào)研子系統(tǒng)的業(yè)務(wù)邏輯處理,處于數(shù)據(jù)訪問(wèn)層與界面表現(xiàn)層中間,其任務(wù)集中在對(duì)面向商業(yè)的網(wǎng)絡(luò)調(diào)研子系統(tǒng)業(yè)務(wù)規(guī)則的制定、業(yè)務(wù)流程的實(shí)現(xiàn)等與業(yè)務(wù)需求有關(guān)的系統(tǒng)設(shè)計(jì)上,起到了數(shù)據(jù)交換中承上啟下的作用。由于屢是一種弱耦舍結(jié)構(gòu),層與層之間的依賴是向下的,底層對(duì)于上層而言是“無(wú)知”的,改變上層的設(shè)計(jì)對(duì)于其調(diào)用的底層而言沒(méi)有任何影響。如果在分層設(shè)計(jì)時(shí),遵循了面向接口設(shè)計(jì)的思想,那么這種向下的依賴也應(yīng)該是一種弱依賴關(guān)系。因而在不改變接口定義的前提下,理想的分層式架構(gòu),應(yīng)誼是一個(gè)支持可抽取、可替換的“抽屜”式架構(gòu)。正因?yàn)槿绱?,業(yè)務(wù)邏輯層的設(shè)計(jì)時(shí)于一個(gè)支持可擴(kuò)展的架構(gòu)尤為關(guān)鍵,因?yàn)樗缪萘巳齻€(gè)不同的角色——對(duì)于數(shù)據(jù)訪問(wèn)層而言。它是調(diào)用者;對(duì)于界面表現(xiàn)層而言,它則是被調(diào)用者;對(duì)于挖掘模型層而言,它是協(xié)作者。

3挖掘模型層。挖掘模型層(MiningModelLayer)是本系統(tǒng)特有的一層,它在邏輯分層上與業(yè)務(wù)邏輯層同屬于一層并行工作,但是它的功能卻和業(yè)務(wù)邏輯層有明顯區(qū)別,挖掘模型層是數(shù)據(jù)挖掘的核心,本系統(tǒng)由兩個(gè)子系統(tǒng)構(gòu)成,業(yè)務(wù)邏輯層是負(fù)責(zé)面向商業(yè)的網(wǎng)絡(luò)調(diào)研子系統(tǒng)的業(yè)務(wù)處理,而挖掘模型層則是負(fù)責(zé)數(shù)據(jù)挖掘子系統(tǒng)的挖掘處理。挖掘模型層主要設(shè)計(jì)了通過(guò)數(shù)據(jù)分析(AS)服務(wù)器的支持參與挖掘模型的建立,訓(xùn)練數(shù)據(jù)和新數(shù)據(jù)預(yù)測(cè)方面。提供與第三方軟件如SAS,SPSS,MATLAB的接口和對(duì)象設(shè)計(jì)。同時(shí)設(shè)計(jì)了允許第三方挖掘算法參與的接口和挖掘?qū)ο?。它通過(guò)調(diào)用數(shù)據(jù)訪問(wèn)層中的挖掘數(shù)據(jù)庫(kù)和調(diào)研數(shù)據(jù)庫(kù)參與數(shù)據(jù)處理,并與業(yè)務(wù)邏輯層協(xié)作,提供挖掘的業(yè)務(wù)支持,將結(jié)果返回到界面表現(xiàn)層。

4數(shù)據(jù)訪問(wèn)層。數(shù)據(jù)訪問(wèn)層(DataAccessLayer)有時(shí)候也稱作持久層,其功能主要是負(fù)責(zé)數(shù)據(jù)庫(kù)的訪問(wèn)。訪問(wèn)底層數(shù)據(jù)源的所有編碼都在該層,它與數(shù)據(jù)庫(kù)直接打交道,譬如數(shù)據(jù)庫(kù)的連接、操縱、檢索、調(diào)用數(shù)據(jù)庫(kù)內(nèi)部編程等的代碼都放在該層。數(shù)據(jù)庫(kù)內(nèi)部編程一般是數(shù)據(jù)庫(kù)存儲(chǔ)過(guò)程(StoredProcedllre)。存儲(chǔ)過(guò)程是一組為了完成特定功能的SQL語(yǔ)句集,經(jīng)編譯后存儲(chǔ)在數(shù)據(jù)庫(kù)中,可以在程序中直接調(diào)用執(zhí)行。當(dāng)要修改的時(shí)候,也可以直接在數(shù)據(jù)庫(kù)中修改,而不必重新編譯。因此,提高了數(shù)據(jù)處理的速度。編寫(xiě)存儲(chǔ)過(guò)程的另一個(gè)目的是進(jìn)行事務(wù)處理和觸發(fā)器,這可以確保除非事務(wù)性單元內(nèi)的所有操作都成功完成。通過(guò)將一組相關(guān)操作組合為一個(gè)要么全部成功要么全部失敗的單元,可以簡(jiǎn)化錯(cuò)誤恢復(fù)并使應(yīng)用程序更加可靠。

(二)系統(tǒng)功能模塊設(shè)計(jì)

根據(jù)系統(tǒng)的業(yè)務(wù)設(shè)計(jì)。整個(gè)系統(tǒng)由網(wǎng)絡(luò)調(diào)研子系統(tǒng)與數(shù)據(jù)挖掘子系統(tǒng)組成,網(wǎng)絡(luò)調(diào)研子系統(tǒng)功能可以劃分為四個(gè)基本模塊,即問(wèn)卷管理模塊:用戶數(shù)據(jù)管理模塊:?jiǎn)柧硗斗排c收集模塊;調(diào)研報(bào)告管理模塊。挖掘子系統(tǒng)功能可以劃分為三個(gè)基本模塊,即數(shù)據(jù)預(yù)處理模塊;數(shù)據(jù)挖掘模塊;挖掘決策模塊。兩個(gè)子系統(tǒng)共享三個(gè)基本功能模塊,即頁(yè)面顯示模塊;數(shù)據(jù)庫(kù)連接模塊;數(shù)據(jù)安全控制模塊。在具體設(shè)計(jì)上,每個(gè)模塊由多個(gè)實(shí)現(xiàn)具體功能的aspx與cs文件構(gòu)成。

1用戶數(shù)據(jù)管理模塊。該模塊包括用戶注冊(cè),激活,用戶介紹機(jī)制和積分管理。具體的功能包括:新用戶的注冊(cè)和認(rèn)證;用戶分類管理:新用戶激活機(jī)制;介紹用戶調(diào)研機(jī)制;受訪者條件篩選/搜索;用戶的鎖定/凍結(jié);積分激勵(lì)管理。

2問(wèn)卷管理模塊。該主要負(fù)責(zé)問(wèn)卷和問(wèn)題的建立,編輯和修改。具體的功能包括:?jiǎn)柧韼?kù)管理;不同問(wèn)卷之間的調(diào)用;問(wèn)卷收集參數(shù)設(shè)置;問(wèn)卷導(dǎo)入生成;問(wèn)卷問(wèn)題的邏輯編輯;問(wèn)卷頁(yè)面編輯/預(yù)覽;問(wèn)卷模板;圖片及其他多媒體文件管理調(diào)用;問(wèn)卷設(shè)計(jì)的幫助模塊。

3問(wèn)卷投放與收集模塊。該模塊主要負(fù)責(zé)問(wèn)卷投放和收集環(huán)節(jié)的相應(yīng)管理。包括三種投放方式的管理和不同方式問(wèn)卷回收的管理。具體的功能包括:調(diào)研網(wǎng)站的鏈接;問(wèn)卷URI.的生成;EDM問(wèn)卷的生成;問(wèn)卷數(shù)據(jù)的收集/監(jiān)測(cè);投放后問(wèn)卷修改管理:與郵件發(fā)送機(jī)構(gòu)的問(wèn)卷投放/收集接口:與銀行支什的接口。

4調(diào)研報(bào)告管理模塊。誼模塊負(fù)責(zé)調(diào)研報(bào)告的生成和管理,包括數(shù)據(jù)的選擇和產(chǎn)生報(bào)告的用戶控制。具體的功能包括:生成基本日饋數(shù)據(jù)報(bào)告;用戶功能限制;回饋敷據(jù)的導(dǎo)出;時(shí)調(diào)研報(bào)告的篩選。

5頁(yè)面顯示模塊。該模塊主要是展示給用戶的一些頁(yè)面和功能。具體的功能包括:普通用戶和高級(jí)用戶的登陸;線上調(diào)研問(wèn)卷的發(fā)表;積分查看部分;客戶委托有償調(diào)研。

6數(shù)據(jù)庫(kù)連接模塊。該模塊主要自責(zé)配置與連接不同數(shù)據(jù)庫(kù)以及維護(hù)數(shù)據(jù)庫(kù)功能。具體的功能包括:數(shù)據(jù)庫(kù)連接,數(shù)據(jù)庫(kù)維護(hù)。

7數(shù)據(jù)安全控刺模塊。該模塊主要負(fù)責(zé)配置系統(tǒng)安全加密的功能包括數(shù)據(jù)安全配王功能。

8數(shù)據(jù)預(yù)處理模塊。誼模塊主要自責(zé)調(diào)研數(shù)據(jù)或者外部數(shù)據(jù)源提交進(jìn)挖掘數(shù)據(jù)庫(kù)的預(yù)處理功能。

9數(shù)據(jù)挖掘模塊。該模塊主要負(fù)責(zé)對(duì)挖掘數(shù)據(jù)庫(kù)中的數(shù)據(jù)提供數(shù)據(jù)挖掘的業(yè)務(wù)。具體包括數(shù)據(jù)與參數(shù)選擇,模型預(yù)算法建立,訓(xùn)練模型。

10數(shù)據(jù)決策模塊。誼模塊主要負(fù)責(zé)對(duì)訓(xùn)練的模型進(jìn)行預(yù)測(cè)與挖掘,提供不同的算法挖掘結(jié)果供用戶查看與決策。

五、結(jié)論

本文研究并設(shè)計(jì)出支持系統(tǒng)的調(diào)研數(shù)據(jù)庫(kù)和挖掘數(shù)據(jù)庫(kù),通過(guò)這兩個(gè)數(shù)據(jù)庫(kù)的協(xié)作可以實(shí)現(xiàn)面向商業(yè)的網(wǎng)絡(luò)調(diào)研數(shù)據(jù)和挖掘數(shù)據(jù)的存儲(chǔ)和操作。本文構(gòu)建了一個(gè)面向商業(yè)的網(wǎng)絡(luò)調(diào)研數(shù)據(jù)挖掘系統(tǒng),它通過(guò)把商業(yè)網(wǎng)絡(luò)調(diào)研的網(wǎng)站模式與數(shù)據(jù)挖掘相結(jié)合,很好地解決了面向商業(yè)的網(wǎng)絡(luò)調(diào)研與數(shù)據(jù)挖掘結(jié)合的難題,針對(duì)本系統(tǒng)的特點(diǎn)提出了特有的分屢次理論,使系統(tǒng)具備了優(yōu)良的擴(kuò)展性和可維護(hù)性,應(yīng)用領(lǐng)域廣泛。下一步研究的重點(diǎn)是如何把算法和變量統(tǒng)一起來(lái)。使系統(tǒng)可以對(duì)要進(jìn)行分析的問(wèn)題自動(dòng)做出判斷。以降低人為因素導(dǎo)致挖掘失敗的風(fēng)險(xiǎn)。

猜你喜歡
數(shù)據(jù)挖掘調(diào)研問(wèn)卷
人大到基層調(diào)研應(yīng)做到“三不”
調(diào)研“四貼近” 履職增實(shí)效
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
問(wèn)卷網(wǎng)
腳踏實(shí)地扶貧調(diào)研
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于GPGPU的離散數(shù)據(jù)挖掘研究
調(diào)研