国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

現(xiàn)代商業(yè)中計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的應(yīng)用

2016-03-17 02:28李娜娜
科技與創(chuàng)新 2016年5期
關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)庫

李娜娜

摘 要:現(xiàn)代信息技術(shù)和商業(yè)模式發(fā)展迅速,數(shù)據(jù)挖掘技術(shù)的應(yīng)用對(duì)海量商業(yè)信息處理有著極大的現(xiàn)實(shí)意義?;ヂ?lián)網(wǎng)的不斷發(fā)展使得數(shù)據(jù)挖掘技術(shù)成為現(xiàn)代商業(yè)獲取市場(chǎng)信息的重要載體。目前,在大量商業(yè)活動(dòng)中,借助數(shù)據(jù)自動(dòng)分析技術(shù)可以獲得真實(shí)、可靠的市場(chǎng)信息,為企業(yè)各項(xiàng)商業(yè)活動(dòng)提供更多的商業(yè)利潤決策信息。Internet可以說是一個(gè)海量信息資源儲(chǔ)備庫,在商務(wù)活動(dòng)中,企業(yè)希望各類訪問、分析、使用等均是科學(xué)、有效的,從而為數(shù)據(jù)挖掘提供更好的發(fā)展空間。數(shù)據(jù)挖掘是基于企業(yè)已定目標(biāo),深入分析企業(yè)各項(xiàng)數(shù)據(jù),揭示企業(yè)中潛在的未知規(guī)律,從而將其模型化,以此來支持企業(yè)各項(xiàng)商業(yè)決策活動(dòng)。簡(jiǎn)述了Web數(shù)據(jù)挖掘技術(shù),深入分析了數(shù)據(jù)挖掘方法在商業(yè)信息中的使用規(guī)則,探析了數(shù)據(jù)挖掘技術(shù)在商業(yè)信息中的應(yīng)用策略。

關(guān)鍵詞:商業(yè)信息;數(shù)據(jù)挖掘技術(shù);Web技術(shù);數(shù)據(jù)庫

中圖分類號(hào):TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.15913/j.cnki.kjycx.2016.05.024

隨著數(shù)據(jù)庫技術(shù)和人工智能技術(shù)的飛速發(fā)展,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生,屬于一種新型信息技術(shù)。自20世紀(jì)90年代以來,經(jīng)濟(jì)全球化、貿(mào)易自由化、信息現(xiàn)代化進(jìn)展迅速,信息技術(shù)、商務(wù)技術(shù)和管理技術(shù)等的結(jié)合提高了現(xiàn)代生產(chǎn)力。在現(xiàn)代商業(yè)中,計(jì)算機(jī)Web技術(shù)在不斷推動(dòng)著部門經(jīng)濟(jì)、區(qū)域經(jīng)濟(jì)、國民經(jīng)濟(jì)和世界經(jīng)濟(jì)的發(fā)展?,F(xiàn)代化商業(yè)運(yùn)轉(zhuǎn)模式屬于一種全新的商業(yè)模式,是基于網(wǎng)絡(luò)平臺(tái),采用現(xiàn)代化信息技術(shù)手段,著眼于提升經(jīng)濟(jì)效益的現(xiàn)代化商業(yè)模式。這一模式的應(yīng)用使得各項(xiàng)商務(wù)活動(dòng)網(wǎng)絡(luò)化、數(shù)字化?,F(xiàn)代化商業(yè)模式的產(chǎn)生打破了企業(yè)傳統(tǒng)的經(jīng)營理念、管理方式和支付手段,促進(jìn)了社會(huì)各大領(lǐng)域的不斷改革。應(yīng)用功能強(qiáng)大的Web數(shù)據(jù)挖掘技術(shù),可輔助企業(yè)更加深入地分析網(wǎng)絡(luò)上所收集的各項(xiàng)數(shù)據(jù),引導(dǎo)企業(yè)合理調(diào)整營銷策略。這樣,有助于為客戶提供動(dòng)態(tài)、個(gè)性且高效的服務(wù)。

1 Web數(shù)據(jù)挖掘技術(shù)概論

1.1 Web數(shù)據(jù)挖掘技術(shù)簡(jiǎn)述

數(shù)據(jù)挖掘主要是數(shù)據(jù)開采,是從新角度將數(shù)據(jù)庫技術(shù)、KDD技術(shù)與統(tǒng)計(jì)學(xué)合理結(jié)合,依據(jù)企業(yè)既定目標(biāo),在各項(xiàng)數(shù)據(jù)中更深入地挖掘其內(nèi)部潛在性信息,且有效處理各項(xiàng)知識(shí)的過程。在數(shù)據(jù)挖掘過程中,高效率獲取大量數(shù)據(jù),或者基于一定應(yīng)用領(lǐng)域找出數(shù)據(jù)之間所存在的關(guān)系,可有效提升算法效率。數(shù)據(jù)挖掘大都是為達(dá)到一定目的而進(jìn)行數(shù)據(jù)收集,這就使得數(shù)據(jù)挖掘難度較大。在數(shù)據(jù)挖掘中,重要的數(shù)據(jù)極易丟失,未知性和不完全性等均存在于其中。Web數(shù)據(jù)挖掘大都是從眾多Web站點(diǎn)和文檔集合中深層挖掘潛在有效信息,這也是數(shù)據(jù)挖掘技術(shù)在Web環(huán)境下的應(yīng)用。Web數(shù)據(jù)挖掘技術(shù)是一項(xiàng)綜合技術(shù),其涉及多個(gè)學(xué)科,比如計(jì)算機(jī)語言學(xué)、統(tǒng)計(jì)學(xué)和信息學(xué)等。Web數(shù)據(jù)挖掘一般可分為Web結(jié)構(gòu)挖掘、Web內(nèi)容挖掘和Web訪問信息挖掘等。其中,Web結(jié)構(gòu)挖掘即挖掘Web潛在的鏈接結(jié)構(gòu)模式;Web內(nèi)容挖掘是對(duì)Web頁面內(nèi)容進(jìn)行挖掘,從大量的Web數(shù)據(jù)中發(fā)現(xiàn)信息、抽取知識(shí)的過程;Web訪問信息挖掘即用戶從Web站點(diǎn)的訪問數(shù)據(jù)中發(fā)現(xiàn)有價(jià)值的信息。近年來,現(xiàn)代商業(yè)發(fā)展迅速,用戶量逐年增長,Web數(shù)據(jù)庫包含的數(shù)據(jù)資源日趨多樣。自動(dòng)收集數(shù)據(jù),并將挖掘數(shù)據(jù)轉(zhuǎn)換為商業(yè)行為,從而滿足數(shù)據(jù)挖掘條件,這也使現(xiàn)代商業(yè)成為了Web數(shù)據(jù)挖掘的一大領(lǐng)域。

1.2 Web數(shù)據(jù)挖掘技術(shù)分析

路徑分析技術(shù)的應(yīng)用使網(wǎng)絡(luò)中的信息劇增。用戶不可能在短時(shí)間內(nèi)就找出自己所需的各類信息,需要從一個(gè)頁面鏈接至另一個(gè)頁面,同時(shí)由這一頁面鏈接至其他頁面。這樣的訪問路徑均會(huì)被記錄于服務(wù)器日志文件中。路徑分析屬于深層分析路徑中所含的日志文件,所得的結(jié)果有助于網(wǎng)站管理人員以多數(shù)用戶的對(duì)應(yīng)需求改善各網(wǎng)站結(jié)構(gòu)。分類分析技術(shù)是基于示例數(shù)據(jù)來分析模型,同時(shí)運(yùn)用此類模式分類描述網(wǎng)上的數(shù)據(jù)。將分類分析技術(shù)應(yīng)用于網(wǎng)絡(luò)銷售中,可為用戶提供他們喜歡的產(chǎn)品。聚類技術(shù)則是有效分析和整理海量用戶訪問數(shù)據(jù),比如用戶喜歡的各種商品及其訪問網(wǎng)頁等,且基于相關(guān)規(guī)則分類,從而給出相應(yīng)的特征描述,比如網(wǎng)絡(luò)營銷中的聚類技術(shù)。這有助于企業(yè)將用戶分為不同群體,同時(shí)給出該類群體的關(guān)鍵喜好和需求,依據(jù)用戶網(wǎng)站上的訪問記錄具有關(guān)聯(lián)性的深層分析,基于用戶習(xí)慣和喜好提供便捷的訪問方式,并為用戶推薦他們喜歡的相關(guān)商品和對(duì)應(yīng)服務(wù)。

1.3 Web數(shù)據(jù)挖掘流程

在現(xiàn)代商業(yè)中,計(jì)算機(jī)Web數(shù)據(jù)挖掘流程為:①發(fā)現(xiàn)資源。在目標(biāo)Web文檔中,由相關(guān)任務(wù)可獲得對(duì)應(yīng)的數(shù)據(jù)。信息資源不僅局限于在線Web文檔中的數(shù)據(jù),還包括新聞組、電子文檔、電子郵件、網(wǎng)站日志數(shù)據(jù)庫、交易數(shù)據(jù)庫中的海量數(shù)據(jù)。②選擇和預(yù)處理信息。在獲得Web資源的過程中,應(yīng)用Web數(shù)據(jù)挖掘技術(shù)可將無用信息有效去除,合理調(diào)配有用信息。比如在Web文檔中,將廣告了解、自動(dòng)識(shí)別字段或者段落、多余格式標(biāo)記等去除,且將數(shù)據(jù)有效組合,建立具有內(nèi)在邏輯性的關(guān)系表。③模式發(fā)現(xiàn)。自動(dòng)模式發(fā)現(xiàn)可于多個(gè)站點(diǎn)或者同一站點(diǎn)內(nèi)進(jìn)行。數(shù)據(jù)發(fā)現(xiàn)主要是通過模式識(shí)別中的數(shù)據(jù)挖掘算法加工、分析用戶日志文件,掌握用戶訪問站點(diǎn)習(xí)慣和流量模式,便于企業(yè)進(jìn)行決策改進(jìn)和市場(chǎng)目標(biāo)制訂。數(shù)據(jù)發(fā)現(xiàn)中應(yīng)進(jìn)行的操作主要是,先決定如何產(chǎn)生假設(shè),然后再選擇適當(dāng)?shù)墓ぞ?,從而深入發(fā)掘知識(shí)操作,最終證實(shí)所發(fā)掘的知識(shí)。④分析模式。該階段應(yīng)表述數(shù)據(jù)挖掘結(jié)果,且深層分析和選擇處理提取的信息,合理區(qū)分最具價(jià)值的信息,經(jīng)由決策支持工具而將信息交于決策人,最終通過可視化技術(shù)用圖形界面充分展示挖掘成果。

2 數(shù)據(jù)挖掘方法在商業(yè)信息中的使用規(guī)則

將數(shù)據(jù)挖掘技術(shù)應(yīng)用于商業(yè)中,采用高度自動(dòng)化技術(shù)分析商業(yè)原始數(shù)據(jù),以作出歸納性推理,深層挖掘數(shù)據(jù)中的潛在性模式,嚴(yán)格預(yù)測(cè)客戶多方面的行為,這樣可幫助商業(yè)決策者合理調(diào)整市場(chǎng)策略,以便降低市場(chǎng)投資風(fēng)險(xiǎn),確保決策者作出正確的決策,這也充分體現(xiàn)了決策支持的整個(gè)過程。

2.1 商業(yè)信息泛化、簡(jiǎn)約和特征提取規(guī)則

商業(yè)信息泛化大多是為了商業(yè)數(shù)據(jù)能被深入理解和掌握,而將實(shí)際數(shù)據(jù)信息抽象為更高層次的信息;商業(yè)信息簡(jiǎn)約是使用對(duì)應(yīng)手段對(duì)信息進(jìn)行描述;商業(yè)信息特征提取則是為了從海量信息中找尋信息通用特征。

2.2 商業(yè)信息分類技術(shù)規(guī)則

商業(yè)信息分類是依據(jù)一組商業(yè)信息對(duì)象特征對(duì)信息對(duì)象進(jìn)行劃分。該類模式可深入反映數(shù)據(jù)庫中的大量數(shù)據(jù)信息,并將其提供于給定類別中。

2.3 商業(yè)信息聚類規(guī)則

商業(yè)信息聚類是為了識(shí)別一組信息對(duì)象的內(nèi)在性規(guī)則而將對(duì)象分組,以組成類似的對(duì)象類,從中找出數(shù)據(jù)信息的分布規(guī)律,深入分析一組混雜數(shù)據(jù)信息的潛在性分類規(guī)則。聚類則是盡量縮短一組個(gè)體間的距離,同時(shí)確保不同類別個(gè)體間的距離較遠(yuǎn)。

2.4 商業(yè)信息關(guān)聯(lián)規(guī)則

商業(yè)信息關(guān)聯(lián)規(guī)則主要是在商業(yè)數(shù)據(jù)挖掘中基于概念層次關(guān)聯(lián)規(guī)則而發(fā)現(xiàn)的。關(guān)聯(lián)規(guī)則是研究者于大型商場(chǎng)顧客購買上衣和褲子時(shí)總結(jié)出來的。經(jīng)分析發(fā)現(xiàn),大約10%的顧客會(huì)同時(shí)購買上衣和褲子,這體現(xiàn)出了一定的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則在時(shí)間和序列方面存在一定的規(guī)律,比如不同季節(jié)購買的商品不同,不同層次或者不同年齡的人購買的商品也不同。

3 數(shù)據(jù)挖掘技術(shù)在商業(yè)信息中的應(yīng)用策略

數(shù)據(jù)挖掘技術(shù)屬于現(xiàn)代商業(yè)信息處理中常見的處理技術(shù),可為商業(yè)領(lǐng)域中的數(shù)據(jù)庫和復(fù)雜信息提取有價(jià)值的知識(shí),從而提升信息的利用率,這對(duì)企業(yè)相應(yīng)策略的制訂有著重要的現(xiàn)實(shí)意義。

3.1 在電子商務(wù)網(wǎng)站數(shù)據(jù)中的應(yīng)用

隨著Web技術(shù)的飛速發(fā)展,電子商務(wù)網(wǎng)站成為了各大企業(yè)和商家的必爭(zhēng)之地。企業(yè)或商家如果想要吸引客戶,就要提升客戶忠誠度。電子商務(wù)網(wǎng)站每天都有上百萬次的在線交易,會(huì)生成大量記錄文件和登記表。對(duì)這些數(shù)據(jù)進(jìn)行深層分析,可幫助商家了解客戶的喜好和購買模式,以滿足不同客戶群體的需求。企業(yè)或商家要從提升自身競(jìng)爭(zhēng)力的角度出發(fā),創(chuàng)建個(gè)性化網(wǎng)站。這些都是企業(yè)或商家生存、獲勝的關(guān)鍵手段。

網(wǎng)站數(shù)據(jù)挖掘所需的數(shù)據(jù)主要來自于客戶背景信息和瀏覽者點(diǎn)擊流??蛻舯尘靶畔⒅饕强蛻舻怯洷?,而瀏覽者點(diǎn)擊流則是考察客戶的各種行為表現(xiàn)。但有時(shí),客戶對(duì)自己的背景信息保密,不愿意將信息盡數(shù)填寫在登記表上,這就給數(shù)據(jù)分析和挖掘帶來了很大的難度。這時(shí),就不得不從瀏覽者的各項(xiàng)表現(xiàn)數(shù)據(jù)著手,以此推測(cè)客戶背景信息,且將所得信息進(jìn)行有效運(yùn)用。從分析、建模技術(shù)和算法來講,網(wǎng)站數(shù)據(jù)挖掘與之前的數(shù)據(jù)挖掘差異較小,很多方式和分析思想均可借用。不同的網(wǎng)站數(shù)據(jù)格式均來自于點(diǎn)擊流,與傳統(tǒng)的數(shù)據(jù)格式差別很大,這為電子商務(wù)網(wǎng)站進(jìn)行數(shù)據(jù)挖掘和電子商務(wù)運(yùn)行提供了數(shù)據(jù)支持。

3.2 在金融領(lǐng)域中的應(yīng)用

金融事務(wù)處理均需搜集相關(guān)數(shù)據(jù)。深層分析此類數(shù)據(jù)且總結(jié)其主要模式和特征,發(fā)現(xiàn)消費(fèi)群體或金融組織的商業(yè)興趣,密切觀察相應(yīng)金融市場(chǎng)的主要變化趨勢(shì)。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于銀行信息中時(shí),商業(yè)銀行的業(yè)務(wù)利潤和風(fēng)險(xiǎn)是共存的。為了確保最大利潤和最小風(fēng)險(xiǎn),應(yīng)對(duì)賬戶展開嚴(yán)格的分析和歸類,同時(shí)對(duì)銀行信用進(jìn)行評(píng)估。其間,應(yīng)有效運(yùn)用數(shù)據(jù)挖掘工具,根據(jù)客戶消費(fèi)模式來預(yù)測(cè)何時(shí)給客戶提供何類產(chǎn)品。銀行應(yīng)嚴(yán)格督促新開銀行網(wǎng)點(diǎn)盡早盈利,結(jié)合GPS來推理信息系統(tǒng)和商業(yè)智能應(yīng)用系統(tǒng),務(wù)必詳細(xì)記錄客戶的常駐地、客戶到此銀行網(wǎng)點(diǎn)辦理的業(yè)務(wù)等客戶信息。同時(shí),銀行商業(yè)智能系統(tǒng)會(huì)自動(dòng)記錄客戶的各項(xiàng)操作信息和銀行網(wǎng)點(diǎn)信息。利用各類記錄而獲得客戶常駐地至銀行網(wǎng)點(diǎn)的關(guān)鍵路線后會(huì)發(fā)現(xiàn),某個(gè)地區(qū)進(jìn)行各項(xiàng)業(yè)務(wù)操作的客戶較多,但因周邊沒有銀行網(wǎng)點(diǎn)而去別的地方辦理。此時(shí),銀行應(yīng)于該地方開辦銀行網(wǎng)點(diǎn)。

將數(shù)據(jù)挖掘技術(shù)應(yīng)用于證券信息中時(shí),上市企業(yè)都會(huì)定期作財(cái)務(wù)報(bào)告。這里包含了很多信息,比如當(dāng)期會(huì)計(jì)盈余數(shù)據(jù)信息體現(xiàn)于股票市價(jià)上。對(duì)于中長期投資者來講,其可預(yù)見未來,質(zhì)地較好或是未來有高盈利增長能力的企業(yè)屬中長期投資者,包括普通投資者和券商等。這些均是普通關(guān)注對(duì)象,此類公司可帶給投資者更高的回報(bào)。財(cái)務(wù)報(bào)告中有著大量描述公司經(jīng)營狀況的相關(guān)數(shù)據(jù)。最終所獲得的數(shù)據(jù)為投資者提升企業(yè)未來盈利能力的關(guān)鍵信息,中長期投資者應(yīng)合理利用此類信息挖掘其中盈利水平高、成長性好的企業(yè)。應(yīng)用數(shù)據(jù)挖掘技術(shù)來挖掘財(cái)務(wù)報(bào)告中的關(guān)鍵信息,還可獲得更精準(zhǔn)的預(yù)測(cè)效果,其所選擇的投資組合可獲得更好的收益。這些對(duì)投資者來說都非常關(guān)鍵。

3.3 在企業(yè)市場(chǎng)營銷中的應(yīng)用

數(shù)據(jù)挖掘技術(shù)早已被普遍應(yīng)用于企業(yè)市場(chǎng)營銷中,其基于市場(chǎng)營銷學(xué)的市場(chǎng)細(xì)分原理,基本假定消費(fèi)者早期行為為未來消費(fèi)傾向更好的體現(xiàn)。收集、加工和處理大都涉及消費(fèi)者各項(xiàng)消費(fèi)行為的大量信息,確保滿足特定消費(fèi)群體、個(gè)體的興趣和消費(fèi)習(xí)慣等各方面需求,從而嚴(yán)格推斷其相關(guān)消費(fèi)群體,或者個(gè)體的繼續(xù)消費(fèi)行為?;诖?,給予識(shí)別的消費(fèi)群體特定內(nèi)容的定向營銷,比傳統(tǒng)的大規(guī)模營銷更能節(jié)約營銷成本,提升營銷效果和利潤。這些數(shù)據(jù)信息經(jīng)組合之后,用超級(jí)計(jì)算機(jī)及并行處理和神經(jīng)元網(wǎng)絡(luò)等方式有效處理,獲得商家特定消費(fèi)群體或個(gè)體定向營銷的決策信息。

4 結(jié)束語

隨著計(jì)算機(jī)技術(shù)的飛速發(fā)展,人們對(duì)數(shù)據(jù)挖掘技術(shù)提出了更高的要求。數(shù)據(jù)挖掘技術(shù)是一種新型信息技術(shù),Web挖掘形式及其研究方向持續(xù)更新變化?,F(xiàn)代化商業(yè)領(lǐng)域的發(fā)展與變化更是十分迅速,這也要求未來Web數(shù)據(jù)挖掘技術(shù)具備更高的效率,大量商業(yè)活動(dòng)均需經(jīng)過自動(dòng)、有效的數(shù)據(jù)分析技術(shù)獲得真實(shí)、可靠的市場(chǎng)信息,為企業(yè)各項(xiàng)活動(dòng)提供更多的利潤決策信息。現(xiàn)代化商業(yè)模式打破了企業(yè)傳統(tǒng)的經(jīng)營理念、管理方式和支付手段,也促進(jìn)了社會(huì)各大領(lǐng)域的不斷改革,企業(yè)及時(shí)調(diào)整自身營銷策略,提供動(dòng)態(tài)且個(gè)性化的高效率服務(wù)非常重要。

參考文獻(xiàn)

[1]藺莉,潘浩.Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J].電腦知識(shí)與技術(shù),2010(2).

[2]龐英智.Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用[J].情報(bào)科學(xué),2011(2).

[3]由海涌,姜達(dá).淺談Web數(shù)據(jù)挖掘技術(shù)的應(yīng)用[J].電子技術(shù)與軟件工程,2013(6).

〔編輯:劉曉芳〕

猜你喜歡
數(shù)據(jù)挖掘技術(shù)數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)挖掘在計(jì)算機(jī)網(wǎng)絡(luò)病毒防御中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)及其在醫(yī)學(xué)信息領(lǐng)域的應(yīng)用
基于Web的數(shù)據(jù)挖掘技術(shù)與相關(guān)研究
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫
數(shù)據(jù)庫