符萍
摘 要:通過數(shù)據(jù)挖掘技術(shù)和商務(wù)解析方法之間的關(guān)系入手,說明二者之間的隸屬關(guān)系。介紹數(shù)據(jù)挖掘技術(shù)的數(shù)據(jù)準(zhǔn)備、尋找模式、數(shù)據(jù)解釋和建模和依據(jù)結(jié)果制定計(jì)劃的運(yùn)作步驟,并指出各步驟的關(guān)鍵事項(xiàng)。討論了數(shù)據(jù)挖掘和文本挖掘技術(shù)在商務(wù)解析中的作用和應(yīng)用現(xiàn)狀和進(jìn)一步發(fā)展商務(wù)解析能力的促進(jìn)因素,更多的了解商務(wù)解析能力在企業(yè)中應(yīng)用的潛力和限制。說明了商務(wù)解析在企業(yè)實(shí)際制定計(jì)劃和決策時(shí)的關(guān)鍵作用,利用商務(wù)解析能力能夠提升企業(yè)的業(yè)績(jī)和競(jìng)爭(zhēng)能力。
關(guān)鍵詞:數(shù)據(jù)挖掘;商務(wù)解析;文本挖掘;電子商務(wù)
中圖分類號(hào):F27
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):16723198(2015)03011903
推薦系統(tǒng)出現(xiàn)改變了顧客的選購模式,系統(tǒng)自動(dòng)記錄顧客的購買偏好,在下次購買時(shí),將相關(guān)商品自動(dòng)推薦給顧客,推薦系統(tǒng)的出現(xiàn)減少了顧客選購時(shí)間,增加了公司獲利可能性,得到雙贏效果。系統(tǒng)背后的基礎(chǔ)是數(shù)據(jù)整理能力,收集好商業(yè)活動(dòng)中數(shù)據(jù)并加工出能夠準(zhǔn)確有效的信息,提升企業(yè)競(jìng)爭(zhēng)力和商業(yè)效率。新商務(wù)模式也為消費(fèi)者帶來便利,增加了消費(fèi)者生活多樣性,消費(fèi)者的購買已經(jīng)主要發(fā)生在因特網(wǎng)上。因此,在龐大的網(wǎng)絡(luò)交易中,如何增加企業(yè)利潤,發(fā)現(xiàn)業(yè)務(wù)市場(chǎng)潛力,都要以數(shù)據(jù)為基礎(chǔ)來挖掘有效信息,提升企業(yè)分析和決策能力。夏國恩等以SCI、EI、CNKI相關(guān)數(shù)據(jù)庫為基礎(chǔ),系統(tǒng)的分析了商務(wù)智能的研究趨勢(shì)和研究進(jìn)展,并集中研究了商務(wù)智能在我國的研究現(xiàn)狀并提出建議。張巧從商務(wù)智能的核心概念和框架入手,分析我們商務(wù)智能的發(fā)展現(xiàn)狀,介紹主流軟件產(chǎn)品和廠商,并對(duì)未來的發(fā)展做了預(yù)測(cè)。胡翠華等以商務(wù)智能為研究視角,分析適合發(fā)展的行業(yè)和在我國的市場(chǎng)規(guī)模,針對(duì)發(fā)展趨勢(shì)制定了相關(guān)政策。夏維力等從戰(zhàn)略管理的角度討論商務(wù)智能在戰(zhàn)略決策中的作用,分析了戰(zhàn)略決策中信息獲取及處理方法和決策者洞察力等問題,介紹SWOT專家系統(tǒng)和智能網(wǎng)的情況。葉瓊偉等介紹了商務(wù)智能在我國電子商務(wù)企業(yè)中的應(yīng)用,從時(shí)間、價(jià)值信息和技術(shù)三個(gè)維度對(duì)商務(wù)智能進(jìn)行了分析,并結(jié)合案例討論其應(yīng)用的好處。李振國等介紹了商務(wù)智能的含義和技術(shù),討論商務(wù)智能在供應(yīng)鏈管理中的具體應(yīng)用,指出了應(yīng)用應(yīng)遵循的原則和指導(dǎo)。田新等介紹了BPM的歷史背景,BPM和BI之間的關(guān)系,描述了基于商務(wù)智能平臺(tái)的企業(yè)績(jī)效管理框架。
國內(nèi)研究數(shù)據(jù)挖掘和商務(wù)智能的文獻(xiàn)已有很多,但是針對(duì)商務(wù)解析的研究較少。商務(wù)解析過程的表現(xiàn)形式為商務(wù)智能,商務(wù)智能化需要了解商務(wù)解析過程和數(shù)據(jù)挖掘能力。分析企業(yè)已有數(shù)據(jù),理解企業(yè)所處的商業(yè)環(huán)境,提高企業(yè)的競(jìng)爭(zhēng)力,都要以商務(wù)解析能力為基礎(chǔ)。商務(wù)解析是利用技術(shù)、規(guī)則、技能和實(shí)踐經(jīng)驗(yàn)分析和開發(fā)過去商業(yè)數(shù)據(jù),在此基礎(chǔ)上得出洞察力和有效商業(yè)機(jī)會(huì)。商務(wù)解析是基于數(shù)據(jù)和統(tǒng)計(jì)方法來了解企業(yè)過去的績(jī)效、建立一種新的洞察力。商務(wù)解析廣泛利用大數(shù)據(jù)、統(tǒng)計(jì)和計(jì)量方法、預(yù)測(cè)模型等來實(shí)現(xiàn)決策。
1 數(shù)據(jù)挖掘與商務(wù)解析的關(guān)系
從技術(shù)角度來看,在很多應(yīng)用領(lǐng)域都將數(shù)據(jù)挖掘和商務(wù)解析等同,因?yàn)樯虅?wù)解析現(xiàn)在大多依靠數(shù)據(jù)挖掘技術(shù)來實(shí)現(xiàn)其功能。但是,在理論上兩者有本質(zhì)的區(qū)別。
數(shù)據(jù)挖掘技術(shù)為在企業(yè)數(shù)據(jù)庫中將大量數(shù)據(jù)中隱含的、未知的、有價(jià)值的信息挖掘出來的技術(shù)。數(shù)據(jù)挖掘也是一個(gè)價(jià)值發(fā)現(xiàn)過程,主要利用統(tǒng)計(jì)方法、智能優(yōu)化、人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)庫技術(shù)等方法自動(dòng)分析企業(yè)數(shù)據(jù),歸納、推理出潛在的價(jià)值信息,幫助企業(yè)發(fā)現(xiàn)價(jià)值、減少不必要的浪費(fèi)、做出準(zhǔn)確的決策。理論上,數(shù)據(jù)挖掘主要是識(shí)別企業(yè)數(shù)據(jù)集的模式,數(shù)據(jù)集可以來源企業(yè)數(shù)據(jù)庫和公共數(shù)據(jù)庫。能夠利用數(shù)據(jù)庫找出不同數(shù)據(jù)之間的相互聯(lián)系和一般模式,得到不同的關(guān)聯(lián)關(guān)系。
商務(wù)解析主要指利用數(shù)據(jù)收集方法和數(shù)據(jù)挖掘技術(shù)產(chǎn)生有價(jià)值信息的過程,要將數(shù)據(jù)呈現(xiàn)為標(biāo)準(zhǔn)的、可讀性的文件用來指導(dǎo)決策者決策和管理活動(dòng)。商務(wù)解析是一個(gè)過程,在這個(gè)過程前期主要進(jìn)行信息收集整理和確定可執(zhí)行文件的度量標(biāo)準(zhǔn),后期根據(jù)數(shù)據(jù)挖掘技術(shù)處理數(shù)據(jù),提取有價(jià)值信息??梢哉f,數(shù)據(jù)挖掘過程是商務(wù)解析過程的一部分。企業(yè)如果能夠準(zhǔn)確、有效的利用商務(wù)解析功能,將會(huì)提高決策過程,提高運(yùn)作效率,實(shí)現(xiàn)商務(wù)智能化。圖1說明了數(shù)據(jù)挖掘和商務(wù)解析之間的關(guān)系。
圖1 商務(wù)解析過程
2 數(shù)據(jù)挖掘運(yùn)作步驟
數(shù)據(jù)挖掘的正確使用能夠提升企業(yè)競(jìng)爭(zhēng)力,有效運(yùn)用數(shù)據(jù)挖掘技術(shù)主要包括以下四個(gè)過程:
(1)數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)準(zhǔn)備是從一個(gè)或多個(gè)數(shù)據(jù)源中構(gòu)造數(shù)據(jù)集,為以后數(shù)據(jù)建模做準(zhǔn)備。通常包括數(shù)據(jù)清理、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)整理。數(shù)據(jù)清理主要是如何處理丟失的數(shù)據(jù),數(shù)據(jù)轉(zhuǎn)換是通過標(biāo)準(zhǔn)化、映射和聚集等方法轉(zhuǎn)換數(shù)據(jù)價(jià)值,數(shù)據(jù)整理是將數(shù)據(jù)整合到更小的數(shù)據(jù)集中。數(shù)據(jù)準(zhǔn)備是一個(gè)很長的過程,要有對(duì)數(shù)據(jù)的敏感度,知道什么樣的數(shù)據(jù)是企業(yè)需要的數(shù)據(jù)。對(duì)選擇好的數(shù)據(jù)也可能存在數(shù)據(jù)質(zhì)量問題,要設(shè)定一系列標(biāo)準(zhǔn)來對(duì)待所選擇的數(shù)據(jù)。數(shù)據(jù)的有效性、完整性和規(guī)范性能夠?qū)е略跀?shù)據(jù)分析之后的結(jié)果輸出時(shí),錯(cuò)誤的得出企業(yè)實(shí)際結(jié)果,造成不必要損失。
(2)在數(shù)據(jù)集尋找模式。數(shù)據(jù)挖掘的模式選擇有很多類型,主要依據(jù)不同的企業(yè)目的和要求。從挖掘任務(wù)的角度可以分成概念/類描述,挖掘頻繁模式、關(guān)聯(lián)和相關(guān),分類和預(yù)測(cè),聚類分析,離群點(diǎn)分析和演變分析等。實(shí)現(xiàn)以上模式的挖掘工具有關(guān)聯(lián)規(guī)則、聚類分類算法等,每一種不同的算法都可以找出不同的數(shù)據(jù)模式。企業(yè)如果要尋找下一個(gè)業(yè)務(wù)的增長點(diǎn),就要在已有顧客信息的基礎(chǔ)上,利用預(yù)測(cè)算法分析出顧客潛在的相關(guān)需求。
(3)數(shù)據(jù)解釋和建模。通過找出的某一類型的數(shù)據(jù),就要建立分析模型。利用模型進(jìn)行準(zhǔn)確、有效的數(shù)據(jù),如果數(shù)據(jù)不符合開始的要求,那么將利用算法從更大的樣本數(shù)據(jù)進(jìn)行挖掘或更換數(shù)據(jù)屬性。數(shù)據(jù)結(jié)果的解釋要求準(zhǔn)確和恰當(dāng),這對(duì)數(shù)據(jù)結(jié)果要按照目的和要求進(jìn)行,不同的數(shù)據(jù)屬性設(shè)置會(huì)造成數(shù)據(jù)結(jié)果的誤差,這種誤差會(huì)影響到后期的商務(wù)計(jì)劃的制定和執(zhí)行過程。
(4)根據(jù)結(jié)果制定計(jì)劃。數(shù)據(jù)挖掘產(chǎn)生的結(jié)果被評(píng)估后是準(zhǔn)確和可行的,就可以制定相關(guān)的商業(yè)計(jì)劃,商業(yè)計(jì)劃的制定也不能完全按照挖掘的結(jié)果制定,要綜合分析企業(yè)的現(xiàn)狀和人員素質(zhì),這樣可以保證企業(yè)運(yùn)用技術(shù)的合理性。如果某個(gè)商場(chǎng)發(fā)現(xiàn)兩種平時(shí)不相關(guān)的商品存在一種購買關(guān)系,那么,就可以將它們放到相近的位置進(jìn)行銷售。互聯(lián)網(wǎng)公司利用文本挖掘技術(shù)能夠從相關(guān)網(wǎng)站挖掘出潛在的顧客,根據(jù)顧客的信息開發(fā)相關(guān)的網(wǎng)站模塊或相關(guān)應(yīng)用產(chǎn)品,到達(dá)公司發(fā)展的目的。
3 數(shù)據(jù)挖掘在商務(wù)解析中的作用
數(shù)據(jù)挖掘技術(shù)或知識(shí)發(fā)現(xiàn)是商務(wù)解析的基礎(chǔ),商務(wù)解析對(duì)數(shù)據(jù)進(jìn)行篩選、甄別,了解企業(yè)過去與現(xiàn)狀的實(shí)際狀況,通過數(shù)據(jù)挖掘技術(shù)創(chuàng)造有價(jià)值的信息,預(yù)測(cè)企業(yè)將來的方向。數(shù)據(jù)挖掘技術(shù)利用算法挖掘海量數(shù)據(jù)集中的數(shù)據(jù)模式,在數(shù)據(jù)模式的基礎(chǔ)上建立有價(jià)值的信息。該過程為利用預(yù)測(cè)、關(guān)聯(lián)規(guī)則、聚類和分類一些數(shù)學(xué)方法,將數(shù)據(jù)之間的關(guān)系明確,發(fā)現(xiàn)企業(yè)產(chǎn)品之間的關(guān)系,顧客購買的一些行為模式,通過企業(yè)更好的了解產(chǎn)品和客戶的需求,為客戶更好的服務(wù)。很多公司利用文本數(shù)據(jù)挖掘技術(shù),在博客、Twitter、Facebook等網(wǎng)站信息中找出顧客品牌的偏好,根據(jù)技術(shù)提取有價(jià)值信息指導(dǎo)企業(yè)在客戶關(guān)系管理中如何行動(dòng)。
數(shù)據(jù)查詢是很多數(shù)據(jù)庫軟件的主要功能之一,數(shù)據(jù)查詢通過已有的數(shù)據(jù)庫中的數(shù)據(jù)查詢出企業(yè)想得到的信息,但是在進(jìn)行查詢之前,企業(yè)已經(jīng)設(shè)定好查詢的目的和內(nèi)容。而數(shù)據(jù)挖掘技術(shù)是在企業(yè)的數(shù)據(jù)庫中進(jìn)行沒有設(shè)置目的的查詢,找出一些企業(yè)無知的信息,通常將這個(gè)過程稱為知識(shí)發(fā)現(xiàn)。這種知識(shí)發(fā)現(xiàn)是商務(wù)解析的基礎(chǔ),能夠?yàn)樯虅?wù)解析過程提供豐富的信息源泉。數(shù)據(jù)挖掘技術(shù)最早在沃爾瑪?shù)玫胶芎玫膽?yīng)用,零售商的產(chǎn)品銷售主要是陳列各種產(chǎn)品,沃爾瑪從顧客的消費(fèi)記錄中挖掘出啤酒和尿不濕之間有一定的關(guān)系,通過將兩種產(chǎn)品就近陳列促進(jìn)了銷售。零售商的商務(wù)解析過程叫做市場(chǎng)籃子分析,利用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)規(guī)則,找出商品之間的購買關(guān)聯(lián)度,增加產(chǎn)品的交叉銷售,指導(dǎo)商品的陳設(shè)方式。
鋼鐵企業(yè)根據(jù)客戶的購買記錄可以將其分類,利用數(shù)據(jù)挖掘技術(shù)的聚類分析找出相關(guān)客戶之間屬性的一致性分為不同的客戶等級(jí)。很多客戶在購買產(chǎn)品時(shí)將預(yù)付一定的款項(xiàng),等商品收到后再支付其余貨款,但是往往存在一定的違約現(xiàn)象,這類現(xiàn)象就可以利用聚類分析找出優(yōu)良客戶和不良客戶之間的分界線,在不良客戶中采用全額支付后發(fā)貨的決策。這種技術(shù)的應(yīng)用屬于風(fēng)險(xiǎn)管理范疇,在銀行或保險(xiǎn)等金融行業(yè),數(shù)據(jù)挖掘能夠起到檢測(cè)的作用,將信用不好的顧客分類,采取措施防范違約現(xiàn)象的發(fā)生。
4 促進(jìn)商務(wù)解析發(fā)展的因素分析
雖然利用數(shù)據(jù)挖掘技術(shù)能夠增強(qiáng)商務(wù)解析的分析能力,但是如果要更好的發(fā)展商務(wù)解析方法,要求問題求解邏輯、技術(shù)水平、系統(tǒng)整合等方面得到更好的提升。提高商務(wù)解析方法發(fā)展的因素主要包括以下方面:
(1)垂直一體化。由于不同客戶和市場(chǎng)的要求,相關(guān)商務(wù)解析的應(yīng)用程序和軟件要求要縮短知識(shí)發(fā)現(xiàn)的時(shí)間,明確的客戶問題和目標(biāo)的確定,能夠依據(jù)行業(yè)的特點(diǎn)制定詳細(xì)的商業(yè)計(jì)劃,這種要求促進(jìn)了垂直一體化的產(chǎn)生。將專業(yè)的行業(yè)知識(shí)和行業(yè)目標(biāo)包含到商務(wù)解析過程中,設(shè)計(jì)出準(zhǔn)確分析客戶的數(shù)據(jù)。在這一過程中,不單單利用數(shù)據(jù)挖掘技術(shù)挖掘信息,挖掘出的信息的評(píng)價(jià)也很重要。
(2)易理解模型和轉(zhuǎn)換。商務(wù)解析后的結(jié)果往往不能被使用者讀懂,需要數(shù)據(jù)挖掘?qū)<襾矸治龀鲚敵鼋Y(jié)果的意義,這樣會(huì)帶來使用不便。構(gòu)建易理解的模型和容易掌握的轉(zhuǎn)換結(jié)果是客戶的需求,客戶要求能夠用簡(jiǎn)單的圖形或文字來表示最終的結(jié)果,這樣有利于其他業(yè)務(wù)部門的專家直接得到結(jié)果,制定更詳盡的商業(yè)計(jì)劃。
(3)增強(qiáng)系統(tǒng)能力。系統(tǒng)的數(shù)據(jù)分析部分是很重要的部分,系統(tǒng)分析什么取決于收集到什么樣的數(shù)據(jù),擴(kuò)大數(shù)據(jù)收集的范圍能夠?yàn)橄到y(tǒng)分析提供更多的素材。在擴(kuò)大數(shù)據(jù)收集范圍的同時(shí),要考慮存儲(chǔ)的安全性,設(shè)定唯一的標(biāo)示來接受數(shù)據(jù)的存儲(chǔ)。要擴(kuò)大數(shù)據(jù)收集的來源渠道,例如需要客戶信息時(shí),要從網(wǎng)站、尋呼中心、無線接口等途徑獲得需要的數(shù)據(jù)。另外,提高系統(tǒng)運(yùn)行的硬件設(shè)備和所在的網(wǎng)絡(luò)環(huán)境,也同樣有利于系統(tǒng)分析。
(4)應(yīng)用新領(lǐng)域。越來越多的管理理念和方法的誕生為商務(wù)解析提供更多的應(yīng)用空間,供應(yīng)鏈管理、產(chǎn)品價(jià)格管理和員工管理是直接的應(yīng)用方向。供應(yīng)鏈管理利用數(shù)據(jù)的分析和解析能力,能夠更好的建立供應(yīng)鏈上企業(yè)的關(guān)系,按照準(zhǔn)確的市場(chǎng)需求供應(yīng)產(chǎn)品,減少不必要的庫存成本和生產(chǎn)能力。企業(yè)制定產(chǎn)品價(jià)格時(shí),可以從多個(gè)渠道收集產(chǎn)品相關(guān)價(jià)格,及時(shí)調(diào)整自身的價(jià)格,加快產(chǎn)品的流通速度。利用商務(wù)解析更多了解員工的實(shí)際情況和偏好,及時(shí)調(diào)整對(duì)企業(yè)員工的管理方法。
5 結(jié)論
數(shù)據(jù)挖掘技術(shù)的提高和發(fā)展,會(huì)不斷加強(qiáng)商務(wù)解析能力。企業(yè)越來越需要數(shù)據(jù)挖掘和文本挖掘技術(shù)在商務(wù)解析中應(yīng)用,成為企業(yè)發(fā)展的戰(zhàn)略工具,提高企業(yè)競(jìng)爭(zhēng)力。通過了解和熟悉數(shù)據(jù)挖掘技術(shù)的運(yùn)作步驟,了解各步驟中的關(guān)鍵因素,結(jié)合企業(yè)實(shí)際情況,將數(shù)據(jù)挖掘技術(shù)引入商務(wù)解析方法之中,同時(shí),了解企業(yè)商務(wù)解析發(fā)展的主要影響因素,努力在各影響因素中尋找突破口,加強(qiáng)影響因素對(duì)商務(wù)解析的正面作用,使企業(yè)都能夠快速、準(zhǔn)確的擁有商務(wù)解析能力,鞏固企業(yè)供應(yīng)鏈管理、客戶關(guān)系管理和內(nèi)部員工管理等方面的效率。
參考文獻(xiàn)
[1]夏恩國,金煒東,張葛祥.商務(wù)智能在中國的現(xiàn)狀和發(fā)展研究[J].科技進(jìn)步與對(duì)策,2006,(1):173176.
[2]張巧.商務(wù)智能發(fā)展現(xiàn)狀與趨勢(shì)研究[J].中國證券期貨,2009,(2):1417.
[3]胡翠華,陳登科.商務(wù)智能在我國的發(fā)展現(xiàn)狀、問題及其對(duì)策[J].科技管理研究,2007,(10):5052.
[4]夏維力,許昌元.商務(wù)智能技術(shù)在企業(yè)戰(zhàn)略決策中的支持作用及方法研究[J].軟科學(xué),2004,18(3):1521.
[5]葉瓊偉,宋光興,譚繼江.商務(wù)智能(BI)在電子商務(wù)企業(yè)中應(yīng)用的實(shí)證研究以YNYY藥業(yè)連鎖企業(yè)為例[J].科技進(jìn)步與對(duì)策,2010,27(21):112115.
[6]李振國,朱杰.商務(wù)智能在供應(yīng)鏈管理中的應(yīng)用[J].物流技術(shù),2007,26(2):145147.
[7]田新,張玉峰,夏恩德等.基于商務(wù)智能平臺(tái)的企業(yè)績(jī)效管理框架研究[J].科技管理研究,2013,(1):235240.
[8]Mostafa M M. More than words: Social networks text mining for consumer brand sentiments [J]. Expert Systems with Applications,2013,40(10):42414251.
[9]Agrawal R, Imielinski T, Swami A. Mining association rules between sets of items in large database[J].Proceedings of the ACM Sigmoid International Conference on Management of Data,New York,1993.