陳虎 楊利明
【摘要】數(shù)字技術(shù)的快速發(fā)展賦予了財(cái)務(wù)新的職能, 讓財(cái)務(wù)基于數(shù)據(jù)、業(yè)務(wù)和技術(shù)深入分析數(shù)據(jù)信息、汲取數(shù)據(jù)價(jià)值, 成為企業(yè)數(shù)字化經(jīng)營(yíng)的實(shí)踐者與推動(dòng)者。 數(shù)據(jù)分析包含數(shù)據(jù)探索與數(shù)據(jù)算法, 財(cái)務(wù)人員通過探索數(shù)據(jù)的特征與分布, 開展對(duì)海量數(shù)據(jù)的處理與分析, 挖掘出更多的潛在信息, 釋放數(shù)據(jù)的真正價(jià)值, 從而驅(qū)動(dòng)企業(yè)的科學(xué)高效決策, 促進(jìn)企業(yè)財(cái)務(wù)的數(shù)字化轉(zhuǎn)型。 本文基于數(shù)據(jù)探索與數(shù)據(jù)算法的原理, 突出其在財(cái)務(wù)領(lǐng)域的應(yīng)用, 詳細(xì)介紹了應(yīng)收賬款信用風(fēng)險(xiǎn)管理、銷售量與訂貨量預(yù)測(cè)、潛在流失客戶畫像等場(chǎng)景內(nèi)容, 體現(xiàn)了數(shù)據(jù)分析對(duì)財(cái)務(wù)的重要價(jià)值在于提高財(cái)務(wù)管理的效率與質(zhì)量、強(qiáng)化財(cái)務(wù)風(fēng)險(xiǎn)的評(píng)估與防范、全方位支撐業(yè)務(wù)的高效開展和精準(zhǔn)驅(qū)動(dòng)企業(yè)的經(jīng)營(yíng)管理決策。
【關(guān)鍵詞】數(shù)據(jù)分析;數(shù)據(jù)探索;數(shù)據(jù)算法;財(cái)務(wù)領(lǐng)域
【中圖分類號(hào)】F275? ? ? 【文獻(xiàn)標(biāo)識(shí)碼】A? ? ? 【文章編號(hào)】1004-0994(2022)14-0122-5
一、引言
數(shù)字經(jīng)濟(jì)加速了行業(yè)的變革與創(chuàng)新, 改變了企業(yè)傳統(tǒng)的商業(yè)模式與運(yùn)營(yíng)需求, 而面對(duì)企業(yè)經(jīng)營(yíng)者日益復(fù)雜、多維、多變的要求, 財(cái)務(wù)人員卻疲于應(yīng)對(duì), 大量的手工業(yè)務(wù)、冗雜的數(shù)據(jù)處理工作更讓財(cái)務(wù)人員深陷窘境。 為了順應(yīng)時(shí)代發(fā)展變化, 洞察企業(yè)經(jīng)營(yíng)狀況與市場(chǎng)變化趨勢(shì), 越來越多的企業(yè)希望通過數(shù)據(jù)分析技術(shù)降本增效, 提升財(cái)務(wù)的數(shù)據(jù)信息挖掘能力, 以數(shù)據(jù)驅(qū)動(dòng)決策, 提高財(cái)務(wù)管理水平, 實(shí)現(xiàn)企業(yè)的精細(xì)管理與價(jià)值創(chuàng)造。
數(shù)據(jù)分析作為一門科學(xué), 最早由美國(guó)統(tǒng)計(jì)學(xué)家Tukey[1] 于1962年正式提出, 他認(rèn)為數(shù)據(jù)分析及其中的統(tǒng)計(jì)學(xué)知識(shí)必須具備科學(xué)特征而非數(shù)學(xué)特征, 數(shù)據(jù)分析的本質(zhì)是經(jīng)驗(yàn)科學(xué), 即可以不斷地通過實(shí)驗(yàn)以獲得知識(shí)的過程。 伴隨著數(shù)據(jù)分析科學(xué)的不斷發(fā)展, 越來越多的研究聚焦于數(shù)據(jù)分析的應(yīng)用價(jià)值。 如Moll等[2] 研究發(fā)現(xiàn), 數(shù)據(jù)分析等技術(shù)可以顯著提高財(cái)務(wù)的可見性, 能夠?qū)ω?cái)務(wù)管理起到及時(shí)干預(yù)的作用, 極大地減少財(cái)務(wù)人員的任務(wù)數(shù)量, 而財(cái)務(wù)人員需要盡快學(xué)習(xí)數(shù)據(jù)分析技術(shù), 及時(shí)跟上時(shí)代變化, 為企業(yè)創(chuàng)造新的附加值。 同時(shí), 數(shù)據(jù)分析也是眾多企業(yè)和機(jī)構(gòu)關(guān)注的焦點(diǎn), 麥肯錫全球研究院(McKinsey Global Institution, MGI)強(qiáng)調(diào), 數(shù)據(jù)本身的價(jià)值是有限的, 而數(shù)據(jù)分析的價(jià)值將不斷被放大, 數(shù)據(jù)分析不止于分析結(jié)果, 其將驅(qū)動(dòng)企業(yè)實(shí)現(xiàn)新的商業(yè)模式的探索和突破[3] 。
本文認(rèn)為, 數(shù)據(jù)分析是利用數(shù)據(jù)分析技術(shù)對(duì)數(shù)據(jù)進(jìn)行處理以獲取有效信息, 達(dá)到科學(xué)思考和決策的過程, 包括數(shù)據(jù)探索和數(shù)據(jù)算法。 數(shù)據(jù)探索是運(yùn)用專業(yè)的統(tǒng)計(jì)方法對(duì)數(shù)據(jù)的特征與分布進(jìn)行呈現(xiàn), 以基礎(chǔ)分析方法獲得對(duì)于數(shù)據(jù)的初步認(rèn)識(shí), 幫助財(cái)務(wù)人員掌握數(shù)據(jù)的特征、關(guān)聯(lián)性及分布規(guī)律; 數(shù)據(jù)算法是基于數(shù)據(jù)創(chuàng)建算法模型的計(jì)算過程, 對(duì)海量數(shù)據(jù)開展深度信息挖掘, 從而在經(jīng)營(yíng)管理中發(fā)揮數(shù)據(jù)的深度價(jià)值。 因此, 將數(shù)據(jù)分析應(yīng)用于財(cái)務(wù)領(lǐng)域十分必要, 用數(shù)據(jù)提煉企業(yè)管理思維, 形成符合企業(yè)價(jià)值訴求的思路和方法, 賦能企業(yè)的智慧成長(zhǎng)。
二、數(shù)據(jù)探索與數(shù)據(jù)算法
(一)數(shù)據(jù)探索的原理與應(yīng)用
數(shù)據(jù)探索是基于數(shù)據(jù)樣本, 對(duì)數(shù)據(jù)進(jìn)行解釋性的分析工作。 數(shù)據(jù)探索旨在描述數(shù)據(jù)的形態(tài)特征并解釋數(shù)據(jù)的相關(guān)性, 幫助企業(yè)準(zhǔn)確掌握數(shù)據(jù)的分布規(guī)律與發(fā)展趨勢(shì), 洞察其中可能存在的問題。 對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)與分析, 不僅可以凸顯數(shù)據(jù)的特征, 逐步形象化數(shù)據(jù)的變化趨勢(shì), 有效衡量指標(biāo)水平, 還能夠發(fā)現(xiàn)存在的問題, 并挖掘產(chǎn)生問題的原因及采取相應(yīng)措施, 為下一步的數(shù)據(jù)算法工作奠定良好的基礎(chǔ)。 當(dāng)然, 數(shù)據(jù)價(jià)值不全都深藏于數(shù)據(jù)之中, 并非必須通過復(fù)雜的算法才能進(jìn)行挖掘, 一些情況下, 以基礎(chǔ)的統(tǒng)計(jì)學(xué)知識(shí)與工具也足以發(fā)現(xiàn)規(guī)律, 獲得洞見。 數(shù)據(jù)探索具體包括以下三個(gè)方面:
1. 描述性統(tǒng)計(jì)。 財(cái)務(wù)人員可以從集中趨勢(shì)、離散趨勢(shì)、分布形態(tài)三個(gè)方面對(duì)數(shù)據(jù)特征進(jìn)行刻畫: 常見的衡量樣本數(shù)據(jù)集中趨勢(shì)的統(tǒng)計(jì)指標(biāo)包括平均數(shù)、中位數(shù)和眾數(shù)等, 衡量離散趨勢(shì)的指標(biāo)包括極差、標(biāo)準(zhǔn)差及方差等, 衡量分布形態(tài)的指標(biāo)包括峰度和偏度。 例如, 在計(jì)算公司資產(chǎn)周轉(zhuǎn)率時(shí), 會(huì)選擇一定時(shí)期內(nèi)的銷售收入凈額與平均資產(chǎn)總額(資產(chǎn)總額年初數(shù)與年末數(shù)的平均值)來計(jì)算, 以衡量銷售水平與資產(chǎn)投資規(guī)模之間的配比情況。
2. 推斷性統(tǒng)計(jì)。 財(cái)務(wù)人員通常無法收集到針對(duì)某一業(yè)務(wù)的所有數(shù)據(jù), 難以對(duì)該項(xiàng)業(yè)務(wù)的運(yùn)營(yíng)情況展開分析, 推斷性統(tǒng)計(jì)方法則能夠有效解決這一問題。 推斷性統(tǒng)計(jì)通過抽取樣本進(jìn)行測(cè)量, 并可以根據(jù)獲得的樣本數(shù)據(jù)對(duì)所研究對(duì)象的總體特征進(jìn)行推斷[4] 。 該方法能夠幫助財(cái)務(wù)人員利用樣本數(shù)據(jù)來推斷總體特征。 基于研究對(duì)象的分布情況, 可以采用推斷統(tǒng)計(jì)的方法從總體中抽取樣本數(shù)據(jù)進(jìn)行分析, 包括參數(shù)估計(jì)和假設(shè)檢驗(yàn)。 例如, 企業(yè)的財(cái)務(wù)人員可利用假設(shè)檢驗(yàn)的方法分析企業(yè)不良資產(chǎn)產(chǎn)生的原因。
3. 相關(guān)性統(tǒng)計(jì)。 相關(guān)性分析是研究?jī)蓚€(gè)或兩個(gè)以上隨機(jī)變量之間相關(guān)關(guān)系的統(tǒng)計(jì)分析方法, 主要包括繪制相關(guān)圖表和計(jì)算相關(guān)系數(shù)。 例如, 財(cái)務(wù)人員可以利用Pearson相關(guān)系數(shù)判斷總資產(chǎn)周轉(zhuǎn)率、凈資產(chǎn)收益率、流動(dòng)資產(chǎn)周轉(zhuǎn)率等多種財(cái)務(wù)指標(biāo)對(duì)上市公司財(cái)務(wù)風(fēng)險(xiǎn)的影響方向與影響程度, 以基于公司的實(shí)際經(jīng)營(yíng)狀況及時(shí)防范和控制財(cái)務(wù)風(fēng)險(xiǎn)。
(二)數(shù)據(jù)算法的原理與應(yīng)用
算法是指一切經(jīng)過明確定義的計(jì)算過程, 其將某個(gè)或者某組值作為輸入內(nèi)容, 并產(chǎn)生某個(gè)或者某組值作為輸出結(jié)果, 其既包含一系列解決問題的清晰指令, 也包含決定各項(xiàng)清晰指令背后的邏輯規(guī)則與方法[5] 。 算法可以從數(shù)據(jù)中“學(xué)習(xí)”或?qū)?shù)據(jù)集進(jìn)行“擬合”, 不同的算法對(duì)應(yīng)著企業(yè)不同的信息需求, 數(shù)據(jù)算法是數(shù)據(jù)價(jià)值鏈中的核心環(huán)節(jié), 面向業(yè)務(wù)需求, 對(duì)采集、清洗后的數(shù)據(jù)由淺入深地進(jìn)行價(jià)值挖掘, 發(fā)揮數(shù)據(jù)的作用, 賦能企業(yè)財(cái)務(wù)的數(shù)字化轉(zhuǎn)型。 常見的算法包括:
1. 回歸算法。 每一件事情的發(fā)生都有一定的因果關(guān)系, 回歸的過程即是由因溯果的過程, 最終得到因果關(guān)系。 回歸算法能夠基于獲取到的測(cè)試集數(shù)據(jù)建立模型, 并得到自變量與因變量的關(guān)系。 回歸算法一般應(yīng)用于預(yù)測(cè)分析, 如財(cái)務(wù)人員通過今年的利潤(rùn)額, 采用線性回歸分析得出利潤(rùn)額與時(shí)間的關(guān)系模型, 從而預(yù)測(cè)明年第一季度的利潤(rùn)額。 常見的回歸算法包括線性回歸算法和非線性回歸算法。
2. 分類算法。 分類是人類認(rèn)知事物最基本的方法, 人類通過對(duì)復(fù)雜的事物進(jìn)行分類, 尋找規(guī)律, 并根據(jù)每個(gè)類別的特征快速識(shí)別每個(gè)具體的事物, 降低被分析問題的復(fù)雜程度, 從而簡(jiǎn)化問題。 分類不僅是認(rèn)識(shí)事物的基本方法, 也可以作為數(shù)據(jù)分析的重要方法。 分類算法的基本功能是做預(yù)測(cè)。 例如, 商業(yè)銀行會(huì)根據(jù)客戶的基本信息情況, 搭建貸款償還的決策樹, 通過學(xué)習(xí)形成分類器, 對(duì)客戶未來貸款償還能力進(jìn)行預(yù)測(cè), 判斷銀行是否應(yīng)該接受其貸款申請(qǐng)。 常見的分類算法包括KNN算法、Logistic回歸算法、決策樹算法、BP神經(jīng)網(wǎng)絡(luò)算法等。
3. 聚類算法。 聚類和分類都是把多個(gè)分散的事物歸集為不同的類別, 但聚類的目標(biāo)只是把相似的東西聚到一起, 并不需要明確類別信息。 聚類算法可以對(duì)無標(biāo)簽樣本進(jìn)行分析, 因此實(shí)際應(yīng)用十分廣泛。 例如, 保險(xiǎn)公司可以對(duì)平均賠付率較高的人群進(jìn)行聚類, 研究相似特征, 從而達(dá)到鑒別風(fēng)險(xiǎn)、個(gè)性化定價(jià)以及識(shí)別騙保行為的目的。 常見的聚類算法包括K-means聚類算法、均值漂移聚類算法等。
4. 時(shí)間序列算法。 時(shí)間序列分析能夠在特定時(shí)間里對(duì)某區(qū)域進(jìn)行連續(xù)觀測(cè)形成圖像, 并分析其變化過程與發(fā)展規(guī)模[6] 。 通過建立時(shí)間序列模型, 可以根據(jù)已有的歷史數(shù)據(jù)研究變量的自身發(fā)展規(guī)律, 從而對(duì)未來的變化趨勢(shì)進(jìn)行預(yù)測(cè), 如預(yù)測(cè)利率波動(dòng)、收益率變化、股市行情等。 常見的時(shí)間序列模型有四種, 包括AR模型(Autoregression Model, 自回歸模型)、MA模型(Moving Average Model, 移動(dòng)平均模型)、ARMA模型(Autoregression Moving Average Model, 自回歸移動(dòng)平均模型)和ARIMA模型(Autoregressive Integrated Moving Average Model, 自回歸差分移動(dòng)平均模型)。
5. 關(guān)聯(lián)規(guī)則算法。 關(guān)聯(lián)規(guī)則分析也稱為購(gòu)物籃分析, 是通過機(jī)器學(xué)習(xí)的方式尋找數(shù)據(jù)間的關(guān)聯(lián)性并對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換, 幫助企業(yè)通過銷售找到具有關(guān)聯(lián)關(guān)系的商品, 并以此獲得銷售收益的增長(zhǎng)。 例如, 通過對(duì)客戶歷史購(gòu)買記錄的數(shù)據(jù)進(jìn)行深層分析, 構(gòu)建基于銷售的主題數(shù)據(jù)倉(cāng)庫(kù), 得到有效、有價(jià)值的產(chǎn)品銷售關(guān)聯(lián)規(guī)則, 挖掘出客戶群體購(gòu)買習(xí)慣背后的內(nèi)在共性, 以此調(diào)整營(yíng)銷手段或銷售方式, 指導(dǎo)企業(yè)制定科學(xué)的銷售計(jì)劃, 實(shí)現(xiàn)銷量的提高[7] 。 常見的關(guān)聯(lián)規(guī)則算法包含Apriori算法、FP-Tree算法、Eclat算法及灰色關(guān)聯(lián)法等。
三、數(shù)據(jù)算法在財(cái)務(wù)領(lǐng)域的應(yīng)用
(一)應(yīng)收賬款信用風(fēng)險(xiǎn)管理
某通信解決方案提供商為電信運(yùn)營(yíng)商、政企客戶和消費(fèi)者提供技術(shù)與產(chǎn)品解決方案。 該企業(yè)面對(duì)客戶的項(xiàng)目周期較長(zhǎng), 應(yīng)收賬款的回款周期通常也較長(zhǎng), 占用資金量較大, 存在較高的信用風(fēng)險(xiǎn), 對(duì)方履行到期債務(wù)的不確定性增大。 因此, 財(cái)務(wù)部門根據(jù)客戶資信情況, 確定對(duì)其授信的額度, 對(duì)于資信表現(xiàn)不佳的客戶, 降低授信額度, 改善應(yīng)收賬款回收情況。 為此, 財(cái)務(wù)部門選擇應(yīng)用分類算法構(gòu)建客戶違約(不履行到期債務(wù))概率模型, 并在此基礎(chǔ)上建立授信額度計(jì)算模型, 如表1所示。
1. 建立違約概率模型。 構(gòu)建違約概率模型是為了計(jì)算出不同客戶的違約概率p, 以得到違約概率調(diào)整系數(shù)T1, T1是授信額度計(jì)算模型中調(diào)整財(cái)務(wù)授信額度的關(guān)鍵系數(shù)。 首先, 根據(jù)上述應(yīng)用目標(biāo), 選擇運(yùn)用Logistic回歸算法來構(gòu)建違約概率模型, 并以企業(yè)歷史客戶數(shù)據(jù)為樣本, 其中70%為訓(xùn)練集、20%為測(cè)試集、剩余10%為驗(yàn)證集。 其次, 從區(qū)域經(jīng)濟(jì)環(huán)境、公司治理、財(cái)務(wù)風(fēng)險(xiǎn)三個(gè)維度出發(fā), 選擇公司規(guī)模、運(yùn)營(yíng)實(shí)力、盈利能力、償債能力、現(xiàn)金流、社會(huì)責(zé)任等作為影響客戶違約概率的因素, 形成模型訓(xùn)練參數(shù)。 最后, 利用訓(xùn)練集初步構(gòu)建違約概率模型, 通過測(cè)試集和驗(yàn)證集反復(fù)測(cè)驗(yàn)?zāi)P偷挠行圆⑦M(jìn)行調(diào)整優(yōu)化, 以構(gòu)建最終的違約概率模型。 通過該模型, 可計(jì)算得出違約概率p, 從而得到T1。
2. 計(jì)算最終授信額度。 除需得到T1之外, 財(cái)務(wù)部門還需要設(shè)計(jì)信用與財(cái)務(wù)評(píng)級(jí)體系, 并根據(jù)客戶的資信情況進(jìn)行信用評(píng)級(jí)、財(cái)務(wù)評(píng)級(jí), 從而得到信用評(píng)級(jí)調(diào)整系數(shù)(T2)、財(cái)務(wù)授信額度(X), 最終通過授信額度計(jì)算模型(L=T1×T2×X)得出不同客戶的授信額度, 實(shí)現(xiàn)對(duì)應(yīng)收賬款信用風(fēng)險(xiǎn)的管理, 以提升應(yīng)收賬款周轉(zhuǎn)效率, 改善經(jīng)營(yíng)現(xiàn)金流量。
(二)銷售量與訂貨量預(yù)測(cè)
某餐飲企業(yè)通常依靠經(jīng)驗(yàn)來決定每日食材訂貨量, 然而, 由于經(jīng)驗(yàn)不足, 總是無法保證精準(zhǔn)訂貨, 導(dǎo)致門店采購(gòu)成本增加, 每月利潤(rùn)難以保持穩(wěn)定。 實(shí)際上, 每日食材的訂貨量取決于每日各菜品的銷售量, 因此, 科學(xué)預(yù)測(cè)每日銷售量是精準(zhǔn)配備食材、降低門店運(yùn)營(yíng)成本及提高門店利潤(rùn)率的關(guān)鍵。
1. 模型選擇。 該餐飲企業(yè)希望根據(jù)旗下某門店各菜品的歷史銷售量, 預(yù)測(cè)未來一周內(nèi)的銷售量。 從歷史數(shù)據(jù)來看, 門店銷售量受季節(jié)更替因素的影響, 大致依照一個(gè)固定周期呈規(guī)律性變化, 因此, 該門店選擇應(yīng)用時(shí)間序列算法中的ARIMA模型(如圖1所示), 以設(shè)計(jì)構(gòu)建銷售量預(yù)測(cè)模型, 并應(yīng)用規(guī)則模型將一些非常規(guī)因素也考慮進(jìn)預(yù)測(cè)中。
2. 基礎(chǔ)預(yù)測(cè)。 在正式構(gòu)建模型之前, 該門店收集了自開業(yè)以來各菜品的銷售量歷史數(shù)據(jù), 應(yīng)用ARIMA模型, 調(diào)整目標(biāo)參數(shù), 不斷修正優(yōu)化, 構(gòu)建銷售量的基礎(chǔ)預(yù)測(cè)模型, 基于歷史數(shù)據(jù)推斷未來各菜品的銷量走勢(shì)。
3. 調(diào)節(jié)預(yù)測(cè)。 由于一些非常規(guī)的因素也會(huì)對(duì)門店銷售量產(chǎn)生一定影響, 如新菜品上市、促銷活動(dòng)、周邊同類門店變動(dòng)等, 因此, 在基礎(chǔ)預(yù)測(cè)模型之上, 還需要考慮這些非常規(guī)因素, 以提高模型預(yù)測(cè)的準(zhǔn)確性與合理性。 為此, 門店通過搜集、分析非常規(guī)因素, 利用規(guī)則模型調(diào)節(jié)預(yù)測(cè)量, 對(duì)基礎(chǔ)預(yù)測(cè)模型進(jìn)行校正, 從而獲得最終的銷售量預(yù)測(cè)模型。
4. 自動(dòng)預(yù)測(cè), 支持決策。 根據(jù)最終調(diào)節(jié)校正后的銷售量預(yù)測(cè)模型預(yù)測(cè)每日菜品銷售量, 并基于菜品銷售量與所需食材的數(shù)量關(guān)系, 可以獲得門店每日所需的食材量, 為門店訂購(gòu)食材提供重要參考。
銷售量預(yù)測(cè)模型可以幫助餐飲企業(yè)科學(xué)預(yù)測(cè)各菜品的銷售量, 從而合理地預(yù)訂食材, 促進(jìn)以銷定產(chǎn)、產(chǎn)銷結(jié)合, 降低企業(yè)的綜合運(yùn)營(yíng)成本。 同時(shí), 科學(xué)的銷售量預(yù)測(cè)既避免了食材短缺又兼顧了食材新鮮, 提高了門店的服務(wù)質(zhì)量和顧客滿意度, 進(jìn)一步降低門店運(yùn)營(yíng)成本、提升門店?duì)I業(yè)利潤(rùn)率。
(三)潛在流失客戶畫像
隨著數(shù)據(jù)分析技術(shù)的快速發(fā)展與廣泛應(yīng)用, 財(cái)務(wù)的職能范圍不斷擴(kuò)大, 財(cái)務(wù)不再局限于對(duì)賬表的處理, 還可以通過對(duì)數(shù)據(jù)的采集、處理和分析為企業(yè)提供更有價(jià)值的信息, 參與到業(yè)務(wù)發(fā)展和經(jīng)營(yíng)決策的過程中。 例如, 商業(yè)銀行之間的競(jìng)爭(zhēng)主要集中于對(duì)客戶資源的爭(zhēng)奪, 然而, 許多商業(yè)銀行在不斷挖掘新客戶的同時(shí), 往往忽略了存量客戶的流失, 而存量客戶的營(yíng)銷成本遠(yuǎn)低于新開發(fā)客戶的成本, 因此, 實(shí)現(xiàn)對(duì)客戶流失率的精準(zhǔn)測(cè)算并及時(shí)控制以減少客戶流失, 對(duì)于銀行來說十分必要。 某商業(yè)銀行從二季度開始頻繁出現(xiàn)存量客戶理財(cái)資產(chǎn)減少、銷戶客戶數(shù)量增加等問題, 存量客戶的流失率同比增長(zhǎng)30%。 該銀行調(diào)研得知, 產(chǎn)品利率降低、銀行服務(wù)質(zhì)量下降等是客戶流失的主要原因。 為此, 該銀行希望聯(lián)合業(yè)務(wù)部門和財(cái)務(wù)部門, 通過數(shù)據(jù)算法實(shí)現(xiàn)對(duì)客戶特征的洞察與分析, 預(yù)測(cè)潛在流失的客戶群體, 提供差異化的營(yíng)銷及管理方案。
1. 模型選擇。 歷史流失客戶數(shù)據(jù)和現(xiàn)有客戶數(shù)據(jù)均呈現(xiàn)出維度多、目標(biāo)類別未知及特征相似度高等特點(diǎn), 因此, 該商業(yè)銀行選擇利用K-means算法(K均值, 聚類算法)對(duì)潛在流失客戶群體進(jìn)行特征挖掘, 根據(jù)客戶的年齡、資產(chǎn)數(shù)額、消費(fèi)偏好等數(shù)據(jù)將客戶分群, 從不同的維度對(duì)客戶進(jìn)行畫像, 預(yù)測(cè)未來一年內(nèi)可能會(huì)流失的客戶群體與客戶數(shù)量。
2. 算法步驟。 從該銀行實(shí)體數(shù)據(jù)庫(kù)中采集半年內(nèi)的業(yè)務(wù)數(shù)據(jù)樣本, 從客戶屬性、資產(chǎn)、持倉(cāng)產(chǎn)品、交易筆數(shù)、交易方式、投資偏好、投資收益、消費(fèi)能力等多個(gè)維度進(jìn)行描述, 并對(duì)樣本中多個(gè)異常數(shù)據(jù)進(jìn)行清洗處理, 使用K-means函數(shù)對(duì)樣本數(shù)據(jù)進(jìn)行聚類建模。 先隨機(jī)選擇可以作為初始化的中心點(diǎn), 將數(shù)據(jù)點(diǎn)歸集到距離其最近的中心點(diǎn), 所有數(shù)據(jù)點(diǎn)分配完成后, 重新計(jì)算聚類的中心, 且這個(gè)過程將不斷重復(fù)直到每一個(gè)聚類中心的數(shù)據(jù)點(diǎn)不太變化為止, 從而完成對(duì)樣本數(shù)據(jù)的分類。
3. 客戶畫像。 由K-means 算法建??傻玫綕撛诹魇Э蛻魯?shù)量, 以及客戶分布情況。 通過總結(jié)可從潛在流失客戶群體中劃分出三類特征最為明顯的群體, 得到流失客戶的特征規(guī)律。 具體客戶群體分類如圖2所示。
依據(jù)三組客戶群體的特征維度, 以客戶屬性、投資偏好、發(fā)展空間、風(fēng)險(xiǎn)接受度等特征對(duì)各群組客戶進(jìn)行全方位刻畫, 完成對(duì)每一位客戶的特征洞察和價(jià)值挖掘, 及時(shí)預(yù)警客戶的流失風(fēng)險(xiǎn), 并制定個(gè)性化、差異化的營(yíng)銷策略, 從客戶的需求出發(fā), 合理配置資源, 幫助客戶實(shí)現(xiàn)價(jià)值最大化, 提高客戶的滿意度和忠誠(chéng)度, 延長(zhǎng)客戶的生命周期, 從而實(shí)現(xiàn)對(duì)銀行存量客戶數(shù)量的維持。
通過以上應(yīng)用場(chǎng)景的介紹可以看出, 依托商業(yè)環(huán)境下數(shù)據(jù)的持續(xù)增值, 算法作為深度挖掘數(shù)據(jù)價(jià)值的工具, 在財(cái)務(wù)工作中的應(yīng)用場(chǎng)景逐漸豐富, 正在顛覆財(cái)務(wù)傳統(tǒng)的工作模式及企業(yè)運(yùn)營(yíng)決策的方式, 實(shí)現(xiàn)企業(yè)向洞察驅(qū)動(dòng)型模式的轉(zhuǎn)變。
四、數(shù)據(jù)分析常用工具
常見的數(shù)據(jù)分析工具包括Excel、SQL、SPSS、SAS、Python、R等。 Excel雖能滿足日常辦公的基本需求, 但不能有效地處理大量數(shù)據(jù), 而SAS、Python、R這類傳統(tǒng)的數(shù)據(jù)分析工具雖然功能強(qiáng)大, 但具有一定的技術(shù)門檻, 往往需要使用者具備相應(yīng)的編程能力。 隨著企業(yè)對(duì)數(shù)據(jù)分析需求的不斷增加, 以算子平臺(tái)為代表的面向財(cái)務(wù)人員的人工智能大數(shù)據(jù)平臺(tái)應(yīng)運(yùn)而生。 借助算子平臺(tái), 財(cái)務(wù)人員即便不懂編程, 也能得心應(yīng)手地開展數(shù)據(jù)分析。
算子平臺(tái)將獨(dú)立的數(shù)據(jù)處理邏輯和建模計(jì)算能力抽象為一個(gè)個(gè)算子。 簡(jiǎn)單來說, 算法中的一個(gè)函數(shù)、幾行可以重復(fù)使用的代碼、一個(gè)數(shù)學(xué)中的平方操作都可以認(rèn)為是“算子”, 算子即進(jìn)行某種“操作”。 算子平臺(tái)通過對(duì)算子的自由拖拽、編排和可視化配置, 構(gòu)建算子流, 滿足數(shù)據(jù)清洗、計(jì)算、分析、建模等需求。 算子平臺(tái)的主要功能特點(diǎn)包括: 第一, 算子平臺(tái)對(duì)機(jī)器學(xué)習(xí)算法組件進(jìn)行了封裝, 故使用者在進(jìn)行數(shù)據(jù)分析時(shí), 無須編寫代碼, 只需要將相應(yīng)的算子拖拽至畫布, 進(jìn)行連接, 即可實(shí)現(xiàn)模型的快速搭建, 且數(shù)據(jù)取用全鏈路、數(shù)據(jù)加工計(jì)算規(guī)則可視、可配置、可理解。 算子平臺(tái)這種自由拖拽式的可視化操作大大簡(jiǎn)化了大數(shù)據(jù)工具的使用流程, 降低了數(shù)據(jù)加工、智能算法應(yīng)用、可視化展示的技術(shù)門檻。 第二, 算子平臺(tái)內(nèi)置數(shù)理統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、知識(shí)圖譜、可視化分析等多種不同功能的算子, 能幫助使用者挖掘數(shù)據(jù)深層規(guī)則與關(guān)聯(lián)關(guān)系, 并利用模型進(jìn)行業(yè)務(wù)預(yù)測(cè), 實(shí)現(xiàn)對(duì)企業(yè)管理決策的指導(dǎo)。 例如, 利用算子平臺(tái), 可以實(shí)現(xiàn)對(duì)支付異常數(shù)據(jù)的識(shí)別, 以企業(yè)的燃料費(fèi)用管理為例進(jìn)行分析。 算子平臺(tái)支持多種導(dǎo)入方式, 選擇導(dǎo)入銀行流水本地文件, 同時(shí), 企業(yè)將單筆平均支付金額大于歷史平均支付金額的15%設(shè)定為異常大額交易。 通過篩選算子, 在2020年流水中過濾出燃料費(fèi)用交易數(shù)據(jù), 與對(duì)應(yīng)的采購(gòu)信息進(jìn)行整合, 通過簡(jiǎn)單配置能夠識(shí)別出的異常燃料交易結(jié)果中存在11筆異常交易, 分析人員可以基于此結(jié)果進(jìn)一步分析業(yè)務(wù)信息, 以提高企業(yè)的內(nèi)控管理效率。
算子平臺(tái)作為一種企業(yè)級(jí)的數(shù)據(jù)分析工具, 集數(shù)據(jù)接入、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)可視化、數(shù)據(jù)應(yīng)用、數(shù)據(jù)資產(chǎn)沉淀與共享于一體, 助力企業(yè)深度挖掘數(shù)據(jù)價(jià)值, 實(shí)現(xiàn)“從數(shù)據(jù)到模型, 從模型到場(chǎng)景化應(yīng)用”的全流程數(shù)據(jù)資產(chǎn)管理閉環(huán)。
五、數(shù)據(jù)分析對(duì)財(cái)務(wù)的價(jià)值
(一)提高財(cái)務(wù)分析的效率與質(zhì)量
在傳統(tǒng)的財(cái)務(wù)工作中, 財(cái)務(wù)人員常常要面對(duì)大量的手工處理所帶來的成本高、效率低、質(zhì)量差等問題。 因此, 財(cái)務(wù)部門需要將數(shù)據(jù)分析技術(shù)應(yīng)用于財(cái)務(wù)工作當(dāng)中, 降低數(shù)據(jù)處理工作的成本, 提高財(cái)務(wù)分析的效率與質(zhì)量, 讓財(cái)務(wù)對(duì)企業(yè)需求與外部市場(chǎng)變化做出快速響應(yīng), 從而高效率、高質(zhì)量地支撐企業(yè)的管理和發(fā)展。
(二)強(qiáng)化財(cái)務(wù)風(fēng)險(xiǎn)的評(píng)估與防范
面對(duì)各類風(fēng)險(xiǎn)的不可控問題, 企業(yè)應(yīng)增強(qiáng)財(cái)務(wù)預(yù)警與風(fēng)險(xiǎn)管控意識(shí), 利用數(shù)據(jù)分析技術(shù), 運(yùn)用比對(duì)數(shù)據(jù)差值、篩查異常數(shù)據(jù)、分類統(tǒng)計(jì)、監(jiān)督審查、指標(biāo)預(yù)測(cè)等各類分析方法, 建立并完善企業(yè)財(cái)務(wù)風(fēng)險(xiǎn)識(shí)別與預(yù)警系統(tǒng), 科學(xué)合理地評(píng)估財(cái)務(wù)數(shù)據(jù)信息與財(cái)務(wù)指標(biāo)趨勢(shì), 并及時(shí)采取相應(yīng)的防范措施, 從傳統(tǒng)的事后反應(yīng)轉(zhuǎn)變?yōu)槭虑?、事中的控制與追蹤, 迅速捕捉危機(jī)發(fā)生的先兆, 增強(qiáng)企業(yè)抵御風(fēng)險(xiǎn)和防范風(fēng)險(xiǎn)的能力, 以保障企業(yè)持續(xù)健康發(fā)展。
(三)全方位支撐業(yè)務(wù)的高效開展
數(shù)據(jù)來自于業(yè)務(wù), 最終也要回到業(yè)務(wù)中去。 財(cái)務(wù)利用數(shù)據(jù)探索與數(shù)據(jù)算法深度挖掘數(shù)據(jù), 預(yù)測(cè)未來產(chǎn)品趨勢(shì)、服務(wù)業(yè)務(wù)的開展方向與收益分布, 提升企業(yè)在市場(chǎng)中的競(jìng)爭(zhēng)力。 同時(shí), 財(cái)務(wù)還可以及時(shí)識(shí)別業(yè)務(wù)風(fēng)險(xiǎn)、監(jiān)督資金流向及預(yù)警財(cái)務(wù)風(fēng)險(xiǎn), 避免企業(yè)陷入財(cái)務(wù)危機(jī)。 數(shù)據(jù)分析在財(cái)務(wù)領(lǐng)域的應(yīng)用, 進(jìn)一步賦能企業(yè)業(yè)務(wù)的高效開展, 加強(qiáng)財(cái)務(wù)管理對(duì)企業(yè)科學(xué)經(jīng)營(yíng)的支持。
(四)精準(zhǔn)驅(qū)動(dòng)企業(yè)經(jīng)營(yíng)管理決策
財(cái)務(wù)部門通過數(shù)據(jù)分析對(duì)多種數(shù)據(jù)資料進(jìn)行深層次的研究, 可提高數(shù)據(jù)的有效利用率, 挖掘潛藏在數(shù)據(jù)中的信息, 釋放數(shù)據(jù)價(jià)值, 完成企業(yè)從流程驅(qū)動(dòng)到數(shù)據(jù)驅(qū)動(dòng)的轉(zhuǎn)變, 賦能企業(yè)的智慧決策革命, 緩解經(jīng)營(yíng)者的焦慮, 消除財(cái)務(wù)人員的決策困境, 增強(qiáng)運(yùn)營(yíng)的靈活性與敏捷性, 實(shí)現(xiàn)科學(xué)決策與精準(zhǔn)決策, 為企業(yè)創(chuàng)造新的附加值, 幫助企業(yè)在競(jìng)爭(zhēng)激烈的市場(chǎng)中保持長(zhǎng)久的競(jìng)爭(zhēng)優(yōu)勢(shì)。
【 主 要 參 考 文 獻(xiàn) 】
[1] Tukey J. W.. The future of data analysis[ J].The Annals of Mathematical Statistics,1992(1):1 ~ 67.
[2] Moll J., Yigitbasioglu O.. The role of internet-related technologies in shaping the work of accountants: New directions for accounting research[ J].The British Accounting Review,2019(5):1 ~ 20.
[3] MGI. The age of analytics: Competing in a data-driven world[R].New York: McKinsey & Company,2016.
[4] 賈俊平,何曉群,金勇進(jìn).統(tǒng)計(jì)學(xué)(第4版)[M].北京:中國(guó)人民大學(xué)出版社,2009.
[5] 李琳,劉鳳委,李扣慶.會(huì)計(jì)演化邏輯與發(fā)展趨勢(shì)探究——基于數(shù)據(jù)、算法與算力的解析[ J].會(huì)計(jì)研究,2021(7):3 ~ 16.
[6] Philip Kotler, Gary Armstrong著.趙平,戴賢遠(yuǎn),曹俊喜譯. 市場(chǎng)營(yíng)銷原理(第七版)[M].北京:清華大學(xué)出版社,1997.
[7] 祖巧紅,陳定方,李文鋒.基于關(guān)聯(lián)規(guī)則重要性的產(chǎn)品購(gòu)買序列模式發(fā)現(xiàn)[ J].東南大學(xué)學(xué)報(bào)(自然科學(xué)版),2007(S2):440 ~ 444.
【作者單位】深圳市中興新云服務(wù)有限公司, 深圳 518000