陳濤
摘 要:隨著計(jì)算機(jī)技術(shù)的進(jìn)步,獲取準(zhǔn)確的銷量統(tǒng)計(jì)數(shù)據(jù)一直是車企探索的方向,通過銷量趨勢對車企銷售形勢進(jìn)行判斷、及時(shí)調(diào)整生產(chǎn)節(jié)奏、分車及營銷策略,以此優(yōu)化庫存結(jié)構(gòu)或評估經(jīng)銷商運(yùn)營能力進(jìn)而調(diào)整渠道。對全行業(yè)車企銷量統(tǒng)計(jì)不僅可進(jìn)行市場前景預(yù)測、還可進(jìn)行各細(xì)分領(lǐng)域分析進(jìn)而對車企自身進(jìn)行準(zhǔn)確定位,在激烈的競爭中獲取競爭優(yōu)勢。消費(fèi)者亦通過銷量排名鎖定購車范圍。本文討論了從機(jī)動(dòng)車銷售發(fā)票數(shù)據(jù)中進(jìn)行車輛銷量統(tǒng)計(jì)方法和實(shí)踐。介紹了發(fā)票數(shù)據(jù)現(xiàn)狀、數(shù)據(jù)倉發(fā)票數(shù)據(jù)預(yù)處理、數(shù)據(jù)模型構(gòu)建、多維統(tǒng)計(jì)分析可視化的實(shí)現(xiàn)方法。
關(guān)鍵詞:機(jī)動(dòng)車發(fā)票;數(shù)據(jù)倉;數(shù)據(jù)模型;多維分析
目前車輛銷量統(tǒng)計(jì)方法多種多樣,按數(shù)據(jù)源頭分,有各廠商批發(fā)量、4S店上報(bào)銷量、車管所上牌量、車輛上險(xiǎn)量;按數(shù)據(jù)發(fā)布主體分:有乘聯(lián)會(huì)、汽車工業(yè)協(xié)會(huì)、汽車流通協(xié)會(huì)等等。由于數(shù)據(jù)源及統(tǒng)計(jì)方式的不同,銷量統(tǒng)計(jì)結(jié)果不一樣。對于批發(fā)量,是由車企每個(gè)月向乘用車市場信息聯(lián)席會(huì)上報(bào)批發(fā)出去的汽車數(shù)量。4S店上報(bào),是由車企的加盟4S店在各時(shí)間周期內(nèi)上報(bào)的客戶購車信息,由于車企將4S店所上報(bào)銷量目標(biāo)完成情況與返點(diǎn)掛鉤,所以4S店上報(bào)量并非絕對準(zhǔn)確。車管所上牌量是客戶購車后在辦理上牌時(shí)車管所記錄的購車數(shù)據(jù),該數(shù)據(jù)在各種統(tǒng)計(jì)方法中較為權(quán)威,但是數(shù)據(jù)往往較難獲取。車輛上險(xiǎn)量,是客戶購買車輛后購買交強(qiáng)險(xiǎn)的記錄數(shù)據(jù),該部分?jǐn)?shù)據(jù)覆蓋面較廣,可獲取全行業(yè)上險(xiǎn)數(shù)據(jù),但是數(shù)據(jù)具有滯后性,滯后周期為一個(gè)月。
除了上述銷量統(tǒng)計(jì)方法外,還可以通過機(jī)動(dòng)車銷售發(fā)票信息中提取銷量數(shù)據(jù)。本文基于所獲取的機(jī)動(dòng)車銷售發(fā)票數(shù)據(jù)討論如何進(jìn)行數(shù)據(jù)預(yù)處理提取車輛銷量數(shù)據(jù),并進(jìn)行數(shù)據(jù)建模、多維統(tǒng)計(jì)分析及可視化展示方法。
1 機(jī)動(dòng)車銷售發(fā)票數(shù)據(jù)統(tǒng)計(jì)利用現(xiàn)狀
1.1 機(jī)動(dòng)車銷售發(fā)票數(shù)據(jù)來源
汽車銷售行業(yè)在車輛銷售后需要向客戶開具《機(jī)動(dòng)車銷售統(tǒng)一發(fā)票》,為了提高開票業(yè)務(wù)操作效率以及數(shù)據(jù)準(zhǔn)確率、并更方便財(cái)務(wù)做賬,使用企稅通開票系統(tǒng)通過掃描合格證和身份證分別獲取汽車相關(guān)信息車主信息。并將汽車信息及車主信息自動(dòng)傳輸給機(jī)動(dòng)車銷售統(tǒng)一發(fā)票系統(tǒng),進(jìn)而協(xié)助開票員將輕松、快捷、準(zhǔn)確地打印出機(jī)動(dòng)車發(fā)票并交付給客戶,并且獲取到機(jī)動(dòng)車銷售發(fā)票信息。與銷量統(tǒng)計(jì)有關(guān)的機(jī)動(dòng)車銷售發(fā)票信息主要包括:銷售單位名稱(經(jīng)銷商名稱)、車輛VIN、開票日期、整車價(jià)格、稅率、稅額、價(jià)稅合計(jì)、開票方式、備注、刪除標(biāo)記、作廢標(biāo)記等。
1.2 機(jī)動(dòng)車銷售發(fā)票人工統(tǒng)計(jì)銷量現(xiàn)狀
企稅通稅控發(fā)票系統(tǒng)所獲取的機(jī)動(dòng)車銷售發(fā)票數(shù)據(jù)臟亂,很難直接通過常規(guī)方法統(tǒng)計(jì)得到銷量數(shù)據(jù)。具體表現(xiàn)為:發(fā)票包含非機(jī)動(dòng)車發(fā)票、非本廠車輛,同一臺車重復(fù)多次開票與退票,開票與退票先后順序錯(cuò)綜復(fù)雜,正常與作廢發(fā)票過程記錄混雜在一起,無銷售單位代碼、無車型信息等等,進(jìn)而無法直接進(jìn)行地域維度、車型維度統(tǒng)計(jì)分析。
采用人工統(tǒng)計(jì)的方式,需全量導(dǎo)出臟亂發(fā)票數(shù)據(jù),僅可對作廢或已刪除數(shù)據(jù)做數(shù)據(jù)篩選預(yù)處理,但是對同一臺車重復(fù)開票與退票數(shù)據(jù),尤其是開票與退票過程時(shí)間跨度超過一個(gè)月的時(shí)候,需人為對該車輛所有歷史開票信息進(jìn)行人工識別比對。人工識別比對過程需依據(jù)開票先后順序及價(jià)稅合計(jì)金額人為識別出可作為車輛銷量數(shù)據(jù)統(tǒng)計(jì)的有用開票信息,同時(shí)還需人工對歷史已統(tǒng)計(jì)過的車輛銷量進(jìn)行扣減,以便去除對同一臺車的重復(fù)銷量統(tǒng)計(jì)。這個(gè)過程不僅效率低還容易出錯(cuò)、可分析維度單一,且統(tǒng)計(jì)分析過程和結(jié)果不便于在線共享。
1.3 利用機(jī)動(dòng)車銷售發(fā)票數(shù)據(jù)統(tǒng)計(jì)銷量的優(yōu)勢
相比各廠商批發(fā)量與真實(shí)銷量統(tǒng)計(jì)角度差異、車管所上牌數(shù)據(jù)難以獲取、4S店上報(bào)銷量受銷量目標(biāo)影響、車輛上險(xiǎn)量數(shù)據(jù)獲取滯后性,利用機(jī)動(dòng)車銷售發(fā)票獲取的銷量統(tǒng)計(jì)數(shù)據(jù)具有數(shù)據(jù)實(shí)時(shí)、由真實(shí)車輛銷售業(yè)務(wù)產(chǎn)生,數(shù)據(jù)容易獲取且不受銷售目標(biāo)影響的特點(diǎn)。
1.4 利用機(jī)動(dòng)車銷售發(fā)票數(shù)據(jù)統(tǒng)計(jì)銷量的問題
由于機(jī)動(dòng)車銷售發(fā)票是圍繞著車輛銷售過程的發(fā)票打印業(yè)務(wù)開展獲取的,其具有以下問題影響直接的銷量統(tǒng)計(jì)獲取:
①包含非機(jī)動(dòng)車銷售發(fā)票,通常表現(xiàn)為無VIN信息。
②包含非本廠發(fā)票信息。
③正常與作廢發(fā)票數(shù)據(jù)信息均記錄。
④開票和退票過程不規(guī)范,退票過程可能先退舊票再開有效發(fā)票,也可能先開有效發(fā)票再退舊票。
⑤經(jīng)銷商名稱為非必填信息,未記錄經(jīng)銷商代碼,無法識別銷售該車輛的經(jīng)銷商。
⑥VIN信息會(huì)書寫錯(cuò)誤,例如位數(shù)不足17位、數(shù)字寫錯(cuò)等。
⑦時(shí)間跨度超過一個(gè)月車輛退票時(shí),不能作廢原發(fā)票,只能通過開負(fù)票進(jìn)行紅沖。
2 基于機(jī)動(dòng)車銷售發(fā)票進(jìn)行多維數(shù)據(jù)統(tǒng)計(jì)分析的實(shí)現(xiàn)方法
2.1 整體思路
首先基于機(jī)動(dòng)車銷售發(fā)票數(shù)據(jù)問題,采用SQL語句對數(shù)據(jù)進(jìn)行預(yù)處理剔除非車輛銷售、非本車企、VIN位數(shù)不正確的數(shù)據(jù),利用虛擬視圖識別最終狀態(tài)為已經(jīng)銷售的車輛及其銷售日期得到企稅通開票表。其次將企稅通開票表與其他需進(jìn)行多維統(tǒng)計(jì)分析用到的基礎(chǔ)信息表進(jìn)行數(shù)據(jù)建模,再并依據(jù)分析需求建好模型的數(shù)據(jù)創(chuàng)建統(tǒng)計(jì)度量值,最后進(jìn)行可視化展示。
2.2 數(shù)據(jù)預(yù)處理過程
SQL數(shù)據(jù)預(yù)處理過程如圖1所示:
2.3 數(shù)據(jù)建模過程
利用表之間的關(guān)系,構(gòu)建數(shù)據(jù)模型。在powerbi中導(dǎo)入以下表:經(jīng)銷商檔案表、車型表、實(shí)銷與庫存表、企稅通開票表、日期表、行政區(qū)域劃分表;實(shí)銷表、實(shí)銷與庫存表與車型表通過VSN字段建立關(guān)系,從而拓展車型分析維度;實(shí)銷、企稅通開票與標(biāo)準(zhǔn)日期表通過銷售時(shí)間、開票日期字段建立關(guān)系;企稅通開票表和實(shí)銷與庫存表之間通過VIN字段構(gòu)建關(guān)系從而獲得企稅通開票的開票單位代碼信息;實(shí)銷、實(shí)銷與庫存表與經(jīng)銷商檔案表通過經(jīng)銷商代碼字段建立關(guān)系。經(jīng)銷商檔案表與行政區(qū)域劃分表通過省份字段建立關(guān)系。
2.4 統(tǒng)計(jì)分析與可視化過程
基于構(gòu)建好的數(shù)據(jù)模型,創(chuàng)建指標(biāo)度量值:開票當(dāng)期、系統(tǒng)實(shí)銷(4S店上報(bào)實(shí)銷)、企-實(shí)(開票與實(shí)銷差異)等,并且創(chuàng)建切片器、從而不僅可以從開票的維度統(tǒng)計(jì)車輛銷量,還可以對將4S店上報(bào)實(shí)銷與開票當(dāng)期對比,并且基于車型、區(qū)域、品牌、時(shí)間維度進(jìn)行多維數(shù)據(jù)統(tǒng)計(jì)結(jié)果查詢。
3 實(shí)現(xiàn)范例
3.1 數(shù)據(jù)預(yù)處理
用SQL語句從開票信息表中選擇所需的字段(銷售單位名稱(經(jīng)銷商名稱DealerName)、車輛VIN、開票日期InvoicingDate、整車價(jià)格ExcludingTaxAmount、稅率TaxRate、稅額TaxAmount、價(jià)稅合計(jì)Totalamount、開票方式InvoicingMethod、備注Comments、刪除標(biāo)記IsDeleted、作廢標(biāo)記FailureFlag等。),其中過濾條件設(shè)置有VIN開頭為“LZW”( substring(Vin,1,3)='LZW')、并且VIN長度為17位(len(Vin)=17),數(shù)據(jù)未刪除(IsDeleted=0)、數(shù)據(jù)未作廢(FailureFlag =0),此過程數(shù)據(jù)存儲(chǔ)為虛擬視圖。
以VIN為主鍵,對VIN進(jìn)行分組統(tǒng)計(jì),并對每條VIN價(jià)稅金額進(jìn)行合計(jì)總額,篩選合計(jì)總額>0的數(shù)據(jù)(group by AllInvoicingCar.Vin;having sum(AllInvoicingCar.Totalamount)>0),此步驟可綜合同一輛車的所有開票和退票記錄,僅留下累計(jì)開票金額為正的數(shù)據(jù),過濾掉銷售開過票但又發(fā)生了退車的數(shù)據(jù)。此過程存儲(chǔ)為表A。
對虛擬視圖中的數(shù)據(jù),只保留價(jià)稅合計(jì)金額為正的數(shù)據(jù),并且以VIN為主鍵,對VIN進(jìn)行分組統(tǒng)計(jì),對每條VIN的開票日期降序排序,保留排序等于1的數(shù)據(jù),,此步驟可保留下所有正常車輛銷售業(yè)務(wù)所開的票據(jù)。次過程存儲(chǔ)為表B。
以表A為主表,用VIN進(jìn)行表關(guān)系關(guān)聯(lián),匹配B表中的信息,采用left join 語句取出B表中所有與A表能匹配上的信息,以此獲取到車輛開票日期信息等。
3.2 數(shù)據(jù)建模
依據(jù)2.3數(shù)據(jù)建模過程思路,創(chuàng)建利用機(jī)動(dòng)車銷售發(fā)票統(tǒng)計(jì)車輛銷量的多維分析模型如圖2。
3.3 數(shù)據(jù)分析與可視化展示
依據(jù)2.4統(tǒng)計(jì)分析與可視化過程思路,構(gòu)建以下度量值,并在可視化界面分別構(gòu)建瀑布圖-區(qū)域系統(tǒng)實(shí)銷與開票差異對比、區(qū)域開票當(dāng)期與實(shí)銷表、省份開票當(dāng)期與實(shí)銷表,如圖3。
①開票當(dāng)期=CALCULATE(sum('企稅通開票'[sl]),'企稅通開票'[價(jià)稅合計(jì)]>0)
②系統(tǒng)實(shí)銷=CALCULATE(sum('實(shí)銷'[數(shù)量]))
③企-實(shí)=CALCULATE('度量值-企稅通'[開票當(dāng)期])-CALCULATE('度量值-實(shí)銷'[系統(tǒng)實(shí)銷])
4 結(jié)束語
1.通過該數(shù)據(jù)處理方法進(jìn)行數(shù)據(jù)預(yù)處理,通過算法自動(dòng)進(jìn)行有效數(shù)據(jù)過濾,不需要反復(fù)多次導(dǎo)出臟亂發(fā)票數(shù)據(jù);對于同一輛車多次開票問題,不需要人工識別各種開票場景并進(jìn)行數(shù)據(jù)比對;可一次性導(dǎo)入有效性開票數(shù)據(jù),降低錯(cuò)誤率。
2.該多維數(shù)據(jù)統(tǒng)計(jì)分析的方法和裝置,一次性搭建好數(shù)據(jù)模型和統(tǒng)計(jì)度量值之后,只需要進(jìn)行數(shù)據(jù)更新,即可得到既定的可視化分析結(jié)果,大大提升統(tǒng)計(jì)分析效率。
3.依據(jù)建好的模型,可設(shè)置自動(dòng)更新數(shù)據(jù)網(wǎng)關(guān)或手動(dòng)刷新數(shù)據(jù),可實(shí)現(xiàn)不同人員/團(tuán)隊(duì)進(jìn)行在線異步分享可視化分析結(jié)果,提升工作溝通效率。
參考文獻(xiàn):
[1]黃歆哲.計(jì)算機(jī)信息技術(shù)在銷售統(tǒng)計(jì)管理工作中的應(yīng)用[M].科技視界. 2095-2457.2013.23.024.
[2]張紅軍.多維數(shù)據(jù)集中高維數(shù)據(jù)可視化算法研究[M].微電子學(xué)與計(jì)算機(jī).34卷.第5期2017年5月.
[3]王淑蓉,趙穎.數(shù)據(jù)倉庫的OLAP多維展現(xiàn)技術(shù)的研究與應(yīng)用[J].電子設(shè)計(jì)工程。20卷 第14期.2012年7月.
[4]航天信息股份有限公司.一種用于增值稅的數(shù)據(jù)清洗存儲(chǔ)方法[P].CN104636337B,2018.01.12.
[5]航天信息股份有限公司.稅控開票系統(tǒng)及利用該稅控開票系統(tǒng)統(tǒng)計(jì)商品數(shù)據(jù)的方法[P].CN106875237A,2017.06.20.