張智勇 吳宣達
華南理工大學電子商務學院
高值醫(yī)用耗材是直接作用于人體、風險高、對安全管理方面有嚴格要求且價值相對較高的醫(yī)用耗材[1]。醫(yī)療機構進行醫(yī)療耗材管理時,較為常見的方式是根據(jù)醫(yī)療耗材單位價值的高低,將醫(yī)療耗材分為高值耗材和低值耗材,采用不同的管理流程[2]。以往對高值耗材的需求預測通常采用時間序列預測法、季節(jié)指數(shù)平滑指數(shù)模型和ARIMA預測模型,近期有學者使用神經網絡[3]進行預測分析。這些預測方法本身存在一定的局限性。
時間序列預測法、季節(jié)指數(shù)平滑法以及ARIMA預測模型是[4]根據(jù)變量自身過去的變化規(guī)律預測未來的變化。這些方法要求時間序列具有穩(wěn)定的變化趨勢,對于不確定需求的預測的可信度較差。神經網絡法[5]需要考慮預測對象自身的多個數(shù)字屬性進行分析,而在實際情況中,高值耗材供應商關于高值耗材數(shù)據(jù)中數(shù)字型屬性通常較少,不滿足高值耗材領域預測需求。
本文對高值耗材領域進行分析,基于實際需求手術包商品組合的特點,使用關聯(lián)分析挖掘商品組合,并根據(jù)商品組合特點對特定高值耗材銷量進行預測分析。
Apriori算法是常用的關聯(lián)規(guī)則算法,是一種通過逐層搜索實現(xiàn)的迭代方法。其核心思想通過迭代產生候選項集,再通過對候選項進行剪枝產生頻繁項集。
給定一數(shù)據(jù)集I={i1,i2,…,id}為購物籃數(shù)據(jù)中所有項的集合,而T={t1,t2,…,tN}是所有事務的集合。每個事務ti包含的項集都是I的子集。令Ck為候選k-項集的集合,而Fk為頻繁k-項集的集合,Ck中的每個元素需在交易數(shù)據(jù)庫中根據(jù)其是否滿足給定的最小支持度來決定其是否可以加入LK,然后遵循下圖算法操作。
圖1 Apriori算法思想
商品組合挖掘的迭代過程中需要設置的算法:
(1)規(guī)則置信度XYC→。表示在出現(xiàn)X的條件下出現(xiàn)Y的概率。規(guī)則置信度高,則表示Y關于X的條件概率高,規(guī)則的可信度高。其數(shù)學表達式為:
(2)規(guī)則支持度XYS→。表示X、Y同時出現(xiàn)的概率。以丨T丨表示總事務數(shù),其數(shù)學表達式為:
(3)頻繁項集B(A)。指包含項目A的項集B,其支持度大于設定的最小支持度,即
本文使用控制變 量法進行合理設置。若設置最小置信度過高,會導致商品關聯(lián)組合為常規(guī)組合,組合中商品數(shù)目過小,不利于進行關聯(lián)分析。若最小置信度過小,會導致商品關聯(lián)組合將相關度不高的商品也輸出到商品組合中,導致組合中商品數(shù)目過大,不利于進行關聯(lián)分析,同時也會大大增加了信息搜尋成本,給之后的預測算法的設置增加難度。
2.組合組數(shù)的設置
設定最小置信度后,實驗取其中商品組合中數(shù)目最多的組合來進行預測,因為在一定的關聯(lián)度規(guī)則中,關聯(lián)信息越多,預測精度就越準確。
通過實地考察和對相關專業(yè)人員的咨詢發(fā)現(xiàn),高值醫(yī)用耗材銷售物流與傳統(tǒng)商品物流有所不同,通常有正向物流和逆向物流兩個過程。當醫(yī)院需要進行手術,醫(yī)院方會將需求發(fā)送給醫(yī)院代表或相關聯(lián)系人。醫(yī)院代表或相關聯(lián)系人根據(jù)需求制作訂單并將訂單發(fā)送給供應商。供應商根據(jù)訂單需求進行緊急備貨并打包成手術包進行配送。醫(yī)院方消耗手術包中部分醫(yī)療器械,在手術完成后將經過部分消耗的手術包返還給供應商。
手術包本身即為商品組合(見圖2)。正向物流的手術包是基于歷史銷售訂單來進行備貨的,而通過分析逆向物流的手術包可以挖掘高值醫(yī)用耗材實際消耗情況。本文針對高值耗材的商品特性,通過正向物流和逆向物流兩個方面進行需求預測分析。
圖2 醫(yī)用高值耗材銷售過程
商品組合中商品間存在關聯(lián)性,以其中一個商品作為預測的對象,以其他的商品銷售數(shù)據(jù)作為預測對象的銷量影響因子,得出預測對象預測結果。
設關聯(lián)分析后商品組合為F={x1,x2,x3,…,xn},第i個商品銷售數(shù)據(jù)為Dxi={d1,d2,…,dm},指定xj作為預測對象,以{d1,d2,d3,…,dj-1,dj+1,…dm}作為輸入變量,以dj作為輸出變量,使用相關算法進行預測分析(見圖3)。
圖3 商品組合預測
本文分別使用簡單線性回歸、多元線性回歸和BP神經網絡對商品組合銷量進行預測分析。取損失函數(shù)作為衡量預測結果好壞的依據(jù)。本文設置銷量預測的損失函數(shù)為Lquad(f(x)-y)=(f(x)-y)2,對應于在最小平方誤差標準ESS。
本研究選取實際深圳市某醫(yī)藥供應商2021年1月—10月醫(yī)用高值耗材歷史銷售訂單數(shù)據(jù)進行數(shù)據(jù)分析,其中包含歷史銷售訂單5043份(其中同一個訂單有借出和歸還兩種操作),借出或歸還銷售記錄共91700條,包含醫(yī)用物料378種,商品編碼類型2108種(見表1)。
表1 醫(yī)用高值耗材歷史銷售記錄原始數(shù)據(jù)類型
基于商品組合的高值耗材需求預測的步驟為:
(1)對銷售歷史數(shù)據(jù)進行分析處理?;谡嫦蛭锪鲗⒉僮鞣謩e為借出和歸還的訂單分類整理,并以物料名稱屬性作為鍵進行區(qū)分,最后再以“月”為單位,對每種醫(yī)用物料的銷售日期進行處理;
(2)對處理后歷史銷售訂單信息中的高值耗材組合進行分析,使用Apriori算法挖掘高值耗材組合中的關聯(lián)性,并根據(jù)關聯(lián)性挖掘提取新的商品組合。
(3)基于挖掘出的商品組合,指定組合中一種高值耗材作為分析對象,運用相關算法(多元線性回歸、BP神經網絡)進行需求預測分析;
(4)對預測結果進行分析,并利用預測樣本對高值耗材商品未來銷量進行預測。本文分別用普通線性回歸方法、多元回歸方法和BP神經網絡方法對某醫(yī)藥企業(yè)某一類高值耗材的銷售量進行預測,并將三者預測結果進行比較(見圖3)。
在正向商品組合中,使用線性回歸的回歸平方誤差ESS為27547.89096,使用多元線性回歸的ESS為5917.228894,而使用神經網絡的ESS為3470。
在逆向商品組合中,使用線性回歸的回歸平方誤差ESS為4205503.194,使用多元線性回歸的ESS為22716.42768,而使用神經網絡的ESS為19477。
圖4 正向物流商品組合預測
圖5 逆向物流商品組合預測
無論是正向物流商品組合和逆向物流商品組合,神經網絡方法的預測精度最佳、而多元線性回歸方法的預測精度次之,而普通線性回歸方法的預測精度最差。
醫(yī)用高值耗材本身具有附加價值高、商品時效性強、需求不確定性明顯等特點,因此對醫(yī)用高值耗材的管理及需求預測成為急需研究的問題。Apriori算法是常用的關聯(lián)規(guī)則算法,其使用基于支持度的剪枝技術從數(shù)據(jù)集中有價值的數(shù)據(jù)組合,通過設置適當?shù)闹С侄龋梢詫Ω咧岛牟氖中g包的組合進行優(yōu)化。而實例證明,基于數(shù)據(jù)組合對單一高值耗材進行銷量需求預測時,神經網絡方法表現(xiàn)優(yōu)于多元線性回歸方法,多元線性回歸方法優(yōu)于普通線性回歸方法。后續(xù)可嘗試將本文的研究成果推廣到其他類型醫(yī)用耗材的庫存管理與采購策略制定中,以此優(yōu)化醫(yī)用耗材供應商、分銷商以及醫(yī)院的庫存管理,在一定程度上減少不必要囤積或缺貨現(xiàn)象的發(fā)生,從而降低各個節(jié)點的運營成本,為醫(yī)院精細化管理提供科學的數(shù)據(jù)支撐。