馬愿謙,李啟源,陳漢忠,張 智,林振智,楊 莉
(1. 浙江理工大學(xué)機(jī)械與自動控制學(xué)院,浙江省杭州市 310018;2. 浙江大學(xué)電氣工程學(xué)院,浙江省杭州市 310058)
隨著電力市場化改革的深入和高質(zhì)量發(fā)展理念的貫徹,對用戶而言,其不僅要獲得可靠和安全的供電服務(wù),還希望獲得多樣、便捷的售電增值服務(wù);對售電公司而言,也期望通過售電套餐、節(jié)能服務(wù)等增值服務(wù)增強(qiáng)已有用戶黏度,并吸引大量新用戶[1]。售電套餐是市場環(huán)境下售電公司提高收益、獲得市場競爭力的必要手段。澳大利亞[2]、德國[3]、加拿大[4]等國家的電力市場已為用戶提供了上千種的售電套餐,中國面向工商業(yè)[5]和居民用戶[6]也設(shè)計(jì)了多種形式的電價(jià)套餐供用戶選擇,如文獻(xiàn)[7]應(yīng)用演化博弈理論設(shè)計(jì)了考慮有限理性用戶選擇行為的定制化電價(jià)套餐;文獻(xiàn)[8]提出了售電公司峰谷組合電力套餐零售模式,并構(gòu)建了考慮用戶有限理性的電力套餐設(shè)計(jì)雙層優(yōu)化模型。然而,隨著多樣化售電套餐的出現(xiàn),用戶的選擇信息成本將隨之增加,在此背景下,售電公司如何準(zhǔn)確、科學(xué)地為用戶推薦滿足其需求的售電套餐是亟須解決的問題。
現(xiàn)有售電套餐推薦方法可分為直接法和間接法。其中,直接推薦方法多數(shù)應(yīng)用于在線推薦平臺,即基于用戶用電情況,將成本最低的售電套餐推薦給相應(yīng)用戶,如iSelect[2]、Check24[3]、Power to Choose[4]等平臺。此外,文獻(xiàn)[9]采用自適應(yīng)k-medoids 和k-means 聚類算法將用戶分為用電行為多變和用電行為規(guī)律的用戶,以用電成本最小為目標(biāo),提出了一種實(shí)現(xiàn)階梯電價(jià)套餐和階梯分時電價(jià)套餐推薦服務(wù)的方法。直接推薦方法簡單、易于實(shí)施,但這種方法僅考慮了用戶電費(fèi)成本,忽略了用戶評價(jià)信息的多樣性,如綠電、增值服務(wù)等。除直接基于成本的推薦方法外,協(xié)同過濾算法[10]也是常用的間接推薦方法,如文獻(xiàn)[11]采用模糊c 均值聚類算法對用戶進(jìn)行分類,并基于目標(biāo)用戶與所屬類別中歷史用戶的相似度,以及歷史用戶對售電套餐的評分,獲得目標(biāo)用戶的評分,實(shí)現(xiàn)售電套餐的推薦;文獻(xiàn)[12]以居民用戶家用設(shè)備耗電特征表征用戶的用電特性,設(shè)計(jì)了基于貝葉斯混合協(xié)同過濾算法的居民售電套餐推薦系統(tǒng)。上述協(xié)同過濾算法為售電套餐的推薦提供了思路,其中,準(zhǔn)確、高效的樣本用戶聚類是提高推薦準(zhǔn)確度的前提。然而,上述聚類方法均需預(yù)先設(shè)定聚類數(shù),因而聚類效率和準(zhǔn)確度較低。盡管上述間接推薦方法考慮了用戶的用電成本、行為特性和偏好,但僅考慮了用戶熟悉套餐所有屬性的情形,忽略了用戶評價(jià)時表現(xiàn)出的“亦此亦彼”猶豫模糊狀態(tài)[13],且由于用戶對套餐的了解程度有限,很難給出定量精準(zhǔn)的評價(jià)信息。此外,由于不同用戶知識、文化背景及信息來源的差異性,使得不同用戶描述其猶豫模糊信息時的語言評價(jià)集粒度不同[14],即用戶套餐評價(jià)信息呈現(xiàn)出多粒度猶豫模糊特性。綜上,如何提高用戶聚類的準(zhǔn)確度和效率,如何真實(shí)準(zhǔn)確刻畫用戶評價(jià)信息并等值不同粒度下的評價(jià)信息,是售電公司準(zhǔn)確量化用戶滿意度,并為用戶精準(zhǔn)推薦售電套餐所亟須解決的問題。
為此,本文提出一種基于雙層鄰近傳播(bilevel affinity propagation,BLAP)聚類和多粒度猶豫模糊集的售電套餐推薦方法。首先,基于用戶畫像標(biāo)簽體系和BLAP 聚類的樣本用戶集劃分方法,為判別與新用戶相似的用戶提供支撐;然后,構(gòu)建基于多粒度猶豫模糊語言評價(jià)集的樣本用戶集套餐評價(jià)矩陣;接著,考慮用戶售電套餐屬性權(quán)重信息的不完整性,采用猶豫模糊語言加權(quán)平均算子(hesitant fuzzy linguistic weighted average operator,HFLWAO)集結(jié)用戶的評價(jià)信息,并將其等值為同一粒度下的評價(jià)信息;進(jìn)而基于相似用戶的售電套餐等值評價(jià)信息,評估新用戶套餐滿意度,并對售電套餐進(jìn)行全排序推薦;最后,以中國某地區(qū)用戶為對象進(jìn)行算例分析,驗(yàn)證了所提售電套餐推薦方法的準(zhǔn)確性和有效性。
不同類型用戶的用能和消費(fèi)習(xí)慣存在差異,其差異體現(xiàn)在不同用戶對售電套餐的選購結(jié)果不同。本文將構(gòu)建用戶的畫像標(biāo)簽體系來反映用戶的用電特性,為判別與新用戶畫像相似的用戶提供支撐。本 文 基 于 樣 本 用 戶 集A={A1,A2,…,Ai,…,AI}的 某 月 負(fù) 荷 數(shù) 據(jù)P={PA1,PA2,…,PAi,…,PAI},以月負(fù)荷率、月最高利用小時數(shù)、工作日和非工作日峰谷差率均值、峰平谷期負(fù)載率均值為標(biāo)簽[15],建立用戶畫像。其中,Ai為第i個用戶,PAi為用戶Ai某月的 負(fù) 荷 數(shù) 據(jù),PAi={PAi,1,PAi,2,…,PAi,v,…,PAi,V},PAi,v為 用 戶Ai在 某 月 第v個 時 段 的 負(fù) 荷 數(shù) 據(jù),V為月總時段數(shù),單個時段的單位為h。各標(biāo)簽的物理意義和定義如表1 所示。值得注意的是,表1 中各標(biāo)簽的時間尺度均為月度,具體含義見附錄A。
表1 用戶的畫像標(biāo)簽體系Table 1 Portrait label system of customers
根據(jù)表1 標(biāo)簽構(gòu)建用戶Ai的畫像m→Ai=[bAi,lr,bAi,mu,bAi,wd,bAi,nwd,bAi,plr,bAi,slr,bAi,vlr],用 于 反映用戶Ai的用能習(xí)慣,為判別新用戶的相似用戶,以及為新用戶推薦售電套餐奠定基礎(chǔ)。其中,bAi,lr、bAi,mu、bAi,wd、bAi,nwd、bAi,plr、bAi,slr、bAi,vlr分 別 為 用 戶Ai的月負(fù)荷率、月最高利用小時數(shù)、工作日峰谷差率均值、非工作日峰谷差率均值、峰期負(fù)載率均值、平期負(fù)載率均值、谷期負(fù)載率均值。
考慮到用戶數(shù)量較大,為降低計(jì)算量,須將畫像相似的用戶進(jìn)行聚類。由B. J. Fery 和D. Dueck 提出的近鄰傳播(affinity propagation,AP)聚類[16]通過傳遞用戶畫像包含的“責(zé)任度”和“可信度”信息來對用戶進(jìn)行聚類,相比于傳統(tǒng)k-means 聚類,AP 聚類具有準(zhǔn)確度高、無須預(yù)先設(shè)定聚類數(shù)等優(yōu)點(diǎn),但聚類結(jié)果受用戶規(guī)模和設(shè)定的自我相似度的影響較大[17]。為此,本文在傳統(tǒng)AP 聚類基礎(chǔ)上,提出基于用戶畫像標(biāo)簽體系和BLAP 聚類的樣本用戶集劃分方法,以彌補(bǔ)AP 聚類在樣本規(guī)模較大時聚類結(jié)果準(zhǔn)確度較低的缺點(diǎn),實(shí)現(xiàn)對與新用戶相似用戶的精準(zhǔn)判別。
首先,為減小用戶規(guī)模對聚類準(zhǔn)確度和效率的影響,對樣本用戶集A進(jìn)行局部分區(qū)AP 聚類,即第1 層AP 聚類。將A劃分為互不重疊的B個 部 分,表 示 為H1,H2,…,Hγ,…,HB,且 滿 足H1∩H2∩…∩HB=?,H1∪H2∪…∪HB=A。通常,當(dāng)用戶規(guī)模超過400 時,AP 的聚類效率會迅速降低[17]。因此,每部分用戶數(shù)應(yīng)滿足fnum(Hγ)<400,其中,fnum(Hγ)表示用戶集Hγ中的用戶數(shù),Hγ為A的第γ個劃分部分。同時,為進(jìn)一步提高聚類效率,減少第1 層AP 聚類所得聚類中心數(shù),規(guī)定每部分用戶數(shù)不少于200。因此,初始劃分的每部分用戶數(shù)應(yīng)滿足200 ≤fnum(Hγ)<400?;趧澐纸Y(jié)果,對每部分用戶進(jìn)行AP 聚類。AP 聚類僅須輸入各用戶間 的 畫 像 相 似 度,Ai和Aj畫 像 相 似 度s′ρ(Ai,Aj)表示Aj適合作為Ai聚類中心的程度,用戶Aj畫像的自我相似度s′ρ(Ai,Aj)通常設(shè)為Aj與其他用戶畫像相似度的中值??紤]到Pearson 相關(guān)系數(shù)[11]能夠有效衡量各用戶畫像間的相關(guān)性和密切程度,本文利用該系數(shù)刻畫各用戶間的相似度,即:
然后,考慮到聚類數(shù)受自我相似度的影響較大,為進(jìn)一步提高聚類結(jié)果的準(zhǔn)確度,降低設(shè)置的用戶自我相似度對聚類結(jié)果的影響,對第1 層聚類所得的聚類中心集進(jìn)行自適應(yīng)AP(adaptive affinity propagation,AAP)聚類[18],即第2 層AP 聚類。自我相似度越大,聚類數(shù)越多,因此,為了滿足不同情況下對聚類數(shù)的需求,每次迭代需對用戶自我相似度進(jìn)行更新,更新步長隨聚類數(shù)的變化而動態(tài)調(diào)整[18],即:
式中:ZQ(Ai)為聚類數(shù)取Q時用戶Ai與其對應(yīng)聚類中心的緊密程度;dout(Ai)為類間平均距離,表示用戶Ai與其他類用戶畫像間距離的平均值;din(Ai)為類內(nèi)平均距離,表示用戶Ai與所屬類別內(nèi)的其他用戶畫像間距離的平均值;I為用戶總數(shù)。
比較不同聚類數(shù)對應(yīng)的聚類質(zhì)量指標(biāo)ZQ,av,ZQ,av最大時對應(yīng)的聚類數(shù)為最佳聚類數(shù)c*,即:
綜上,基于BLAP 聚類的樣本用戶集劃分步驟如下。
步驟1:利用式(1)計(jì)算A中各用戶畫像間的相似度。
步驟2:將用戶集A劃分為B個部分,以每部分內(nèi)用戶畫像相似度中值μm,Hγ作為用戶自我相似度,即sρ(Aj,Hγ,Aj,Hγ)=μm,Hγ,其中,Aj,Hγ為Hγ中的第j個用戶。
步驟3:對每部分用戶進(jìn)行AP 聚類,獲得各部分用戶的聚類中心集E1,E2,…,Eγ,…,EB。
步驟4:將每部分用戶的聚類中心集組成新的用戶集Enew=E1∪E2∪…∪EB。若Enew中的用戶數(shù)大于400,則返回步驟2,否則,轉(zhuǎn)至步驟5。
步驟5:初始化Enew中用戶自我相似度sρ(Aj,Enew,Aj,Enew)=μm,Enew,其中,Aj,Enew為Enew中的第j個用戶,μm,Enew為Enew中用戶畫像相似度的中值。
步驟6:對Enew進(jìn)行AP 聚類,得到穩(wěn)定聚類數(shù)為QEnew,并基于式(2)確定用戶Ai是否屬于聚類中 心Aj,Enew。
步驟7:基于步驟6 所得聚類結(jié)果,利用式(4)計(jì)算聚類質(zhì)量指標(biāo)。
步驟8:利用式(3)更新用戶自我相似度。
步驟9:判斷聚類數(shù)是否滿足QEnew≤2,若滿足,則迭代結(jié)束,轉(zhuǎn)至步驟10,否則,返回步驟6 繼續(xù)迭代。
步驟10:比較不同聚類數(shù)下對應(yīng)的聚類質(zhì)量指標(biāo),由式(5)確定最佳聚類數(shù)c*。
基于BLAP 聚類的樣本用戶集劃分思路示意圖和對應(yīng)的流程見附錄B 圖B1 和圖B2。需要說明的是,由于第1 層AP 聚類僅是為了得到初始聚類中心集Enew,第1 層AP 聚類還會在此基礎(chǔ)上通過不斷更新Enew的自我相似度進(jìn)行AAP 聚類,最終依據(jù)聚類質(zhì)量指標(biāo)獲得最佳聚類結(jié)果,用戶初始樣本的劃分將不會對最終聚類結(jié)果產(chǎn)生影響。上述對初始用戶樣本集A的劃分為隨機(jī)劃分,即在滿足200 ≤fnum(Hγ)<400 的條件下,隨機(jī)設(shè)定劃分的部分?jǐn)?shù)B和每部分用戶數(shù)fnum(Hγ)。
設(shè) 售 電 套 餐 集 合 為T={T1,T2,…Tj,…,TJ},用戶集A={A1,A2,…Ai,…,AI}對售電套餐評價(jià)的 屬 性 集 為C={CA,1,CA,2,…,CA,k,…,CA,K}。其中,Tj為第j個售電套餐,CA,k為用戶集A評價(jià)售電套餐的第k個屬性,J為售電套餐總數(shù),K為售電套餐屬性總數(shù)。本文考慮的售電套餐屬性為電價(jià)、可再生能源比例、增值服務(wù)、獎勵政策,各屬性含義見附錄C。
通常,用戶評價(jià)售電套餐屬性時表現(xiàn)出“亦此亦彼”的猶豫模糊狀態(tài),且由于其對套餐的了解程度有限,很難給出定量精準(zhǔn)的評價(jià)信息,因此,本文引入猶豫模糊語言集[19]刻畫用戶套餐評價(jià)信息。
設(shè)用戶Ai傾向于對套餐屬性采取g(Ai)個等級進(jìn)行評價(jià),即Ai的語言評價(jià)集為Lg(Ai)={lg(Ai),0,lg(Ai),1,…,lg(Ai),p,…,lg(Ai),g(Ai)-1},其中,g(Ai)為奇數(shù),表示語言評價(jià)集的粒度;lg(Ai),p為語言評價(jià)集粒度為g(Ai)時的第p+1 個語言評價(jià)量。Lg(Ai)中的元素按照順序排列,即若p>x,則lg(Ai),p?lg(Ai),x,其中?表示優(yōu)于。
用戶Ai基于自身語言評價(jià)集Lg(Ai),對售電套餐屬性做出評價(jià),評價(jià)矩陣為RAi,sx=(rAi,jk)J×K,其中,rAi,jk表示Ai對套餐Tj的屬性CA,k給出的猶豫模糊語言評價(jià)信息。需要說明的是,考慮到Ai評價(jià)時的猶豫 模 糊 狀 態(tài),rAi,jk可 包 含 多 個Lg(Ai)中 的 語 言 評價(jià)量。
為集結(jié)各用戶的售電套餐屬性評價(jià)信息,需確定套餐屬性的權(quán)重。售電套餐屬性權(quán)重反映了該屬性在套餐評價(jià)中的重要程度??紤]到用戶受知識和時間的限制,無法提供權(quán)重的確切值,僅能提供不完整信息,如Ai提供的信息為:屬性1 比屬性2 更重要(ωAi,1>ωAi,2),屬性3 與屬性4 的重要性之差不小于0.15(ωAi,3-ωAi,4≥0.15)。為保證所得權(quán)重能綜合反映各屬性的重要程度,且對同一屬性,如果同一用戶對不同套餐的評價(jià)差異較大,則該屬性應(yīng)被賦予較大的權(quán)重,因此,本文擬采用離差最大化法[20]確定各屬性權(quán)重ωAi=[ωAi,1,ωAi,2,…,ωAi,k,…,ωAi,K],其中,ωAi,k表示對于用戶Ai而言,屬性CA,k的權(quán)重。可以得到:
式中:ΩAi為用戶Ai提供的權(quán)重不完整信息;DAi,k為對于第k個屬性CA,k,用戶Ai對各售電套餐給出的語言評價(jià)結(jié)果間的偏差程度;DIS(rAi,jk,rAi,qk)為用戶Ai對套餐Tj的屬性CA,k給出的猶豫模糊語言與對套餐Tq的 屬 性CA,k結(jié) 果 之 間 的 偏 差 程 度;ψ(min(rAi,jk))=ψ(lg(Ai),p)=p,p=0,1,…,g(Ai)-1。
式中:lg(Ai),zh,αzh為一個語言評價(jià)二元組;αzh為用戶Ai對售電套餐Tj的評價(jià)結(jié)果隸屬于lg(Ai),zh的程度;zh為集結(jié)后的評價(jià)信息量角標(biāo);h為語言評價(jià)量總數(shù)。fHFLWAO的詳細(xì)計(jì)算步驟見附錄D。
式中:φij,yzh為用戶Ai對售電套餐Tj評價(jià)結(jié)果隸屬于lg(Af),yzh的程度。
綜上,考慮多粒度猶豫模糊語言集和權(quán)重不完整信息的售電套餐評價(jià)流程見附錄E 圖E1。
售電公司對套餐的推薦需考慮用戶售電套餐滿意度,滿意度越高,推薦成功的概率就越大。首先,判別新用戶的相似用戶;然后,計(jì)算相似用戶售電套餐滿意度,再結(jié)合新用戶與相似用戶的相似度,計(jì)算新用戶售電套餐滿意度。
基于1.2 節(jié)獲得的最佳聚類結(jié)果,可判別新用戶 的 相 似 用 戶 。 設(shè) 新 用 戶 集 為W={W1,W2,…,Wn,…,WM},其 中,Wn為 第n個 新 用戶,M為新用戶總數(shù),基于各新用戶Wn的畫像m→Wn=[bWn,lr,bWn,mu,bWn,wd,bWn,nwd,bWn,plr,bWn,slr,bWn,vlr],計(jì) 算最佳聚類數(shù)c*下各聚類中心與m→Wn的距離,距離最小者對應(yīng)類中的用戶判定為新用戶Wn的相似用戶,記 為Anc*={A1,nc*,A2,nc*,…,At,nc*,…,AN,nc*}。 其中,N為與新用戶Wn的相似用戶總數(shù),At,nc*為最佳聚類數(shù)c*下與新用戶Wn相似的第t個用戶,則新用戶Wn與相似用戶的相似度矩陣表示為S=(s′ρ(Wn,At,nc*))M×N。需要說明的是,新用戶的月負(fù)荷數(shù)據(jù)未知,須通過負(fù)荷預(yù)測的方法進(jìn)行預(yù)測。
基于第2 章獲得的相似用戶售電套餐等值評價(jià)信息,對用戶的評價(jià)信息求期望,得到相似用戶售電套餐滿意度矩陣UA,T=(uAi,T,ij)I×J,其中,uAi,T,ij為用戶Ai對售電套餐Tj的滿意度,即:
新用戶售電套餐滿意度取決于相似用戶套餐滿意度,以及新用戶與相似用戶的相似度,則新用戶Wn對售電套餐Tj的滿意度uW,nj為:
式 中:uAt,nc*,t,nc*,j為 最 佳 聚 類 數(shù)c*下 新 用 戶Wn中 第t個相似用戶At,nc*對售電套餐Tj的滿意度。
基于新用戶滿意度的量化結(jié)果,本文提出售電套餐的全排序推薦方法,即售電公司將基于新用戶的滿意度,對各售電套餐進(jìn)行排序,將所有的套餐和相應(yīng)的排序結(jié)果推薦給新用戶,供新用戶選購。
為衡量所提全排序推薦方法的效果,基于排序結(jié)果,計(jì)算均方根誤差,則對新用戶Wn的售電套餐推薦結(jié)果偏差εn可表示為:
式中:Onj和O*nj分別為對Wn推薦的套餐Tj的實(shí)際排序結(jié)果和算法所得排序結(jié)果。售電套餐推薦的均方根誤差εn越小,所提算法的推薦效果越好。
綜上,所提套餐推薦方法可分為樣本用戶集評價(jià)信息庫構(gòu)建和新用戶售電套餐推薦2 個階段,實(shí)施框架見附錄F 圖F1,基于BLAP 聚類和多粒度猶豫模糊集的售電套餐推薦流程如圖1 所示。
圖1 基于BLAP 聚類和多粒度猶豫模糊集的售電套餐推薦流程圖Fig.1 Flow chart of electricity retail plan recommendation based on BLAP clustering and multigranular hesitant fuzzy sets
以中國某地區(qū)用戶為例對所提售電套餐推薦方法進(jìn)行驗(yàn)證分析。以智能電表采集的700 位典型用戶A={A1,A2,…,A700}在2020 年1 月1—31 日的負(fù)荷數(shù)據(jù)為基礎(chǔ),采用留一交叉驗(yàn)證法[22]對所提方法進(jìn)行驗(yàn)證,即每次抽取1 個用戶作為新用戶,剩余的699 個用戶作為樣本集。
參考該省交易中心的數(shù)據(jù)和美國得克薩斯州淘電網(wǎng)套餐數(shù)據(jù)[4],以及用戶實(shí)際情況,售電公司為用戶提供的套餐集為T={T1,T2,…,T5},各屬性信息見附錄G 表G1。考慮到本文主要目的是研究套餐的推薦方法,直接將上述負(fù)荷數(shù)據(jù)作為新用戶月負(fù)荷進(jìn)行分析。
在試點(diǎn)期間,售電公司對用戶進(jìn)行了問卷調(diào)查,收集各用戶基于自身語言評價(jià)集的評價(jià)信息。據(jù)統(tǒng)計(jì),用戶的語言評價(jià)集粒度分別為5、7、9,各粒度下語言評價(jià)量含義見附錄G。各用戶的平均日負(fù)荷率、平均日峰谷差率與其對應(yīng)的語言評價(jià)集粒度見附錄G 圖G1。樣本數(shù)據(jù)集的數(shù)據(jù)結(jié)構(gòu)見附錄G。
4.2.1 樣本用戶集聚類分析
將樣本用戶集隨機(jī)劃分為3 組,取阻尼因子λ=0.8,基于BLAP 算法對樣本用戶集進(jìn)行聚類,結(jié)果見附錄H 圖H1,分別為晚高峰型、峰平型、避峰型和雙峰型。為探究用戶的初始劃分對聚類結(jié)果和聚類時間的影響,不同劃分下最終聚類結(jié)果對應(yīng)的聚類質(zhì)量指標(biāo)和聚類數(shù),以及聚類時間分析見附錄H。
基于樣本用戶集聚類結(jié)果,計(jì)算新用戶的畫像與晚高峰型、峰平型、避峰型、雙峰型聚類中心的距離分別為0.109 5、0.398 5、0.397 6、0.319 7,可判定新用戶的相似用戶為晚高峰型用戶。
4.2.2 售電套餐的推薦與效果評價(jià)
基于相似用戶售電套餐滿意度,以及新用戶與各相似用戶的相似度,詳見附錄I,得到新用戶售電套餐滿意度的歸一化結(jié)果,如表2 所示。
表2 新用戶售電套餐滿意度的歸一化結(jié)果Table 2 Normalization results of satisfaction of new customers with electricity retail plans
由表2 可知,新用戶對T4的滿意度最大。實(shí)際中,該新用戶為居民用戶,用電時段集中在19:00—22:00,更關(guān)注用電成本和電費(fèi)折扣,且相比于高電能質(zhì)量增值服務(wù),該類用戶對節(jié)能管理服務(wù)的需求更大,與晚高峰型樣本用戶集套餐的滿意度結(jié)果相吻合。可見,本文所得結(jié)果與理論分析相一致,說明了所提用戶滿意度量化方法的準(zhǔn)確性。
基于上述結(jié)果,售電公司提供給新用戶的售電套餐及排序結(jié)果如表3 所示。
表3 推薦的排序結(jié)果和模擬的實(shí)際排序結(jié)果Table 3 Recommended ranking results and simulated actual ranking results
考慮到各套餐的實(shí)際排序結(jié)果較難獲得,本文將做出如下選擇模式的假設(shè)來模擬實(shí)際選擇情況:
選擇模式1:在非工作時間耗電量較大的用戶更傾向于分時電價(jià)套餐。
選擇模式2:耗電量較大且較為固定的用戶更傾向于階梯電價(jià)套餐。
選擇模式3:售電套餐價(jià)格相當(dāng)?shù)那闆r下,用戶更傾向于可再生能源比例較高的售電套餐。
選擇模式4:售電套餐價(jià)格相當(dāng)?shù)那闆r下,對電能質(zhì)量擾動敏感的用戶較關(guān)注高電能質(zhì)量增值服務(wù),而其他用戶更關(guān)注節(jié)能管理服務(wù)。
選擇模式5:售電套餐價(jià)格相當(dāng)?shù)那闆r下,用戶更傾向于節(jié)約成本較多的獎勵政策。
基于上述模擬,結(jié)合用戶實(shí)際負(fù)荷特性,將各套餐與用戶關(guān)聯(lián),作為套餐的模擬實(shí)際排序結(jié)果,則新用戶套餐模擬實(shí)際排序結(jié)果如表3 所示。值得注意的是,上述選擇模式的假設(shè)主要是為了仿真模擬套餐的選擇情況。實(shí)際中,用戶可能存在不同的選擇模式,但不影響本文所提售電套餐推薦方法的實(shí)施。
由表3 可知,本文方法所得的套餐排序結(jié)果與模擬的實(shí)際排序結(jié)果大部分一致,均方根誤差為0.632 5。T1和T5的排序結(jié)果有差異是因?yàn)樵赥1和T5的成本相當(dāng)且增值服務(wù)類型和獎勵政策相同的情況下,T1的可再生能源比例更高,用戶對T1的滿意度更高,說明本文方法獲得的套餐排序結(jié)果符合實(shí)際。同理,可隨機(jī)抽取其他用戶作為新用戶,得各新用戶套餐滿意度評價(jià)結(jié)果見附錄I。
4.3.1 不同聚類算法對聚類效果的影響分析
為了驗(yàn)證本文BLAP 聚類算法在聚類效果上的有效性,比較AP[16]、AAP[18]、BLAP 聚類算法在不同用戶規(guī)模下的最佳聚類數(shù)以及聚類質(zhì)量指標(biāo),如圖2 所示。
圖2 不同用戶規(guī)模下各聚類算法的最佳聚類數(shù)和聚類質(zhì)量指標(biāo)Fig.2 Optimal clustering number and clustering quality index of various clustering algorithms with different customer scales
由圖2 可知,用戶規(guī)模越大,AP 聚類算法所得聚類數(shù)越多,相比于AAP 和BLAP,其聚類質(zhì)量指標(biāo)較低。AAP 和BLAP 的最佳聚類數(shù)均為4,AAP的聚類質(zhì)量指標(biāo)略低于BLAP,但均大于0.9,聚類結(jié)果較為準(zhǔn)確。此外,相比于AP 和AAP 聚類算法,BLAP 聚類算法通過將用戶進(jìn)行分區(qū)分層處理,降低了時間復(fù)雜度,能夠處理較大的數(shù)據(jù)集,而AP和AAP 輸入的是所有用戶的相似度矩陣,尤其是AAP,每更新一次用戶自我相似度,都需要對所有用戶的相似度矩陣進(jìn)行重新輸入,復(fù)雜度較大。
4.3.2 不同售電套餐推薦方法的比較
為進(jìn)一步驗(yàn)證所提售電套餐推薦方法的合理性和可行性,將本文推薦方法與以下3 種推薦方法作比較,分別計(jì)算各推薦方法下各類新用戶的推薦結(jié)果如圖3 所示。
方法1:售電套餐的評價(jià)屬性僅考慮成本,對應(yīng)屬性權(quán)重為1,其他屬性權(quán)重為0,基于BLAP 和多粒度猶豫模糊語言評價(jià)集的套餐推薦方法。
方法2:不對用戶聚類,直接基于所有樣本集用戶售電套餐滿意度以及新用戶與樣本集用戶的相似度來進(jìn)行售電套餐推薦的方法。
方法3:不考慮各評價(jià)屬性的差異性,各售電套餐的屬性權(quán)重相等,基于BLAP 聚類和多粒度猶豫模糊語言評價(jià)集的售電套餐推薦方法。
由圖3 可見,本文推薦方法所得的排序結(jié)果均方根誤差最小,均小于1。僅考慮成本的推薦方法所得結(jié)果偏差較大,最大為2.178 3??梢?,考慮用戶評價(jià)信息的多樣性能顯著減小推薦結(jié)果的偏差。如果不考慮各用戶的差異性,直接根據(jù)新用戶與所有樣本用戶的相似度對套餐進(jìn)行推薦,相比于其他3 種推薦方法,該推薦結(jié)果對應(yīng)的均方根誤差最大,推薦效果較差。此外,若不考慮售電套餐各屬性的差異,由圖3 可知,各類用戶的均方根誤差均值分別為1.581 2、1.536 0、1.509 9、1.289 1,推薦效果明顯低于本文考慮各屬性差異性和權(quán)重不完整信息的推薦效果。
圖3 不同方法下售電套餐推薦排序結(jié)果的均方根誤差Fig.3 Root mean square error of recommended ranking results of electricity retail plan with different methods
本文提出了一種基于BLAP 聚類和多粒度猶豫模糊集的售電套餐推薦方法。該方法具有以下特點(diǎn):
1)所提出的基于用戶畫像與BLAP 聚類的相似用戶判別方法,具有準(zhǔn)確度高、聚類效率高、無須預(yù)先設(shè)定聚類數(shù)等優(yōu)點(diǎn),使得判別結(jié)果能更有效地反映新用戶的負(fù)荷特性。
2)采用多粒度猶豫模糊集刻畫用戶的售電套餐多屬性評價(jià)信息并將其等值化處理,不僅能更準(zhǔn)確地反映用戶售電套餐的多樣化需求,而且能保證評價(jià)結(jié)果的準(zhǔn)確性與公平性。
3)提出了基于離差最大化模型的屬性權(quán)重確定方法,并基于HFLWAO 集結(jié)用戶套餐評價(jià)信息,不僅能有效反映用戶對售電套餐屬性的偏好程度,而且能保證用戶評價(jià)信息的完整性和可解釋性。
4)提出了基于用戶滿意度的售電套餐全排序推薦方法,實(shí)現(xiàn)了售電公司對套餐的精準(zhǔn)推薦,有利于售電公司提升用戶滿意度,增強(qiáng)用戶黏性。
需要指出的是,本文僅是在考慮用戶評價(jià)信息的多粒度猶豫模糊性和權(quán)重不完整信息的基礎(chǔ)上初步研究了售電套餐推薦方法,推薦方法得到更大規(guī)模的試點(diǎn)推行后,還需研究主觀打分和客觀評價(jià)指標(biāo)相結(jié)合的用戶滿意度量化方法,結(jié)合套餐增溢價(jià)值、售電公司市場份額等開展售電套餐推薦的研究。
論文研究得到浙江省教育廳一般科研項(xiàng)目(21020073-F)資助,謹(jǐn)此致謝!
附錄見本刊網(wǎng)絡(luò)版(http://www.aeps-info.com/aeps/ch/index.aspx),掃英文摘要后二維碼可以閱讀網(wǎng)絡(luò)全文。