臧振春, 李潔璐, 王美琦, 王娜娜
(1.周口師范學(xué)院 數(shù)學(xué)與統(tǒng)計學(xué)院,河南 周口 466001; 2.河南財經(jīng)政法大學(xué) 計算機(jī)與信息工程學(xué)院,河南 鄭州 450046; 3.河南財經(jīng)政法大學(xué) 河南經(jīng)濟(jì)研究中心,河南 鄭州 450046)
當(dāng)前,網(wǎng)絡(luò)正能量在中國特色社會主義社會建設(shè)中逐漸被重視。何家華[1]將“網(wǎng)絡(luò)正能量”定義為通過互聯(lián)網(wǎng)工具和媒介所傳播的積極向上、富有正義、樂觀進(jìn)取、感恩奉獻(xiàn)等具有感染力和號召力的精神和力量。胡江偉[2]指出有效傳播網(wǎng)絡(luò)正能量是主流媒體展示黨和政府執(zhí)政能力的一種途徑,也是媒體凝心聚力實現(xiàn)中國夢的重要方略。趙可金等[3]將正能量傳播與中美關(guān)系聯(lián)系在一起分析正能量對國家與外交的影響。孫莉等[4]通過分析正能量文字總結(jié)和諧語言類型,研究正確話語類型對網(wǎng)絡(luò)正能量傳播的意義。
針對猶豫模糊相似和推薦,學(xué)者們已有若干相關(guān)的研究成果。猶豫模糊相似的研究中,王森[5]等人將基于模糊評分的項目相似度與基于標(biāo)簽隸屬度的項目相似度融合在一起形成新的項目相似度用于推薦。郭耿[6]提出一種基于改進(jìn)模糊相似度的輿情演化規(guī)則,實驗得出模糊觀點的類型對輿情演化的周期與規(guī)模有影響的結(jié)論。胡悅[7]通過模糊神經(jīng)網(wǎng)絡(luò)和改進(jìn)的粒子群優(yōu)化算法對模糊神經(jīng)網(wǎng)絡(luò)的參數(shù)進(jìn)行優(yōu)化。Zhan等[8]使用一個向量來基于項目的特征在多個維度上測量用戶相似度,提高了推薦系統(tǒng)的預(yù)測精度。Qian[9]提出了一種基于二分網(wǎng)絡(luò)投影的概率猶豫模糊推薦決策方法。崔春生[10]從推薦系統(tǒng)中的推薦對象角度出發(fā)分析了用戶的興趣度指標(biāo)及其取值方法。
本文針對網(wǎng)絡(luò)正能量的語言與傳統(tǒng)猶豫模糊評價性特點,結(jié)合這兩種屬性的評價因素,分別對不同屬性的評價因素的算子特點計算其熵值從而得到因素權(quán)值,再結(jié)合不同距離公式與評價專家組對網(wǎng)絡(luò)正能量的評價理想值計算備選網(wǎng)絡(luò)正能量推薦組與其的距離,從而得到兩者相似度,并根據(jù)不同相似值分級對備選事件進(jìn)行推薦相關(guān)決策。在數(shù)值實驗中也表明了該方法具有良好的推薦效果。
定義1[11]定義A={
定義2[12]定義下標(biāo)對稱的語言術(shù)語集為S={sp|p=-τ,…,-1,0,1,…,τ}。其中,τ為正整數(shù),s0表示中間性評估,其余的對稱分布在s0兩邊。s-τ和sτ為語言變量的上下界。則S滿足以下條件:
(1)如果α>β,則sα>sβ;
(2)存在否算子neg(sα)=s-α,特別地,neg(s0)=s0。
(1)EF(AS)=0,當(dāng)且僅當(dāng)?c∈C,r(hs(c))={0}或者r(hs(c))={1};
(2)EF(AS)=1,當(dāng)且僅當(dāng)?c∈C,r(hs(c))={0.5};
稱EF(AS)為語言猶豫模糊集AS的模糊熵。
g(s(l-a+1)(cg)))]
(1)
其中zg為正實數(shù),令fa:[0,1]×[0,1]→[0,1]滿足:
(1)?x,y∈[0,1],fa(1-x,1-y)=fa(y,x);
(2)fa(0,0)=0;
(1)E(h)=0當(dāng)且僅當(dāng)h={0}或h={1};
(2)E(h)=1,即h模糊性最高,當(dāng)且僅當(dāng)h={1/2};
(3)E(h)=E(hc);
定義5[18]假設(shè)A1和A2為同一屬性集的兩猶豫模糊集,A1和A2的距離測度記為d(A1,A2),則其滿足以下性質(zhì):
(1)0≤d(A1,A2)≤1;
(2)d(A1,A2)=0當(dāng)且僅當(dāng)A1=A2;
(3)d(A1,A2)=d(A2,A1);
由定義可知,
(2)
經(jīng)典的距離公式有Hamming距離和Euclidean距離,在此基礎(chǔ)上,又發(fā)展出了猶豫模糊Hausdorff距離公式,設(shè)wj為cj對應(yīng)的權(quán)重:
(3)
猶豫模糊Hausdorff距離能夠較準(zhǔn)確的對比兩兩猶豫模糊集的距離。
設(shè)待評價網(wǎng)絡(luò)事件集為A={a1,a2,…,ai,…,am},網(wǎng)絡(luò)正能量的猶豫模糊綜合評價屬性集為C={c1,c2,…,cj,…,cn},且集合中存在n1(n1 S={s-3=最低,s-2=一般低,s-1=稍低, s0=中,s1=稍高,s2=一般高,s3=最高} (4) 事件ai的各屬性歸屬猶豫模糊集可綜合記為Ai: (5) 在已有的關(guān)于數(shù)值猶豫模糊數(shù)據(jù)標(biāo)準(zhǔn)化的研究中,大多應(yīng)用樂觀法則和悲觀法則兩種方法[18]。由于要推薦的用戶所要看的是網(wǎng)絡(luò)正能量的新聞,可認(rèn)為此用戶為樂觀型用戶,本文中我們通過樂觀法則對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。 令初始猶豫模糊評價矩陣為H: (6) hS={s(1),s(2),…,s(l)} (7) 其語言猶豫模糊評價集為HS;再令A(yù)i″,i=1,…,m中所有猶豫模糊元的最大長度為lmax,分別在滿足l hA*={γl(1),γl(2),…,γl(max)} (8) 其數(shù)值猶豫模糊評價集為HA″。 標(biāo)準(zhǔn)化后的評價矩陣記作M: (9) 設(shè)hS(cg)為語言猶豫模糊評價集中任一標(biāo)準(zhǔn)化后的猶豫模糊元,s(a)為語言猶豫模糊評價集hS中的語言術(shù)語元素,令語言猶豫模糊評價熵為: (10) 通過熵最小化原則,定義語言猶豫模糊評價屬性的熵權(quán)計算公式: (11) 設(shè)hA″(ct)為數(shù)值猶豫模糊評價集中任一標(biāo)準(zhǔn)化后的猶豫模糊元,γl(a)為數(shù)值猶豫模糊元hA″中的第a小的元素,經(jīng)定義4驗證,數(shù)值猶豫模糊評價熵公式為: [γl(a)e(1-γl(a))+(1-γl(a))eγl(a)-1] (12) 同理,數(shù)值猶豫模糊評價屬性熵權(quán)公式定義為: (13) 設(shè)語言猶豫模糊評價屬性權(quán)重集為: (14) 數(shù)值猶豫模糊評價屬性權(quán)重集為: W″={w″n1+1,…,wn″} (15) 則最終綜合屬性權(quán)重集為: W={w1,…,wn1,wn1+1,…,wn} (16) 其中,ɑ+β=1。一般地,ɑ=β=0.5。 首先通過Python獲取網(wǎng)絡(luò)正能量事件各屬性的猶豫模糊理想值,記作: (17) (18) 則相似度公式可定義為: (19) 設(shè)置相似度的分段標(biāo)準(zhǔn)E: E={<[0,0.4],不推薦>,<(0.4,0.8], 一般推薦>,<(0.8,1],優(yōu)先推薦>} (20) 易知,事件網(wǎng)絡(luò)正能量相關(guān)性排序為: 優(yōu)先推薦事件?一般推薦事件?不推薦事件 (21) 推薦算法綜合實現(xiàn)步驟如下: 步驟1經(jīng)咨詢專家和調(diào)研結(jié)果得到猶豫模糊語言評價集和數(shù)值評價集,規(guī)范語言術(shù)語集S形式并整合為初始猶豫模糊評價矩陣H,并分別標(biāo)準(zhǔn)化語言猶豫模糊集和數(shù)值猶豫模糊集得HS和HA″,規(guī)范化后的評價矩陣M; 步驟2分別計算語言猶豫模糊元的熵Eig(HS)和數(shù)值猶豫模糊元的熵Eit(HA″),依次計算不同屬性集的分權(quán)重集W′和W″; 步驟3計算屬性集的綜合權(quán)重集W; 步驟5定義各事件與理想值的相似度分段標(biāo)準(zhǔn)E,根據(jù)推薦閾值做不推薦,一般推薦或優(yōu)先推薦決策。 在日常生活中,人們生活中在手機(jī)中獲取的信息數(shù)不勝數(shù),由于人們對信息不敏感,所以如何在人們得到信息之前對信息進(jìn)行篩選就成了首要問題,本文根據(jù)網(wǎng)絡(luò)正能量的特征將篩選網(wǎng)絡(luò)正能量的影響因素分為6點:c1:敏感煽動性,c2:政府可控性,c3:傳播途徑廣泛率,c4:評論互動率,c5:積極/消極的關(guān)鍵詞率,c6:涉及不同范圍詞率。其中,c1和c2為語言評價集,分別描述事件的傳播速率和政府管控程度,c3,c4,c5,c6為數(shù)值評價集,分別從傳播途徑效率,大眾關(guān)注度,直觀描述的正向性和關(guān)注人群分散度出發(fā)來對事件進(jìn)行評價。在本節(jié)應(yīng)用中,我們首先根據(jù)近期不同時段新聞選取八個熱點事件作為推薦備選方案,并由專家組分別對不同影響因素做出評價:事件A1:我國絕對貧困人口全部脫貧;事件A2:離婚冷靜期提議通過; 事件A3:民法典的誕生;事件A4:我國首支火星探測器“天問一號”抵達(dá)火星;事件A5:中印沖突;事件A6:中央督察組到地方車牌泄露;事件A7:“熟雞蛋返生”論文被下架;事件A8:嚴(yán)查偷稅漏稅。 步驟1經(jīng)調(diào)研與專家組評價集整合得初始猶豫模糊評價矩陣為: 利用公式(7)和(8)分別對語言猶豫模糊評價集和數(shù)據(jù)猶豫模糊評價集進(jìn)行標(biāo)準(zhǔn)化,得到公式(9)形式的評價矩陣為: 步驟2根據(jù)公式(10)計算出語言猶豫模糊元的熵為: 同理,Ei2=1.99。 根據(jù)公式(12)計算出數(shù)值猶豫模糊元的熵為: 同理可求得其余猶豫模糊元熵值,E23=0.92,E33=0.82,E43=0.82等。 數(shù)值型猶豫模糊元的熵集可整合為: 根據(jù)公式(11)計算語言猶豫模糊集的不同屬性的分權(quán)重集 步驟3根據(jù)公式(16)可得綜合權(quán)重集W=0.5W′∪0.5W″={0.25,0.25,0.11,01.3,0.18,0.08}。 步驟4通過Python對熱點新聞進(jìn)行整合處理,選出其中10個正能量新聞,收集專家對每個屬性的評分,得到標(biāo)準(zhǔn)化后的猶豫模糊集如表1所示。 表1 標(biāo)準(zhǔn)化的猶豫模糊評價集 選取正理想解作為正能量的猶豫模糊標(biāo)準(zhǔn)值,則: 用公式(18)計算出事件A1與專家評價網(wǎng)絡(luò)正能量理想值的距離為: =(0.25×02+0.25×0.22+0.11×0.042+0.13×0.22+0.18×0.152+0.08×0.282)=0.16 同理得: d(A,A8)=0.22 步驟5由公式(20)可知 優(yōu)先推薦事件為:A1 一般推薦事件為:A8,A3,A4,A7,A2,A5,A6 由公式(21)綜合相似度值,可以得出推薦順序為A1?{A8,A3}?A4?A7?A2?A5?A6 文章通過計算交叉熵確定屬性權(quán)重,根據(jù)距離確定每個事件的相似度來明確網(wǎng)絡(luò)正能量進(jìn)行推薦,最后通過實例驗證及結(jié)果分析證明了模型有效性,即其存在良好的應(yīng)用前景。但在模型建立過程中,評價因素僅考慮到了語言術(shù)語隸屬度和數(shù)值隸屬度,沒有考慮到存在其他數(shù)據(jù)集的情況,也缺少推薦對象的個體性分析,在未來研究中,將著重研究網(wǎng)絡(luò)正能量推薦中存在的多種數(shù)據(jù)集形式,并拓展研究適用于更多數(shù)據(jù)集的推薦算法。2.2 權(quán)重的確定
2.3 相似度計算
3 網(wǎng)絡(luò)正能量推薦實例
3.1 網(wǎng)絡(luò)正能量實例描述
3.2 推薦算法應(yīng)用
4 結(jié)論與展望