国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于事理圖譜下社交媒體重疾知識型行為推薦算法研究

2023-09-25 19:11:48張玉潔丁翔宇
現(xiàn)代信息科技 2023年16期
關鍵詞:協(xié)同過濾

張玉潔 丁翔宇

摘 ?要:在線健康社區(qū)已成為公民進行健康咨詢的重要平臺,研究在線社區(qū)知識型節(jié)點間的行為路徑,有利于揭露問答規(guī)律和事件發(fā)展邏輯,總結知識型節(jié)點之間的聯(lián)系,進行知識路徑追蹤,為用戶提供最優(yōu)推送。從用戶交互信息出發(fā)進行知識型節(jié)點的提取,識別關鍵知識型節(jié)點進行事理圖譜的構建,基于圖譜的邏輯關系,利用行為路徑融合用戶的協(xié)同過濾推薦算法識別關鍵路徑,將適合用戶需求的內(nèi)容推薦給用戶,有效解決用戶提問難和提問方法不準確等問題,提高在線健康社區(qū)推送的信息服務質量。

關鍵詞:在線健康社區(qū);事理圖譜;行為路徑;協(xié)同過濾;最優(yōu)推送

中圖分類號:TP391.3 ? 文獻標識碼:A ? 文章編號:2096-4706(2023)16-0151-05

Research on Recommendation Algorithm of Serious Diseases Knowledge Behavior in Social Media Based on Event Evolution Graph

ZHANG Yujie, DING Xiangyu

(Business School, Shandong University of Technology, Zibo ?255012, China)

Abstract: Online health community has become an important platform for citizens to conduct health consultation. The study of behavior paths among knowledge nodes in online communities is conducive to revealing the law of question and answer and the logic of event development, summarizing the connections between knowledge nodes, tracing knowledge paths, and providing users with optimal push. It starts from the user interaction information to extract knowledge nodes, identifies key knowledge nodes to construct the event evolution graph. Based on the logical relationship of the graph, it uses the collaborative filtering recommendation algorithm that integrates the user's behavior path to identify the critical path, and recommends the content suitable for user needs to the user, so as to effectively solve the problems such as difficult and inaccurate method to ask questions of user. And it improves the quality of information service pushed by online health communities.

Keywords: online health community; event evolution graph; behavior path; collaborative filtering; optimal push

0 ?引 ?言

隨著“健康中國2030”規(guī)劃[1]的落地,公民健康意識與信息素養(yǎng)正不斷提升,同時人口老齡化問題嚴峻,日益增加的就醫(yī)需求給國家和社會的醫(yī)療資源造成了巨大的壓力,于是發(fā)展健康產(chǎn)業(yè)、優(yōu)化多元辦醫(yī)格局、完善健康服務新業(yè)態(tài)成為新時代發(fā)展藍圖?!盎ヂ?lián)網(wǎng)+醫(yī)療” 旨在推廣醫(yī)療衛(wèi)生在線的新模式,公民可以利用各種社交媒體平臺搜尋疾病相關癥狀的原因或解決辦法。中國互聯(lián)網(wǎng)絡信息中心2023年3月2日在京發(fā)布的第51次《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》稱,截至2022年12月互聯(lián)網(wǎng)醫(yī)療用戶規(guī)??蛇_3.63億,占網(wǎng)民整體的34%,同比增長21.7%,成為當年用戶規(guī)模增長最快的應用[2]。在新冠疫情期間,部分互聯(lián)網(wǎng)醫(yī)療信息服務平臺中用戶信息咨詢量同比增長20多倍,在線醫(yī)療健康平臺已逐漸成為公民獲取醫(yī)療健康信息的重要途徑。

然而,現(xiàn)有的在線醫(yī)療健康信息平臺信息與服務質量魚龍混雜、良莠不齊,并且僅針對所詢問的問題進行回復,未能考慮用戶查詢的相關需求信息,缺乏對事理邏輯這一重要人類知識的刻畫。在此背景下,本文提出了一種基于事理圖譜的社交媒體重疾問答行為推薦算法研究的方法,針對在線健康平臺用戶問答行為的過程進行挖掘分析,揭露問答規(guī)律和事件發(fā)展邏輯[3],總結知識型節(jié)點之間的聯(lián)系,進行知識路徑追蹤。

1 ?文獻綜述

1.1 ?社交媒體問答挖掘研究

隨人們生活質量的不斷提高,在線醫(yī)療知識的挖掘在人工智能和大數(shù)據(jù)時代受到了學界的極大關注,已經(jīng)成為信息抽取和文本挖掘中的重要研究方向。但在面向在線社區(qū)社交媒體醫(yī)療問答數(shù)據(jù)的挖掘與分析中,研究內(nèi)容主要聚焦在健康社區(qū)信息主題內(nèi)容的挖掘、識別疾病實體并構建圍繞該實體的用戶畫像、關鍵詞的最優(yōu)推送、研究問答行為中用戶數(shù)據(jù)交互網(wǎng)絡等方面。其中針對疾病實體的識別,如張明淘[4]考慮到傳統(tǒng)的機器學習沒有涉及深層語義信息,便基于深度學習模型開展對在線問答社區(qū)醫(yī)療實體識別的研究;廖開際[5]等提出兩種深度學習模型以及條件隨機場模型進行疾病實體識別并驗證;針對知識推送也有較為廣泛的研究,學者們依據(jù)不同準則對用戶進行分類分析,如指出社區(qū)內(nèi)存在信息分享者、信息需求者和社區(qū)陪伴者,對于不同類型的用戶進行不同方面的推送;盛姝[6]等提出的利用知識庫與案例庫的半自動構建,對患者案例進行風險劃分,進而自動推理診療方案。但以上研究對知識類別的推送僅僅考慮了與搜索關鍵詞一致的結果,為考慮事理邏輯之間的關系,如搜索疾病癥狀的用戶可能對治療方法或者醫(yī)院費用等方面的知識感興趣。

1.2 ?推薦算法研究現(xiàn)狀

針對知識行為路徑推薦,常用的推薦算法有內(nèi)容推薦、標簽推薦、物品協(xié)同過濾(Item CF)和用戶協(xié)同過濾(User CF)等,但是這些算法以及在它們基礎上的改進算法大多偏向于關注用戶的顯性反饋行為(如點贊、標簽、評分等),缺少對新用戶的識別推薦及知識行為順序的利用,導致推薦準確率不夠高及冷啟動等問題。為了提高推薦精度,有學者將虛擬健康社區(qū)用戶生成的關鍵主題詞用圖譜的形式變現(xiàn)出來,采用事理圖譜可以揭露問答規(guī)律及事件發(fā)展邏輯,提出了一種基于圖譜的行為路徑協(xié)同過濾推薦算法[7],基于該事理圖譜的推薦算法依據(jù)知識行為之間的鏈接關系,將適合用戶需求的內(nèi)容推薦給用戶,包含用戶所查詢的內(nèi)容和相關內(nèi)容,有效解決用戶冷啟動和推薦內(nèi)容不準確等問題。

2 ?知識型識別及推薦算法分析

2.1 ?知識型識別及推薦路徑構建

用戶信息知識型識別及推薦算法研究的過程如圖1所示,首先利用獲取的在線健康數(shù)據(jù)構建知識圖譜,明確知識節(jié)點和知識鏈接關系,為重疾知識推薦算法提供數(shù)據(jù)基礎;其次,融合用戶的信息交互行為及對應的文本信息,識別知識型種類,對醫(yī)療健康各方面的知識進行劃分;最后,根據(jù)用戶的知識行為路徑總結歸納行為事理邏輯之間的聯(lián)系,根據(jù)用戶的查詢信息,給予最優(yōu)推送。

2.2 ?框架分析

2.2.1 ?事理圖譜構建

構建知識圖譜可提供實體之間更深層次和更長范圍內(nèi)的關聯(lián),基于知識圖譜的社交媒體重疾知識推薦算法研究需要借助已有的知識圖譜—CMEKG中文醫(yī)學知識圖譜為基礎,通過對各知識實體及相關屬性的識別,可以更好地認識實體。首先,利用數(shù)據(jù)爬取的方式獲取相關重疾知識的數(shù)據(jù)(本文以在線社區(qū)膽系疾病QQ群聊天數(shù)據(jù)為例,共識別群中2 000余名用戶,197 650條交互數(shù)據(jù)),然后運用Python+Pandas+NumPy技術對獲取數(shù)據(jù)進行預處理,得到膽系疾病交流群中用戶交互的記錄,其中每一條交互信息包含咨詢用戶的昵稱、QQ號、咨詢問題的時間、咨詢問題的內(nèi)容以及需要交互的對象,將經(jīng)過預處理的數(shù)據(jù)存放至.csv文件;最后通過與詞性的結合完成知識圖譜的構建。

2.2.2 ?知識型提取

基于事理圖譜的構建的研究基礎,本文對在線健康社區(qū)用戶知識交互行為進行研究分析,使用python語言提取詞云,結合名醫(yī)百科、百度百科和醫(yī)學文獻構建的詞典(如圖2所示),進而歸納知識型類別,分別是術前檢查、疾病癥狀、術前治療、術后檢查、術后治療、醫(yī)院費用6種知識型,知識型類別參數(shù)設置如表1所示。

在將要構建的知識事理圖譜網(wǎng)絡中,知識型節(jié)點的大小代表節(jié)點度的大小,知識型節(jié)點之間的連接邊粗細代表知識型節(jié)點之間連接邊的權重大小,使用w(ki,kj)表示知識型ki與知識型kj之間交互權重。

2.2.3 ?協(xié)同推薦算法

本文將設計一種基于知識型節(jié)點的行為路徑融合用戶的協(xié)同過濾推薦算法PersonalRank-Collaborative Filtering,即兩種算法混合使用生成兩種推薦結果,最后合并,提高推薦的準確性,擬解決部分用戶冷啟動及咨詢方式不清楚問題。

混合推薦算法步驟:

1)首先將用戶交互行為數(shù)據(jù)提取關鍵內(nèi)容,初始化為n個nodes =(a1,a2,a3,…,an),每個節(jié)點a存儲該行為的知識型類別,并在Neo4j中將這些節(jié)點構建成初級知識型事理圖譜,簡稱事理圖譜。

2)當用戶輸入需要查詢的醫(yī)療健康關鍵內(nèi)容后,根據(jù)此判斷知識型類別,再根據(jù)用戶協(xié)同過濾算法直接生成第一種推薦結果,然后根據(jù)用戶輸入的知識型類別在長周期內(nèi)產(chǎn)生該行為路徑所有類別的有序集合Routepid =(b1,b2,b3,…,bn),并在事理圖譜中根據(jù)行為順序進行構建行為路徑,pid表示知識型節(jié)點ID。

3)導出行為路徑進行向量化處理。

4)計算行為路徑之間的相似度,從而得到第二種推薦結果。

5)將以上生成的兩種推薦結果合并,得到最終的推薦結果。

該算法的流程如圖3所示。

1)構建知識型事理圖譜。以每條行為路徑的知識型為一個節(jié)點,使用Cypher語言將每個知識型行為的m個屬性(a1,a2,a3,…,am)封裝為節(jié)點,存入Neo4j數(shù)據(jù)庫。

2)行為路徑構建。首先可以直接根據(jù)基于知識型節(jié)點的協(xié)同過濾算法直接向用戶推薦,生成第一種推薦結果,然后則取出路徑行為節(jié)點根據(jù)行為順序創(chuàng)建行為路徑。

由于事理圖譜中的用戶關鍵詞和知識型類別可以映射為推薦系統(tǒng)中用戶期望值較高的推薦類別及結果,并且可以從事理圖譜中知識型節(jié)點之間的聯(lián)系得到三個重要數(shù)據(jù):兩個節(jié)點之間的路徑數(shù);兩個節(jié)點之間路徑的長度;兩個節(jié)點之間的路徑經(jīng)過的頂點可以構成一個二分圖。

然后在二分圖中使用PersonalRank算法(隨機游走算法,實現(xiàn)基于事理圖譜的推薦,從而對用戶A進行個性化推薦)可以算出該用戶比較關注的知識型內(nèi)容的所有訪問概率,而得到的這些概率大小可以作為該用戶每個行為的優(yōu)先級大小,如定義行為優(yōu)先級(b1,b2,b3,…,bn),b代表單個行為,b1的優(yōu)先級最低,bn的優(yōu)先級最高。

PersonalRank算法步驟如下:

1)從用戶A節(jié)點開始在用戶-知識型節(jié)點二分圖隨機游走,以alpha的概率從A的出邊中,等概率選擇一條游走過去。

2)到達該頂點后(舉例頂點a),由alpha的隨機游走概率繼續(xù)從頂點a的出邊集合out(v)中,等概率選擇一條繼續(xù)游走到下一個節(jié)點,或者(1-alpha)的概率回到頂點a,多次迭代,直到各頂點對于用戶A的重要度收斂。

3)經(jīng)過很多次隨機游走后,每個相關知識型節(jié)點被訪問到的概率會收斂到一個數(shù),最終的推薦列表中該相關疾病某知識型類別文章的權重就是該用戶行為的訪問概率PR(v),概率大小也就是路徑的優(yōu)先級,概率計算如式(1)所示:

(1)

4)路徑節(jié)點向量化。因為上一步創(chuàng)建的行為路徑的數(shù)據(jù)類型是文本類型,而進行路徑相似度計算需要數(shù)字類型的數(shù)據(jù),因此需要對路徑進行向量化和對齊處理。具體步驟為:導出用戶行為路徑—根據(jù)用戶行為優(yōu)先級分類—采用Keras的Tokenizer的向量化技術—利用kps.pad_sequences方法進行路徑對齊。

5)路徑相似度計算并得出推薦結果。根據(jù)排列組合原理,進行路徑類別組合,確定路徑組合后,計算路徑相似度。本文采用歐氏距離計算路徑的相似度,n維空間的歐氏距離的計算如下:

(2)

其次,根據(jù)式(3)計算class1類中每條路徑與class2類中所有路徑的距離總和,其中class1和class2代表路徑分類的兩個類,其他路徑分類情況依次類推。

(3)

最終可得到對應總距離列表,并且選擇距離最小的向用戶生成第二種推薦結果。

3 ?實證結果分析

3.1 ?知識型分析模型

本文基于事理圖譜的在線醫(yī)療健康知識型節(jié)點共包括術前檢查、醫(yī)院費用、術后檢查、術后治療、疾病癥狀、術前治療6個類別,通過對2020年7月1日—2022年6月30日期間數(shù)據(jù)進行分析,運用Python+Pandas+NumPy技術對獲取數(shù)據(jù)進行預處理,得到膽系疾病交流群中用戶交互的記錄,總數(shù)據(jù)量達99.6 MB,原數(shù)據(jù)樣例如表2所示。

通過對各搜索文本關鍵詞的提取識別,分別對應各知識型,通過給關鍵詞賦予權值的方法提取出各搜索語句的關鍵節(jié)點,進而填充知識型節(jié)點與對應搜索文本之間的聯(lián)系,并挖掘不同知識型節(jié)點之間的鏈接方式,其中各知識型高頻詞匯詳如表3所示。

3.2 ?最優(yōu)路徑推薦

根據(jù)在線社區(qū)膽系疾病QQ群數(shù)據(jù),選擇其關鍵數(shù)據(jù)記錄,代入?yún)f(xié)同過濾算法分析,關鍵路徑如表4所示。

根據(jù)知識型的評估結果,可得最優(yōu)行為路徑,如表5所示。

4 ?結 ?論

本文提出了基于事理圖譜下用戶知識型節(jié)點推薦算法,用于解決在線社交媒體重疾知識交互的最優(yōu)推薦問題。首先基于用戶的查詢信息提取知識型節(jié)點,并識別關鍵知識型,文中以術前檢查、醫(yī)院費用、術后檢查、術后治療、疾病癥狀、術前檢查為關鍵知識型,以關鍵知識型為節(jié)點構建在線醫(yī)療社區(qū)事理圖譜,融合用戶知識共享行為和知識型鏈接關系,提出知識路徑推薦算法,對膽系重疾用戶知識需求提供預判。同時,在用戶知識共享模式基礎上,實現(xiàn)重疾知識行為路徑融合協(xié)同過濾算法,提高在線健康社區(qū)推送的信息服務質量。

參考文獻:

[1] 中國互聯(lián)網(wǎng)信息中心.第51次《中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》 [EB/OL].[2023-01-02].https://www.cnnic.net.cn/.

[2] 新華社.中共中央 國務院印發(fā)《“健康中國2030”規(guī)劃綱要》 [EB/OL].http://www.gov.cn/zhengce/2016-10/25/content_

5124174.htm.

[3] 張海濤,李佳瑋,劉偉利,等.重大突發(fā)事件事理圖譜構建研究 [J].圖書情報工作,2021,65(18):133-140.

[4] 張明淘.基于深度學習的問答社區(qū)中醫(yī)療實體識別研究 [D].南京:南京郵電大學,2021.

[5] 廖開際,鄒珂欣,席運江.一種在線醫(yī)療社區(qū)問答文本實體識別方法——基于卷積神經(jīng)網(wǎng)絡和雙向長短期記憶神經(jīng)網(wǎng)絡 [J].科技管理研究,2021,41(8):173-179.

[6] 盛姝,黃奇,郭進京,等.基于知識庫與案例庫的在線健康社區(qū)診療解決方案自動推理模型研究 [J].情報科學,2022,40(5):161-172.

[7] 陳源毅,馮文龍,黃夢醒,等.基于知識圖譜的行為路徑協(xié)同過濾推薦算法 [J].計算機科學,2021,48(11):176-183.

作者簡介:張玉潔(2001—),女,漢族,河南商丘人,本科在讀,研究方向:事理圖譜構建及推薦算法;丁翔宇(2003—),男,漢族,山東青島人,本科在讀,研究方向:推薦算法。

猜你喜歡
協(xié)同過濾
基于用戶評分和項目類偏好的協(xié)同過濾推薦算法
軟件導刊(2016年12期)2017-01-21 14:49:10
基于用戶相似度加權的Slope One算法
軟件(2016年4期)2017-01-20 09:44:28
圖書推薦算法綜述
改進的協(xié)同過濾推薦算法
基于鏈式存儲結構的協(xié)同過濾推薦算法設計與實現(xiàn)
軟件導刊(2016年11期)2016-12-22 21:40:40
基于相似傳播和情景聚類的網(wǎng)絡協(xié)同過濾推薦算法研究
基于協(xié)同過濾算法的個性化圖書推薦系統(tǒng)研究
混合推薦算法在電影推薦中的研究與評述
關于協(xié)同過濾推薦算法的研究文獻綜述
商(2016年29期)2016-10-29 15:22:08
基于混合信任模型的協(xié)同過濾推薦算法
新晃| 河北省| 武隆县| 陇西县| 普格县| 龙泉市| 奎屯市| 英山县| 高阳县| 万载县| 新兴县| 广平县| 旺苍县| 科尔| 项城市| 望城县| 绵阳市| 隆子县| 绿春县| 南川市| 若尔盖县| 伊吾县| 鹿泉市| 海晏县| 平果县| 莱西市| 泸定县| 蒙山县| 焦作市| 嘉禾县| 桦南县| 棋牌| 沾化县| 阜康市| 五台县| 鄄城县| 西充县| 洛浦县| 昌江| 北票市| 舟山市|