新醫(yī)改以來,我國醫(yī)療保障體系建設(shè)取得了一定成就,但受資源配置結(jié)構(gòu)和布局不合理等的限制,醫(yī)療資源緊缺與優(yōu)質(zhì)醫(yī)療資源過于集中仍是我國衛(wèi)生健康領(lǐng)域的突出問題[1]。因此,如何有效利用與合理分配現(xiàn)有的醫(yī)療資源成為醫(yī)療行業(yè)領(lǐng)域的研究重點。在線醫(yī)療模式可有效提高醫(yī)療工作者的工作效率,具有開放、交互便捷和跨界等待等特點,有利于醫(yī)療資源的優(yōu)化配置與高效利用[2]。在線醫(yī)療社區(qū)(Online Health Communities)是新型的醫(yī)療形式,涵蓋問診、掛號、醫(yī)藥電商、醫(yī)療咨詢、患者自我管理等多個方面。此外,醫(yī)療領(lǐng)域?qū)I(yè)知識的不對稱性是造成醫(yī)患關(guān)系緊張的重要因素[3]。在線醫(yī)療社區(qū)可在一定程度上揭示醫(yī)院、醫(yī)生及過往患者的相關(guān)信息。這種信息相對透明化可減輕醫(yī)患雙方的知識不對等程度,使患者能夠從過往患者評論文本中獲取契合自身情況的信息,為就診決策提供依據(jù)。
在線醫(yī)療社區(qū)評論文本主要反映患者接受一定醫(yī)療服務(wù)后,對相應(yīng)服務(wù)進(jìn)行評價并反饋自身診療過程中的主觀感受或客觀效果等。評論文本不僅可以為醫(yī)院管理提供針對性改進(jìn)意見,而且可對后續(xù)患者就診提供參考。已有研究證實,在線評論文本可反映線下就診服務(wù)質(zhì)量的真實情況[4]。“微醫(yī)網(wǎng)”[5]成立于2010年,截至2018年5月累計服務(wù)人次超過5.8億,積累了大量患者就診后服務(wù)評價文本,及時挖掘其中文本的深層內(nèi)容能幫助進(jìn)一步了解患者的真實需求和提升醫(yī)療服務(wù)質(zhì)量。
患者反饋不同于消費者在線購物反饋,其中包括患者與線下醫(yī)院進(jìn)行直接接觸,相對服務(wù)體驗有著更為直觀的感受,并且不同疾病的診斷與其療效的產(chǎn)生需要一定的時間間隔?;诖吮疚膰L試從時滯的角度對患者就診后在不同時滯區(qū)間內(nèi)的反饋評論文本所反映的內(nèi)容進(jìn)行挖掘,一方面能幫助醫(yī)院管理者了解患者發(fā)表評論的普遍時間規(guī)律,了解患者真實意愿并進(jìn)行醫(yī)院管理質(zhì)量的優(yōu)化;另一方面有助于患者根據(jù)不同時間點的評論篩選出更切合自身情況的評論文本輔助就診決策。
在醫(yī)生與患者認(rèn)知與專業(yè)知識不匹配的情境下,得益于信息網(wǎng)絡(luò)通信的高速發(fā)展,用戶在進(jìn)行健康類問題咨詢時更為方便快捷。研究表明[6],用戶進(jìn)行健康相關(guān)信息咨詢的途徑逐步從線下醫(yī)療衛(wèi)生機構(gòu)轉(zhuǎn)移到在線醫(yī)療社區(qū),在線醫(yī)療社區(qū)已成為有健康問題的人們獲得社會支持的主要來源,在線醫(yī)療評論也成為患者尋找適合自己健康問題的醫(yī)院與醫(yī)生的主要途徑[7]。Emmert等[8]認(rèn)為,含有患者反饋的醫(yī)師評級網(wǎng)站可提高醫(yī)療衛(wèi)生領(lǐng)域的透明度,因此越來越受到人們的歡迎,其研究表明患者的反饋內(nèi)容可幫助醫(yī)生調(diào)整診療方式。Dellarocas[9]的研究表明,患者通過瀏覽就診評論信息,線上反饋的影響力會得到正向增強。Wang等[10]從社會支持的角度發(fā)現(xiàn),患者在在線健康社區(qū)中隨著時間的推移會有不同角色的變換,如從支持尋求者變?yōu)橹С痔峁┱?。Gao等[11]研究了來自RateMDs.com的2005-2010年數(shù)據(jù),結(jié)果顯示評級良好的醫(yī)生可能提供更好的護(hù)理。為驗證在線健康社區(qū)評論文本的有效性,也有研究者[12]通過患者與醫(yī)務(wù)工作者評審意見對比評分文本,結(jié)果顯示了較高的一致性。
由于患者評論數(shù)據(jù)公開可見,且數(shù)據(jù)量呈現(xiàn)井噴式增長,醫(yī)療領(lǐng)域人員也越來越重視這部分內(nèi)容的研究[13]。在實際就診中,患者的就診體驗經(jīng)常會涉及多個醫(yī)生、醫(yī)院等對象的多個維度。Kadry等[14]通過分析常用在線醫(yī)生評級網(wǎng)站的評論文本發(fā)現(xiàn),醫(yī)生的評分等級與患者就診時醫(yī)生的態(tài)度、溝通方式以及醫(yī)生的職業(yè)技能、醫(yī)院員工、醫(yī)院環(huán)境存在高度相關(guān)性。Alodadi[15]等通過對RateMDs.com的評論數(shù)據(jù)進(jìn)行評論語義、評級、情感等多層面特征提取發(fā)現(xiàn),評級最能反映患者的真實表達(dá)意愿。馬騁宇[16]通過分析“好大夫在線平臺”評論數(shù)據(jù)發(fā)現(xiàn),患者在就診后的康復(fù)階段依然會與醫(yī)生保持咨詢關(guān)系。患者就診反饋文本的研究呈現(xiàn)多元化趨勢,但多數(shù)研究者針對文本具體內(nèi)容分析而忽視了醫(yī)療就診結(jié)果的時間滯后性帶來的評論差異。因此本文通過提取患者評論文本中的不同時滯區(qū)間,挖掘與時滯相關(guān)聯(lián)的評分滿意度以及評論文本中所反映的患者關(guān)注內(nèi)容之間的關(guān)系。
本文擬定的基于時滯關(guān)聯(lián)特征患者就診反饋分析的技術(shù)路線,如圖1所示。從圖1可看出,技術(shù)路線主要包括數(shù)據(jù)獲取、數(shù)據(jù)處理和數(shù)據(jù)分析3個步驟。數(shù)據(jù)獲取主要從微醫(yī)網(wǎng)上抓取研究內(nèi)容字段數(shù)據(jù);數(shù)據(jù)處理主要對各數(shù)據(jù)字段進(jìn)行清洗,對就診后評論發(fā)布時間間隔劃分時滯區(qū)間,并對相應(yīng)的文本進(jìn)行主題抽取;數(shù)據(jù)分析指對不同時滯區(qū)間數(shù)據(jù)進(jìn)行評分等級相關(guān)性分析,并對相應(yīng)時滯區(qū)間文本主題進(jìn)行分析與探討。
圖1 基于時滯關(guān)聯(lián)特征患者就診反饋分析的技術(shù)路線
本文選取了復(fù)旦大學(xué)醫(yī)院管理研究所發(fā)布的2017年華中區(qū)醫(yī)院綜合實力排行榜[17]前5家醫(yī)院的“微醫(yī)網(wǎng)”醫(yī)患評論數(shù)據(jù)作為數(shù)據(jù)源,并利用自開發(fā)的Python網(wǎng)絡(luò)爬蟲對數(shù)據(jù)進(jìn)行采集,選取時間維度為1年,采集了2018年3月30日到2019年3月30日的6 230條評論數(shù)據(jù),刪去不包含就診時間評論、評論文本為空的數(shù)據(jù)后,剩余6 173條有效數(shù)據(jù),包含醫(yī)院名稱、患者滿意度評分、評論文本、就診后評論間隔時間等字段。
?;劬萚18]的研究表明,不同時間間隔內(nèi)患者的行為規(guī)律存在不同特征表現(xiàn),因此本文采用K-means聚類算法確定在線醫(yī)療社區(qū)患者評論文本數(shù)據(jù)時間間隔區(qū)間。K-means聚類算法屬于無監(jiān)督學(xué)習(xí)算法,聚類過程需要指定類別數(shù)量,因此本文在進(jìn)行實驗時指定K在2至5進(jìn)行嘗試,評價標(biāo)準(zhǔn)采用輪廓系數(shù)[19]評定,結(jié)果見表1?;谠摻Y(jié)果選定K=2進(jìn)行聚類,并將患者評論文本按時滯區(qū)間聚類結(jié)果分為短期、長期文本。
表1 K值確定
隱含狄利克雷分布(Latent Dirichlet Allocation,LDA)是主題概率生成模型中的一種,可用其對大規(guī)模語料庫進(jìn)行潛在主題的建模[20]。具體步驟為:為每一篇文檔d從主題分布θ中抽取一個主題t,從該主題t對應(yīng)的單詞分布φ中抽取一個單詞d,重復(fù)上述過程直至遍歷文檔中每一個單詞。公式為:
pj(wi|ds)=p(wi|tj)×p(tj|ds)
在參數(shù)的選取中,θ和φ是根據(jù)超參數(shù)α、β在Dirichlet分布取樣得到,其次對于第s個文檔ds中第i個單詞wi,若令該單詞對應(yīng)的topic為tj,枚舉主題集合T中的主題,得到所有的pj(wi|ds),其中j的范圍是[1,k]。根據(jù)概率值結(jié)果為ds中第i個單詞wi選擇一個topic,選取通過pj(wi|ds)最大化選取的tj為這篇ds文檔的主題。由于LDA模型中主題數(shù)目具有確定的先驗性,并且是無監(jiān)督學(xué)習(xí)模型,本文將5到10個主題類目分別進(jìn)行嘗試,將迭代次數(shù)和超參數(shù)α、β分別設(shè)定為1 000和0.1、0.2,顯示類目相似度較高的將歸并到一類,最終根據(jù)實驗結(jié)果設(shè)定主題數(shù)為5。另外,將就最終結(jié)果通過時滯區(qū)間聚類后結(jié)果單獨進(jìn)行分析,并且根據(jù)趙楊等[21]的研究,發(fā)現(xiàn)不同滿意度文本中患者所關(guān)注的內(nèi)容并不相同。因此,本文將患者評論滿意度1~3分劃分為低分評價,4~5分為高分評價,由此將主題聚類進(jìn)一步細(xì)分為短期低分、短期高分、長期低分與長期高分,并選用每類主題中的前5位關(guān)鍵詞作為主題劃分依據(jù)。
本文對提取的時滯與相應(yīng)患者滿意度分布進(jìn)行了統(tǒng)計(圖2),發(fā)現(xiàn)患者評論滿意度反饋呈現(xiàn)偏態(tài)分布,高分就診反饋占比為82.72%,并且低分反饋相比高分反饋更集中于就診后時間間隔短的區(qū)間內(nèi)。張艷豐等[22]的研究也表明,患者滿意度在不同的時間間隔區(qū)間內(nèi)存在差異?;诖吮疚脑跀?shù)據(jù)清洗后,將數(shù)據(jù)中的滿意度評分與就診后時間間隔進(jìn)行了雙變量相關(guān)性的統(tǒng)計分析,并采用Pearson相關(guān)系數(shù)進(jìn)行評價。結(jié)果顯示相關(guān)系數(shù)r=0.68,P<0.001,差異有統(tǒng)計學(xué)意義。
圖2 就診評論發(fā)布間隔時長與滿意度分布
為進(jìn)一步比較不同時滯內(nèi)相關(guān)滿意度及其評論文本的不同特征,本文對抓取數(shù)據(jù)時滯進(jìn)行聚類,通過K-means聚類,把時滯切分為短期與長期兩個階段(圖3)。時滯劃分結(jié)果如表2所示。
圖3 時滯區(qū)間聚類
評論類型時間間隔/天評論數(shù)量/條短期0-22914長期≥33259
不同時滯區(qū)間內(nèi)不同患者就診反饋主題挖掘分布見圖4,主題聚類結(jié)果相關(guān)統(tǒng)計見表3。
圖4患者反饋主題分布
本文挖掘患者態(tài)度主題時發(fā)現(xiàn)患者在表述醫(yī)生態(tài)度時存在不同維度的描述,如從服務(wù)層面描述“熱情”“和藹”“平易近人”等以及從職業(yè)層面描述“仔細(xì)”“負(fù)責(zé)”“敬業(yè)”等。為區(qū)分二者差異,本文將態(tài)度主題細(xì)分為服務(wù)態(tài)度以及職業(yè)態(tài)度。研究發(fā)現(xiàn),不同時滯間內(nèi)患者評論的主題類目分布上大致相同,患者基本針對醫(yī)生的服務(wù)態(tài)度、職業(yè)態(tài)度、醫(yī)術(shù)、掛號預(yù)約、就診措施、時間、效果、環(huán)境、費用、醫(yī)患間的溝通等方面發(fā)表評論。結(jié)果顯示,醫(yī)生的服務(wù)態(tài)度與就診措施依然是患者關(guān)注的重點,低分區(qū)間除服務(wù)態(tài)度、就診措施外描述醫(yī)患溝通、時間、環(huán)境、掛號、費用、就診措施、就診效果等客觀因素的文本相對更多,短期文本中除就診效果外均有涉及,長期文本均涉及。
表3 不同時滯區(qū)間主題分布統(tǒng)計
注:各百分比表示各個主題在各自時滯區(qū)間所占比重
就診后評論是基于就診服務(wù)發(fā)生后對相應(yīng)的就診過程中的一些主觀、客觀屬性進(jìn)行反饋的渠道。從主題分布結(jié)果中可以發(fā)現(xiàn),在長、短期時滯區(qū)中患者對服務(wù)態(tài)度、職業(yè)態(tài)度、溝通以及就診效果的描述存在差異。為便于描述,本文將患者反饋基于短期到長期的固定順序以主題數(shù)量變化由少到多定義為正向變化,反之為負(fù)向變化。
從評論主題正向變化角度觀察,在短期到長期時滯的變化區(qū)間內(nèi)關(guān)于醫(yī)生的職業(yè)態(tài)度及就診效果發(fā)生了比重變化。在接受診療服務(wù)前部分患者對自身病情有一定的先驗了解,就診時患者會對部分就診屬性有所側(cè)重[23]。有研究表明[24],隨著接受服務(wù)時間變長,患者關(guān)注的層面會呈現(xiàn)一定變化。因此,在長期區(qū)間內(nèi)由于就診后時滯變長,就診效果需要一定的時滯才能顯現(xiàn)也符合事實,患者在就診完成后時間間隔處于3~362天內(nèi)發(fā)表評論對于醫(yī)務(wù)人員職業(yè)態(tài)度描述在長期區(qū)間比重加大,表明患者就診關(guān)注內(nèi)容維度發(fā)生了正向偏移,處于長時滯區(qū)間的患者更能關(guān)注到醫(yī)生的專業(yè)屬性。
從時滯區(qū)間內(nèi)患者評論描述主題負(fù)向變化角度看,患者對于服務(wù)態(tài)度以及醫(yī)患間的溝通的關(guān)注有所變化。服務(wù)態(tài)度與溝通主要還是主觀情感層面問題,石文華等[25]的研究也表明患者在情感強度越強時,更容易在短時間內(nèi)發(fā)表評論。本文研究結(jié)果也顯示,服務(wù)態(tài)度與溝通主題呈現(xiàn)負(fù)向變化,在短時滯內(nèi)患者對于情感傾向較為明顯,患者的關(guān)注會由就診完成的初始階段對于醫(yī)生服務(wù)態(tài)度以及溝通等情感層面的內(nèi)容部分向醫(yī)生的職業(yè)態(tài)度變化。不同患者由于自身疾病類型,就體驗性而言更容易在短期內(nèi)發(fā)表評論。不管由于自身原因還是與醫(yī)生交互體驗原因,處于短期時滯區(qū)間的患者都更需要醫(yī)生、醫(yī)療單位給與更多情感層面的主觀關(guān)懷。
基于以上發(fā)現(xiàn),不同時滯內(nèi)患者關(guān)注內(nèi)容的變化對于醫(yī)療機構(gòu)以及患者自身都具有一定的啟示意義。針對這些變化,醫(yī)生可以基于患者就診結(jié)果對患者進(jìn)行不同時滯的差異化管理,更精細(xì)地分析不同患者的就診需求,從而更有效地提高患者就診體驗。如基于就診結(jié)果初步判斷患者屬于時滯的哪個區(qū)間,若患者屬于短期區(qū)間則醫(yī)生對于患者情感層面應(yīng)予以重點關(guān)注,在溝通以及服務(wù)態(tài)度層面更貼切患者情感需求。當(dāng)然要從根源解決患者對醫(yī)生的情感依賴,還需醫(yī)生在人文關(guān)懷[26]以及溝通技巧[27]方面做出更多努力。對于長期區(qū)間患者醫(yī)生可通過自身職業(yè)態(tài)度屬性對患者的主觀需求進(jìn)行一定的彌補,對于提升患者就診體驗有一定的啟示?;颊咭部赏ㄟ^對自身健康狀況的先驗了解,通過篩選不同時滯區(qū)間評論文本定向匹配自身就診需求,選取適合自身情況的醫(yī)療機構(gòu)就診,從而提升自身就診體驗。
本文在挖掘時滯與患者反饋差異變化時發(fā)現(xiàn),從就診后時間間隔與滿意度分布來看,時間間隔長的患者的就診體驗呈現(xiàn)更滿意的狀態(tài),但患者就診滿意度的高分與低分描述也存在差異?;颊邔︶t(yī)生醫(yī)術(shù)的描述主要分布在高分區(qū)間,對一些現(xiàn)實客觀因素的描述則主要集中于低分區(qū)間。如對于時間、環(huán)境、掛號以及費用在整個時滯區(qū)間均有涉及,但在長期高分區(qū)間內(nèi),患者并未對這部分的內(nèi)容發(fā)表評論?,F(xiàn)有研究[28]也表明這些現(xiàn)實因素將是患者就診客觀體驗差的主要影響因素。因此,對醫(yī)院就診環(huán)境、掛號機制、患者就診時長與等待時長的配比進(jìn)行優(yōu)化,對醫(yī)療費用及時進(jìn)行價格結(jié)構(gòu)調(diào)整等都可顯著提升患者就診滿意度[29-30]和醫(yī)院管理質(zhì)量。
本文就時滯區(qū)間對評論文本進(jìn)行了高低分分類,以挖掘不同時滯區(qū)間內(nèi)患者關(guān)注差異,結(jié)果顯示,不同時滯區(qū)間內(nèi)患者關(guān)注內(nèi)容會有所變化。通過挖掘內(nèi)容差異變化可對醫(yī)院、醫(yī)生以及患者有一定啟示。研究表明,提升患者就診滿意度可有效緩解醫(yī)患矛盾[29]。此外,本文也存在一些局限,研究選取的醫(yī)院數(shù)據(jù)是復(fù)旦大學(xué)醫(yī)院管理研究所發(fā)布的華中區(qū)綜合實力前5的醫(yī)院,對于綜合實力較強的醫(yī)院可能由于對醫(yī)院部分屬性無法進(jìn)行深入挖掘而無法體現(xiàn)差異;其次,由于患者疾病類型也存在時間上的差異,在時滯劃分時本文并未對疾病類型做進(jìn)一步的區(qū)分。今后將針對這一部分內(nèi)容進(jìn)一步嘗試。