顧勁梅,覃麗,趙璨,彭厚瑄,奚謙,申穎
1.530021 廣西壯族自治區(qū)南寧市,廣西醫(yī)科大學第一附屬醫(yī)院全科醫(yī)學科
2.530041 廣西壯族自治區(qū)南寧市西鄉(xiāng)塘區(qū)壇洛中心衛(wèi)生院
3.530603 廣西壯族自治區(qū)南寧市馬山縣周鹿中心衛(wèi)生院
4.530229 廣西壯族自治區(qū)南寧市江南區(qū)延安鎮(zhèn)衛(wèi)生院
5.530021 廣西壯族自治區(qū)南寧市,廣西醫(yī)科大學全科醫(yī)學院
加強以全科醫(yī)生為核心的基層醫(yī)療衛(wèi)生隊伍能力建設(shè)是提升我國基層醫(yī)療衛(wèi)生服務質(zhì)量和水平的重要保障。自2009 年新醫(yī)改啟動以來,《以全科醫(yī)生為重點的基層醫(yī)療衛(wèi)生隊伍建設(shè)規(guī)劃》[1]、《關(guān)于改革完善全科醫(yī)生培養(yǎng)與使用激勵機制的意見》[2]、《“健康中國2030”規(guī)劃綱要》[3]、《“十四五”國民健康規(guī)劃》[4]等一系列國家政策均提出強化基層衛(wèi)生人才隊伍建設(shè)的要求,尤其明確了加強全科醫(yī)生教育培養(yǎng)的重要性和緊迫性。目前,我國關(guān)于全科醫(yī)生臨床能力測評的研究較少,缺乏評估全科醫(yī)生在基層環(huán)境中執(zhí)業(yè)能力的指標體系[5],不利于客觀鑒別全科醫(yī)生臨床能力缺口及其教育培訓的薄弱之處。列斯特評估量表(Leicester Assessment Package,LAP)是歐美國家廣泛使用的評估全科醫(yī)生應診能力及接診患者過程的工具之一[6]。LAP 包含7 個維度、39 個條目,用以評價全科醫(yī)生在應診過程中接診和病史采集、體格檢查、患者管理、解決問題、醫(yī)生行為和與患者的關(guān)系、預防性治療、病歷記錄7 個方面的表現(xiàn)及能力[6]。1994 年,英國萊斯特大學FRASER 等[7]首次提出LAP,并在臨床醫(yī)學生、住院醫(yī)師及臨床醫(yī)師中檢驗了LAP 的內(nèi)部一致性信度、外表效度及評價者間信度[8]。LAP 適用范圍頗廣,既可在真實或模擬診療場景下評估全科醫(yī)生、醫(yī)學生及其他專業(yè)住院醫(yī)師的應診能力,也可回顧性測評應診過程的視頻錄像[9]。除英國[10]外,荷蘭[11]、愛爾蘭[12]、澳大利亞[13]、科威特[14]等多個國家,以及我國香港特別行政區(qū)[15]等多地區(qū)已出現(xiàn)根據(jù)本地實際情況改良的LAP,并將其常規(guī)運用于全科醫(yī)生應診能力的評估與教育培訓中。近年來,我國北京市、上海市等地區(qū)零星開展了應用LAP 測評全科醫(yī)生或住院醫(yī)師規(guī)范化培訓(簡稱住培)學員應診能力及醫(yī)患溝通能力的研究,但數(shù)量較少,納入的全科醫(yī)生或住培學員樣本量偏低,且局限在極少數(shù)城市社區(qū)衛(wèi)生服務中心環(huán)境中測評[16-18]。我國仍然缺乏在基層執(zhí)業(yè)環(huán)境中測評全科醫(yī)生應診能力的指標體系及工具。本研究基于LAP 的測評條目,構(gòu)建適用于基層環(huán)境的全科醫(yī)生應診能力評價指標體系,為客觀、科學評價以全科醫(yī)生為核心的基層醫(yī)療衛(wèi)生隊伍能力提供理論基礎(chǔ)和研究依據(jù)。
本研究納入經(jīng)典LAP 中文版的全部7 個一級指標和39 個二級指標作為初步構(gòu)建的基層全科醫(yī)生應診能力評價指標體系內(nèi)容。7 個一級指標分別為接診和病史采集、體格檢查、患者管理、解決問題、醫(yī)生行為和與患者的關(guān)系、預防性治療、病歷記錄;39 個二級指標包括允許患者詳述現(xiàn)患問題,識別患者就診原因,適當?shù)厥褂脙x器,善用化驗、轉(zhuǎn)診及藥物治療,形成恰當?shù)脑\斷或根據(jù)所處環(huán)境確認問題所在,與患者建立一種友善、專業(yè)和道德的關(guān)系,跟患者合作促進健康的生活方式,準確、清楚、恰當?shù)赜涗浢看吾t(yī)患溝通和轉(zhuǎn)診等[19-20]。
1.2.1 咨詢專家遴選:于2022 年5—8 月,采用目的抽樣法,從全科醫(yī)療、全科醫(yī)學教育及基層醫(yī)療衛(wèi)生管理3 個領(lǐng)域遴選咨詢專家。遴選標準為:(1)具有高級職稱;(2)有≥5 年的全科醫(yī)療工作經(jīng)驗,且熟悉基層醫(yī)療工作;(3)熟悉基層衛(wèi)生人才隊伍能力評價,并具備實踐經(jīng)驗;(4)自愿參與課題研究,且能完成連續(xù)2~3 輪咨詢。依據(jù)以上遴選標準,最終從北京市、長春市、成都市、長沙市、深圳市、南寧市、桂林市、柳州市等地遴選出15 名專家,專家的地域分布較廣。其中,醫(yī)科大學附屬教學醫(yī)院全科醫(yī)學科科室主任4 名、全科醫(yī)師3 名,市級三級甲等醫(yī)院全科醫(yī)學科科室主任4 名,社區(qū)衛(wèi)生服務中心主任3 名、全科醫(yī)師1 名。
1.2.2 函詢問卷設(shè)計:第1 輪函詢問卷包括致專家信、專家基本情況調(diào)查表、初始指標體系評分表3 部分內(nèi)容:(1)致專家信詳述研究背景、專家咨詢法原理及流程、初始指標體系框架及填寫注意事項等,以便讓專家熟悉咨詢內(nèi)容、流程及方式。(2)專家基本情況調(diào)查表旨在調(diào)查專家對咨詢內(nèi)容的熟悉程度、判斷系數(shù)及權(quán)威系數(shù)。其中,熟悉程度測評提供非常熟悉、熟悉、一般、不太熟悉及不熟悉5 個等級選項,分別賦值0.9、0.7、0.5、0.3、0.1;判斷系數(shù)提供2 個維度測評,一從臨床經(jīng)驗、理論分析、國內(nèi)外文獻及直觀感覺等方面考量,二從大、中及小等程度方面考察,2 個維度形成一個綜合判斷,各項相加即為判斷系數(shù);權(quán)威系數(shù)=(熟悉程度+判斷系數(shù))/2。(3)初始指標體系評分表要求專家對各條目的重要性和可行性評分,采用Likert 5 級評分法,重要性分為非常重要(5 分)、重要(4 分)、一般(3 分)、不重要(2 分)、完全不重要(1 分),可行性分為可行性較高(5 分)、可行性高(4 分)、一般(3 分)、可行性差(2 分)、可行性很差(1 分),并設(shè)置相應的修改、增加及刪減意見欄。
以電子郵件的形式將函詢問卷發(fā)放給各位專家,問卷回收后及時進行統(tǒng)計分析,形成第2 輪函詢問卷。第2 輪函詢問卷不再包括致專家信,提供第1 輪咨詢的專家增刪修訂意見和各條目重要性及可行性評分均值,其余設(shè)置同前輪。多輪反復咨詢后,專家意見漸趨一致,即可停止咨詢。
本研究采用AHP 確定應診能力評價指標體系各一級和二級指標的權(quán)重。AHP 的具體步驟為:(1)建立各指標的層次結(jié)構(gòu)模型;(2)構(gòu)造判斷矩陣;(3)檢驗判斷矩陣的一致性;(4)計算各指標權(quán)重及組合權(quán)重。本文依據(jù)最后一輪專家咨詢后確定的各指標的重要性和可行性得分之和的算數(shù)均值進行指標間兩兩比較排序,以此來構(gòu)造判斷矩陣,隨后計算各指標權(quán)重及組合權(quán)重。
使用SPSS 26.0 統(tǒng)計軟件進行數(shù)據(jù)統(tǒng)計分析。以相對數(shù)描述計數(shù)資料,以(±s)描述計量資料。專家基本情況采用描述性統(tǒng)計分析;專家參與咨詢的積極程度采用有效問卷回收率表示;專家意見的集中程度使用重要性得分的算數(shù)均數(shù)表示,均數(shù)越大表明專家意見越集中,該指標越重要;專家意見的協(xié)調(diào)程度用肯德爾和諧系數(shù)(Kendall's W)及重要性、可行性得分的變異系數(shù)(CV)表示。本研究基于每一輪專家咨詢的各條目的重要性及可行性評分進行肯德爾W 檢驗計算Kendall's W。Kendall's W 數(shù)值越接近1 說明專家對指標認同的一致程度越高,P<0.05 表示專家意見協(xié)調(diào)程度有統(tǒng)計學意義。CV 計算方法為各項指標重要性、可行性得分的標準差除以均數(shù),CV 越小(CV<0.3)說明指標間專家意見差異程度越小。將各指標重要性或可行性得分的算術(shù)均數(shù)<3 分或相應的CV>0.3 作為刪除指標的標準,同時結(jié)合專家咨詢意見及課題組討論意見進行最終判斷。
運用SPSSAU 數(shù)據(jù)科學分析平臺(https://spssau.com/index.html)構(gòu)建8 個判斷矩陣(含1 個一級指標判斷矩陣和7 個二級指標判斷矩陣),計算各一級和二級指標的特征向量及最大特征根;隨后采用一致性比率(CR)檢驗各判斷矩陣一致性,CR=一致性指標(CI)/隨機一致性指標(RI),CI=(最大特征根-n)/(n-1),n 表示各判斷矩陣中的指標數(shù),即n 階,RI 可從平均隨機一致性指標RI 表格中獲取,CR<0.1 表明判斷矩陣通過一致性檢驗,此時最大特征根所對應的歸一化后的特征向量即為各指標權(quán)重。然后再計算各二級指標組合權(quán)重,其為各二級指標的權(quán)重與對應一級指標權(quán)重的乘積。
本研究共進行2 輪專家咨詢,完成2 輪咨詢的專家共計15 名,均為執(zhí)業(yè)全科醫(yī)師。其中,11 名為女性,4 名為男性;6 名具有副高級職稱,9 名具有正高級職稱;學歷以碩士研究生、博士研究生居多(13 名);15 名專家的專業(yè)領(lǐng)域均涉及全科醫(yī)學、醫(yī)學教育,見表1。
第1 輪和第2 輪咨詢各發(fā)放函詢問卷15 份,回收有效問卷15 份,專家積極系數(shù)為100.0%。兩輪咨詢的專家熟悉程度、判斷系數(shù)及權(quán)威系數(shù)分別為0.77、0.91、0.84,見表2。
表2 專家熟悉程度、判斷系數(shù)及權(quán)威系數(shù)Table 2 Expert familiarity coefficient,judgement coefficient and authority coefficient during two rounds of Delphi consultation
第1 輪專家咨詢包括7 個一級指標和39 個二級指標,提出新增指標類意見10 條,合并指標類意見1 條,修改指標表述類意見26 條,共計37 條意見。第2 輪專家咨詢7 個一級指標和42 個二級指標,提出修改指標表述類意見3 條。結(jié)合課題組討論、各指標重要性和可行性得分及CV 考量,最終采納34 條專家修改意見,見表3。
表3 兩輪專家咨詢意見匯總Table 3 Summary of two rounds of Delphi consultation
各指標重要性或可行性評分的均數(shù)在兩輪專家咨詢中均>3.5 分,CV 均<0.3,專家意見集中程度較高,未因重要性、可行性得分及CV 值刪除任何指標(表4)。Kendall's W 在兩輪專家咨詢中均顯示有統(tǒng)計學意義,且第2 輪咨詢高于第1 輪咨詢(表5)。專家意見在第2輪咨詢中僅有3 條修改指標表述類意見,無重大指標增刪意見,專家意見的協(xié)調(diào)程度和集中程度均較高,即專家意見趨于一致,可停止咨詢。最終構(gòu)建了包含7 個一級指標和42 個二級指標的基層全科醫(yī)生應診能力評價指標體系。
表5 專家咨詢的肯德爾和諧系數(shù)Table 5 Kendall's W during two rounds of Delphi consultations
依據(jù)層次分析法,最終的指標體系構(gòu)建出1 個一級指標判斷矩陣和7 個二級指標判斷矩陣。各矩陣內(nèi)指標均通過隨機一致性檢驗,最大特征根值、CI 和CR 見表6,各一級和二級指標的權(quán)重及組合權(quán)重見表7。
表6 最大特征根和一致性檢驗結(jié)果Table 6 Greatest characteristic root and the consistency test results
表7 基層全科醫(yī)生應診能力評價指標體系及權(quán)重Table 7 Evaluation index system and weights for consultation competency of GPs
本研究基于經(jīng)典LAP,通過2 輪專家咨詢及AHP,構(gòu)建了適用于我國基層執(zhí)業(yè)環(huán)境的全科醫(yī)生應診能力評價指標體系。該指標體系包含接診和病史采集、體格檢查、患者管理、解決問題、醫(yī)生行為和與患者的關(guān)系、預防性照顧及病歷記錄7 個一級指標,42 個二級指標,全面體現(xiàn)基層全科醫(yī)生接診過程中的各重要環(huán)節(jié)和內(nèi)容,為客觀評價全科醫(yī)生在基層環(huán)境中的執(zhí)業(yè)能力提供科學、可行的指標體系框架。本研究是國內(nèi)較早開展評價全科醫(yī)生應診能力的研究,可為我國基層醫(yī)療衛(wèi)生隊伍能力評價提供理論基礎(chǔ)和研究范例。
參與本研究的專家均具備全科醫(yī)學、醫(yī)學教育或基層衛(wèi)生管理專業(yè)背景,從事全科醫(yī)療一線工作,熟悉全科醫(yī)生應診或接診內(nèi)容;第1 輪和第2 輪專家熟悉程度、判斷系數(shù)及權(quán)威系數(shù)無變化,分別是0.77、0.91、0.84,均處于較高水平,且專家有主動參與研究的意愿,兩輪專家積極系數(shù)均達100.0%。以上數(shù)據(jù)提示,本研究遴選的專家合適,具有較好的權(quán)威性[21-22]。從德爾菲結(jié)果來看:一方面,第1 輪和第2 輪各指標的重要性及可行性評分均數(shù)均≥3.5 分,CV 均<0.3,兩輪專家意見重要性及可行性的Kendall's W 值分別是0.173、0.170、0.296、0.321,肯德爾W 檢驗的P 值均<0.001,具有統(tǒng)計學意義,且第2 輪的Kendall's W 值大于第1 輪數(shù)值,表明專家對指標體系的結(jié)構(gòu)及各指標的認可度較高,專家意見協(xié)調(diào)程度好、分歧少[23-24];另一方面,專家對初始指標體系提出較多修改意見。在第1 輪咨詢中提出37 條修改意見,包括新增指標類意見10 條,合并指標類意見1 條,修改指標表述類意見26 條。課題組采納4 條新增指標類意見,如“適時的問診總結(jié),再做相應補充”“采集病史的完善程度”“注意對患者隱私的保護”“嘗試改變患者不當?shù)木歪t(yī)行為”等,其余該類別的意見均因與其他指標內(nèi)容重復,不予采納;接受合并指標類意見1 條(“善用化驗、轉(zhuǎn)診及藥物治療”)、修改指標表述類意見26 條。在第2 輪咨詢中,專家僅提出3 條修改指標表述類意見,全部采納。大多數(shù)專家意見旨在改善指標表述,提高其理解性和操作性;同時在初始指標體系中增加保護患者隱私、幫助改善患者就醫(yī)、遵醫(yī)行為及完善病史采集等評價內(nèi)容,體現(xiàn)全科醫(yī)生執(zhí)業(yè)中所要求的醫(yī)學人文關(guān)懷、賦能患者的要求。本研究所構(gòu)建的基層全科醫(yī)生應診能力評價指標體系保留了經(jīng)典LAP 的核心結(jié)構(gòu),依據(jù)我國基層醫(yī)療特點,增減少量指標條目,并修訂指標表述。這與經(jīng)典LAP 在多個國家(地區(qū))的應用情況相似,除英國外,其他一些國家(地區(qū))均采納了LAP 的核心內(nèi)容,調(diào)整了少量細化條目以加強本地適用性,因此相關(guān)文獻中出現(xiàn)由5 個或6 個一級指標、28 個或35 個二級指標構(gòu)成的LAP 改良版本[15,25]。
本研究所構(gòu)建的指標體系中各級指標的權(quán)重較為接近,差別不大。7 個一級指標的權(quán)重波動于13.61%~14.69%,42 個二級指標的組合權(quán)重范圍是0.95%~4.91%,這意味著7 個維度相對于全科醫(yī)生應診能力評價的重要性相當。而經(jīng)典LAP 的7 個一級指標權(quán)重分別是20%、10%、20%、20%、10%、10%、10%[26],相較于體格檢查、醫(yī)生行為和與患者的關(guān)系、預防性照顧及病歷記錄等維度,接診和病史采集、患者管理和解決問題等維度被賦予更高的重要性得分。兩者一級指標權(quán)重不一致的原因考慮可能與以下兩個因素相關(guān):一是咨詢專家對全科醫(yī)生應診工作中各項任務相對重要性的認知不盡相同。顯然,構(gòu)建經(jīng)典LAP 的專家認為在全科應診工作中如何接診患者、病史采集、患者管理及解決問題等能力的相對重要性或?qū)\結(jié)果的相對貢獻度要明顯高于體格檢查、醫(yī)患關(guān)系、預防性照顧及病歷記錄等方面的能力;而本研究邀請的專家則認為以上7 個維度的能力在全科醫(yī)生實際應診工作中均有相似的重要性或?qū)\結(jié)果產(chǎn)生類似的貢獻度。各國對全科醫(yī)生執(zhí)業(yè)定位、醫(yī)療工作內(nèi)容及臨床能力所形成的不同共識是造成專家對全科醫(yī)生應診能力評價指標權(quán)重判斷差異的重要原因[27]。二是權(quán)重計算方法差異。與傳統(tǒng)AHP采用各指標重要性評分均數(shù)作為權(quán)重計算依據(jù)不同,本研究采用各指標重要性得分和可行性得分之和的均數(shù)計算權(quán)重。權(quán)重計算同時納入指標重要性和可行性的評分,充分考慮了所建指標是否能在實際環(huán)境中操作執(zhí)行,突出指標體系的實用性和可操作性,但合并重要性和可行性評分計算權(quán)重,可能稀釋重要性對權(quán)重計算的影響,導致各一級指標的權(quán)重趨于一致。
傳統(tǒng)的AHP 需要專家按照Saaty 標度填寫兩兩比較的問卷,結(jié)構(gòu)復雜,當指標較多時填寫難度大,易引起咨詢專家的反感和判斷混亂[28]。本研究直接采用專家咨詢法中各指標重要性和可行性評分數(shù)據(jù)實施AHP,無須再請專家就每個判斷矩陣內(nèi)的指標進行兩兩比較,能較好地規(guī)避判斷混亂及邏輯錯誤的發(fā)生。專家在德爾菲法中給予各指標重要性及可行性評分,已經(jīng)包含對各指標間相對重要性或相對可行性的比較。充分利用以上數(shù)據(jù)之間所蘊含的相對關(guān)系開展后續(xù)權(quán)重計算,可提高研究效率及數(shù)據(jù)利用率。目前相關(guān)文獻已有改良AHP計算權(quán)重的報道,值得進一步實踐[29-31]。
本研究基于全球廣泛使用的經(jīng)典LAP,構(gòu)建了適用于我國基層醫(yī)療環(huán)境的全科醫(yī)生應診能力評價指標體系,指標體系包括7 個一級指標和42 個二級指標,內(nèi)容覆蓋全科醫(yī)生應診工作的各主要環(huán)節(jié)和重點任務,具備較高的科學性和實用性,為我國基層全科醫(yī)生應診能力評價提供標準化工具。本研究的局限性在于:所構(gòu)建的基層全科醫(yī)生應診能力評價指標體系尚需進一步在相關(guān)人群中驗證信度和效度,以實際人群檢驗的數(shù)據(jù)持續(xù)改進指標體系質(zhì)量,同時還應進一步細化評估指標,提高科學性和實用性,從而推動指標體系的實際應用。
作者貢獻:申穎負責研究構(gòu)思與設(shè)計;顧勁梅、覃麗、趙璨、彭厚瑄、奚謙實施專家咨詢法及層次分析法;顧勁梅、覃麗、趙璨進行數(shù)據(jù)收集、整理及統(tǒng)計學分析;顧勁梅、申穎負責撰寫論文;申穎負責論文最終版修訂,對論文整體負責。
本文無利益沖突。