劉蓬 鄭蕓
臨床醫(yī)生接診耳鳴患者,首先面臨其程度評估的問題,耳鳴需要什么干預(yù)方法?干預(yù)后效果如何?這是臨床醫(yī)生面對耳鳴患者必須考慮的問題,因此,選擇合適的耳鳴評估工具,對耳鳴嚴(yán)重程度作出符合實際情況的評估,是診治耳鳴所必須的。
近20多年來,源自國外的眾多耳鳴自評量表(self-report tinnitus questionnaire,SRTQ)漸漸成為國內(nèi)外文獻報道中使用較多的耳鳴療效評價工具,但這類評估工具的可靠性值得商榷[1]。研究顯示,國內(nèi)應(yīng)用較多的SRTQ之一的中文版耳鳴殘疾量表(tinnitus handicap inventory,THI)有些條目并不能被患者正確理解,因而評估的結(jié)果不一定能真實反映患者的耳鳴程度[2]。SRTQ是由專職研究人員而不是臨床醫(yī)生研發(fā),研究者對臨床醫(yī)生的需求并不十分了解,多數(shù)SRTQ比較復(fù)雜,而醫(yī)生的診務(wù)工作非常繁忙,因此極少有臨床醫(yī)生將SRTQ作為常規(guī)耳鳴評估工具在臨床上使用,一般僅在進行某項研究時才臨時使用,即臨床醫(yī)生對SRTQ中各條目并不十分熟悉,因此,醫(yī)生和患者都不夠熟悉的情況下,問卷填寫結(jié)果的可信度自然是值得懷疑的。
耳鳴評價量表(tinnitus evaluation questionnaire,TEQ)是由中國臨床醫(yī)生在長期的耳鳴實際診療工作中研發(fā)出的耳鳴評估工具[3],較之以THI為代表的SRTQ不僅使用簡潔、方便,即使在繁忙的診務(wù)工作中,亦可作為臨床醫(yī)生的常規(guī)評估工具應(yīng)用于耳鳴患者的初診和復(fù)診中,且評估結(jié)果準(zhǔn)確、可靠。
SRTQ條目數(shù)多少不一、表述語句不同、計分方法有異,但總體研發(fā)思路基本是一致的,即所用的基本條目池來源于少數(shù)樣本患者以書面的方式寫出的針對耳鳴的抱怨[4],然后應(yīng)用統(tǒng)計學(xué)方法進行篩選?;颊邔ΧQ的認(rèn)識有很多是錯誤的,基于錯誤的認(rèn)識對耳鳴產(chǎn)生的抱怨有很多是偏離實際的,與耳鳴的嚴(yán)重程度之間并無必然聯(lián)系。
與SRTQ的研發(fā)思路不同的是,TEQ的條目設(shè)計并非直接取材于患者的抱怨,而是基于臨床醫(yī)生在長達6年時間里與1000多例不同類型的耳鳴患者面對面的深度交流,在了解不同患者抱怨的基礎(chǔ)上,進一步根據(jù)醫(yī)生對耳鳴的系統(tǒng)認(rèn)識結(jié)合文獻調(diào)研對患者的抱怨進行深入分析,剔除了與耳鳴嚴(yán)重程度無關(guān)的一些抱怨,逐漸篩選出能代表耳鳴嚴(yán)重程度且易于被醫(yī)生掌握的共性指標(biāo)[5],進而研究這些指標(biāo)的科學(xué)計分方法[6],最后將指標(biāo)轉(zhuǎn)變?yōu)?個問題形成TEQ[3]。TEQ的形成過程如圖1所示。
圖1 TEQ的形成過程
對耳鳴的評估包括兩個方面:一是對耳鳴的感知,二是對耳鳴的反應(yīng)。前者是基礎(chǔ),后者是基于前者所繼發(fā)的問題,兩個方面缺一不可。
在20多種SRTQ中[1],除耳鳴功能指數(shù)(tinnitus functional index,TFI)[7]等極少數(shù)SRTQ含有對耳鳴感知的問題外,包括THI在內(nèi)的絕大多數(shù)SRTQ只包含對耳鳴的反應(yīng)。作為評估耳鳴嚴(yán)重程度的工具,這是不夠全面的。有人認(rèn)為耳鳴一旦形成,就不可能變化,這可能是多數(shù)SRTQ對耳鳴的感知不納入評價的原因之一,但這種認(rèn)識是不符合實際的。有報道顯示,對耳鳴患者的長期隨訪中,有21.5%的耳鳴在5年后可自發(fā)消失[8],說明耳鳴并非一成不變的。筆者在對耳鳴患者的長期臨床觀察中亦發(fā)現(xiàn),耳鳴的響度及持續(xù)時間會隨著某些因素的改變而發(fā)生變化,例如睡眠不足或疲勞時耳鳴的響度會增大,改善睡眠后或經(jīng)過某些治療措施后耳鳴的響度會降低,甚至?xí)簳r停止,由持續(xù)性耳鳴變?yōu)殚g歇性耳鳴。如果耳鳴的評估工具中沒有包含對耳鳴的感知,則不能反映出這種變化。
耳鳴的治療目的是改變對耳鳴的感知和改變對耳鳴的反應(yīng)。一切藥物治療、經(jīng)顱磁刺激(transacranial magnetic strmulation,TMS)、電磁療法、電刺激等治療方法的目的都是試圖改變對耳鳴的感知;而要改變對耳鳴的反應(yīng)主要靠教育及心理行為學(xué)治療方法,如認(rèn)知行為療法(cognitive behavioral therapy,CBT)、接受與承諾療法(acceptance and commitment therapy,ACT)、習(xí)服療法(tinnitus retraining therapy,TRT)等。前者的治療周期一般較短,后者較長。后一類的治療方法,應(yīng)用SRTQ去評估療效也許有一定的可取之處;而前一類的治療方法,應(yīng)用只包含對耳鳴的反應(yīng)的SRTQ評估療效則未必是恰當(dāng)?shù)?,這可能是某些治療方法在不同作者得到相互矛盾結(jié)論的原因之一,例如應(yīng)用THI評價褪黑素對耳鳴的治療作用,有人報道有效[9],也有人報道無效[10]。對rTMS治療耳鳴也有不少類似相反結(jié)論的報道[11,12],這種矛盾的結(jié)論可能有方案設(shè)計等方面的原因,但療效評價方法是否合理也是不容忽視的原因之一。
TEQ盡管只有6個問題[3],卻包含了對耳鳴的感知及對耳鳴的反應(yīng)兩方面的內(nèi)容,且對耳鳴的反應(yīng)基本囊括了幾乎所有SRTQ中真正與耳鳴嚴(yán)重程度相關(guān)的內(nèi)容,較全面反映耳鳴的嚴(yán)重程度及其變化情況,因此適合于評估任何治療方法對耳鳴的療效。
采集信息的方法是否恰當(dāng),對于評估結(jié)果是否準(zhǔn)確、可靠至關(guān)重要。SRTQ的信息采集方法一般是將書面問卷讓患者自行填寫,這種方法由于不同患者自身條件的限制可能帶來答案的不確定性[2]、反復(fù)填寫問卷給患者帶來的厭倦甚至可能產(chǎn)生的負(fù)面影響是值得考慮的[2]。與此不同的是,TEQ的信息采集方法是由醫(yī)務(wù)人員與患者交流后進行評分,可以有效避免自填問卷的缺陷,醫(yī)務(wù)人員理解TEQ6個問題的核心后,針對不同文化程度的患者可以靈活運用患者能理解的語言進行詢問以獲取真實的答案,使收集的信息更加準(zhǔn)確、可靠[3]。由于TEQ的6個問題都是臨床醫(yī)生面對耳鳴患者時必須了解的,可以與臨床問診有機結(jié)合在一起,不需要增加額外的工作量,因此,每次復(fù)診都可以進行評估,便于醫(yī)生隨時了解治療的效果,無論評估多少次都不會使患者產(chǎn)生厭倦情緒或負(fù)面影響。當(dāng)然,由醫(yī)務(wù)人員采集信息可能帶來的一個問題是:在臨床研究中可能會存在一定的主觀性偏倚,使治療組與對照組的結(jié)果比較在某種程度上降低其公正性。但是,采用盲法評價則可有效避免這一問題,即在正式的臨床研究中可采用不參與治療、也不知道分組的第三方進行TEQ評價。TEQ與SRTQ在研發(fā)思路上的主要區(qū)別見表1。
信度是評價一個測量工具可靠性的重要指標(biāo)。從兩個方面研究TEQ的信度,即內(nèi)部一致性信度與重測信度。
2.1.1 內(nèi)部一致性信度 以Cronbach's α為指標(biāo),系數(shù)越大,表示條目間的相關(guān)性越好。一般而言,系數(shù)>0.7被認(rèn)為量表內(nèi)部一致性信度好[13],但本系數(shù)的大小與量表條目數(shù)量有關(guān),條目少會降低Cronbach’sα系數(shù)。TEQ僅有6個條目,先后由兩個不同單位通過202例及414例耳鳴患者的研究,Cronbach’sα系數(shù)分別為0.76[14]及0.79[15],說明量表的各個條目具有較好的內(nèi)部一致性信度。
2.1.2 重測信度 重測信度是考察外部信度常用的方法,即在觀察對象的病情沒有改變的情況下,在不同時間內(nèi)用同一工具進行重復(fù)測量,用兩次測量結(jié)果的相關(guān)系數(shù)來表示重測信度,相關(guān)系數(shù)越大,表示重測信度越高。研究重測信度的前提是研究對象的病情沒有發(fā)生變化,對耳鳴評估工具來說,必須在確保耳鳴嚴(yán)重程度沒有變化的情況下研究重測信度才有可靠的結(jié)果。有作者研究耳鳴殘疾問卷(tinnitus handicap questionnaire,THQ)的重測信度,兩次測試間隔時間達1個月[16]甚至6~8周[17],在這么長的時間里很難保證患者耳鳴程度不發(fā)生變化,如果耳鳴程度發(fā)生了變化,而兩次測試結(jié)果卻顯示差異很小,說明測量工具本身的信度不可靠。對于SRTQ來說,由于患者自行填寫答案,如果兩次測試間隔時間太短,可能存在記憶效應(yīng)的問題。因此,研究重測信度時,確定兩次測試的合理間隔時間并非易事:既要保證耳鳴程度本身不發(fā)生變化,又要避免患者的記憶效應(yīng)。大部分已發(fā)表的SRTQ在研究重測信度時僅考慮了后者,而忽視了前者。
在研究TEQ的重測信度時,選擇在門診就診的病例,在首次問診時由醫(yī)生進行第一次TEQ評估,經(jīng)過一系列的臨床檢查后再由醫(yī)生進行第二次TEQ評估,兩次評估的間隔時間在1~3小時內(nèi),此期間未經(jīng)醫(yī)生的解釋和干預(yù),可以確?;颊叩亩Q程度不會發(fā)生變化,如果兩次測試結(jié)果的差異很小,說明測量工具本身的信度是可靠的;而由醫(yī)生用不同的語言詢問患者后進行評分的方式,也不會產(chǎn)生患者的記憶效應(yīng)問題。應(yīng)用此方法先后由不同單位的研究組通過202例、96例及414例耳鳴患者進行過3次研究,重測信度分別為0.938[14]、0.94[18]及0.97[15],3次的研究結(jié)果非常接近且十分理想,表明TEQ評估結(jié)果具有良好的穩(wěn)定性及可靠性。
效度是評價一個測量工具有效性的重要指標(biāo),體現(xiàn)測量工具與測試對象的真實性相符合的程度。我們以匯聚效度作為研究指標(biāo)進行考察,選擇了目前文獻中應(yīng)用最多的THI作為對照量表,研究TEQ與THI的相關(guān)性。先后在兩個單位進行了4次研究:第一次(2009年)經(jīng)219例研究,TEQ與THI的相關(guān)系數(shù)為0.73[19];第二次(2012年)經(jīng)202例研究,二者的相關(guān)系數(shù)為0.769[14];第3次(2017年)經(jīng)187例研究,二者的相關(guān)系數(shù)為0.79[8];第4次(2018年)經(jīng)414例研究,二者的相關(guān)系數(shù)為0.78[5]。4次的研究結(jié)果十分接近,說明二者的相關(guān)程度是較好的。而TEQ的平均評估時間僅3.27 min,較THI的平均評估時間11.17 min縮短了2/3[8],在臨床醫(yī)生繁忙的日常工作中,選用TEQ作為評估工具可以得到較為準(zhǔn)確的結(jié)果,并大大節(jié)約評估時間。
表1 TEQ與SRTQ在研發(fā)思路上的主要區(qū)別
反應(yīng)度是評價一個療效測量工具敏感性的重要指標(biāo),即測量對象發(fā)生變化時,應(yīng)用測量工具能否及時測量出這種變化的能力。效應(yīng)量(effect size,ES)是考察反應(yīng)度的一個重要指標(biāo)[20],ES值越大,反應(yīng)度越好,一般來說ES大于0.8就很理想了。關(guān)于TEQ的反應(yīng)度,先后通過治療前后的57例與173例研究,結(jié)果自覺改善組的ES分別達到1.04[18]與1.90[15],顯示TEQ具有非常理想的反應(yīng)度,能夠及時反應(yīng)耳鳴程度的變化。
最小臨床有意義變化值(minimum clinical meaningful score change,MCMSC)是作為療效評價工具的一個重要指標(biāo)[20],其意義在于為臨床醫(yī)生提供一個判斷有效與否的參考指標(biāo),即應(yīng)用此評價工具時,分值變化多少可以判定為有效。計算MCMSC主要有95%CI法、1/2 SD法等方法。其中,95%CI法為最常用的方法[21],其原理是基于兩次重復(fù)測試結(jié)果,計算出測試誤差的最大允許范圍,超過此范圍即被視為病情的真實變化。有研究表明,慢性疾病的健康相關(guān)生活質(zhì)量的MCMSC與基線評估的1/2 SD十分接近[22],因此也可以通過計算基線的1/2 SD來估計MCMSC。對173例經(jīng)過治療的耳鳴患者分別應(yīng)用95%CI法及1/2 SD法兩種方法進行了測算,得到TEQ的MCMSC值分別為1.85分與1.88分[15],兩種方法得到的結(jié)果非常接近,而THI分別應(yīng)用以上兩種方法得到的MCMSC值分別為20分[23]與7分[24],差異很大,說明TEQ的MCMSC值較THI更穩(wěn)定,因而更適合用于療效評價。由于TEQ的分值為整數(shù),因此,臨床上如果治療前后TEQ分值變化達到2分以上,可視為耳鳴程度發(fā)生了變化(即有效)而不是測試的誤差。
依據(jù)TEQ總分將耳鳴程度分為5級:Ⅰ級1~6分,Ⅱ級7~10分,Ⅲ級11~14分,Ⅳ級15~18分,Ⅴ級19~21分。先后在不同單位通過219例[19]及414例[15]耳鳴患者研究表明,這種分級具有良好的區(qū)分度,對臨床干預(yù)措施的選擇具有實際指導(dǎo)意義。一般來說,臨床上求醫(yī)的耳鳴患者以Ⅱ~Ⅳ級為多見,占90%以上[15,19]。
作為一種科學(xué)而實用的評估工具必須滿足兩個條件:一是準(zhǔn)確可靠,反復(fù)使用時誤差盡可能??;二是使用方便,符合臨床醫(yī)生日常診療工作的需要。TEQ作為耳鳴嚴(yán)重程度評估工具符合以上兩個條件。近10年里,筆者在臨床診療工作中每天都在應(yīng)用于耳鳴評估,目前已有超過萬例的應(yīng)用經(jīng)驗。TEQ具有如下優(yōu)點。
第一,全面而簡潔。目前源自國外的多數(shù)SRTQ條目數(shù)很多[1],填寫費時,且均局限于患者對耳鳴的不良反應(yīng),沒有包含對耳鳴的感知。TEQ雖然只有簡單的6個問題,卻完整地包含了以上兩個方面的內(nèi)容,且吸收了患者對耳鳴程度總體印象評價的指標(biāo),評估耳鳴嚴(yán)重程度更為全面。TEQ一般在2~4分鐘可完成評估,適合于繁忙的臨床診療工作中作為常規(guī)應(yīng)用。
第二,準(zhǔn)確而可靠。TEQ的問題設(shè)計基于醫(yī)生對耳鳴的系統(tǒng)認(rèn)識而非直接取材于患者的抱怨,使問題本身能真實反映耳鳴的嚴(yán)重程度,杜絕了多余的問題。由醫(yī)務(wù)人員根據(jù)6個問題的實質(zhì)與患者交流后進行評分而非由患者自行填寫的方式,確保了評分準(zhǔn)確而可靠,在每次的復(fù)診與隨訪中隨時可應(yīng)用,且避免了患者反復(fù)填寫問卷可能帶來的負(fù)面影響。
第三,便于耳鳴程度分級。面對一個耳鳴患者,通過簡單的交流很快得出TEQ評分并對嚴(yán)重程度作出分級,醫(yī)生根據(jù)分級情況選擇是否需要臨床干預(yù),十分方便。對于耳鳴流行病學(xué)調(diào)查來說,取得耳鳴嚴(yán)重程度分布的數(shù)據(jù)亦非常便捷。
第四,便于評價療效。應(yīng)用TEQ評價療效可采用兩種方式:一是根據(jù)治療前后耳鳴程度分級的變化,降低一級以上可視為有效[6];二是根據(jù)治療前后TEQ總分值的變化,降低2分以上可視為有效[15]。
TEQ是基于中文語境下歷時多年研發(fā)供臨床醫(yī)生日常使用的耳鳴評估工具,在多年的應(yīng)用實踐中已顯示出良好的臨床應(yīng)用優(yōu)勢。2008年世界中醫(yī)藥學(xué)會聯(lián)合會耳鼻喉口腔科專業(yè)標(biāo)準(zhǔn)審定委員會及中華中醫(yī)藥學(xué)會耳鼻喉科分會確定以TEQ作為耳鳴程度分級與中醫(yī)藥治療耳鳴的療效評定標(biāo)準(zhǔn)[25];2012年由中華耳鼻咽喉頭頸外科雜志編委會耳科專業(yè)組組織的全國耳鳴專家共識會推薦應(yīng)用TEQ作為耳鳴流行病學(xué)調(diào)查及療效評價標(biāo)準(zhǔn)[26]。因此,TEQ已成為國內(nèi)中、西醫(yī)界一致推薦使用的耳鳴程度與療效評價標(biāo)準(zhǔn)。至于在英語及其他語種環(huán)境下的應(yīng)用價值如何,尚有待于進一步研究。