楊潔,石巖巖,曾琳,李楠,陶立元,張華,王曉曉,褚紅玲,趙一鳴,詹思延*
醫(yī)學博士、碩士學位論文是醫(yī)學生學術能力和科學貢獻的集中體現(xiàn),也是研究生培養(yǎng)質(zhì)量的重要載體,其反映了研究生學習期間掌握和綜合運用知識的水平與產(chǎn)出[1]。學位論文質(zhì)量是研究生培養(yǎng)質(zhì)量的重要組成部分,而做好研究生學位論文評審工作是保證學位論文質(zhì)量的重要環(huán)節(jié)[2]。論文質(zhì)量除了取決于臨床問題的重要性和新穎性,還與研究方法學的嚴謹規(guī)范密切相關。臨床研究整體設計核心的內(nèi)容集中在研究的方法學部分——如樣本量的確定、測量評價的指標、統(tǒng)計學方法等。臨床研究方法學運用的是否正確直接關系到研究結果是否可信、研究結論是否成立?,F(xiàn)有文獻對于醫(yī)學學位論文從設計到撰寫的規(guī)范性有較多報道,各大醫(yī)學院校也針對研究生學位論文撰寫了寫作指南,但對醫(yī)學博、碩士論文臨床研究方法學的規(guī)范尚未細化,相關文獻研究較少。鑒于此,筆者從學位論文評審的角度,分析總結了某大學盲審前醫(yī)學博士、碩士學位論文初稿的論文質(zhì)量,重點分析了論文重要組成維度方面的質(zhì)量,及其中涉及的臨床研究方法學方面出現(xiàn)的常見問題,旨在指導研究生利用較短的時間正確應用臨床研究方法學,為規(guī)范論文撰寫和自查、改善論文質(zhì)量提供依據(jù),也為改進臨床研究方法學教學提供方向。
1.1 研究對象 北京大學第三醫(yī)院臨床流行病學研究中心于2019—2020年對某校2019屆臨床醫(yī)學生內(nèi)部初審階段畢業(yè)論文就方法學部分進行評審并給予專業(yè)指導,并進行評審結果分析,涉及婦產(chǎn)科、骨科、放射科、消化科等21個學科,學生類型包括八年制博士(37篇)、科研型博士(8篇)、臨床型博士(5篇)、科研型碩士(5篇),其中8篇為基礎研究,6篇為臨床+基礎研究,41篇為臨床研究,共計55篇。其中47篇為臨床觀察性研究。
1.2 研究方法 由7名臨床研究方法學專家對論文進行臨床研究方法學評審,1名進修醫(yī)師對所有評閱意見進行逐篇閱讀,提取有明確指向的評價性內(nèi)容進行編碼、歸類,不斷合并和修正,參考STROBE聲明清單條目統(tǒng)計每個問題維度所涉及論文的篇數(shù)。STROBE聲明涉及觀察性研究報告的題目與摘要、背景介紹、方法、結果、討論和其他信息,共計22項條目組成,包含了在3種主要觀察性流行病學研究類型(即隊列研究、病例對照研究和橫斷面研究)中應報告的項目[3-4],有18項是3種研究設計共用的,另外4項則在不同研究設計上存在差異。國際醫(yī)學期刊編輯委員會已經(jīng)將STROBE聲明列入《生物醫(yī)學期刊投稿的統(tǒng)一要求》中。
本文從題目與摘要、背景介紹、方法、結果、討論和其他信息等方面匯總醫(yī)學研究生學位論文臨床方法學常見問題,結果見表1。
表1 STROBE聲明條目清單與47篇學位論文方法學常見問題〔n(%)〕Table 1 STROBE list and methodology FAQs of 47 dissertations
3.1 題目和摘要部分
3.1.1 存在的問題 本研究結果顯示,29.8%(14/47)的論文在題目和摘要部分存在問題。題目中經(jīng)常存在的問題有:模糊不確切,過大過于空洞,過于陳舊,缺乏新意等。摘要較為突出問題是“需進一步凝練,尤其對研究背景和選題意義的闡述不夠明確”。
3.1.2 修改建議 題目或摘要需用常用術語來體現(xiàn)研究設計,便于識別研究類型。題目應語言精練,題目貼切,充分反映論文研究的范圍。摘要應提供研究的重要信息,內(nèi)容一般包括對研究問題的陳述、研究方法和研究結果的概述以及結論。學位論文的摘要應對研究的重要信息進行總結,并且只能提供全文中包含的信息[5]。
3.2 方法部分 該部分主要集中在統(tǒng)計方法、研究對象以及樣本量等方面。
3.2.1 統(tǒng)計方法存在的問題 基于對論文評閱意見的分析,47篇臨床觀察性研究論文初稿中,統(tǒng)計分析方法描述與分析方法的使用有待提高。主要問題是缺少必要的統(tǒng)計學方法的描述或統(tǒng)計學方法不完整。例如一篇研究論文“統(tǒng)計分析方法基本合理,但缺少統(tǒng)計描述的內(nèi)容”,作者對統(tǒng)計描述與統(tǒng)計分析方法分界不是很清楚,使得文章內(nèi)容方法學部分內(nèi)容混亂。其次是“統(tǒng)計分析方法使用有誤或分析方法不全面”問題。例如一篇以某類手術患者為研究對象的論文,由于兩組基線差異存在統(tǒng)計學意義,單因素分析患者滿意度、患者功能評分、并發(fā)癥和費用等分析時還應考慮采用多因素分析方法,為“保證結論真實可靠,還需作多因素分析”。再如一論文中比較三組間血漿某項指標的濃度,在三組間比較后采用t檢驗進行兩兩比較分析,此例統(tǒng)計分析方法使用存在嚴重錯誤,導致“結論存在偏倚”的問題。
3.2.2 統(tǒng)計方法修改建議 關于統(tǒng)計學分析的描述建議包括以下內(nèi)容:統(tǒng)計分析軟件及版本、觀察指標、數(shù)據(jù)表達方法、統(tǒng)計學分析方法、研究設計的類型、樣本含量的估算、顯著性檢驗的水準等。學位論文中統(tǒng)計學分析方法的選擇:根據(jù)所采用的研究設計類型、資料所具備的條件以及其研究目的,結合定量資料和定性資料,選用合適的統(tǒng)計分析方法。如定量資料不盲目套用t檢驗和單因素方差分析;定性資料不盲目套用χ2檢驗;結合專業(yè)知識和散點圖,選用合適的回歸模型,不盲目套用簡單直線回歸分析;多因素多指標資料要在一元分析的基礎上,盡可能運用多因素統(tǒng)計分析方法,以便對各因素之間的交互作用和多指標之間的內(nèi)在聯(lián)系做出更為全面、合理的解釋和評價[6]。
3.2.3 研究對象存在的問題 具有代表性的病例抽樣和合適的樣本量,可以保證由樣本信息推斷總體特征。評審論文初稿中研究對象主要存在兩類問題,一是研究對象選擇錯誤,缺少代表性;二是研究對象未明確納入排除標準或標準不完整。例如編號29研究目標為“檢測中國某類疾病患者的術前病毒感染率,了解病毒感染譜,并分析相關臨床指標”,其入組條件為“于某年3月至11月期間的某疾病患者”,其研究對象僅入組了2018年3—11月就診的患者,研究對象的代表性不足,難以實現(xiàn)研究目標。
3.2.4 研究對象修改建議 研究對象的納入與排除標準需要明確包括具體的適應證是什么,疾病的診斷標準是什么,排除標準如何設定,從而保證研究質(zhì)量,保證研究的安全性、可行性以及可重復性,均需在進行臨床研究對象入組前進行周密設計[7]。
3.2.5 樣本量存在的問題 樣本量應該滿足回答科學問題需要,是臨床研究科學性基礎之一[8]。評審論文中樣本量估算的問題集中體現(xiàn)在缺少樣本量估算方法或樣本量不足。樣本量過小,無法充分體現(xiàn)總體內(nèi)部的變異規(guī)律,研究結果不可信,最終導致“不足以下結論,影響結論的可靠性”。
3.2.6 樣本量修改建議 臨床研究一般均需注意樣本量計算[9]。是否科學合理地對樣本量進行估算是影響研究質(zhì)量的重要方面[10-11]。如Logistic回歸模型采用的參數(shù)估計方法是最大似然估計,這就需要足夠的樣本量來保證參數(shù)估計的準確性,否則將導致分析模型不穩(wěn)定,從而造成研究結論不可靠[12-13]。
3.3 結果部分 結果部分主要問題以描述性資料與主要結果為主,體現(xiàn)在描述研究對象的特征不準確或不充分,結果展示不充分,統(tǒng)計圖表欠規(guī)范較為突出等。
3.3.1 描述研究對象存在的問題及修改建議 描述研究對象的特征不準確或不充分:如關于“某病年齡分布表現(xiàn)出主要集中在幼年及中老年的特點”,那么描述研究對象時應列出幼年(說明具體年齡范圍)和中老年的占比,以明確研究對象的特征。
3.3.2 結果展示存在的問題及修改建議 結果部分描述存在整體研究結果和引言中介紹的研究目的不一致,如目標是“探討3年內(nèi)再發(fā)心臟不良事件的影響因素,建立院外再發(fā)某病事件的風險模型”,首先得在研究內(nèi)容和研究結果中,應體現(xiàn)“再”發(fā);其次,“新構建的風險模型”描述不明確,未能體現(xiàn)“新”等問題。
3.3.3 圖表存在的問題 圖表具有形象、直觀、簡潔、集中和邏輯性強等特點,將復雜的、表達不清的文字用圖表表述,使量、事物間的關系更加明朗、清晰[14]。絕大部分論文初稿存在一處或多處圖表問題,其中圖形問題多集中在缺少圖名或圖名不符、圖標注不清、圖形清晰度差、作圖不規(guī)范、自明性不強等;表格多未采用三線表格式、表格名稱不統(tǒng)一、小數(shù)點位數(shù)不一致、缺少統(tǒng)計學檢驗及P值等問題。
3.3.4 圖表修改建議 學位論文中圖表的規(guī)范使用可參考期刊論文圖表相關要求:如“圖表分別按其在正文中出現(xiàn)的先后次序連續(xù)編碼。每幅圖表應冠有圖(表)題。說明性的文字應置于圖(表)下方注釋中,并在注釋中標明圖(表)中使用的全部非公知公用的縮寫。表格建議采用三線表(頂線、表頭線、底線),如遇有合計和統(tǒng)計學處理內(nèi)容(如t值、P值等),則在此行上面加一條分界橫線;表內(nèi)數(shù)據(jù)要求同一指標有效位數(shù)一致,一般按標準差的1/3確定有效位數(shù)。照片圖要求有良好的清晰度和對比度;病理照片要求注明染色方法和放大倍數(shù)。圖表中如有引自他刊者,應注明出處[15]。
3.4 討論部分
3.4.1 存在的問題 學位論文討論部分的問題主要體現(xiàn)在未概括與研究目標有關的主要結果,未充分對研究結果發(fā)掘與提煉。袁文青等[16]對北京大學第三醫(yī)院學位申請人學位論文寫作認知的調(diào)查,發(fā)現(xiàn)討論深度、統(tǒng)計學方法和創(chuàng)新性是學位論文寫作過程中最常見的難點,學生最希望獲得的學位論文寫作指導是學位論文寫作思路、論文撰寫邏輯和研究結果發(fā)掘與提煉。
3.4.2 修改建議 討論部分能夠充分反映作者對某個學術問題的理解程度,在學位論文的撰寫中,需對討論部分給予高度重視,既針對研究結果展開充分的討論,有理有據(jù)、突出重點,又要避免過度延伸,避免毫無依據(jù)的妄下結論,以充分體現(xiàn)對研究結果的客觀性分析,結合研究不可避免存在的局限性,對未來研究給予方向性指引[17]。
3.5 其他問題:寫作結構規(guī)范欠佳,倫理易忽視
3.5.1 寫作結構規(guī)范欠佳 針對論文初稿的評審意見分析,除有關臨床研究方法學外,寫作結構規(guī)范性的問題在論文評閱意見中出現(xiàn)頻次相對較少,但也有所涉及,均為博士論文,同時論文中多處存在語句不通順、語義表述不清、文章格式不符合要求、用詞前后不一致、筆誤等問題。博士論文的核心評價標準如原創(chuàng)性、顯著性和知識貢獻等相比,規(guī)范性是最低的底線要求[18]。學位論文的規(guī)范性體現(xiàn)了認真嚴謹?shù)膶W術研究和寫作態(tài)度。學術寫作訓練至少在碩士研究生教育階段就已經(jīng)開始,對于尚未完成、內(nèi)容不完整的論文,建議督促學生在規(guī)定時間內(nèi)完成,避免影響論文整體質(zhì)量及評審工作的有效性。
3.5.2 倫理易忽視 55篇學位論文初稿中個別論文未標注倫理學內(nèi)容。倫理審查和知情同意是保障受試者權益的主要措施[19]。張錦玉等[20]在對醫(yī)學生進行醫(yī)學倫理學作用的認知調(diào)查中發(fā)現(xiàn)醫(yī)學倫理學作為一門應用型的學科,在校教育重視不足,大部分醫(yī)學生在學習醫(yī)學倫理學課程前不了解這門課程,學習主動性較差,認為課程內(nèi)容偏難。在臨床醫(yī)學研究中,倫理學審查具有不可替代的重要作用,醫(yī)學教育更要提高醫(yī)學生對倫理學的重視,在推動醫(yī)學科學技術不斷進步的同時,保護受試者權益不受侵害。
本研究參考了STROBE聲明清單項目框架,比對分析醫(yī)學博、碩士學位論文臨床研究方法學中的問題,為醫(yī)學學位論文臨床研究方法學提供理論依據(jù)。筆者認為很有必要構建醫(yī)學學位論文臨床方法學評價指標體系,畢業(yè)論文寫作方法學規(guī)范化清單是教學研究的一個方向,建議在博士、碩士醫(yī)學教育課程開設學位論文寫作指導課程,重點增加論文寫作思路、論文撰寫邏輯、研究結果發(fā)掘與提煉等方面的認識、積累,開設統(tǒng)計學規(guī)范等基礎課程,使其論文符合統(tǒng)計學表述基本形式規(guī)范,如圖表的應用、統(tǒng)計學詞匯及符號等。其次,學位論文進一步加強規(guī)范臨床研究設計和論證,包括論文研究內(nèi)容闡釋嚴謹和清晰、符合研究過程和論證邏輯。例如,對研究方法和研究技術應當逐層進行闡釋,對資料獲取的方式和研究過程的描述應清晰嚴謹。
本研究存在一定的局限性,僅收集了某校2019屆臨床醫(yī)學生送教育部盲審前內(nèi)部初審階段的畢業(yè)論文,因論文版權、納入論文數(shù)量等方面因素,本文僅作為下一步開展更大規(guī)模橫斷面研究的試點研究。在未來的研究計劃中,將會在多所醫(yī)學院校開展學位論文大樣本的抽樣調(diào)查,嘗試采用混合研究方法,科學總結《醫(yī)學研究生課題結題階段學位論文自查清單》,用于醫(yī)學研究生學位論文臨床研究方法學自我評價,提高論文質(zhì)量。
作者貢獻:楊潔、石巖巖進行文章撰寫、課題設計、數(shù)據(jù)收集與整理;曾琳、李楠、陶立元、張華、王曉曉、褚紅玲進行數(shù)據(jù)收集與整理;趙一鳴、詹思延進行課題設計、文章撰寫和修改審校。
本文無利益沖突。