国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于音頻的罪犯自殺危險(xiǎn)性評(píng)估

2023-04-29 20:36鄭子強(qiáng)何得淮廖瀟楠蘭琳蔣靜文張偉
關(guān)鍵詞:機(jī)器學(xué)習(xí)音頻

鄭子強(qiáng) 何得淮 廖瀟楠 蘭琳 蔣靜文 張偉

摘要:現(xiàn)較為主流的罪犯自我傷害風(fēng)險(xiǎn)評(píng)估主要通過(guò)量表實(shí)現(xiàn),但存在耗時(shí)長(zhǎng)、虛報(bào)率高的問(wèn)題,缺乏客觀(guān)有效的識(shí)別方法.音頻數(shù)據(jù)不受個(gè)體語(yǔ)言限制,有采集方便、信息豐富等特征,目前基于音頻數(shù)據(jù)構(gòu)建的自我傷害風(fēng)險(xiǎn)識(shí)別模型取得了不錯(cuò)的效果.通過(guò)訪(fǎng)談獲取罪犯音頻數(shù)據(jù),對(duì)音頻進(jìn)行預(yù)處理后提取音頻關(guān)鍵特征,采用4種機(jī)器學(xué)習(xí)算法構(gòu)建分類(lèi)模型.實(shí)驗(yàn)結(jié)果表明,罪犯音頻能有效區(qū)分罪犯是否具有自我傷害、自殺傾向,平均F1分?jǐn)?shù)為86.88%.

關(guān)鍵詞:罪犯評(píng)估;自傷自殺;音頻;機(jī)器學(xué)習(xí)

收稿日期: 2023-04-05

基金項(xiàng)目: 罪犯綜合評(píng)估系統(tǒng)研發(fā)項(xiàng)目(HX20220768);四川省科技計(jì)劃(2020YFS0575)

作者簡(jiǎn)介: 鄭子強(qiáng)(1994-),男,研究實(shí)習(xí)員,碩士,研究方向?yàn)樽匀徽Z(yǔ)言處理與語(yǔ)音信號(hào)處理. E-mail: zhengziqiang@wchscu.cn

通訊作者: 張偉. E-mail: zhangwei@wchscu.cn

Audio based suicide risk assessment of criminals

ZHENG Zi-Qiang1, HE De-Huai1, LIAO Xiao-Nan1

LAN Lin2, JIANG Jing-Wen1, ZHANG Wei1

(1.West China Biomedical Big Data Center, West China Hospital, Sichuan University, Chengdu 610044, China;

2. Education and Correction Department, Sichuan Provincial Administration of Prisons, Chengdu 610016, China)

The mainstream suicide risk assessment of criminals is achieved through scales, but there are some problems such as long time consuming, high false reporting rate and lack of objective and effective identification. Since audio data is convenient and informative while not restricted by individual language, previous studies have achieved good results in audio-based modeling of criminal suicide. In this study, the audio data of criminals were obtained through interviews. After pre-processing, the key audio features were extracted for machine learning modeling, and four classifiers were used to build the classification model. The experimental results show that the audio of criminals can effectively distinguish whether criminals have suicidal tendencies with the average F1 score of 86.88%.

Assessment of criminal; Self-harm and suicide; Audio; Machine learning

1 引 言

自殺是全球監(jiān)獄中罪犯的主要死因之一,罪犯自殺率是普通人群的三倍以上[1].自殺死亡的罪犯中有一半以上曾有過(guò)自傷事件記錄[2].據(jù)統(tǒng)計(jì),監(jiān)獄中男性罪犯自傷事件發(fā)生率在5%~6%,女性罪犯自傷事件發(fā)生率在20%~24%[3],自傷罪犯在獄中自殺的風(fēng)險(xiǎn)是其他罪犯的6~8倍[4].國(guó)內(nèi)學(xué)者的研究表明,我國(guó)的服刑人員也是自殺風(fēng)險(xiǎn)較高的人群之一,但在有效及時(shí)的管控措施下,自殺死亡率遠(yuǎn)低于國(guó)外比例[5].罪犯自傷自殘尤其是自殺等非正常死亡事件常會(huì)引起媒體和社會(huì)的關(guān)注,對(duì)監(jiān)獄內(nèi)工作人員、其他罪犯以及監(jiān)獄系統(tǒng)造成嚴(yán)重影響,對(duì)自傷自殺罪犯的治療與監(jiān)管還會(huì)進(jìn)一步增加成本.2007年世界衛(wèi)生組織將減少監(jiān)獄自殺人數(shù)列為國(guó)際優(yōu)先事務(wù)[6],許多國(guó)家都制定了預(yù)防罪犯自傷自殺的標(biāo)準(zhǔn)和指南[7],但如何有效評(píng)估罪犯自殺風(fēng)險(xiǎn)成為了各國(guó)監(jiān)獄的研究重點(diǎn).

預(yù)防罪犯自殺,首先需要了解該類(lèi)事件的產(chǎn)生因素.Duthé 等[8]研究了法國(guó)男性囚犯的監(jiān)禁特征與自殺風(fēng)險(xiǎn)之間的聯(lián)系,結(jié)果顯示自殺與罪名、年齡相關(guān),多發(fā)生于住院期間和懲戒室內(nèi),親屬探視可有效降低自殺率.2014年,《柳葉刀》發(fā)布了一項(xiàng)關(guān)于英格蘭和威爾士監(jiān)獄罪犯自傷的研究報(bào)告[9],表明自傷人群主要為年輕人和白人,與監(jiān)獄類(lèi)型、刑期、罪名相關(guān),同時(shí)自傷事件的后續(xù)一個(gè)月以?xún)?nèi)是自殺高風(fēng)險(xiǎn)期.此項(xiàng)工作已經(jīng)對(duì)英格蘭和威爾士監(jiān)獄管理局對(duì)危險(xiǎn)犯的管理方式產(chǎn)生了影響.目前國(guó)內(nèi)外對(duì)于罪犯自傷自殺的相關(guān)危險(xiǎn)因素研究較多,也得到了基本共識(shí),與罪犯自傷自殺最相關(guān)的因素有罪犯的自殺意念、自殺自殘史、精神疾病和單獨(dú)監(jiān)禁[10,11].

盡管目前已經(jīng)有如此多的研究確定了罪犯自傷自殺行為的廣泛風(fēng)險(xiǎn)因素,但并沒(méi)有確定哪些罪犯最有可能在監(jiān)禁期間對(duì)他們的自殺意念采取行動(dòng),大多數(shù)有自殺意念的人沒(méi)有自殺行為[12],這意味著自殺意念并不是一個(gè)充分的原因.Favril等[13]從比利時(shí)15個(gè)監(jiān)獄中隨機(jī)抽取了1203名男性罪犯,以自我報(bào)告的形式來(lái)了解他們的自殺意念,約三分之一的參與者存在自殺念頭,其中26%的人在獄中企圖自殺,占所有參與者的9%.該研究顯示,對(duì)于存在自殺意念的罪犯,需要關(guān)注是否有吸毒、暴力犯罪、非自殺性自殘史,這些因素是該群體高自殺風(fēng)險(xiǎn)的標(biāo)志.

既往的研究主要聚焦于實(shí)證研究,宏觀(guān)地考察了自殺罪犯與環(huán)境、生理、心理等因素之間的關(guān)系,而犯人作為個(gè)體的聲音則一直被排除在研究的內(nèi)容之外.目前對(duì)于自傷自殺言語(yǔ)特征的研究較少,相關(guān)文獻(xiàn)不多,而且基本上都是與抑郁癥相關(guān)聯(lián).實(shí)際上,重度抑郁癥和雙相情感障礙這兩種情緒障礙在自殺死亡中占很大比例[14],新出現(xiàn)的證據(jù)進(jìn)一步支持了情緒障礙嚴(yán)重程度與自殺風(fēng)險(xiǎn)之間存在強(qiáng)有力的表型關(guān)系[15].從聽(tīng)感上,早期研究者形容自殺傾向者說(shuō)話(huà)時(shí)音調(diào)單一[16].有研究發(fā)現(xiàn),聲帶抖動(dòng)和聲門(mén)頻譜參數(shù)對(duì)近期自殺患者、抑郁患者、非抑郁對(duì)照組有良好的識(shí)別能力,支持了語(yǔ)音與自殺風(fēng)險(xiǎn)之間的聯(lián)系[17,18].對(duì)抑郁患者和高自殺風(fēng)險(xiǎn)者的語(yǔ)音特征進(jìn)行分析,結(jié)果表明梅爾倒譜系數(shù)(Mel Frequency Cepstrum Coefficient, MFCC)和聲門(mén)譜斜率參數(shù)在重度抑郁相對(duì)應(yīng)的聲帶指標(biāo)上略高,組間分離表現(xiàn)較好[19].

國(guó)內(nèi)外暫未查見(jiàn)基于音頻的罪犯自殺評(píng)估研究,還處于話(huà)語(yǔ)分析、解釋歸因形成評(píng)估量表的階段.相較于傳統(tǒng)的量表篩查方法,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法可以為自殺篩查和評(píng)估提供更精確客觀(guān)的指標(biāo)[20],主要應(yīng)用于問(wèn)卷調(diào)查[21]、語(yǔ)音學(xué)[22]、電子健康記錄[23]、fMRI[24]等,均取得了不錯(cuò)的效果.受限于場(chǎng)景和成本,文章僅圍繞罪犯音頻開(kāi)展研究,為現(xiàn)代化監(jiān)獄的罪犯自殺危險(xiǎn)性評(píng)估奠定語(yǔ)音研究基礎(chǔ).

2 相關(guān)工作

語(yǔ)音信號(hào)形簡(jiǎn)意豐,由語(yǔ)言和音頻構(gòu)成,語(yǔ)言是語(yǔ)音的內(nèi)容,用于表達(dá)語(yǔ)義,音頻是語(yǔ)音信號(hào)的載體,體現(xiàn)的是語(yǔ)音的聲學(xué)特征.通常情況下,語(yǔ)音分析是結(jié)合語(yǔ)言特征和音頻特征共同分析,但對(duì)于小語(yǔ)種或方言,人工理解尚有困難,計(jì)算機(jī)對(duì)于這些資源稀缺語(yǔ)言的識(shí)別性能更差,若人工轉(zhuǎn)錄成本又過(guò)高,因此研究者們嘗試僅通過(guò)自殺患者的聲學(xué)特征來(lái)學(xué)習(xí)自殺意念和自殺行為的檢測(cè)方法,并已證明了聲學(xué)特征與自殺傾向之間的關(guān)系[17,18].

2.1 自殺音頻聲學(xué)特征

自殺音頻聲學(xué)特征主要分為韻律特征、聲源特征、共振峰特征和頻譜特征.

(1)韻律特征(Prosodic Feature).韻律特征主要體現(xiàn)說(shuō)話(huà)人的語(yǔ)速、節(jié)奏、能量、基頻(也稱(chēng)為F0)等特征,其中能量和基頻能夠直接反映聲音的響度和音高,因此是最常用的特征.自殺傾向者存在聲能降低、音高變化少等特點(diǎn)[25],并且語(yǔ)音信號(hào)的衰減速度更加緩慢.

(2)聲源特征(Source Feature).聲源特征測(cè)量的是發(fā)聲過(guò)程中的聲音質(zhì)量,表現(xiàn)從肺部通過(guò)聲門(mén)時(shí)的氣流變化.自殺傾向者的喉部控制會(huì)受到影響,出現(xiàn)刺耳、呼吸音、尖銳音,這一變化可以反映在聲源特征上[26].自殺音頻分析中廣泛使用的聲源特征包括基頻微擾(Jitter)、振幅微擾(Shimmer)、諧波噪聲比,這些聲源特征與聲帶振動(dòng)直接相關(guān),已被證明與自殺傾向相關(guān)[17,27].

(3)共振峰特征(Formant Feature).共振峰特征是測(cè)量鼻腔和聲道共振的物理特征,因此喉嚨肌肉張力、唾液分泌的變化,均可以通過(guò)共振峰特征捕捉.許多研究已經(jīng)證明共振峰特征變化與自殺狀態(tài)之間的關(guān)系,例如,F(xiàn)rance等[28]研究發(fā)現(xiàn),自殺傾向者的共振峰頻率增加和帶寬減少.Stasak等[29]研究表明共振峰特征有助于識(shí)別自殺患者.

(4)頻譜特征(Spectral Features).頻譜特征表示在給定時(shí)間內(nèi)語(yǔ)音信號(hào)的頻率分布.自殺音頻分析中常用的頻譜特征有梅爾倒譜系數(shù)(Mel Frequency Cepstral Cofficients, MFCC)和功率譜密度(Power Spectral Density, PSD).多項(xiàng)研究表明,將MFCC和其他聲學(xué)特征相結(jié)合,能夠有效提升非抑郁患者、近期自殺患者和抑郁癥患者的識(shí)別準(zhǔn)確率[19,30-32].

2.2 基于音頻的自殺檢測(cè)方法

目前基于音頻的自殺檢測(cè)方法主要分為兩類(lèi),一類(lèi)是統(tǒng)計(jì)分析法,另一類(lèi)是機(jī)器學(xué)習(xí)分類(lèi)法.統(tǒng)計(jì)分析法是將音頻特征作為觀(guān)測(cè)變量,應(yīng)用統(tǒng)計(jì)學(xué)方法挖掘相關(guān)特征及特征維度之間的關(guān)系,用于描述自殺者與健康者音頻之間的獨(dú)特性[17,28,33].機(jī)器學(xué)習(xí)分類(lèi)法是對(duì)具有相似音頻特征的人群進(jìn)行分類(lèi),以期望將自殺者和健康者區(qū)分開(kāi)來(lái).目前使用最多的機(jī)器學(xué)習(xí)分類(lèi)方法是支持向量機(jī)(Support Vector Machines, SVM)[18,34],也有結(jié)合AdaBoostM1[35]、K近鄰(K-Nearest Neighbor, KNN)[29]等算法對(duì)自殺者和非自殺者的音頻特征進(jìn)行二分類(lèi)學(xué)習(xí).除此之外,還有研究用高斯混合模型對(duì)自殺者的音頻特征分布進(jìn)行建模[32,36].盡管深度學(xué)習(xí)模型已經(jīng)在抑郁癥檢測(cè)[37]、阿爾茲海默癥檢測(cè)[38]等任務(wù)上取得了不錯(cuò)的效果,但很少應(yīng)用于基于音頻的自殺傾向檢測(cè).

3 研究方法

研究方法主要包括四個(gè)步驟:(1)獲取罪犯音頻數(shù)據(jù);(2)對(duì)音頻數(shù)據(jù)進(jìn)行數(shù)據(jù)處理;(3)音頻特征提取,并選擇關(guān)鍵特征;(4)訓(xùn)練分類(lèi)模型,并在測(cè)試音頻上進(jìn)行有/無(wú)自殺傾向的人群分類(lèi)實(shí)驗(yàn).文章提出的方法整體流程如圖1所示.

3.1 音頻數(shù)據(jù)獲取

研究數(shù)據(jù)來(lái)源于對(duì)監(jiān)獄罪犯的訪(fǎng)談. 訪(fǎng)談室為監(jiān)區(qū)內(nèi)獨(dú)立辦公室,環(huán)境設(shè)置參考了其他訪(fǎng)談數(shù)據(jù)集的環(huán)境,同時(shí)結(jié)合了心理醫(yī)生訪(fǎng)談環(huán)境和監(jiān)獄心理咨詢(xún)民警的意見(jiàn).室內(nèi)擺放一張圓桌和兩張座椅,訪(fǎng)談員和罪犯呈桌角式落座,可以讓雙方有自由的目光接觸,給罪犯帶來(lái)輕松自在的心理感受.罪犯由民警帶入訪(fǎng)談室,然后民警在訪(fǎng)談室外等待訪(fǎng)談結(jié)束后,進(jìn)入訪(fǎng)談室將罪犯帶離.為了能夠讓罪犯暢所欲言,訪(fǎng)談室內(nèi)僅罪犯和訪(fǎng)者兩人,無(wú)第三者在場(chǎng).訪(fǎng)者在訪(fǎng)談開(kāi)始時(shí)聲明本次談話(huà)僅作為學(xué)術(shù)之用,對(duì)罪犯在獄內(nèi)的表現(xiàn)、加扣分、刑期等均無(wú)影響,盡可能讓罪犯保持自然狀態(tài).在訪(fǎng)談過(guò)程中進(jìn)行音視頻的同步記錄,禁止人員進(jìn)出、室外交談走動(dòng),以減少噪音干擾,保證數(shù)據(jù)質(zhì)量.

3.2 音頻數(shù)據(jù)處理

錄制下來(lái)的音頻為完整的訪(fǎng)談音頻,包含訪(fǎng)者和罪犯兩人,因此需要對(duì)音頻進(jìn)行剪輯處理.音頻剪輯流程如圖2所示,基于python工具包實(shí)現(xiàn).

剪輯完成后得到采樣率為16 kHz,采樣位寬為16 bit,單聲道的wav文件.

3.3 音頻特征提取

文章采用openSMILE提取音頻特征,選用2016年ComParE_2016特征集,包含了MFCC、基頻、響度等65個(gè)低水平特征,基于這些低水平特征計(jì)算得到高級(jí)統(tǒng)計(jì)量共6373維特征.該特征集的音頻特征十分全面,但是過(guò)多的特征會(huì)降低模型的可解釋性,因此采用特征選擇從特征集合中選擇出相關(guān)特征子集.

特征選擇算法分為過(guò)濾式、包裝式和嵌入式三種,其中嵌入式結(jié)合了過(guò)濾式和包裝式的優(yōu)點(diǎn),將特征選擇嵌入到模型構(gòu)建的過(guò)程中,常用方法有Lasso和樹(shù)模型.

3.4 分類(lèi)模型訓(xùn)練

選用KNN、SVM、隨機(jī)森林(Random Forest, RF)和邏輯回歸(Logistic Regression, LR)等四種監(jiān)督學(xué)習(xí)算法對(duì)人群進(jìn)行分類(lèi)模型訓(xùn)練.

(1)KNN:每個(gè)樣本都可以用它最接近的k個(gè)鄰居來(lái)預(yù)測(cè)它的類(lèi)別;(2)SVM:在特征空間中找到一個(gè)使正負(fù)例間隔最大的超平面;(3)RF:由多個(gè)決策樹(shù)組成,個(gè)別決策樹(shù)選擇的眾數(shù)決定輸出類(lèi)別;(4)LR:通過(guò)logistic回歸分析,得到自變量的權(quán)重,根據(jù)該權(quán)重來(lái)預(yù)測(cè)類(lèi)別.

4 實(shí)驗(yàn)與分析

4.1 實(shí)驗(yàn)數(shù)據(jù)

2022年7月,項(xiàng)目組聯(lián)合四川省監(jiān)獄管理局和四川大學(xué)華西醫(yī)院組織訪(fǎng)談員對(duì)某監(jiān)獄內(nèi)服刑人員進(jìn)行訪(fǎng)談?wù){(diào)查,本次訪(fǎng)談共41人,其中有12人曾實(shí)施過(guò)自傷自殺或具有不同程度的自傷自殺傾向,作為有自殺傾向的實(shí)驗(yàn)組,其余29人作為無(wú)自殺傾向的對(duì)照組.完整訪(fǎng)談數(shù)據(jù)時(shí)間長(zhǎng)達(dá)12.43 h,平均每段訪(fǎng)談時(shí)長(zhǎng)18.2 min,經(jīng)過(guò)數(shù)據(jù)處理后,罪犯音頻平均時(shí)長(zhǎng)為9.7 min.本研究及其程序得到了華西醫(yī)院生物醫(yī)學(xué)倫理委員會(huì)的批準(zhǔn),所有的方法都按照相關(guān)的準(zhǔn)則和規(guī)定進(jìn)行,整個(gè)實(shí)驗(yàn)遵循《赫爾辛基宣言》.

4.2 評(píng)估指標(biāo)

在評(píng)估指標(biāo)的選取方面,文章使用了四種性能度量:精度(Precision, Pre)、召回率(Recall)、F1分?jǐn)?shù)(F1)、ROC曲線(xiàn)下面積(Area Under Curve, AUC).各指標(biāo)的解釋如下:

(1)Pre:正確預(yù)測(cè)為有自殺傾向樣本的數(shù)量與所有預(yù)測(cè)為有自殺傾向樣本的數(shù)量之比;(2)Recall:所有實(shí)際有自殺傾向樣本中被預(yù)測(cè)正確的比例;(3)F1:精度和召回率的調(diào)和平均值;(4)AUC:用于比較多個(gè)模型的分類(lèi)效果,值越大說(shuō)明分類(lèi)效果越好.

4.3 實(shí)驗(yàn)結(jié)果與分析

4.3.1 特征選擇實(shí)驗(yàn)

采用隨機(jī)森林對(duì)轉(zhuǎn)換后的6373維特征進(jìn)行特征選擇,并按重要性進(jìn)行排序,選定排名前40的特征,重要性排名前十的特征如表1所示.在選定的40個(gè)特征中,有39個(gè)特征是基于梅爾頻譜和梅爾倒譜系數(shù)計(jì)算得到,還有一個(gè)特征為最終基頻候選的發(fā)聲概率,與前文所述語(yǔ)音信號(hào)衰減速度相關(guān).

4.3.2 人群分類(lèi)實(shí)驗(yàn)

為了說(shuō)明特征選擇實(shí)驗(yàn)的有效性,將原始特征集表示為DA,篩選后的特征集表示為DS.由于實(shí)驗(yàn)數(shù)據(jù)樣本量較少,在實(shí)驗(yàn)過(guò)程中,使用十折交叉驗(yàn)證對(duì)數(shù)據(jù)集進(jìn)行劃分,并進(jìn)行10次,最后計(jì)算各指標(biāo)均值用于模型評(píng)估,得到的最佳平均性能如表2所示.

由表2可知,特征選擇使整體分類(lèi)效果都得到了大幅提升,其中RF取得了最好的分類(lèi)效果,平均F1值達(dá)到了86.88%.由于自殺檢測(cè)常與抑郁癥檢測(cè)進(jìn)行對(duì)照,并且存在方法上的相似性,因此本文與目前基于音頻的自殺檢測(cè)方法和抑郁癥檢測(cè)方法進(jìn)行了對(duì)比,結(jié)果如表3所示.其中深度學(xué)習(xí)方法為多模態(tài)融合方法,在本實(shí)驗(yàn)中僅采用了音頻模型部分參與對(duì)比,實(shí)驗(yàn)結(jié)果說(shuō)明了本文的方法在判別罪犯是否具有自傷自殺傾向具有更好的識(shí)別效果.

在驗(yàn)證了特征選擇和模型有效性后,文章還探究了在不同時(shí)間段提取的罪犯音頻對(duì)于模型分類(lèi)效果的影響.罪犯音頻平均時(shí)長(zhǎng)為9.7 min,為了避免提取的音頻子段存在太多重合,以min為時(shí)間單位,將提取的最大子段限定為5 min.音頻的前段、中段、后段分別用B、M、E表示,用下標(biāo)表示時(shí)間長(zhǎng)度,如B2表示音頻開(kāi)始的2 min,M3表示音頻中間的3 min,E5表示音頻最后的5 min.基于音頻子段的人群分類(lèi)實(shí)驗(yàn)選擇分類(lèi)效果最好的RF進(jìn)行,實(shí)驗(yàn)設(shè)置和評(píng)估與前文一致,實(shí)驗(yàn)結(jié)果如表4所示.

4.3.3 實(shí)驗(yàn)分析

結(jié)合表2和表4的數(shù)據(jù)可知,總體趨勢(shì)為音頻時(shí)間越長(zhǎng),模型分類(lèi)效果越好.值得關(guān)注的是,當(dāng)音頻時(shí)長(zhǎng)小于3 min時(shí),音頻中段的分類(lèi)效果最佳,當(dāng)時(shí)長(zhǎng)大于3min后,音頻中段的分類(lèi)效果下降,音頻前段和后段的分類(lèi)效果超過(guò)音頻中段,逐漸接近完整音頻的分類(lèi)效果.此現(xiàn)象可能與音頻整體時(shí)長(zhǎng)、訪(fǎng)談問(wèn)題的設(shè)置有關(guān).音頻整體平均時(shí)長(zhǎng)為9.7 min,均分成三段,每段時(shí)長(zhǎng)約3 min,此時(shí)音頻無(wú)重疊.當(dāng)超過(guò)3 min后,前段和后段音頻與中段音頻的重疊部分增加,分類(lèi)效果均在提升,但中段音頻隨著重疊部分的增加,分類(lèi)性能反而降低,這表現(xiàn)出了中段數(shù)據(jù)對(duì)于整體的有效性和局部的特異性.

為了探究中段數(shù)據(jù)的異?,F(xiàn)象,研究人員對(duì)訪(fǎng)談音頻進(jìn)行了回顧分析.訪(fǎng)談數(shù)據(jù)整體為自由交談,內(nèi)容大致分為三部分:(1)罪犯描述自己的罪行;(2)罪犯描述在獄內(nèi)的身心狀況;(3)罪犯描述對(duì)未來(lái)的憧憬.自殺風(fēng)險(xiǎn)組罪犯的音頻平均時(shí)長(zhǎng)低于對(duì)照組,雖然具體音頻時(shí)長(zhǎng)有差異,但訪(fǎng)談內(nèi)容分布與時(shí)間分割段基本對(duì)應(yīng),全長(zhǎng)音頻的特征相比于子段音頻特征減少了因?yàn)樵L(fǎng)談問(wèn)題不同而引起的差異,其中梅爾頻率倒譜系數(shù)(MFCC)、頻譜(Spectrum)等系列特征差異顯著(P<0.05).結(jié)合表4的實(shí)驗(yàn)結(jié)果,當(dāng)罪犯在自我描述獄內(nèi)身心狀況時(shí),最能體現(xiàn)出與自傷自殺相關(guān)的音頻特征,這對(duì)于后續(xù)訪(fǎng)談問(wèn)題的設(shè)置具有重要的參考意義.

4.3.4 討論

本文以音頻數(shù)據(jù)為例探究了罪犯自殺危險(xiǎn)性評(píng)估工作未來(lái)的應(yīng)用場(chǎng)景,對(duì)于目前的監(jiān)獄工作具有啟發(fā)與指導(dǎo)作用,結(jié)合大數(shù)據(jù)技術(shù)進(jìn)行監(jiān)獄現(xiàn)代化管理是必然的發(fā)展趨勢(shì).與前人研究結(jié)果相似,本文也發(fā)現(xiàn)自殺風(fēng)險(xiǎn)組與對(duì)照組在共振峰特征、頻譜特征、韻律特征上存在差異,但發(fā)現(xiàn)自殺風(fēng)險(xiǎn)罪犯在訪(fǎng)談時(shí)的講話(huà)時(shí)間要低于對(duì)照組,這與之前的研究結(jié)果相反,需要后續(xù)擴(kuò)大數(shù)據(jù)樣本進(jìn)一步驗(yàn)證.

針對(duì)本文數(shù)據(jù)量少、數(shù)據(jù)模態(tài)單一的問(wèn)題,提出以下兩點(diǎn)發(fā)展方向:(1)構(gòu)建獲取罪犯音頻的規(guī)范化流程.通過(guò)訪(fǎng)談獲取音頻數(shù)據(jù)耗時(shí)長(zhǎng),且自然交談的方式具有隨機(jī)性,無(wú)法保證談話(huà)內(nèi)容的質(zhì)量與時(shí)長(zhǎng).構(gòu)建獲取音頻的規(guī)范化流程,包括讓罪犯保持自然狀態(tài)的環(huán)境、有針對(duì)性的問(wèn)題、回答問(wèn)題設(shè)置倒計(jì)時(shí)等,如人機(jī)問(wèn)答、日常打卡的形式,從而獲取高質(zhì)量音頻數(shù)據(jù).(2)融合罪犯多模態(tài)數(shù)據(jù)進(jìn)行危險(xiǎn)性評(píng)估.罪犯多模態(tài)數(shù)據(jù)包括行為表現(xiàn)、文本、生理信號(hào)等,行為表現(xiàn)包括動(dòng)作、姿態(tài)、語(yǔ)音、表情、睡眠等數(shù)據(jù),文本包括獄偵、獄政等記錄數(shù)據(jù),生理信號(hào)包括心率、呼吸、血壓、溫度等.隨著信息化技術(shù)的發(fā)展與專(zhuān)用設(shè)備的研發(fā),未來(lái)對(duì)罪犯實(shí)時(shí)監(jiān)測(cè)預(yù)警評(píng)估成為可能.

5 結(jié) 論

文章提出了一種基于音頻的罪犯自殺危險(xiǎn)性評(píng)估方法,利用機(jī)器學(xué)習(xí)對(duì)罪犯進(jìn)行分類(lèi),實(shí)驗(yàn)表明RF能夠有效區(qū)分罪犯是否具有自殺傾向,相較于傳統(tǒng)的問(wèn)卷評(píng)估更加實(shí)時(shí)和便捷.我國(guó)罪犯的自殺成功率低得利于及時(shí)有效的管控措施,但這本質(zhì)上屬于事后干預(yù),如何在事發(fā)前進(jìn)行防控才是研究重點(diǎn),本文為現(xiàn)代化監(jiān)獄推進(jìn)罪犯的分級(jí)分類(lèi)提供了新的思路和方法.在未來(lái)的工作中,將嘗試采用深度學(xué)習(xí)與機(jī)器學(xué)習(xí)融合分析的方法,納入罪犯的視頻、語(yǔ)言、生理等信息,探索多模態(tài)數(shù)據(jù)有效融合的算法,以取得更好的罪犯?jìng)€(gè)體危險(xiǎn)性評(píng)估效果.

參考文獻(xiàn):

[1]Slade K, Edelman R. Can theory predict the process of suicide on entry to prison? Predicting dynamic risk factors for suicide ideation in a high-risk prison population [J]. Crisis, 2014, 35: 82.

[2]Humber N, Webb R, Piper M, et al. A national case-control study of risk factors among prisoners in England and Wales[J]. Soc Psych Psych? Epid, 2013, 48: 1177.

[3]Favril L, Indig D, Gear C, et al. Mental disorders and risk of suicide attempt in prisoners[J]. Soc Psych Psych Epid, 2020, 55: 1145.

[4]Fazel S, Cartwright J, Norman-Nott A, et al. Suicide in prisoners: a systematic review of risk factors[J]. J Clin Psychiat, 2008, 69: 1721.

[5]呂成榮. 服刑罪犯自殺行為調(diào)查分析[J]. 中國(guó)健康心理學(xué)雜志, 2011, 19: 304.

[6]Organization W H. International association for suicide prevention: preventing suicide in jails and prisons [J]. Brit J Psychiat, 2007, 309: 364.

[7]Daigle M S, Daniel A E, Dear G E, et al. Preventing suicide in prisons, Part II: International comparisons of suicide prevention services in correctional facilities [J]. Crisis, 2007, 28: 122.

[8]Duthé G, Hazard A, Kensey A, et al. Suicide among male prisoners in France: a prospective population-based study [J]. Forensic Sci? Int, 2013, 233: 273.

[9]Hawton K, Linsell L, Adeniji T, et al. Self-harm in prisons in England and Wales: an epidemiological study of prevalence, risk factors, clustering, and subsequent suicide [J]. Lancet, 2014, 383: 1147.

[10]Favril L,Yu R Q, Hawton K, et al. Risk factors for self-harm in prison: a systematic review and meta-analysis [J]. Lancet Psychiat, 2020, 7: 682.

[11]Zhong S L, Senior M, Yu R Q, et al. Risk factors for suicide in prisons: a systematic review and meta-analysis [J]. Lancet Public Health, 2021, 6: e164.

[12]Nock M K, Borges G, Bromet E J, et al. Cross-national prevalence and risk factors for suicidal ideation, plans and attempts [J]. Brit J? Psychiat, 2008, 192: 98.

[13]Favril L, OConnor R C, Hawton K, et al. Factors associated with the transition from suicidal ideation to suicide attempt in prison[J]. Eur? Psychiat, 2020, 63: e101

[14]Jackson N A, Jabbi M M. Integrating biobehavioral information to predict mood disorder suicide risk[J]. Brain Behavi Immuni-Heal, 2022, 24: 100495.

[15]Jabbi M, Weber W, Welge J, et al. Frontolimbic brain volume abnormalities in bipolar disorder with suicide attempts [J]. Psychiat? Res, 2020, 294: 113516.

[16]Hall J A, Harrigan J A, Rosenthal R. Nonverbal behavior in clinician—patient interaction [J]. Appl? Prev? Psychol, 1995, 4: 21.

[17]Ozdas A, Shiavi R G, Silverman S E, et al. Investigation of vocal jitter and glottal flow spectrum as possible cues for depression and near-term suicidal risk [J]. IEEE T Bio-med Eng, 2004, 51: 1530.

[18]Scherer S, Pestian J, Morency L P. Investigating the speech characteristics of suicidal adolescents[C]//Proceedings of the International Conference on Acoustics, Speech and Signal Processing. Vancouver: IEEE, 2013.

[19]Akkaralaertsest T, Yingthawornsuk T. Comparative analysis of vocal characteristics in speakers with depression and high-risk suicide [J]. IJCTE, 2015, 7: 448.

[20]Torous J, Larsen M E, Depp C, et al. Smartphones, sensors, and machine learning to advance real-time prediction and interventions for suicide prevention: a review of current progress and next steps[J]. Curr? Psychiat? Rep, 2018, 20: 51.

[21]Naghavi A, Teismann T, Asgari Z, et al. Accurate diagnosis of suicide ideation/behavior using robust ensemble machine learning: a university student population in the Middle East and North Africa (MENA)Region [J]. Diagnostics, 2020, 10: 956.

[22]楊勁寅. 主題統(tǒng)覺(jué)測(cè)驗(yàn)用于自殺風(fēng)險(xiǎn)識(shí)別[D]. 上海: 華東師范大學(xué), 2022.

[23]Boudreaux E D, Rundensteiner E, Liu F F, et al. Applying machine learning approaches to suicide prediction using healthcare data: Overview and future directions[J]. Front? Psychiatry, 2021, 12: 707916.

[24]Just M A, Pan L, Cherkassky V L, et al. Machine learning of neural representations of suicide and emotion concepts identifies suicidal youth[J]. Nat Hum Behav, 2017, 1: 911.

[25]Silverman M M. The language of suicidology [J]. Suicide Life-Threat, 2006, 36: 519.

[26]Drugman T, Bozkurt B, Dutoit T. A comparative study of glottal source estimation techniques [J]. Comput Speech? Lang, 2012, 26: 20.

[27]Quatieri T F, Malyska N. Vocal-source biomarkers for depression:a link to psychomotor activity [C]//Proceedings of Thirteenth Annual Conference of the International Speech Communication Association. Portland: ISCA, 2012.

[28]France D J, Shiavi R G, Silverman S, et al. Acoustical properties of speech as indicators of depression and suicidal risk [J]. IEEE T Bio-med Eng, 2000, 47: 829.

[29]Stasak B, Epps J, Schatten H T, et al. Read speech voice quality and disfluency in individuals with recent suicidal ideation or suicide attempt [J]. Speech Commun, 2021, 132: 10.

[30]Keskinpala H K, Yingthawornsuk T, Wilkes D M,et al. Screening for high risk suicidal states using mel-cepstral coefficients and energy in frequency bands [C]//Proceedings of the 15th European Signal Processing Conference. Poznan: IEEE, 2007.

[31]Anunvrapong P, Yingthawornsuk T. Characterization of ΔMFCC in depressed speech sample as assessment of suicidal risk[C]//Proceedings of the 2014 International Conference on Advanced Computational Technologies & Creative Media. Pattaya: IIE, 2014.

[32]Ozdas A, Shiavi R G, Wilkes D M, et al. Analysis of vocal tract characteristics for near-term suicidal risk assessment[J]. Method? Inform Med, 2004, 43: 36.

[33]NH NNW, Wilkes M D, Salomon R M. Timing patterns of speech as potential indicators of near-term suicidal risk [J]. Int? J? Multidiscip Curr Res, 2015, 3: 1104.

[34]Chakravarthula S N, Nasir M, Tseng S Y, et al. Automatic prediction of suicidal risk in military couples using multimodal interaction cues from couples conversations [C]//Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing. Barcelona: IEEE, 2020.

[35]Venek V, Scherer S, Morency L P, et al. Adolescent suicidal risk assessment in clinician-patient interaction[J]. IEEE T Affect Comput, 2017, 8: 204.

[36]Yingthawornsuk T, Shiavi R G. Distinguishing depression and suicidal risk in men using GMM based frequency contents of affective vocal tract response[C]//Proceedings of the International Conference on Control, Automation and Systems. Seoul: IEEE, 2008.

[37]He L, Cao C. Automated depression analysis using convolutional neural networks from speech [J]. J? Biomed Inform, 2018, 83: 103.

[38]Amini S, Hao B R, Zhang L F, et al. Automated detection of mild cognitive impairment and dementia from voice recordings: a natural language processing approach [J]. Alzheimers Dement, 2023, 19: 946.

[39]吳曉華. 基于機(jī)器學(xué)習(xí)的語(yǔ)音特征模型在單雙相抑郁患者自殺風(fēng)險(xiǎn)識(shí)別中的應(yīng)用[D]. 廣州: 南方醫(yī)科大學(xué), 2021.

[40]Alhanai T, Ghassemi M M, Glass J. Detecting depression with audio/text sequence modeling of interviews [C]//Proceedings of 19th Annual Conference of the International Speech Communication Association. Hyderabad: ISCA, 2018.

[41]Shen Y, Yang H, Lin L. Automatic depression detection: An emotional audio-textual corpus and a gru/bilstm-based model[C]//Proceedings of 2022 IEEE International Conference on Acoustics, Speech and Signal Processing. Singapore: IEEE, 2022.

引用本文格式:

中 文: 鄭子強(qiáng),何得淮,廖瀟楠,等. 基于音頻的罪犯自殺危險(xiǎn)性評(píng)估[J]. 四川大學(xué)學(xué)報(bào): 自然科學(xué)版, 2023, 60: 063005.

英 文: Zheng Z Q, He D H, Liao X N, et al. Audio based suicide risk assessment of criminals [J]. J Sichuan Univ: Nat Sci Ed, 2023, 60: 063005.

猜你喜歡
機(jī)器學(xué)習(xí)音頻
必須了解的音頻基礎(chǔ)知識(shí) 家庭影院入門(mén)攻略:音頻認(rèn)證與推薦標(biāo)準(zhǔn)篇
基于Daubechies(dbN)的飛行器音頻特征提取
音頻分析儀中低失真音頻信號(hào)的發(fā)生方法
基于詞典與機(jī)器學(xué)習(xí)的中文微博情感分析
基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
前綴字母為特征在維吾爾語(yǔ)文本情感分類(lèi)中的研究
基于支持向量機(jī)的金融數(shù)據(jù)分析研究
機(jī)器學(xué)習(xí)理論在高中自主學(xué)習(xí)中的應(yīng)用
臺(tái)內(nèi)音頻響度控制方式
音頻處理器的調(diào)試