何 泉,吳 磊,柳 瓏
(1.國防科技大學(xué)文理學(xué)院,中國湖南 長沙 410073;2.湖南科技大學(xué)大數(shù)據(jù)與智能決策研究中心,中國湖南 湘潭 411201)
動物行為從宏觀上反映了動物高級中樞神經(jīng)功能、學(xué)習(xí)記憶能力、心理狀態(tài)、運動協(xié)調(diào)性等,可用于評估動物對環(huán)境或藥物的生理反應(yīng)和變化,因此通常應(yīng)用于毒理學(xué)、藥理學(xué)、運動損傷及恢復(fù)等方面的研究。近年來,由于動物行為數(shù)據(jù)采集手段不斷改善和提高,大量復(fù)雜高維的數(shù)據(jù)隨之產(chǎn)生,這些行為數(shù)據(jù)具有更加客觀、精確、完整的特點。盡管近些年來,行為自動分析技術(shù)逐漸取代了過去低效率的人工分析方式,但是大部分行為分析技術(shù)依然只關(guān)注行為的完成度,如大鼠完成直立的次數(shù)、進入中間場地的次數(shù)、走完迷宮的次數(shù)等。而多個變量之間可能已經(jīng)不再適用于傳統(tǒng)假設(shè)模型,在這樣的情況下,依靠于簡單計數(shù)或計時的傳統(tǒng)分析方法顯然已遠遠滿足不了當(dāng)下需求,研究人員需要依靠機器學(xué)習(xí)等更加先進的手段對數(shù)據(jù)進一步加工處理。機器學(xué)習(xí)方法提供了非常適合研究這些動物行為數(shù)據(jù)的途徑,能夠?qū)崿F(xiàn)高質(zhì)量、高通量的行為分析。
盡管目前機器學(xué)習(xí)應(yīng)用覆蓋的領(lǐng)域極廣,但是國內(nèi)外對機器學(xué)習(xí)在動物行為分析領(lǐng)域的研究依舊相對較少,綜述性文獻更是寥寥無幾。本文在動物行為數(shù)據(jù)采集方式不斷發(fā)展的背景下,綜合闡述了機器學(xué)習(xí)在動物行為各方面研究的應(yīng)用、優(yōu)勢及挑戰(zhàn)等相關(guān)內(nèi)容,為未來動物行為研究工作提供參考。
與微觀的生理學(xué)分析不同,動物行為的發(fā)生是由多種混合因素所控制的,如大腦功能、肢體狀態(tài)、晝夜節(jié)律等,它反映的是動物的整體狀態(tài)。因此,定性和定量分析對動物行為的研究非常重要。科學(xué)的行為學(xué)研究需要建立通用的基準(zhǔn)和框架等一系列標(biāo)準(zhǔn),在這些標(biāo)準(zhǔn)之下才能獲得相對客觀的、可靠的、可相互交流的行為實驗數(shù)據(jù)。因此,構(gòu)建清晰合理的動物行為結(jié)構(gòu),對行為學(xué)領(lǐng)域的研究具有重要意義,也有助于研究人員開發(fā)出切實可行的動物行為識別算法。
一般而言,行為結(jié)構(gòu)從大到小可分為行為譜(ethogram)、動作(movement)、姿勢(pose)3 個層次[1](圖1)。行為譜為一系列可重復(fù)的且可被定義的動作的組合[2]。例如:在大鼠的行為中,行為譜包括梳洗、求偶、覓食等。動作則是包含于行為譜中的一系列完整的最小分割單元,如步行、轉(zhuǎn)彎、直立等。而姿勢指的是某一時刻的身體形狀和位置。行為譜、動作、姿勢三者共同構(gòu)成了動物基本行為結(jié)構(gòu),為研究人員理解動物行為和開發(fā)行為研究方法提供了基本依據(jù)。
圖1 行為結(jié)構(gòu)Fig.1 The behavior structure
由于行為采集手段的不斷發(fā)展,選取適當(dāng)?shù)男袨椴杉b置就能夠產(chǎn)生大量行為數(shù)據(jù),采集到的數(shù)據(jù)由原來的單一變?yōu)閺?fù)雜、少量變?yōu)槎嗔?、間斷變?yōu)檫B續(xù)。早期的動物行為學(xué)研究常常通過判斷指定的某一行為特征達到評估行為能力的目的,這種研究方式不僅單一、易受人為主觀判斷的干擾,而且還有可能忽略潛在的判斷指標(biāo)。新的采集手段意味著必然要發(fā)展新的數(shù)據(jù)分析方法,在大數(shù)據(jù)時代,必然也要緊隨時代步伐。機器學(xué)習(xí)方法憑借其優(yōu)良的魯棒性、適應(yīng)性以及強大的大數(shù)據(jù)處理能力,越來越受到行為研究者的青睞。其實,機器學(xué)習(xí)方法在動物行為分析中的應(yīng)用已經(jīng)很常見,并有望成為未來動物行為數(shù)據(jù)處理的“主力軍”。
顧名思義,機器學(xué)習(xí)就是將數(shù)據(jù)輸入到計算機,通過某種算法使得計算機發(fā)現(xiàn)數(shù)據(jù)中隱含的規(guī)律,獲取新的知識和經(jīng)驗,產(chǎn)生相適應(yīng)的模型,并對其他同類數(shù)據(jù)具有預(yù)測功能。
機器學(xué)習(xí)算法的應(yīng)用受到數(shù)據(jù)質(zhì)量的影響。例如:障礙物遮擋、信號丟失等導(dǎo)致的數(shù)據(jù)缺失,系統(tǒng)誤差、信號干擾等導(dǎo)致的數(shù)據(jù)錯誤,采集時間不夠、采集條件限制所導(dǎo)致的數(shù)據(jù)不足等,都會對算法效果產(chǎn)生影響。當(dāng)數(shù)據(jù)存在缺失和錯誤時,研究人員需要盡可能擴大有效數(shù)據(jù)量,才能在一定程度上抵御數(shù)據(jù)缺失和數(shù)據(jù)錯誤帶來的學(xué)習(xí)失誤,因此足夠量的準(zhǔn)確數(shù)據(jù)是保證機器學(xué)習(xí)算法良好運行的前提。在處理行為數(shù)據(jù)時,如何定義和提取關(guān)鍵特征至關(guān)重要。通常,在建立學(xué)習(xí)模型之前,研究人員需要人為觀察并挑選出可能能夠區(qū)分和定義行為的特征,并在訓(xùn)練模型的過程中注重參數(shù)的調(diào)節(jié),這樣在后續(xù)處理中才有可能“一勞永逸”,利用已訓(xùn)練好的模型大批量處理同類新數(shù)據(jù)。
根據(jù)是否需要對輸入數(shù)據(jù)分配標(biāo)簽,機器學(xué)習(xí)可分為監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)(表1)。以下就兩者分別進行闡述。
表1 機器學(xué)習(xí)在行為數(shù)據(jù)上的應(yīng)用Table 1 Application of machine learning in behavior data
監(jiān)督學(xué)習(xí)通過已有的輸入數(shù)據(jù)與輸出數(shù)據(jù)之間的對應(yīng)關(guān)系生成一個函數(shù),將輸入映射到合適的輸出。它需要在進行識別分類之前人為對輸入數(shù)據(jù)添加相應(yīng)標(biāo)簽,即在動物行為識別中,研究人員首先需要對動物行為數(shù)據(jù)進行分類并構(gòu)建合適的特征。典型的監(jiān)督學(xué)習(xí)方法有:支持向量機(support vector machine,SVM)、決策樹(decision tree)、貝葉斯網(wǎng)絡(luò)(Bayesian network)、神經(jīng)網(wǎng)絡(luò)(neural network,NN)等。
監(jiān)督學(xué)習(xí)是目前動物行為研究中使用最多的分析方法。其中,SVM通常用于動物行為分類,其通過對動物運動中的各項特征進行劃分,找到最佳分類間隔,構(gòu)建行為分類模型[3]。例如:三軸加速度傳感采集到的加速度數(shù)據(jù)可以用于判別動物是否處于行走、站立、躺臥狀態(tài)。隱馬爾可夫模型(hidden Markov model,HMM)可以對動物行為模塊之間的轉(zhuǎn)換進行預(yù)測和判斷,構(gòu)建合理的行為序列[4]。神經(jīng)網(wǎng)絡(luò)也可用于行為識別與分類。相比于傳統(tǒng)機器學(xué)習(xí)算法,神經(jīng)網(wǎng)絡(luò)用作監(jiān)督學(xué)習(xí)時,能夠簡化特征提取步驟。它通常由機器來自動學(xué)習(xí)并提取數(shù)據(jù)特征,但是它對數(shù)據(jù)量要求更高,小樣本數(shù)據(jù)中存在的偏離值更容易使特征提取出現(xiàn)偏差,從而導(dǎo)致準(zhǔn)確率下降[5]。同時,欠擬合和過擬合的出現(xiàn)也會導(dǎo)致神經(jīng)網(wǎng)絡(luò)的預(yù)測準(zhǔn)確率下降。因此,研究人員在應(yīng)用神經(jīng)網(wǎng)絡(luò)時需要調(diào)節(jié)多個參數(shù)以使其達到最優(yōu)狀態(tài)。根據(jù)筆者所調(diào)研的現(xiàn)有文獻,神經(jīng)網(wǎng)絡(luò)目前多應(yīng)用于視頻采集的動物行為數(shù)據(jù)[6~8]。Stern等[6]利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)對視頻進行逐幀檢測,以分析果蠅是否與產(chǎn)卵基質(zhì)相接觸,所得結(jié)果的錯誤率僅為0.072%,該研究甚至發(fā)現(xiàn)了數(shù)據(jù)中由于人為大意出現(xiàn)的標(biāo)注錯誤。Arac等[7]利用跟隨于長短時記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory network,LSTM)后的GoogLeNet構(gòu)成的CNN模型來監(jiān)測小鼠爪子對食物顆粒的抓取,并利用相同的網(wǎng)絡(luò)來監(jiān)測小鼠在三室測試中的活動,該研究還引入遷移學(xué)習(xí)以解決大量圖片需要人工標(biāo)記的問題。除了視頻圖像外,神經(jīng)網(wǎng)絡(luò)同樣可以應(yīng)用于其他類型的數(shù)據(jù),如:將神經(jīng)網(wǎng)絡(luò)引入三維標(biāo)記點坐標(biāo)[9],可自動學(xué)習(xí)坐標(biāo)點隱藏的規(guī)律并識別分類。
相比于監(jiān)督學(xué)習(xí),無監(jiān)督學(xué)習(xí)在動物行為識別中使用頻率較低。無監(jiān)督學(xué)習(xí)的目的是探尋原始資料中的潛在規(guī)則,了解資料的內(nèi)部結(jié)構(gòu),它不需要人為對數(shù)據(jù)安排相應(yīng)標(biāo)簽,這也是與監(jiān)督學(xué)習(xí)的最大區(qū)別。無監(jiān)督學(xué)習(xí)主要包括聚類、降維、異常值檢測等。Yabumoto等[10]用主成分分析(principal component analysis,PCA)方法對酒精給藥研究中絨猴位置相對應(yīng)的每個坐標(biāo)值進行分析,將狨猴的運動模式分為正常、醉酒(鎮(zhèn)靜與興奮)、興奮狀態(tài)。Rezaei等[11]采用自適應(yīng)高斯混合模型(adaptive Gaussian mixed model,AGMM)算法檢測動物的質(zhì)心,提取動物在長時間內(nèi)的運動軌跡,并利用PCA法對被定位動物的三維深度數(shù)據(jù)進行分析,確定動物的姿態(tài)。無監(jiān)督學(xué)習(xí)也可用于發(fā)現(xiàn)人眼不易察覺的新的運動模式或運動異常情況。為了探尋果蠅幼蟲的神經(jīng)活動與行為之間的聯(lián)系,Vogelstein等[12]應(yīng)用迭代去噪樹算法(iterative denoising tree,IDT)確認先前已知的行為特征并發(fā)現(xiàn)了新的行為特征。當(dāng)應(yīng)用無監(jiān)督學(xué)習(xí)處理數(shù)據(jù)時,因為沒有“正確標(biāo)簽”的驗證數(shù)據(jù)集,所以其錯誤標(biāo)記率和準(zhǔn)確性的計算是相當(dāng)困難的。因此,可以利用標(biāo)簽平滑的方式,將原始數(shù)據(jù)與平滑后標(biāo)簽數(shù)據(jù)對比,從而評價無監(jiān)督學(xué)習(xí)的性能[13]。
早在20世紀(jì),科學(xué)家就為研究動物行為發(fā)明了多種采集行為的設(shè)備和方法,如紅外傳感器[14]、觸摸屏[15]、激光多普勒測振儀[16]、加速度傳感器[17]、視頻記錄(包括普通 2D 相機和深度相機)[3~4,18~19]、光學(xué)標(biāo)記捕捉系統(tǒng)[20~25]等。行為采集設(shè)備的發(fā)展使獲取到的行為數(shù)據(jù)量激增,并且形式更加豐富多樣,機器學(xué)習(xí)無疑能為這些數(shù)據(jù)提供更加便捷、快速的處理方法。機器學(xué)習(xí)主要應(yīng)用于行為分析的如下幾個領(lǐng)域:行為識別與分類、運動狀態(tài)切換及行為預(yù)測、行為結(jié)構(gòu)構(gòu)建、相互作用及社會關(guān)系等。但是,行為數(shù)據(jù)的分析并不只是簡單應(yīng)用某種單一類型的學(xué)習(xí)方式,其往往需要監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)共同評價。比如:PCA降維和SVM的結(jié)合可以先對大量行為數(shù)據(jù)特征降維,隨后選擇貢獻更大的主要特征輸入到SVM中進行分類,在保證相對高的正確率的同時,減少冗余的特征,降低計算量,提高計算效率。
統(tǒng)計某一特定行為發(fā)生的頻率以及時長是傳統(tǒng)行為分析中較為重要的一環(huán)。比如,在大鼠曠場實驗中,直立行為常被解讀為探索性指標(biāo),以表征大鼠興奮性和活動性。有研究報道,在帕金森病大鼠模型建立后,相比于假手術(shù)對照組,實驗組大鼠直立行為次數(shù)明顯減少,并與其大腦損傷程度呈正相關(guān)[26~27]。過去,由于受到行為采集設(shè)備和數(shù)據(jù)分析方法發(fā)展的限制,這些行為實驗的結(jié)果通常由受過訓(xùn)練的實驗人員進行分類和計數(shù),但人工統(tǒng)計方式工作量大,耗時費力,且不能保證不同實驗人員判斷標(biāo)準(zhǔn)的一致性,而新的行為采集方式的發(fā)展和數(shù)據(jù)分析方法理論的成熟得以讓行為分類及計數(shù)走向自動化。
一種最簡單的行為自動分類的方式就是人為對行為直接進行定義,比如通過設(shè)置速度閾值可以定義動物的運動狀態(tài)[28]。但是,依據(jù)這種方法構(gòu)建的行為分類模型只能選取少量特征進行定義[29],很難調(diào)到最優(yōu)值,并難以定義更加復(fù)雜的行為[30]。通過監(jiān)督學(xué)習(xí)方式,人們可以訓(xùn)練帶有標(biāo)簽的行為數(shù)據(jù)得到相應(yīng)的行為分類模型,并對沒有標(biāo)簽的行為數(shù)據(jù)進行分類預(yù)測。但在進行監(jiān)督學(xué)習(xí)之前,研究人員不僅需要人為添加標(biāo)簽,往往還需要定義行為特征,如運動速度、身體傾斜角度、頭部偏角等等,然后再把這些特征輸入到監(jiān)督學(xué)習(xí)的分類器里進行學(xué)習(xí)分類。盡管有研究直接使用原始數(shù)據(jù),如三軸加速度傳感器獲得的加速度值[31],作為特征輸入也能獲得良好效果,但是另外一些原始數(shù)據(jù),如相機拍攝的照片、錄制的視頻,往往很難直接獲得良好的分類效果。此外,研究人員往往希望能夠在動物行為上觀測到更加易于理解的變化,比如:動物的頭部是否發(fā)生左右不對稱偏轉(zhuǎn)、動物肢體運動的靈活性是否下降、動物的某一行為發(fā)生頻率是否有所變化等,而不僅是加速度、標(biāo)記點坐標(biāo)變化等此類較為不直觀的特征。所以,人為指定或構(gòu)建具有物理學(xué)意義的特征,也便于對行為的變化有更加直觀的了解。監(jiān)督學(xué)習(xí)在行為學(xué)研究上已有不少應(yīng)用。Wang等[3]利用監(jiān)督學(xué)習(xí)方式從深度圖象中提取2D和3D特征,并通過SVM訓(xùn)練人工標(biāo)記的數(shù)據(jù)集得到一個行為多分類模型,分析結(jié)果顯示,同時對2D和3D特征進行訓(xùn)練可以獲得更高的分類精確度。Steele等[29]基于不同行為的線性組合,利用邏輯回歸方法構(gòu)建疾病組和對照組的二分類模型。該模型能對6周齡后的亨廷頓病轉(zhuǎn)基因小鼠和感染朊病毒3.5個月后的小鼠與其各自對照組進行有效區(qū)分。Bidder等[31]利用K近鄰(k-nearest neighbor,KNN)算法對8個物種的5種行為模式進行分析,結(jié)果表明其分類準(zhǔn)確度和精確度與更復(fù)雜的方法相似,并且計算量更少。
當(dāng)對相機拍攝的圖像或視頻進行分析時,通常需要先檢測出畫面中動物所在位置,以便與環(huán)境背景區(qū)分,再對檢測框中的動物進行行為分類或其他操作。動物圖像目標(biāo)檢測與分類通常應(yīng)用到深度學(xué)習(xí)方法。根據(jù)所需步驟數(shù),常見的基于深度學(xué)習(xí)的目標(biāo)檢測方法可以分為兩大類:第一類為兩步的目標(biāo)檢測算法,常見的包括R-CNN[32]、SPP-net[33]、Fast R-CNN[34]、Faster R-CNN[35]、RFCN[36]以及Mask R-CNN[37]等;第二類為一步目標(biāo)檢測算法,常見的有 OverFeat[38]、YOLO[39~40]、SSD[41~42]等。還有一些算法嘗試結(jié)合兩者優(yōu)勢,比如RON[43]等。相較于兩步的目標(biāo)檢測算法,一步目標(biāo)檢測算法速度更快,但是在精度上表現(xiàn)不佳;而兩步的目標(biāo)檢測算法雖然在速度上慢于一步目標(biāo)檢測算法,但其在小尺度目標(biāo)上的檢測精度要優(yōu)于一步目標(biāo)檢測算法。例如:Thenmozhi等[44]使用SSD(single shot multibox detector)算法對山羊進行識別并分類,其異常行為預(yù)測率與YOLO算法對比高出了3%~6%。在該項研究當(dāng)中,深度學(xué)習(xí)的利用大大簡化了最為繁瑣的特征提取環(huán)節(jié)。
機器學(xué)習(xí)算法在行為識別與分類上得到了很好的應(yīng)用,但因為其在行為分類上的應(yīng)用需要預(yù)先定義行為類別,且無法自動發(fā)現(xiàn)新的行為類別,所以當(dāng)其遇到未預(yù)先定義的行為時,很可能實施錯誤分類。在這種情況下,研究人員可以結(jié)合無監(jiān)督學(xué)習(xí)方法探索行為結(jié)構(gòu),及時發(fā)現(xiàn)新行為或異常行為。
動物日常行為之間的轉(zhuǎn)換都具有一定的轉(zhuǎn)換概率,根據(jù)動物之前以及當(dāng)下的行為狀態(tài)可以判斷之后可能發(fā)生的行為的概率,如大鼠飲水之后進食的概率要大于躺下休息或前進行走的概率。構(gòu)建動物行為時間序列模型可預(yù)測運動狀態(tài)切換情況,目前較為常用的模型為HMM。
在HMM中,t時刻的狀態(tài)僅依賴于t-1時刻的狀態(tài),該模型可通過前面的狀態(tài)計算出后一個狀態(tài)出現(xiàn)的概率,因此HMM可以用于估計動物在不同行為模式之間切換的概率,并達到預(yù)測行為的目的。該模型可用圖2表示。
圖2 隱馬爾可夫模型示意圖圖中Dt表示在t時刻下的隱藏狀態(tài),St表示在t時刻下的可見狀態(tài),箭頭代表狀態(tài)的轉(zhuǎn)換和輸出。每個狀態(tài)之間都有一定的轉(zhuǎn)換概率,轉(zhuǎn)換概率用P表示,如P(St/Dt)表示在Dt狀態(tài)下發(fā)生St事件的概率。Fig.2 The hidden Markov modelDtrepresents the hidden state at time t,Strepresents the observation at time t.There is a certain transitional probability between each state.P represents transitional probability.For example,P(St/Dt)is the Markov transitional probability from the state Dtat time t to the state Stat time t.
Jiang等[45]利用HMM來描述小鼠行為的時序特征,他們構(gòu)建了一個混合深度學(xué)習(xí)框架,這個框架由兩個部分構(gòu)成,首先是無監(jiān)督學(xué)習(xí)層,用于編碼視覺和上下文特征,隨后是監(jiān)督學(xué)習(xí)層,用于評估HMM的觀測概率;該模型對籠內(nèi)小鼠行為的識別率達到96.5%,比人眼識別的71.6%高出了20多個百分點。Michelot等[46]開發(fā)了一個名為moveHMM的程序包,用以分析動物運動數(shù)據(jù),該程序包使研究人員能夠更加直觀地訪問HMM框架。
過去,行為模塊是通過人類仔細觀察識別出來的,但近年來技術(shù)的不斷進步使行為的組成部分有了更全面的描述。行為結(jié)構(gòu)的構(gòu)建可用到機器學(xué)習(xí)算法中的無監(jiān)督學(xué)習(xí),無監(jiān)督學(xué)習(xí)可用于挖掘行為的內(nèi)在固有結(jié)構(gòu),探尋行為的基本單元、模塊或組分并構(gòu)建合理的行為結(jié)構(gòu)層次,而基本行為單元的發(fā)現(xiàn)可以為構(gòu)建復(fù)雜行為提供結(jié)構(gòu)基礎(chǔ)。因為無監(jiān)督學(xué)習(xí)不需要預(yù)先為數(shù)據(jù)安排標(biāo)簽,所以它探尋的數(shù)據(jù)結(jié)構(gòu)相對比較客觀。2015年,Wiltschko等[4]提出了一種基于機器視覺和機器學(xué)習(xí)的用于評估行為模塊分類以及行為間聯(lián)系的新方法。該研究使用基于深度測量的三維成像系統(tǒng)構(gòu)造小鼠三維姿勢動力學(xué)在亞秒時間尺度上的結(jié)構(gòu),利用無監(jiān)督學(xué)習(xí)等計算模型可有效地將小鼠行為描述為一系列可重復(fù)的、具有轉(zhuǎn)移概率的行為序列模塊。該研究說明,無監(jiān)督學(xué)習(xí)在動物行為分析上的最大優(yōu)勢在于,它具有開發(fā)和發(fā)現(xiàn)人眼無法察覺到的新行為或異常行為及其潛在規(guī)律的潛能,并能系統(tǒng)揭示實驗中行為的整體結(jié)構(gòu),為破譯在環(huán)境、基因和神經(jīng)活動影響下的行為語言描述建立了一個客觀的框架,這是需要人為添加行為標(biāo)簽的監(jiān)督學(xué)習(xí)無法做到的。
行為由各種重復(fù)的模塊所構(gòu)成,但不同行為并不是孤立存在的,而是具有一定的過渡性和連續(xù)性。有觀點認為,大腦通過特定的序列表達更簡單的行為模式化模塊來構(gòu)建連貫的行為。在上面提到的文獻[4]中,作者利用AR-HMM算法構(gòu)建不同行為模塊間切換狀態(tài)模型,他提出將單個行為模塊稱為行為“音節(jié)”,而這些音節(jié)之間的過渡部分稱為行為“語法”。由此可見,在機器學(xué)習(xí)算法的幫助下,未來行為模塊的構(gòu)造和模塊轉(zhuǎn)變將更加清晰明了,可為了解大腦對行為的控制提供理論支撐。
在行為神經(jīng)科學(xué)中,社會行為是神精病學(xué)研究和動物模型神經(jīng)學(xué)測試的重要組成部分。異常的社會行為可以指示神精疾病,如亨廷頓病、阿爾茨海默病、雷特綜合征等[47]。因此,研究實驗動物的社會行為將有助于疾病的動物實驗研究向人類的臨床試驗和治療過渡。社會關(guān)系根據(jù)兩只動物的相對位置及其變化大致可分為以下幾類:接近、接觸、追隨、遠離、分離等,在這基礎(chǔ)上還可以進一步細分,如接觸可分為頭頭相接、頭尾相接、并排、背對背等[48]。另一方面,人們還可根據(jù)動物間的社會行為目的來區(qū)分行為模式,如攻擊、求偶、捕食等。目前,將機器學(xué)習(xí)應(yīng)用于社會行為數(shù)據(jù)分析的文獻較少,現(xiàn)有報道大多都是根據(jù)制定的人工規(guī)則來研究社會行為。Lorbach等[47]利用期待最大化算法構(gòu)建兩只大鼠之間相互關(guān)系的高斯混合模型。Arac等[7]利用機器學(xué)習(xí)方法研究兩只小鼠間的社會關(guān)系互動,用YOLO 3神經(jīng)網(wǎng)絡(luò)來檢測小鼠的位置,計算兩只小鼠身體重心的距離以及鼻尖尾部之間的距離,以確認小鼠之間鼻尖貼鼻尖、鼻尖貼身體、鼻尖貼尾部等互動情形。
除了以上所提到的幾種應(yīng)用外,機器學(xué)習(xí)還可以應(yīng)用于軌跡追蹤[46]、行為數(shù)據(jù)降維、行為變化機制研究[4]、行為與神經(jīng)活動關(guān)系[49]等方面,應(yīng)用范圍非常廣,但它需要使用者了解一定的編程知識以及算法背后的數(shù)學(xué)原理,因此對于大部分沒有編程基礎(chǔ)的生物研究者而言,其使用的門檻往往也較高。不過,現(xiàn)已開發(fā)的一些程序包[46]能夠讓動物行為研究者更方便地將機器學(xué)習(xí)應(yīng)用于自己的研究當(dāng)中,盡管使用的靈活度有限,但無疑也提供了一些便利。
盡管機器學(xué)習(xí)方法的發(fā)展為行為學(xué)研究帶來了極大便利,但機器學(xué)習(xí)行為學(xué)應(yīng)用依舊面臨著許多挑戰(zhàn),這不僅是機器學(xué)習(xí)的本質(zhì)使然,更是動物行為研究特點所決定的。
機器學(xué)習(xí)的首要任務(wù)是獲取合適的數(shù)據(jù)。但是,動物行為以及其生存環(huán)境的復(fù)雜性為數(shù)據(jù)獲取帶來困難。一方面,在視頻錄制的動物行為采集中,由于不可避免的遮擋,攝像頭難以全方位捕捉到動物體態(tài),而三軸加速度傳感器等雖不受障礙物遮擋,卻也很難獲得動物活動全貌;另一方面,動物行為易受到人為干擾,尤其在實驗過程中,不可避免地與人類接觸以及實驗環(huán)境條件的影響,會引起動物警覺。因此,在采集動物行為數(shù)據(jù)的時候,要盡可能避免人為干擾,同時也要進一步改良實驗裝置。
特征選擇是機器學(xué)習(xí)過程中很重要的一環(huán),直接決定機器學(xué)習(xí)的效果。目前這一部分并沒有太多的規(guī)律或方法可循,主要的特征選擇方式還是依靠人類經(jīng)驗,通過人的觀察找到可能有意義的指標(biāo),研究者再將這些指標(biāo)輸入到機器學(xué)習(xí)中進行訓(xùn)練。盡管如此,還是有一些方法和過程能夠用于選擇參考和檢驗所選特征的優(yōu)劣度。獲取特征的過程被稱為特征工程,包括特征構(gòu)建、特征提取、特征選擇3個部分(表2)。
表2 特征工程過程及方法Table 2 The process and common methods of feature engineering
選擇合適的算法也是動物行為學(xué)研究的一個挑戰(zhàn)。由于相關(guān)研究相對較少以及動物種類與行為的多樣性和復(fù)雜性,目前各種算法之間的效果很難有一個標(biāo)準(zhǔn)來比較。對于生物研究者而言,使用機器學(xué)習(xí)需要懂一定的編程知識和算法數(shù)學(xué)原理。根據(jù)現(xiàn)有文獻資料,筆者在圖3中盡可能多地列出可能適合于行為分析的機器學(xué)習(xí)算法,以供讀者參考。圖中實線連接線為該分析用到的主要算法,虛線連接線為可考慮使用的算法,但這個分類并不絕對,研究者需要根據(jù)實際情況選擇適合的算法,比較不同算法的效果以獲得最優(yōu)結(jié)果。
圖3 機器學(xué)習(xí)算法在行為分析中的應(yīng)用Fig.3 Application of machine learning in behavior analysis
機器學(xué)習(xí)作為近年來備受青睞的數(shù)據(jù)處理方法,與傳統(tǒng)行為分析方法相比有著巨大的優(yōu)勢。機器學(xué)習(xí)算法在動物行為數(shù)據(jù)上的應(yīng)用,可以提高數(shù)據(jù)分析效率和準(zhǔn)確性,識別和預(yù)測動物行為,分析動物行為結(jié)構(gòu)與社會關(guān)系。它在實驗動物行為試驗、生態(tài)監(jiān)測、畜牧業(yè)管理等領(lǐng)域都有很大的應(yīng)用潛力。
實驗動物通常被作為研究生命原理和功能的承載者。由于生命機體的復(fù)雜性以及代謝通路的代償作用,微觀生理變化不一定能夠表現(xiàn)在宏觀上,而動物行為則是動物整體狀態(tài)的表現(xiàn),它從宏觀上反映了動物高級中樞神經(jīng)功能、學(xué)習(xí)記憶能力、心理狀態(tài)、運動協(xié)調(diào)性等,可評估動物對環(huán)境或藥物的身體反應(yīng)和變化。傳統(tǒng)的動物行為學(xué)通過某種特定的行為學(xué)實驗評估動物的某項生理行為指標(biāo),如:水迷宮實驗用于監(jiān)測動物的學(xué)習(xí)和記憶能力,曠場實驗用于判斷大鼠的活躍度、緊張度和興趣度等,懸尾實驗用于評價大鼠抑郁狀態(tài)……以往的這些傳統(tǒng)行為實驗通常不會產(chǎn)生大量(超出人工處理能力范圍)的行為數(shù)據(jù),而近年來傳感器、數(shù)字圖像、三維標(biāo)記的發(fā)展對行為數(shù)據(jù)處理提出了新的要求。相較于傳統(tǒng)的人工和軟件分析,機器學(xué)習(xí)極大增強了數(shù)據(jù)分析能力,并帶來一種更加靈活、客觀、準(zhǔn)確的研究手段,為未來實驗動物運動異常模型的建立和評估提供了有效方法[11]。
除了實驗動物學(xué)以外,機器學(xué)習(xí)在生態(tài)學(xué)研究和畜牧業(yè)管理也發(fā)揮了極大作用。在自然生態(tài)環(huán)境中,野生動物會由于覓食、遷徙、求偶、躲避捕食等活動需要而轉(zhuǎn)移位置。研究者通過動物的運動特征可得知其運動狀態(tài),如在覓食時,動物會用短步緩慢移動,而在躲避攻擊時會用長步快速移動。觀察野生動物的活動通??梢酝ㄟ^附著傳感器、全球定位系統(tǒng)(global positioning system,GPS)、衛(wèi)星遙感技術(shù)等來獲取動物活動信息。應(yīng)用機器學(xué)習(xí)算法可以大大減輕數(shù)據(jù)分析的壓力,提供合理的預(yù)測模型。機器學(xué)習(xí)算法可用于研究動物對種子的傳播作用[50]、野生動物遷徙[51]、棲息地選擇[52]等,有助于保護野生動植物多樣性,管理棲息地,維護自然環(huán)境平衡。在畜牧業(yè)動物管理方面,機器學(xué)習(xí)算法可以識別動物情緒、預(yù)警疾病、監(jiān)測飲食等,判斷動物是否受到不良因素刺激,有助于農(nóng)場管理人員及時排除問題,改善動物生活環(huán)境,提高動物福利,有效減少動物死亡率,降低農(nóng)場損失。
綜上所述,隨著信息化的發(fā)展,研究者要順應(yīng)大數(shù)據(jù)潮流,結(jié)合現(xiàn)代化信息手段,開發(fā)動物行為采集新方法以及行為分析新算法,靈活運用機器學(xué)習(xí)算法,提高動物行為學(xué)分析的高效性和準(zhǔn)確性。