国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于標(biāo)志點法的煙草葉形提取與判別

2022-09-07 09:08鐘培閣周也瑩張彥石屹郭焱李保國馬韞韜
關(guān)鍵詞:開花期煙草精度

鐘培閣,周也瑩,張彥,石屹,郭焱,李保國,馬韞韜*

(1.中國農(nóng)業(yè)大學(xué)土地科學(xué)與技術(shù)學(xué)院,北京 100193;2.中國農(nóng)業(yè)科學(xué)院煙草研究所,農(nóng)業(yè)農(nóng)村部煙草生物學(xué)與加工重點實驗室,山東 青島 266101)

葉片是植物的光合器官,不同種類植物的葉片具有不同的特征?;谌~片的植物表型特征提取在種質(zhì)資源的保護(hù)和利用、作物品種間的分類識別以及優(yōu)質(zhì)表型特征的篩選等方面具有重要的現(xiàn)實意義[1]。隨著計算機(jī)圖像處理、模式識別以及機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,對植物葉片特征的提取也從傳統(tǒng)的手動測量與人工鑒定發(fā)展到采用計算機(jī)自動提取[2-4],不僅減少了工作量,也去除了主觀因素的影響,大大增加了特征提取的精度與效率。

植物葉片特征可以從葉形、顏色、葉脈、紋理等多個方面獲取。LARESE 等[5]采用機(jī)器學(xué)習(xí)方法根據(jù)葉脈特征實現(xiàn)了豆科植物的自動分類。MUNISAMI 等[6]開發(fā)了一個能夠利用葉片形狀和顏色直方圖等信息實現(xiàn)植物特征識別的系統(tǒng)。鄭一力等[7]提取葉片的形狀和紋理作為葉片多特征,實現(xiàn)了對植物葉片的快速分類識別。在以上各種葉片表型研究中,對葉形特征的研究主要集中在一些基本幾何形狀的提取上,如葉片長、葉片寬、葉面積、葉周長、質(zhì)心、葉片長寬比等[3]。若要對葉形的細(xì)微差異進(jìn)行捕捉,需要采用更為精確的測量方法。

幾何形態(tài)學(xué)是一門對形態(tài)差異進(jìn)行定量分析和比較的學(xué)科[8]。采用幾何形態(tài)的測量方法可以量化物體的輪廓信息,便于后續(xù)的數(shù)據(jù)處理和分析。標(biāo)志點法是實現(xiàn)幾何形態(tài)測量的最主要的手段。其主要原理為在目標(biāo)物體上選擇具有代表性的標(biāo)志點并剔除輪廓和大小信息,將得到的二維點陣投射到相同空間進(jìn)行樣本間的比較分析[9]。隨著標(biāo)志點測量技術(shù)的發(fā)展,很多學(xué)者將其應(yīng)用到植物研究中。CHITWOOD 等[10]采用標(biāo)志點和橢圓傅里葉描述符對不同種類和不同葉片節(jié)點的西番蓮屬植物葉片進(jìn)行比較分析。FELDMANN 等[11]將包括標(biāo)志點法在內(nèi)的多種幾何形態(tài)測量方法與機(jī)器學(xué)習(xí)算法結(jié)合進(jìn)行草莓形狀分類。在國內(nèi),標(biāo)志點法在植物葉片表型上的應(yīng)用較少,僅有少量學(xué)者采用該方法對樹葉進(jìn)行研究[12],其在農(nóng)作物葉片形狀特征提取上幾乎沒有應(yīng)用。

煙草(Nicotiana tabacumL.)為管狀花目、茄科植物,是一種重要的葉用經(jīng)濟(jì)作物。不同品種的煙草葉片形狀不同,同一株煙草不同生長時期、不同葉位的葉片形狀也存在差異。目前對煙草葉形的定義主要基于人工經(jīng)驗判別,按照葉片最寬位置、葉片長寬比來描述,缺少精確的定量化評價方法。本研究以煙草為研究對象,基于幾何形態(tài)測量方法自動提取煙草葉形信息,并采用機(jī)器學(xué)習(xí)方法對不同的煙草葉形進(jìn)行判別分析來對比標(biāo)志點數(shù)據(jù)和常用葉形指標(biāo)之間的差異,旨在為煙草葉形信息的精確提取提供新方法。

1 材料與方法

1.1 試驗材料

田間試驗于2019年5月5日—8月30日在山東省諸城市賈悅鎮(zhèn)瑯埠農(nóng)場(35°35′24″N,119°14′24″E)進(jìn)行,試驗共選擇39 個煙草品種,每個品種3 個重復(fù)。品種具體信息見圖1。目前對于煙草葉形的分類主要基于專家目測和對葉片長寬比的測量,根據(jù)39個煙草品種的葉形描述信息,可以將其劃分為卵圓形、寬卵圓形、長卵圓形、橢圓形、長橢圓形、披針形6個類別。由于煙草葉形有典型類和非典型類之分,一些具有非典型葉形的煙草品種在人為分類時難以界定葉形,存在模糊性。非典型類煙草品種共12類,在圖1中用“*”號標(biāo)出。

圖1 煙草品種與對應(yīng)葉形分類Fig.1 Classification of tobacco varieties and the corresponding leaf shapes

1.2 葉片圖像獲取與處理

待煙草生長至團(tuán)棵期及開花期(第一朵中心花開放的時期),按照由下至上的順序采集葉片,平鋪,并采用佳能EOS M3相機(jī)拍照(圖2A),相機(jī)鏡頭距離葉片約1.5 m,圖像分辨率為2 880像素×1 920像素。采用Python 3.8.5 軟件(https://www.python.org/)及OpenCV 4.4.0 數(shù)據(jù)庫(https://opencv.org/)進(jìn)行葉片圖像前景背景分離、輪廓提取與葉位劃分等數(shù)據(jù)處理工作,結(jié)果如圖2B~D所示。

采用超綠算法[13],根據(jù)RGB 圖像中紅(R)、綠(G)、藍(lán)(B)3個顏色分量構(gòu)造出超綠指標(biāo)2G-R-B,對圖像進(jìn)行灰度化處理(圖2B),進(jìn)一步突出植物葉片圖像。采用最大類間方差法(OTSU算法)[14]確定灰度圖像的最佳分割閾值,劃分出屬于煙草葉片的像素點。由得到的二值化圖像提取出煙草葉片輪廓點云(圖2C)。根據(jù)背景上放置的5 cm×5 cm的紅色正方形卡片進(jìn)行葉片大小校正。煙株上的煙葉自下而上通常劃分為5 個部位:腳葉、下二棚葉、腰葉、上二棚葉和頂葉。不同部位的煙葉間也存在差異。分離出煙草葉片圖像后,去除研究意義較小的花葉、腳葉和一些缺損葉片,根據(jù)生產(chǎn)經(jīng)驗按照6-8-6 的分布順序?qū)熑~分為上部葉、中部葉、下部葉3 個部分(圖2D)。共獲得煙草葉片2 865 片。

圖2 煙草葉片圖像獲取與處理流程圖Fig.2 Flowchart of tobacco leaf pictures acquisition and processing

1.3 各類葉形指標(biāo)的提取

1.3.1 標(biāo)志點數(shù)據(jù)提取

煙草葉片以橢圓形和卵圓形為主,為了盡量詳盡地描述出葉片形狀的變化,同時減少葉片缺損及褶皺等其他因素的干擾,本研究從葉片的最高點到最低點,每隔1/8 分位在輪廓的最左端和最右端各選取一個像素點,共18 個標(biāo)志點[15](圖3A)。這樣的標(biāo)志點排布不僅可以精確地刻畫出葉柄、葉身、葉尖等位置的信息,還可以檢測出葉片的扭轉(zhuǎn)和不對稱性?;赑ython 3.8.5 編程軟件自動在葉片輪廓點云上提取標(biāo)志點,獲取各個點的位置坐標(biāo)。

由于各個葉片的大小、方向、所在位置不同,在進(jìn)行不同葉片對比分析前,需要先去除干擾信息。本研究采用普氏疊印分析法(generalized Procrustes analysis, GPA)對位于不同葉片上的標(biāo)志點進(jìn)行歸一化處理。其原理為采用最小二乘法最小化樣本間存在的平移和旋轉(zhuǎn)差異,實現(xiàn)葉片構(gòu)型的標(biāo)準(zhǔn)化(圖3B)[16-17]。在將不同葉片的相應(yīng)標(biāo)志點坐標(biāo)移動到對應(yīng)位置后,即可進(jìn)行每個葉片對應(yīng)部位之間的差異比較。采用R 4.0.0 編程軟件(https://www.rproject.org/)中的shapes包[18]對提取的葉片標(biāo)志點坐標(biāo)進(jìn)行普氏疊印分析法處理。

圖3 煙草葉片標(biāo)志點的選取及普氏疊印分析法結(jié)果示意圖Fig.3 Schematic diagrams of the selection of tobacco leaf landmarks and the results of GPA

1.3.2 常用葉形指標(biāo)的提取

基于Python 3.8.5 軟件及其OpenCV 4.4.0 數(shù)據(jù)庫提取葉片長、葉片寬、葉片長寬比、葉面積、葉面積指數(shù)5個常見的煙草葉片形狀指標(biāo)。其中,葉面積指數(shù)的計算方法為:

1.4 統(tǒng)計分析與煙草葉形的判別

由于標(biāo)志點數(shù)量眾多,因此對其進(jìn)行多元方差分析(multivariate analysis of variance, MANOVA),驗證采用標(biāo)志點數(shù)據(jù)是否可以檢測出不同生長時期、不同品種和不同葉位的煙草葉形差異。同時采用主成分分析方法對標(biāo)志點坐標(biāo)結(jié)果進(jìn)行降維,提取出葉形差異的主要來源。采用R 4.0.0編程軟件對以上數(shù)據(jù)進(jìn)行分析。

采用標(biāo)志點數(shù)據(jù)和其他常用葉形指標(biāo),將傳統(tǒng)的煙草人工葉形分類結(jié)果作為真值,采用決策樹(decision tree,DT)、隨機(jī)森林(random forest,RF)和支持向量機(jī)(support vector machine,SVM)3種機(jī)器學(xué)習(xí)算法對各類煙草葉片進(jìn)行分類建模和判別[19],以此比較標(biāo)志點數(shù)據(jù)與常用葉形指標(biāo)的可分性差異。以上3類機(jī)器學(xué)習(xí)算法的原理如下。

決策樹算法是一種應(yīng)用較廣泛的分類算法,其使用樹的結(jié)構(gòu)作為表現(xiàn)形式,內(nèi)部的每一個節(jié)點代表對一個特征的測試,以遞歸的方式自上而下地對數(shù)據(jù)屬性值進(jìn)行比較,得到的分支代表特征屬性的輸出值。建立決策樹的常用算法有很多,本研究采用分類和回歸數(shù)(classification and regression tree,CART)算法[20]。隨機(jī)森林算法以決策樹算法為基礎(chǔ),將多個隨機(jī)決策樹通過集成學(xué)習(xí)組合到一起,并根據(jù)多個分類器的投票決定最優(yōu)的分類結(jié)果,分類精度相對更高[21]。支持向量機(jī)是一種二分類模型,其基本思想為使用核函數(shù)定義的非線性特征映射將待分類數(shù)據(jù)映射到高維特征空間使其線性可分[22],目前被廣泛應(yīng)用于模式分類、回歸分析等多個領(lǐng)域。

采用十折交叉驗證對以上3種模型進(jìn)行分類器性能測試。將數(shù)據(jù)集分為10份,其中9份作為訓(xùn)練集來訓(xùn)練分類器,1 份作為測試集對分類器進(jìn)行測試。上述過程循環(huán)10 次并取10 次驗證結(jié)果的均值。采用準(zhǔn)確率作為評判模型結(jié)果的指標(biāo),即預(yù)測正確的樣本占總樣本的比例。以上機(jī)器學(xué)習(xí)模型的訓(xùn)練及驗證均采用R 4.0.0編程軟件進(jìn)行。

2 結(jié)果與分析

2.1 葉片標(biāo)志點數(shù)據(jù)方差分析結(jié)果

標(biāo)志點的多元方差分析結(jié)果表明,對于團(tuán)棵期及開花期的煙草葉片,不同葉形類別、不同葉位以及兩者間的互作效應(yīng)均整體存在極顯著差異。進(jìn)一步對各標(biāo)志點單獨進(jìn)行雙因素方差分析并將得到的F值結(jié)果可視化,以開花期的葉片數(shù)據(jù)為例。從圖4 中可知,黑色實心輪廓線為所有葉片的平均葉形,周圍的灰色輪廓線為單獨考慮不同葉類、不同葉位以及互作效應(yīng)分組時各類別葉片的平均葉形。位于標(biāo)志點的灰色圓形為該點處F值的可視化表達(dá)。其半徑越大,F(xiàn)值越大,即該標(biāo)志點處不同類別葉片間的葉形差異越大。若標(biāo)志點為深色實心圓,則代表該標(biāo)志點處不同類別葉片間的葉形不存在顯著差異。

圖4A 為7 種葉形類別間由各標(biāo)志點捕捉到的葉形差異,主要集中在葉片的中下部。圖4B為3種葉位間由各標(biāo)志點捕捉到的葉形差異,與圖4A 相比葉位間的差異上移,葉片上、中部的差異都較大,表明煙草不同葉位間的差異主要體現(xiàn)在葉片寬的變化上。圖4C 是葉形與葉位間互作效應(yīng)的可視化表達(dá)。盡管這種互作效應(yīng)十分微小,但顯著性分析結(jié)果表明,對于不同的煙草品種,其上、中、下部葉的葉片形狀變化也不同,且此互作效應(yīng)在葉片上存在不對稱性。團(tuán)棵期煙草葉片數(shù)據(jù)的雙因素方差分析結(jié)果(數(shù)據(jù)未列出)與開花期近似。團(tuán)棵期煙草由于生長時期較短,葉片特征不明顯,存在于品種間和葉位間的葉形差異不大,相比開花期煙草葉片的F值較小。

圖4 開花期不同葉形、葉位以及兩者互作效應(yīng)在各標(biāo)志點的F值Fig.4 F values of different leaf shapes,leaf positions and their interaction effects at each landmark at the flowering stage

2.2 葉片標(biāo)志點主成分分析結(jié)果

對獲取的標(biāo)志點數(shù)據(jù)進(jìn)行主成分分析,降維得到不同煙草葉形的差異類型。對于開花期的煙草葉片,第一主成分占總差異的42.7%,第二主成分占總差異的21.3%,第三主成分占總差異的10.7%。前三者累計占總差異的約75%,能夠解釋葉片間存在的主要差異。團(tuán)棵期煙草葉片標(biāo)志點數(shù)據(jù)的降維結(jié)果與開花期的結(jié)果相似,但3個主成分占總差異的比例不同,第一主成分占總差異的45.2%,第二主成分占總差異的26.3%,第三主成分占總差異的8.5%。

以開花期的煙草葉片為例,圖5~7 分別為第一、第二、第三主成分分析結(jié)果。3個主成分可以捕捉到來自不同方向的葉片差異。圖5A、6A、7A均為可視化的主成分分析結(jié)果,平均葉形左右兩邊分別為將此主成分效應(yīng)在平均標(biāo)志點數(shù)據(jù)結(jié)果中放大1倍標(biāo)準(zhǔn)差與縮小50%標(biāo)準(zhǔn)差得到的葉片示意圖。圖5B、6B、7B均為表現(xiàn)出該主成分特征的典型煙草品種的葉形,其中黑色實心輪廓線為該品種所有葉片的平均形狀,周圍的灰色輪廓線為該品種全部葉片形狀,以此與可視化的主成分分析結(jié)果進(jìn)行對比。

圖5A 顯示:第一主成分值越大,葉片越偏向長橢圓形;第一主成分值越小,葉片越偏向?qū)捖褕A形。該結(jié)果表明葉片的寬度和葉片最寬處的位置在一定程度上表現(xiàn)出同步變化的趨勢。從第一主成分中可以捕捉到長葉片與寬葉片、橢圓形葉片與卵圓形葉片的差異。以具體品種為例,通過對比‘革新1號’與‘遼煙1 號’的葉形可以看出第一主成分對煙草葉片形態(tài)的影響(圖5B)。該主成分也是所有煙草葉形變化的最主要來源。圖5C 為各葉形類別煙葉的第一主成分值對比,中間的實線為該葉形的第一主成分均值。按照第一主成分的差異可以將幾種葉形從寬卵圓形到長橢圓形進(jìn)行清晰的劃分。

圖5 開花期第一主成分結(jié)果對比Fig.5 Comparison of the results of the first principal component at the flowering stage

第二主成分值較大時葉片有向右扭轉(zhuǎn)的趨勢,反之則向左扭轉(zhuǎn)(圖6A)。部分品種的葉片呈現(xiàn)出較大的扭轉(zhuǎn)趨勢,并且左偏、右偏均有出現(xiàn),因此其第二主成分絕對值較大;而其他品種葉片則很少出現(xiàn)扭轉(zhuǎn),因此第二主成分絕對值較小。圖6B 中‘風(fēng)林一號’的第二主成分特征值品種內(nèi)標(biāo)準(zhǔn)差較小,煙草葉形較為對稱;而‘新K326’的第二主成分特征值品種內(nèi)變異很大,從形狀上可以觀察出該品種葉片出現(xiàn)了明顯的扭轉(zhuǎn)。

圖6 開花期第二主成分結(jié)果對比Fig.6 Comparison of the results of the second principal component at the flowering stage

由圖7A可知,第三主成分主要體現(xiàn)葉柄部分的差異性。第三主成分的值越大,葉柄越突出;其值越小,葉柄越不明顯。由圖7B可知,對比‘珊西煙’和‘垛煙’2個煙草品種,盡管兩者葉形相似,但葉柄的差異導(dǎo)致兩者葉片形態(tài)并不相同。相較于開花期的葉片,團(tuán)棵期的煙草葉片第一、第二主成分占比很大,而第三主成分占比有所下降。表明此時不同品種間的差異主要體現(xiàn)在葉片寬和葉形扭轉(zhuǎn)上,葉柄處差異的權(quán)重有所降低。

圖7 開花期第三主成分結(jié)果對比Fig.7 Comparison of the results of the third principal component at the flowering stage

2.3 基于機(jī)器學(xué)習(xí)的煙草葉類判別結(jié)果

為了驗證由標(biāo)志點法提取得到的葉形數(shù)據(jù)和常用葉形指標(biāo)相比是否能對煙草葉形進(jìn)行更加精確的描述,分別采用決策樹、隨機(jī)森林、支持向量機(jī)對不同生長時期的全部煙草品種進(jìn)行葉類判別。以開花期的判別結(jié)果(表1)為例。根據(jù)全部葉片形狀數(shù)據(jù)的判別準(zhǔn)確度可知,采用標(biāo)志點數(shù)據(jù)進(jìn)行判別的精度范圍為52%~62%,高于常用葉形指標(biāo)判別的精度范圍(51%~54%)。兩者的差異主要在于常用葉形指標(biāo)無法對葉片的最大寬位置進(jìn)行區(qū)分,而標(biāo)志點法可以捕捉到這種差異。

表1 基于機(jī)器學(xué)習(xí)的開花期煙草葉形判別精度Table 1 Discriminant accuracies of tobacco leaf shapes based on machine learning at the flowering stage

在3 種機(jī)器學(xué)習(xí)算法中,支持向量機(jī)的判別精度約為65%,略優(yōu)于隨機(jī)森林,兩者均優(yōu)于決策樹方法。各方法對上部葉和中部葉的判別精度比下部葉高出10%左右,甚至優(yōu)于采用全部葉片的結(jié)果,表明不同葉類間下部葉的差異較小,而中、上部葉展示了更明顯的葉形變化,可以捕捉到更多的品種特征。相較于開花期的葉類判別結(jié)果,團(tuán)棵期煙草葉類判別結(jié)果也都表現(xiàn)出了以上特征(數(shù)據(jù)未列出)。但整體上團(tuán)棵期葉片的判別精度較低,標(biāo)志點數(shù)據(jù)的判別精度范圍僅為49%~55%。

由于煙草葉形有典型類和非典型類之分,一些具有非典型葉形的煙草品種僅靠肉眼很難分辨出具體葉形類別,因此人工葉形分類標(biāo)準(zhǔn)具有模糊性,采用該標(biāo)準(zhǔn)作為真值會導(dǎo)致判別精度下降。去除12類非典型煙草品種,對剩余的典型品種進(jìn)行基于標(biāo)志點數(shù)據(jù)的機(jī)器學(xué)習(xí)判別,使用上部葉、中部葉、下部葉分別進(jìn)行判別,最高精度分別為77%、74%、71%,判別效果得到明顯改善。

3 討論

3.1 標(biāo)志點數(shù)據(jù)與常用葉形指標(biāo)的對比

在標(biāo)志點法的研究中,如何選點極為重要。研究人員大多借助MorphoJ[23]、ImageJ[24]等軟件手動選擇標(biāo)志點。該方法主要適合一些棱角特征明顯的葉形,對于煙草這種近似橢圓形的葉片,很難從中選擇出具有代表性的合適點位,并且采用手動標(biāo)點也存在著標(biāo)點誤差的問題[9]。有研究者為解決難以提取出具有同源性標(biāo)志點的問題,提出了半標(biāo)志點法[25],即等間距地在樣本邊緣獲取標(biāo)志點。但是,該方法是一種單純基于數(shù)學(xué)的形態(tài)模擬,缺少生物學(xué)支撐。本研究以煙草葉片形態(tài)特征為基礎(chǔ),自動獲取標(biāo)志點,不僅實現(xiàn)了不同葉片間采樣標(biāo)準(zhǔn)的統(tǒng)一,還具有方便、快捷、精準(zhǔn)等優(yōu)勢,為橢圓形葉片的標(biāo)志點選取提供了新方法。此外,選點數(shù)量的不同也會對結(jié)果的精度造成影響。增加標(biāo)志點的數(shù)量可以更細(xì)致地描述出存在于葉柄、葉耳等部位的表型特征,對葉片形狀進(jìn)行更為精確的刻畫。

方差分析結(jié)果表明煙草葉形間存在的細(xì)微差異可以通過標(biāo)志點數(shù)據(jù)捕捉。相對于各種常用的葉形指標(biāo),標(biāo)志點數(shù)據(jù)對葉形的描述更為全面?;跇?biāo)志點數(shù)據(jù)的主成分分析結(jié)果表明,不同品種的煙草葉片之間存在著很多差異,最主要為葉片寬和葉片最大寬位置、葉片扭轉(zhuǎn)程度以及葉柄部的差異。葉片的寬度對應(yīng)葉片長寬比這一指標(biāo),是最常用、最基本的葉片表型信息[26]。但是有研究表明,盡管葉片的長寬比是葉片最主要的差異來源,但只采用長寬比對葉片進(jìn)行描述會丟失約40%的葉片輪廓信息[27]。機(jī)器學(xué)習(xí)判別結(jié)果也表明,目前常用的葉形指標(biāo)對煙草葉形的鑒別能力較標(biāo)志點數(shù)據(jù)更低。而葉片最大寬位置以及葉片扭轉(zhuǎn)程度、葉柄差異等葉形指標(biāo)需要人工測量,費時費力。采用標(biāo)志點法可以自動提取這些信息,不僅可以替代人眼識別,還可以將其量化為更精確的描述。

3.2 煙草葉形特征分析

由標(biāo)志點的方差分析結(jié)果可知,煙草葉片的葉形在不同品種和不同葉位間存在差異和互作效應(yīng),表明對于不同葉位的葉片,其品種差異的表現(xiàn)強(qiáng)度不同,進(jìn)一步印證了本研究中對煙草葉片進(jìn)行判別分析時不同葉位葉片的分類效力有所區(qū)別。由機(jī)器學(xué)習(xí)的結(jié)果可知,本研究中,無論是對于數(shù)量大、特征明顯的第一朵中心花開放時期數(shù)據(jù),還是數(shù)量少、特征較模糊的團(tuán)棵期數(shù)據(jù),支持向量機(jī)方法的判別效果均最佳,該結(jié)果與前人研究[5]相似。而決策樹法效果最差,原因是決策樹法在每個節(jié)點上都會產(chǎn)生分枝,在離異對象數(shù)量較多的情況下判別準(zhǔn)確率較低。采用上部葉和中部葉進(jìn)行建模預(yù)測的精度更高,原因是煙草下部葉中普遍存在葉片較寬的現(xiàn)象,從而掩蓋了其他葉片表型特征[26]。對比團(tuán)棵期和開花期的煙草葉片數(shù)據(jù),發(fā)現(xiàn)團(tuán)棵期數(shù)據(jù)的判別精度普遍較差,這是由于團(tuán)棵期葉片正處于旺盛的營養(yǎng)生長期,其葉形特征還未顯露完全。因此在對煙草葉片進(jìn)行特征提取時,應(yīng)盡量采用處于現(xiàn)蕾期后上、中部的葉片。在后續(xù)研究中,我們會加入其他生長時期以及不同年份的煙草葉形數(shù)據(jù),對煙草葉片發(fā)育規(guī)律進(jìn)行更加深入的探討。

由以上分析可知,對煙草葉片進(jìn)行標(biāo)志點的測量可以捕捉到葉片存在的大部分輪廓信息,但就機(jī)器學(xué)習(xí)的結(jié)果來說,判別分析的精度并不高,原因是本研究采用的人為分類標(biāo)準(zhǔn)對非典型品種很容易產(chǎn)生模糊的分類結(jié)果,從而影響機(jī)器學(xué)習(xí)結(jié)果的準(zhǔn)確度。去除一些非典型品種后,機(jī)器學(xué)習(xí)判別精度得到了很大提升。由此可見,發(fā)展更精確、更全面的葉形描述方法十分必要。標(biāo)志點法不僅可以捕捉到人眼可以看到的差異,還可以將差異轉(zhuǎn)為數(shù)值特征進(jìn)行精確輸出,結(jié)合葉片的紋理信息[3]、三維株型信息[28-29]等其他表型指標(biāo),將可以實現(xiàn)對作物品種的精確定位,從而成為未來育種和表型分析的新指標(biāo)。

4 結(jié)論

本研究將幾何形態(tài)學(xué)的方法應(yīng)用到作物表型研究領(lǐng)域中,采用標(biāo)志點法對處于團(tuán)棵期和開花期(第一朵中心花開放的時期)的39 個煙草品種進(jìn)行葉片形狀信息提取。結(jié)論如下:

1)不同葉形類別和不同葉位的煙草葉片形狀信息存在顯著性差異,且兩者間存在互作效應(yīng)。對所有煙草葉片標(biāo)志點數(shù)據(jù)進(jìn)行主成分分析,前3 個主成分分別解釋了葉片寬和最大寬位置、葉片扭轉(zhuǎn)程度以及葉柄處的不同所造成的葉片差異。其中葉片寬和最大寬位置是造成不同煙草葉形差異的最主要因素。

2)分別采用決策樹、隨機(jī)森林、支持向量機(jī)3類機(jī)器學(xué)習(xí)算法對煙草葉類進(jìn)行判別。采用開花期全部葉片標(biāo)志點數(shù)據(jù)進(jìn)行判別的精度范圍為52%~62%,高于常用葉形指標(biāo)的判別精度(51%~54%)。相較于其他2 種機(jī)器學(xué)習(xí)判別方法,支持向量機(jī)的判別效果最優(yōu),精度約為65%。采用上部葉、中部葉的判別精度要高于下部葉10%左右。開花期煙草葉片的判別精度明顯優(yōu)于團(tuán)棵期葉片,能展示出更明顯的品種表型特征。在去除12 種非典型煙草品種后,標(biāo)志點數(shù)據(jù)判別精度上升至77%。本研究結(jié)果可為自動化提取葉片形狀信息提供新思路。

猜你喜歡
開花期煙草精度
基于不同快速星歷的GAMIT解算精度分析
上海煙草包裝印刷有限公司
熱連軋機(jī)組粗軋機(jī)精度控制
河南省干熱風(fēng)發(fā)生規(guī)律及其與小麥開花期的關(guān)系
2017年銅川市櫻桃開花期推遲的溫度分析
牡丹不同品種開花時間的差異性研究
種球冷處理時間對水培風(fēng)信子性狀的影響
以工匠精神凸顯“中國精度”
全國首次青少年煙草調(diào)查
煙草鏡頭與歷史真實