張雷 劉昌華 石林峰 張鷹
(1.河南理工大學測繪與國土信息工程學院,河南 焦作 454000;2.自然資源部第一大地測量隊,陜西 西安 710054;3.河南省現(xiàn)代農(nóng)業(yè)大數(shù)據(jù)產(chǎn)業(yè)技術(shù)研究院,河南 鄭州 450046)
煙草的種植信息在我國的生產(chǎn)管理過程中有著十分重要的作用,可以為我國的煙葉種植以及收購提供重要的決策支持[1,2]。我國煙草的生產(chǎn)和消費在世界上占有重要地位,但由于我國地域面積廣闊,不同地區(qū)的地形條件各不相同。傳統(tǒng)的煙草面積提取常采用人工實地調(diào)查的方法進行,這樣不僅耗時費力,而且人為產(chǎn)生的因素可能增大測量的誤差[3],很難實現(xiàn)對煙草進行實時監(jiān)測。
在本原性錯誤中,近20%的錯誤為概念理解性錯誤,近80%的錯誤為數(shù)學推理錯誤.就數(shù)學推理錯誤進行了訪談,結(jié)果發(fā)現(xiàn):職前教師之所以認為昆明空氣質(zhì)量好,是因為主觀上認為昆明是全國有名的空氣質(zhì)量好城市,加之計算平均數(shù)時發(fā)現(xiàn)兩者之間差異不大,所以就忽略這種差異,于是“想當然”地推理出“心中的答案”.
隨著遙感技術(shù)的發(fā)展,因其監(jiān)測范圍大、快速成像和多波段的特點,被廣泛應(yīng)用于作物監(jiān)測中[4-6]。相比傳統(tǒng)的依靠人工實地測量的方法,運用遙感技術(shù)可以大大節(jié)省人力,并且可以提高其準確性[7]。劉蕓等[8]采用面向?qū)ο蠓椒?,根?jù)烤煙的NDVI、光譜、紋理以及形狀等特征,提取烤煙種植信息,總體精度達91%;雷春苗等[9]利用隨機森林、支持向量機、BP神經(jīng)網(wǎng)絡(luò)、SoftMax和最大似然分類器對柴達木地區(qū)的枸杞進行提取,幾種分類器都有著不錯的分類精度。
近年來深度學習興起,大量學者通過深度學習的方法進行作物分類和識別。Kussul等[10]利用深度學習方法對不同的數(shù)據(jù)進行農(nóng)作物分類,取得了較高的準確率;董秀春等[11]利用開放的Google Earth影像結(jié)合U-net網(wǎng)絡(luò)模型,對云南省隴川縣甘蔗種植區(qū)進行提取,總體精度達92%,面積精度為94%;陳妮等[12]利用U-Net深度學習網(wǎng)絡(luò)模型對新昌縣土地利用進行分類,取得了較高的精度;宋曉倩等[13]利用遷移學習方法提取葡萄種植信息,較傳統(tǒng)深度學習方法準確率提高了7%;李濤等[14]在imageNet數(shù)據(jù)集的基礎(chǔ)上,將模型進行微調(diào),對玉米雄穗進行識別,證明深度學習方法在作物特征識別中的良好表現(xiàn)。
洛寧縣具有良好的生態(tài)環(huán)境,非常適合煙草的生長,煙草的種植一直處于洛陽市前列,成為當?shù)氐闹е援a(chǎn)業(yè),也是當?shù)厝嗣衩撠氈赂坏闹匾窘?jīng)之一??焖贉蚀_地掌握煙草的種植分布和面積等情況是政府決策部門的當務(wù)之急[15]。
實驗的硬件CPU為英特爾Xeon E5-1620v4@3.20GHz,GPU為NVIDIA Quadro M2000。TensorFlow后端的Keras深度學習框架實現(xiàn)U-net模型的搭建與實驗行每一個特征點的分類。Keras自帶的生成器不支持多波段,所以自己編寫實現(xiàn),并對U-net網(wǎng)絡(luò)添加BN層和Dropout 層,優(yōu)化器選用Adam,損失函數(shù)為交叉嫡函數(shù)。
高分二號(GF-2)衛(wèi)星是我國自主研制的首顆空間分辨率優(yōu)于1m(星下點全色分辨率0.8m)的民用光學遙感衛(wèi)星,在作物識別、建筑物識別、礦山遙感監(jiān)測、林業(yè)監(jiān)測等方面有著廣泛的應(yīng)用[17]。
研究區(qū)位于河南省洛陽市洛寧縣,全縣面積2306km2,位于E111°08′~111°49′,N34°05′~34°38′。地形地貌總體呈“七山二塬一分川”,生態(tài)環(huán)境良好,全縣耕地面積約8.67萬hm2,適宜種煙面積達3.73萬hm2。本研究實驗區(qū)選擇洛寧縣小界鄉(xiāng),該鄉(xiāng)連續(xù)7a被洛寧縣政府評為“煙葉生產(chǎn)先進鄉(xiāng)鎮(zhèn)”,連續(xù)4a被洛陽市政府評為“煙葉生產(chǎn)先進鄉(xiāng)鎮(zhèn)”[16]。
U-net是一個優(yōu)秀的語義分割模型,如圖1所示。U-net網(wǎng)絡(luò)主要分為上采樣和下采樣部分,下采樣也就是主干特征提取網(wǎng)絡(luò),利用主干部分,獲得5個初步有效特征層;在加強特征提取網(wǎng)絡(luò)部分,對獲得的特征層進行上采樣,并進行特征融合,進而得到一個融合所有特征的有效特征層;利用預測網(wǎng)絡(luò),對獲得的融合所有特征的有效特征層進行每一個特征點的分類。
結(jié)合當?shù)馗黝愖魑锏奈锖颍?月左右煙草與其它作物最易區(qū)分,因此本研究使用高分二號衛(wèi)星PMS傳感器在2020年7月7日的洛寧縣區(qū)域的5景遙感影像,數(shù)據(jù)來源于中國資源衛(wèi)星應(yīng)用中心(www.cresda.com/CN/)[18]。其中,4景用來制作深度學習訓練樣本,1景用來煙草信息的提取。另外,利用無人機拍攝的小范圍高分辨率影像,集思寶實地調(diào)查記錄煙草地塊空間位置信息數(shù)據(jù),輔助后期樣本標簽的制作。
利用ENVI 5.3對原始影像進行輻射定標、大氣校正、正射校正和影像融合等預處理操作。并通過Arcgis軟件結(jié)合無人機、集思寶數(shù)據(jù)對煙草地塊進行標注。用于制作深度學習訓練標簽。
通過ENVI 5.3對高分二號原始影像進行數(shù)據(jù)預處理,將包含較多煙草的區(qū)域剪切出來,并利用ARCGIS進行煙草樣本的標注,如果直接將圖像輸入到深度學習網(wǎng)絡(luò)中,會導致內(nèi)存溢出,因此需要將影像剪切成合適的小塊,本研究通過python腳本對影像和標簽圖像進行隨機裁剪,生成大小均為256×256的衛(wèi)星圖像和標簽圖像。因樣本數(shù)量有限,為了避免訓練過程中出現(xiàn)過擬合現(xiàn)象,需要對數(shù)據(jù)進行數(shù)據(jù)增強[19]。將裁剪處理后的原始影像和標簽圖像進行水平翻轉(zhuǎn)、豎直翻轉(zhuǎn)以及對角翻轉(zhuǎn),樣本擴充到2000張。按照7∶3的比例將樣本分類訓練集和驗證集。
由表2可以看出,大學生之所以選擇貸款,絕大部分原因是為了補貼生活費.提前消費是選擇貸款的一個主要推動力,消費欲望則是選擇貸款的另一大推動力.隱藏在校園貸中的一個主要問題是大學生盲目消費,不能合理支配資金.在調(diào)查的520個學生中,有123個大學生使用過校園貸.在使用過校園貸的學生中,有56.10%的大學生貸款金額在1 000元以內(nèi),貸款金額1 001~5 000元的占20.32%,5 001~10 000元的占10.57%,有13.01%的大學生竟貸款達到了1萬元以上,遠遠超過了他們的承擔能力.這表明當代大學生存在很多不考慮自身情況及后果的個體,缺少前瞻性.
在模型訓練時,為控制網(wǎng)絡(luò)的穩(wěn)定性,初始學習率設(shè)置為1×10-4,通過Adam優(yōu)化器計算損失值相對于網(wǎng)絡(luò)參數(shù)的梯度,將參數(shù)進行反向傳播,進而降低損失值[21]。設(shè)置迭代次數(shù)50次,給訓練模型設(shè)置回調(diào)函數(shù),在val_loss連續(xù)10輪不下降則訓練停止,當3個epoch過去而val_loss不下降,學習率減半。訓練后繪制的loss和acc曲線如圖2、圖3所示,可以看出,訓練集和驗證集有很好的擬合效果。在進行40個epoch的時候,曲線開始趨于穩(wěn)定,損失值在0.02左右波動。說明學習率設(shè)置較為合理,損失函數(shù)實現(xiàn)快速收斂,可見U-net網(wǎng)絡(luò)對煙草數(shù)據(jù)集進行了有效的學習。
圖1 U-net網(wǎng)絡(luò)模型
為了評價模型在煙草提取中的性能,本研究對測試結(jié)果進行準確率(P)、召回率(R)和F1值等評價[20]。計算公式:
(1)
(2)
(3)
從目前的大學生就業(yè)形勢來看,就業(yè)形勢嚴峻并不是工作崗位少,而是工作崗位的匹配度不高,市場上所需的人員和職業(yè),市場營銷占據(jù)了大多數(shù)。但大學生的就業(yè)觀念還是停留在傳統(tǒng)的觀念上,認為政府機關(guān)、國企、銀行、大公司、外資企業(yè)的職業(yè)是金飯碗,希望到這類地方就業(yè),可是,大學生喜歡的就業(yè)部門都存在不同程度的減員增效和機構(gòu)合并,崗位十分有限,相比之下就顯得就業(yè)難度較大。此外,由于大學生剛出校門,沒有技術(shù)經(jīng)驗和資金積累,要想進行創(chuàng)業(yè)就要突破許多障礙,但難度較大,成功率較低。即使成功后,由于門檻低、技術(shù)性不強等原因也會被市場淘汰。
當前建筑企業(yè)管理在工作開展過程中并沒有嚴格按照《企業(yè)會計準則》等相關(guān)文件的指導來開展壞賬準備工作。建筑企業(yè)過度追求產(chǎn)品銷售的利益,在進行賒銷銷售款收回過程中,其清算工作并沒有按時開展,對應(yīng)的資金收回工作也受到影響。同時,工作人員并沒有及時與供貨方取得聯(lián)系,隨著時間的推移,建筑企業(yè)收回資金的可能性逐漸下降。在這種情況下,購貨單位對還款工作的重視程度也會逐漸下降,不斷地延遲還款,導致建筑企業(yè)的壞賬率逐漸提高。
(2)35歲(含 35歲)以下護理人員,調(diào)查中顯示來自學習方面的壓力很少,說明這一年齡段的人員希通過學習來提高自己,針對這個特點,工會可結(jié)合自身的“一活動 一工程”等活動開展一系列的職工技能競賽和培訓;
因為網(wǎng)絡(luò)上并沒有公開的煙草數(shù)據(jù)集,本研究使用自己制作的數(shù)據(jù)集對初始網(wǎng)絡(luò)進行訓練,輸入的圖像大小為256×256尺寸,將數(shù)據(jù)集按7∶3劃分為訓練集和驗證集輸入到訓練網(wǎng)絡(luò)中。
式中,TP表示樣本的真實類別是正類,并且模型識別的結(jié)果也是正類的數(shù)量;FP表示樣本的真實類別是負類,但是模型將其識別為正類的數(shù)量;FN表示樣本的真實類別是正類,模型將其預測為負類的數(shù)量。
進行基層區(qū)隊腐敗治理的過程當中,還需要做好第四步的工作,凸顯出論劍的效果。不斷健全相應(yīng)的監(jiān)督管理制度,以達到應(yīng)有的目的。具體而言,第一,應(yīng)該對企業(yè)員工工資與獎金的分配流程予以優(yōu)化和嚴格管控,通過組織開展相應(yīng)的會議,同時將會議的內(nèi)容予以公開,形成規(guī)范化的審批模式,要求員工親自在工資表上簽字,維護好職工的利益。第二,注重基層區(qū)隊文書的管控。依靠構(gòu)建相應(yīng)的業(yè)績考察、溝通互動以及腐敗治理等相關(guān)機制,達到一定的約束與管控的效果[4]。
圖2 U-net訓練集和驗證集loss曲線
圖3 U-net訓練集和驗證集acc曲線
利用訓練好的模型對待分類影像進行預測,在預測過程中,如果直接將影像輸入到模型中會造成內(nèi)存的溢出。所以,一般將圖像裁剪成較小的圖像分別輸入到模型中進行預測,然后再將預測結(jié)果按順序拼接起來。如果采用常規(guī)的規(guī)則網(wǎng)格裁剪,最后預測拼接的效果并不是很好,會有明顯的拼接痕跡。因此,采用忽略邊緣預測,有重疊地裁剪影像,在拼接時再采用忽略邊緣的方法進行拼接。
將預測結(jié)果與標注后的真實煙草標簽圖像進行精度評價,原始圖像和人工目視標注的標簽圖像以及預測結(jié)果圖像如圖4~6所示,將預測結(jié)果與實際標注的結(jié)果進行精度評價,取得了90.68%的精確率和92.87%的召回率。綜合評價指標F1值為91.76%。
圖4 原始圖像
為了進一步驗證本文所使用的U-net網(wǎng)絡(luò)模型的有效性,使用其它常用的分類模型進行煙草提取并進行精度對比。從圖7可以看出,KNN、Decision Tree和Random Forset模型的準確率分別為87.68%、83.65%和89.21%,相比之下,U-net網(wǎng)絡(luò)模型的準確率比其它模型平均高出3.8%。
圖5 人工目視標簽圖像
圖6 U-net網(wǎng)絡(luò)預測圖像
圖7 各分類模型煙草提取準確率
以上結(jié)果表明,U-net神經(jīng)網(wǎng)絡(luò)模型在少量訓練樣本的時候,依舊可以取得很好的信息提取效果。
本研究使用U-net神經(jīng)網(wǎng)絡(luò)模型,實現(xiàn)了對煙草種植的提取,對于沒有公開的煙草數(shù)據(jù)集的情況,通過實地調(diào)查結(jié)合目視解譯制作深度學習訓練標簽。通過與其它常用分類模型進行精度對比,U-net在少量數(shù)據(jù)集的情況下,表現(xiàn)出良好的性能。
相關(guān)研究還有待深入,需解決面積漏分的問題,需進一步提高訓練樣本的多樣性和優(yōu)化網(wǎng)絡(luò)模型;不同煙葉種植地區(qū)地形各不相同,本文只對洛寧縣山區(qū)進行煙草面積提取,后續(xù)可在擴大數(shù)據(jù)集的基礎(chǔ)上,開展不同地形情況下煙草種植面積提取研究,并進一步探究U-net網(wǎng)絡(luò)模型的普適性。