国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

服務機器學習的遙感圖像樣本采集技術(shù)與工具開發(fā)*

2021-10-14 03:43:00李天一樊浩宸李天賜孟祥卉
科技創(chuàng)新與應用 2021年28期
關鍵詞:類別機器尺寸

李天一,樊浩宸,李天賜,孟祥卉

(吉林大學 地球探測科學技術(shù)學院,吉林 長春 130021)

機器學習發(fā)展迅猛,其技術(shù)方法廣泛應用于各行各業(yè)。其中,計算機視覺技術(shù)中的深度學習方法在遙感目標識別、圖像分類等領域也得到了廣泛應用[1-5]。深度學習方法需要構(gòu)建出對應實驗要求的算法模型,通過對樣本特征的學習產(chǎn)生結(jié)果并反饋以優(yōu)化模型,最終實現(xiàn)速度、精度達到研究要求的模型。在模型構(gòu)建的過程中,學習樣本的采集和訓練集、測試集和驗證集的劃分是一個重要環(huán)節(jié)。學習樣本一般需要大批量、等尺寸圖像作為數(shù)據(jù)集,對于遙感圖像樣本采集來說,原始數(shù)據(jù)來源一般是現(xiàn)存的各類衛(wèi)星所采集到的遙感圖像數(shù)據(jù)。在獲取到原始數(shù)據(jù)后,需要根據(jù)研究要求對原始圖像進行裁剪并重新命名歸類,得到圖片分辨率相同且按類存放的具有統(tǒng)一命名標準的圖像,進而形成圖片樣本集[6-9]。

在樣本采集過程中,會有多種因素制約圖像采集工作效率,往往需要解決如下問題:首先,在遙感圖像樣本采集過程中,不可避免地會涉及到多種遙感數(shù)據(jù)類型。大部分的數(shù)據(jù)來源多樣,不同類型的遙感數(shù)據(jù)存放在不同的遙感數(shù)據(jù)平臺,因此在數(shù)據(jù)采集的時候需要在不同平臺進行不同類別遙感圖像數(shù)據(jù)的下載、采集和處理操作。此外,對于不同地物還有需要根據(jù)其具體尺寸選用不同比例尺的遙感數(shù)據(jù)等問題。在機器學習模型方面,要滿足研究所選用的不同模型對圖像格式的要求和訓練模型時參數(shù)更改的需要,圖像樣本尺寸、類型一般是動態(tài)變化的。同時在同一模型下還有對遙感圖像樣本規(guī)范化的要求,操作上重復性的特征比較突出。所以,這一環(huán)節(jié)往往對采集的靈活性、效率、規(guī)范水平有著較高要求。其次,采集的樣本圖像形成的圖像數(shù)據(jù)集需要服務于后續(xù)機器學習算法模型的訓練與實現(xiàn),因此不能在采集后簡單地按文件夾存儲。機器學習模型訓練過程中需要通過數(shù)據(jù)集中的樣本及時幫助模型發(fā)現(xiàn)參數(shù)問題,并且當發(fā)現(xiàn)采集到的樣本數(shù)據(jù)存在問題時還需要對其進行修正,最后還要考慮機器學習圖像樣本的快速檢索、樣本瀏覽、快視圖查看等需求。所以對樣本動態(tài)檢索與動態(tài)采集有較高的管理要求。

本文在吉林大學“大學生創(chuàng)新創(chuàng)業(yè)訓練計劃”培育項目的支持下,構(gòu)建了尺度程序化控制,跨數(shù)據(jù)平臺和軟件平臺的遙感圖像樣本采集方案,進而解決遙感圖像樣本規(guī)范化要求高、人工采集效率低的問題;然后運用數(shù)據(jù)庫管理模式與可視化程序控制,實現(xiàn)樣本圖像分類化、動態(tài)化、結(jié)果可視化、樣本信息同步采集的樣本管理模型,從而解決機器學習模型對樣本動態(tài)檢索與動態(tài)采集的管理需求。

1 技術(shù)方法

1.1 規(guī)范化、尺度可變的樣本圖片采集方法

本文設計的機器學習遙感數(shù)據(jù)樣本采集方式主要分為四個方面,分別是樣本參數(shù)設計、平臺選擇、樣本取圖和圖像信息入庫四個方面(圖1)。對于樣本參數(shù)設計,首先需要確定采樣數(shù)據(jù)源,以滿足對所采集地物特征描述準確的要求。其次是樣本采樣尺寸的確定,以滿足機器學習模型的參數(shù)要求。對于遙感數(shù)據(jù)平臺的選擇,主要根據(jù)所要采集遙感圖像,進而選擇合適的數(shù)據(jù)資源平臺或遙感數(shù)據(jù)軟件平臺這兩種平臺進行獲取。對于樣本取圖環(huán)節(jié),首先是根據(jù)屏幕分辨率獲取屏幕坐標,進而通過采樣尺寸計算截圖范圍。然后將該范圍內(nèi)的像素轉(zhuǎn)繪到相同范圍大小的畫布上,完成屏幕截圖。最后進行樣本數(shù)據(jù)另存。對于樣本信息入庫,我們根據(jù)所截取地物的類型和位次進行編碼入庫。并且將所截取的地物地理坐標和特征描述等其他信息一并進行錄入。

圖1 技術(shù)方法

1.2 樣本分類與動態(tài)管理模式

用于機器學習訓練和驗證的遙感圖像樣本按不同類型進行管理(圖2)。首先,在顯示圖片的時候需要對已獲取的圖片進行分類顯示,需要確定所選擇的類別信息,因此使用選項按鈕獲取目前所選擇的遙感圖像樣本類別。通過與數(shù)據(jù)庫進行連接,使用SQL語句查詢該類別,提取該類別下的所有項目,在信息欄中呈現(xiàn)。最后將所有樣本信息在圖形頁面中進行呈現(xiàn)。其次,動態(tài)管理方面,在類型確定時對該類型下的條目進行計數(shù),得到同類型的總數(shù),新圖像的編號即為該類型下總數(shù)加一,最終實現(xiàn)新樣本的入庫。

圖2 管理模式

2 關鍵技術(shù)實現(xiàn)方法

2.1 樣本采樣關鍵技術(shù)

在樣本采集時,用戶可通過參數(shù)設置設定截圖尺寸等參數(shù),然后通過鼠標點擊采樣的中心點,獲取圖像坐標,其實現(xiàn)代碼如下:

Point leftUpPoint=new Point(this.mouseDownPoint.X,this.mouseDownPoint.Y);

if(e.X<this.mouseDownPoint.X)

leftUpPoint.X=e.X;

if(e.Y<this.mouseDownPoint.Y)

leftUpPoint.Y=e.Y;

然后,根據(jù)中心點坐標,結(jié)合設置參數(shù),自動計算取樣范圍,從而確定取樣的長寬像素值,通過截圖方式獲取標準化的樣本,其坐標范圍計算代碼如下:

int wideth=Math.Abs(MyFieldClass.PicWidth);int height=Math.Abs(MyFieldClass.PicHeight);

this.rect=new Rectangle(leftUpPoint.X-wideth/2,leftUpPoint.Y-height/2,wideth,height);

this.Refresh();

其中,MyFieldClass.PicWidt是用戶預設的采集圖像寬度值,MyFieldClass.PicHeight是用戶預設的采集圖像長度值。

在確定好截圖相關參數(shù)之后,建立與截圖尺寸等大小的畫布,并且進入截圖狀態(tài)(圖3)。

圖3 截圖狀態(tài)示意圖

操作完成后所截取到的圖,放在內(nèi)存的粘貼板中,然后存為JPG格式文件,圖像名稱根據(jù)數(shù)據(jù)庫的數(shù)據(jù)數(shù)量情況和采樣類型,進行自動編碼后存入相關文件夾。

2.2 樣本動態(tài)管理的實現(xiàn)技術(shù)

在C#中使用radiobutton實現(xiàn)樣本類型唯一選擇,通過讀取已被選擇的radiobutton按鈕文本信息獲取目前已被選擇的類別信息。將該類別字段作為查詢字段,使用select語句在數(shù)據(jù)庫中進行查找,進而將該語句的查詢結(jié)果顯示在列表欄中。并將查詢到的圖像縮略圖展示在左側(cè)圖像框中,并設計單擊縮略圖可顯示其快視圖并顯示其具體信息。在新圖像錄入時,對listbox中的項目進行計數(shù),從而得知選擇該類型下有多少項目,并將該數(shù)加一獲得新圖像錄入的編號。圖片路徑通過定義靜態(tài)變量存儲,通過數(shù)據(jù)庫查詢某類記錄,獲取當前記錄總數(shù)(N),類別為(K),則它的編碼為“RS-K+(N+1)”,例如當前機場最大記錄為“RS-JC-5”,因此下一采樣的數(shù)據(jù)編為“RS-JC-6”,對應的樣本圖片自動命名為RS-JC-6.jpg(圖4)。在截圖完成后,還需要將新截圖的信息存入數(shù)據(jù)庫,通過SQL的INSERT INTO語句將信息存入數(shù)據(jù)庫中。

圖4 數(shù)據(jù)管理流程圖

在新的圖像樣本及其信息入庫后,將該類型下的樣本圖像編號全部讀入到listbox,再將該類型下全部樣本圖像縮略圖在右側(cè)進行展示,并設計點擊縮略圖后在左側(cè)展示該樣本快視圖、在下方展示該樣本地理信息和特征描述的功能,達到可以直觀地管理圖像樣本的效果(圖5)。

圖5 樣本采集工具界面

3 結(jié)束語

本文圍繞深度學習樣本采集復雜性、可變性的特點,提出了一種基于數(shù)據(jù)庫與跨平臺式,尺度可變的樣本采樣技術(shù),并基于Visual Studio和數(shù)據(jù)庫二次開發(fā)技術(shù)實現(xiàn)樣本的快速采集與分類管理,有效地支撐了深度學習模型訓練,具有一定的實用價值。

樣本信息分類化采集、管理、可視化瀏覽可以快速地實現(xiàn)機器學習樣本庫動態(tài)管理與問題排查,并且可以在每次截圖過程中同時完成信息入庫操作,避免了截圖操作與信息錄入操作兩者并行的繁瑣流程,簡化了操作步驟,減少了錄入錯誤情況的發(fā)生。在后續(xù)對目標地物進行樣本采集的實踐結(jié)果表明,本文采用設計與開發(fā)的圖像截取與信息錄入系統(tǒng)能方便快捷地采集等尺寸遙感圖像,使工作效率大大提高。且為進一步劃分訓練集、測試集和驗證集提供較好的技術(shù)支撐。

猜你喜歡
類別機器尺寸
尺寸
智族GQ(2022年12期)2022-12-20 07:01:18
機器狗
機器狗
CIIE Shows Positive Energy of Chinese Economy
未來機器城
電影(2018年8期)2018-09-21 08:00:06
D90:全尺寸硬派SUV
服務類別
新校長(2016年8期)2016-01-10 06:43:59
佳石選賞
中華奇石(2015年5期)2015-07-09 18:31:07
無敵機器蛛
論類別股東會
商事法論集(2014年1期)2014-06-27 01:20:42
仙桃市| 孟州市| 马关县| 白河县| 牡丹江市| 朝阳县| 大新县| 从化市| 砚山县| 淮南市| 新闻| 高州市| 大同市| 临朐县| 广东省| 德钦县| 阿拉善盟| 阿克陶县| 石屏县| 固阳县| 江永县| 广元市| 和静县| 陕西省| 马边| 宝鸡市| 仁化县| 莱阳市| 鄂尔多斯市| 屏南县| 克什克腾旗| 霍州市| 广南县| 甘南县| 宁远县| 屏东市| 永顺县| 古浪县| 黑河市| 兴国县| 汉寿县|