時間:2021年04月07日 分類:科學(xué)技術(shù)論文 次數(shù):
摘要:高光譜圖像含有數(shù)百個波段,包含豐富的光譜信息,因此被廣泛應(yīng)用于地物分類中,但仍存在著維數(shù)災(zāi)難的問題。高光譜圖像中同時也含有豐富的紋理信息,有效利用紋理信息能夠顯著提高分類精度。三維Gabor濾波器不僅能夠保留圖像豐富的光譜信息,還能提取到圖像的紋理特征。為了充分利用高光譜圖像的特征,提出一種基于三維Gabor和殘差三維卷積神經(jīng)網(wǎng)絡(luò)(Res-3DCNN)的分類方法。三維卷積神經(jīng)網(wǎng)絡(luò)(3DCNN)能夠直接對三維立方體數(shù)據(jù)進(jìn)行處理,提取到深層紋理-光譜信息,然而隨著網(wǎng)絡(luò)層的加深會產(chǎn)生網(wǎng)絡(luò)退化問題,因此利用殘差思想對3DCNN模型進(jìn)行改進(jìn)。在PaviaU、IndianPines和Salinas三個公共高光譜圖像數(shù)據(jù)集上進(jìn)行實驗,分別取得99.17%、97.40%、98.56%的平均分類精度,結(jié)果表明該方法能有效提高高光譜圖像的地物分類精度。
關(guān)鍵詞:高光譜圖像分類;卷積神經(jīng)網(wǎng)絡(luò);三維Gabor濾波器;三維卷積;殘差學(xué)習(xí)
衛(wèi)星傳感器捕獲的高光譜圖像(HyperspectralImages,HSI)[1]每個像素都含有大量光譜帶,能夠同時獲取地物的空間信息和光譜信息。與RGB圖像相比,高光譜圖像能夠更精細(xì)、更準(zhǔn)確地識別地物信息。因此高光譜圖像在遙感應(yīng)用中發(fā)揮了重要作用,如目標(biāo)檢測、地物分類等,然而,高光譜圖像分類仍然面臨著維數(shù)災(zāi)難[2]的問題。隨著深度學(xué)習(xí)的應(yīng)用愈發(fā)廣泛,利用深度學(xué)習(xí)對高光譜圖像進(jìn)行分類逐步成為目前的研究熱點。
衛(wèi)星通信論文范例:基于衛(wèi)星通信的應(yīng)急通信系統(tǒng)
卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetworks,CNN)[3]的網(wǎng)絡(luò)結(jié)構(gòu)簡單,不需要人工設(shè)計參數(shù),并且能夠提取深層特征。Chen等人[4]提出首次將空間信息加入到基于光譜信息的堆疊自編碼器(SAE)中,提出一種新的融合光譜信息和空間信息的深度學(xué)習(xí)框架。Huang等人[5]提出雙向遞歸神經(jīng)網(wǎng)絡(luò)(Bi-RNN),用于高光譜圖像分類,考慮了波段之間的相關(guān)性,同時利用前向和后向的信息進(jìn)行分類。無論是SAE還是RNN在輸入時都要將特征拉成一維的向量,以適應(yīng)網(wǎng)絡(luò)結(jié)構(gòu),而高光譜圖像是三維結(jié)構(gòu),無法完整保留空間特征。
二維卷積神經(jīng)網(wǎng)絡(luò)(2DCNN)[6]在三通道圖像上表現(xiàn)良好,但是高光譜圖像有上百個波段,2DCNN無法很好地利用這些波段信息。3D圖像的處理促進(jìn)了三維卷積神經(jīng)網(wǎng)絡(luò)(3DCNN)[7]的發(fā)展,3DCNN可以在空間維度上實施卷積操作,有效利用了圖像的空間特征,而相鄰像素一般在很小的空間里屬于同一類別的可能性很高,而且3DCNN可直接對三維數(shù)據(jù)進(jìn)行特征提取,得到深層空間和光譜信息。
但隨著網(wǎng)絡(luò)層次的加深,網(wǎng)絡(luò)難以收斂,尤其是在樣本量較少的情況下,網(wǎng)絡(luò)結(jié)構(gòu)的加深并不能有效提高分類精度,甚至?xí)尸F(xiàn)梯度消失和梯度爆炸的現(xiàn)象。殘差學(xué)習(xí)和普通神經(jīng)網(wǎng)絡(luò)區(qū)別在于引入捷徑連接,構(gòu)造殘差模塊,殘差模塊以跳層連接的形式實現(xiàn),將單元的輸入直接與單元的輸出加在一起,再使用激活函數(shù)進(jìn)行組合,有效防止了網(wǎng)絡(luò)層數(shù)加深時產(chǎn)生的梯度消失或梯度爆炸問題。
并且殘差網(wǎng)絡(luò)容易優(yōu)化、不會引入額外的參數(shù)。高光譜圖像中的紋理信息,是辨別地物類別的重要因素。Gabor濾波器[8]具有提供區(qū)分性和信息性的特性,對圖像的邊緣變化敏感,有較好的方向性和尺度選擇性。與其它濾波方法相比,Gabor濾波器在提取紋理信息方面顯示出優(yōu)越性能,可以同時在方向和尺度兩個維度進(jìn)行濾波,獲取紋理特征。付青等[9]提出了Log-Gabor-CNN方法,使用Log-Gabor提取其紋理特征。但Log-Gabor為二維Gabor濾波器,只能獲取其紋理特征而沒有考慮光譜信息。
三維Gabor濾波器[10]能夠在提取紋理特征的同時保留光譜信息。馮逍等[11]將三維Gabor濾波器與SVM[12]結(jié)合(Gabor-SVM)用于高光譜影像分類。而SVM分類器雖然可以通過調(diào)節(jié)輸入的信息比如空譜信息來獲得分類結(jié)果,由于是基于淺層特征的分類,精度不高。魏祥坡等[13]提出了雙通道卷積神經(jīng)網(wǎng)絡(luò)和三維Gabor結(jié)合的地物分類方法Gabor-DC-CNN(Gabor-dual-channel-CNN),使用2DCNN提取圖像的空間信息,利用三維Gabor濾波器,對立方體數(shù)據(jù)進(jìn)行濾波,輸入到一維卷積神經(jīng)網(wǎng)絡(luò)(1DCNN)中進(jìn)行深層光譜-紋理特征提取,最后將兩種特征進(jìn)行融合。1DCNN的感受野較小,只能考慮每個位置單獨的信息,而且需要雙通道進(jìn)行特征提取,最后進(jìn)行融合,需要大量的訓(xùn)練時間,效率不高。
為了充分利用高光譜圖像立方體數(shù)據(jù)的信息,本文提出了一種基于三維Gabor濾波器和殘差3DCNN的高光譜圖像分類方法。該方法可以通過三維Gabor濾波器得到包含紋理-光譜信息的立方體數(shù)據(jù),3DCNN可以直接對處理后的立方體數(shù)據(jù)進(jìn)行特征提取,充分利用數(shù)據(jù)的紋理-光譜信息。在三維卷積神經(jīng)網(wǎng)絡(luò)中,添加了多個殘差模塊,用于更有效地提取抽象特征表示。同時,通過殘差模塊,解決隨網(wǎng)絡(luò)深度增加導(dǎo)致的梯度彌散和梯度爆炸問題,提升網(wǎng)絡(luò)性能,有效提高了高光譜圖像中的地物信息的分類精度。
1本文方法
本文方法針對高光譜三維立方體數(shù)據(jù),首先使用三維Gabor濾波器,得到包含紋理-光譜信息的三維立方體數(shù)據(jù);然后輸入到殘差三維卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行特征提取,最后進(jìn)行地物分類。
1.1三維Gabor濾波器
由于高光譜圖像三維數(shù)據(jù)的特殊性,二維Gabor濾波器只能獲取紋理特征沒有考慮光譜特征。三維Gabor能夠在頻域和空間域找到最好的組合定位,在提取紋理信息的基礎(chǔ)上,考慮了圖像的光譜特征。對于紋理信息和光譜信息擁有較好的識別能力。
網(wǎng)絡(luò)結(jié)構(gòu)中共包含3個殘差模塊,其中1個虛線范圍表示使用一個殘差模塊,包括2個5×5×5的三維卷積核和一個特征融合模塊。本文設(shè)計的殘差模塊,放在卷積層之后,將上一層卷積得到的特征,與殘差模塊內(nèi)經(jīng)過2層卷積得到的特征進(jìn)行特征融合,經(jīng)過ReLU激活函數(shù)后,繼續(xù)輸入到下一個池化層。
這使得該殘差模塊在輸入特征基礎(chǔ)上學(xué)習(xí)到新的特征,從而擁有更好的特征表示。為了讓激活函數(shù)更有效地使用輸入信息,在每次ReLU之前采用批量歸一化BN(BatchNormalization),為了防止實驗結(jié)果過擬合,采用Dropout正則化[16]方式,隨機(jī)刪除部分隱藏層結(jié)果。之后,將獲得的結(jié)果輸入全連接層。最后,使用Softmax激活函數(shù),進(jìn)行分類操作,得到其類別標(biāo)簽。
2實驗與分析
實驗時的硬件運行環(huán)境是AMDRyzen53600XCPU@3.80GHz處理器,RadeonRX5500XT@8GBGDDR6顯卡,金士頓駭客3200MHz@8gDDR4內(nèi)存,編譯環(huán)境Python3.6+Tensorflow1.13。2.1實驗數(shù)據(jù)為了證實所提方法的有效性,本文使用目前公開且具有代表性的PaviaU、IndianPines和Salinas數(shù)據(jù)集進(jìn)行實驗。
2.2參數(shù)設(shè)置
訓(xùn)練網(wǎng)絡(luò)時參數(shù)設(shè)置如下:方差為0.1、均值為0、Dropout為0.5、偏置為0.1的截斷正態(tài)分布,初始學(xué)習(xí)率為0.001。從訓(xùn)練時間和測試時間的結(jié)果可以看出,本文方法比Gabor-DC-CNN方法消耗的時間少,主要因為Gabor-DC-CNN是雙通道卷積神經(jīng)網(wǎng)絡(luò),需要分別進(jìn)行訓(xùn)練,所需時間稍長。
和3DCNN方法相比,訓(xùn)練時間多了10s左右,主要因為使用了Gabor濾波器進(jìn)行濾波,加入殘差會在原來的網(wǎng)絡(luò)結(jié)構(gòu)上增加一條路徑,從而降低了網(wǎng)絡(luò)運行效率,增加了訓(xùn)練時間。Log-Gabor-CNN是2DCNN,相比三維卷積在時間效率上會快一些,但同時分類精度會略有下降。Gabor-SVM是使用三維Gabor濾波和SVM進(jìn)行分類,和其它深度學(xué)習(xí)方法相比優(yōu)點在于省去了網(wǎng)絡(luò)訓(xùn)練步驟,因此效率更高,和本文方法相比訓(xùn)練時間快了50s左右,但分類精度不高。
3結(jié)論
本文針對高光譜圖像維度高,具有豐富的光譜信息和紋理信息的特性,提出了一種基于三維Gabor濾波器和殘差3DCNN的高光譜圖像分類方法。主要貢獻(xiàn)為:(1)通過三維Gabor濾波器得到的紋理特征和光譜信息,有助于高光譜遙感圖像的地物分類。(2)通過殘差三維卷積神經(jīng)網(wǎng)絡(luò)對處理后的數(shù)據(jù)進(jìn)行深層特征提取,得到深層光譜紋理特征,利用殘差模塊,有效解決了網(wǎng)絡(luò)訓(xùn)練中梯度消失以及梯度爆炸問題,有效提高地物分類精度。實驗結(jié)果表明,本文提出的方法3DGabor-Res-3DCNN的分類精度能夠達(dá)到97.86%。與其它高光譜圖像分類方法相比,本文使用的方法能夠有效提高分類精度。在之后的研究工作中,準(zhǔn)備在保證分類精度的同時,進(jìn)一步提高算法的運行效率。
參考文獻(xiàn)(References):
[1]AhmadM,ShabbirS,OlivaD,etal.Spatial-priorgeneralizedfuzzinessextremelearningmachineautoencoder-basedactivelearningforhyperspectralimageclassification[J].Optik,2020,206:163712-.
[2]HSIEHPF.Impactandrealizationofincreasedclassessep-arabilityon thesmallsamplesizeprobleminthehyperspectralclassification[J].CanadianJournalofRemoteSensing,2009,35(3):248-261.
[3]KRIZHEVSKYA,SUTSKEVERI,HINTONGE.ImageNetclassificationwithdeepconvolutionalneuralnetworks[J].CommunicationsoftheACM,2017,60(6):84-90.
[4]CHENY,LINZ,ZHAOX,etal.DeepLearning-BasedClassificationofHyperspectralData[J].IEEEJournalofSelectedTopicsinAppliedEarthObservations&RemoteSensing,2017,7(6):2094-2107.
[5]HUANGS,WANGX,HEH,etal.HyperspectralImageClassificationBasedonBidirectionalRecurrentNeuralNetwork[C]//2019IEEEInternationalConferenceonSignalProcessing,CommunicationsandComputing(ICSPCC).IEEE,2019.
[6]H.LEE,H.KWON.ContextualdeepCNNbasedhyperspectralclassification[J].2016IEEEInternationalGeoscienceandRemoteSensingSymposium(IGARSS),Beijing,2016,pp.3322-3325,doi:10.1109/IGARSS.2016.7729859
作者:張明華1,牛玉瑩1,杜艷玲1,黃冬梅1,2,劉刻福3