期刊VIP學術指導 符合學術規(guī)范和道德
保障品質(zhì) 保證專業(yè),沒有后顧之憂
來源:期刊VIP網(wǎng)所屬分類:通信時間:瀏覽:次
【摘要】 傳統(tǒng)基于高分辨率遙感圖像的道路提取方法計算復雜度高,難以實現(xiàn)自動化,基于深度學習的方法可以顯著提高提取的精度和效率。本文選取CVPR 2018 Deep Globe數(shù)據(jù)集作為訓練數(shù)據(jù)集,基于Tensorflow框架的Adam優(yōu)化算法,采用ResNet模型對孟加拉國沿海區(qū)域進行了道路識別和提取。經(jīng)與人工目視解譯數(shù)據(jù)集驗證,得到道路提取總體精度為97.85%,驗證了方法的有效性。
【關鍵詞】 深度卷積神經(jīng)網(wǎng)絡;道路提取 ResNet 網(wǎng)絡結構 Adam優(yōu)化算法
引言:
隨著計算機技術的快速發(fā)展,在一些復雜的大樣本背景下,神經(jīng)網(wǎng)絡顯示出其獨特的優(yōu)勢。如何利用卷積神經(jīng)網(wǎng)絡來解決遙感圖像目標識別和地物提取等領域的熱點問題,引起了廣泛關注。
魏清等人[1]提出了一種結合神經(jīng)網(wǎng)絡模型和數(shù)學形態(tài)學算法的高分辨率遙感影像道路自動提取方法,能夠有效地自動識別道路區(qū)域。郭正勝等人[2]提出一種基于U型卷積網(wǎng)絡的ZY-3道路提取方法,使用形態(tài)學開運算完成孔洞的去除等工作使提取結果在不同實驗區(qū)域中平均準確度達到了95%以上。戴激光等人[3]提出一種基于多尺度卷積神經(jīng)網(wǎng)絡的高分辨率遙感圖像道路提取方法,與傳統(tǒng)的卷積神經(jīng)網(wǎng)絡和U-Net網(wǎng)絡相比,該方法在準確度和精確度上均具有較大優(yōu)勢。Fran?ois Waldner等[4]提出了一種數(shù)據(jù)驅(qū)動、魯棒性強、通用性強的衛(wèi)星圖像場邊界提取方法,使用具有完全連接的U-Net骨干的深度卷積神經(jīng)網(wǎng)絡,能夠從圖像中學習復雜的層次上下文特征以準確地檢測場邊界和丟棄不相關的邊界,優(yōu)于傳統(tǒng)的邊緣濾波器。宋延強等人[5]提出一種在 SegNet 架構的基礎上改進的網(wǎng)絡模型 AA-SegNet,增加了增強的空間金字塔池化模塊和空間注意力融合模塊,能夠更好的學習小目標特征,總體識別準確率達 96.61%。Faster R-CNN 利用RPN 網(wǎng)絡提取待選區(qū)域,并將 RPN 和 Faster R-CNN 結合成一個網(wǎng)絡共享卷積特征,實現(xiàn)真正意義上的端到端訓練,RPN是一個全卷積網(wǎng)絡,通過在特征圖上做窗口滑動,將錨點框(anchor) 映射到原始圖像,并獲得不同大小和比例的候選區(qū)域[6]。為彌補Faster R-CNN 對被遮擋目標和弱小目標不敏感的缺陷,張慶輝等人[7]構建了一個快速、精確道路目標檢測算法(FAROD),獲得了更快的檢測速度和更高的魯棒性。
綜上,基于深度卷積神經(jīng)網(wǎng)絡的高分辨率遙感圖像的道路提取雖取得較好的發(fā)展,但仍需進行深入研究。本文將ResNet模型與Adam優(yōu)化算法相結合,可提高道路檢測的魯棒性,優(yōu)化道路提取網(wǎng)絡模型的性能。
一、研究方法
本文以高分辨率遙感圖像作為研究對象,將衛(wèi)星圖像的每個像素標記為道路或非道路,既將像素通過二值語義分割的方式來標記為道路。本文將基于深度卷積神經(jīng)網(wǎng)絡(DCNN)結構中的ResNet網(wǎng)絡模型提取高分辨率遙感圖像深度特征。選擇道路為提取目標,以 ResNet 模型為基礎,采用一種針對高分辨率衛(wèi)星圖像道路提取的網(wǎng)絡模型算法Adam優(yōu)化算法,該方法將提高模型的學習效率。同時避免丟失更多的細節(jié)特征,為提高道路提取的準確性提供參考。
1.1 Adam優(yōu)化學習算法
Adam 算法和傳統(tǒng)的隨機梯度下降不同。隨機梯度下降保持單一的學習率更新所有的權重,學習率在訓練過程中并不會改變。均方根傳播(RMSProp)優(yōu)化算法將微分平方加權平均算法引入其中,在參數(shù)空間的更平緩的方向上,將會取得更大的進步(因為該平緩,歷史梯度的平方和更小,并且相應的學習下降幅度更小),并且能夠使得陡峭的方向變得平緩,即收斂能在水平方向上采取更大的步長,從而加快訓練速度。Adam既能像Momentum系列算法那樣優(yōu)化更新方向,也能像AdaGrad系列算法那樣調(diào)整學習效率。其公式如下:
其中, 為梯度; 、為累計梯度, 為學習率,參數(shù) 、∈ [0, 1) 控制了這些移動均值(moving average)指數(shù)衰減率。Adam 優(yōu)化算法是將動量法和 RMSprop優(yōu)化算法結合起來使用的一種算法,它能夠同時使用梯度和梯度平方的指數(shù)加權平均。該方法能夠通過快速收斂網(wǎng)絡得到最優(yōu)解,具有較好的穩(wěn)定性。
Adam算法的精度和收斂速度在上述算法中相對較好,故采用Adam 優(yōu)化算法進行實驗,將參數(shù)設定為:學習率為0.001、beta1=0.9和beta2=0.999 。其中beta1為一階矩估計的指數(shù)衰減率,beta2為二階矩估計的指數(shù)衰減率。
1.2 ResNet網(wǎng)絡模型
傳統(tǒng)的卷積神經(jīng)網(wǎng)絡在一定程度上會隨著深度的增加而提高識別、提取精度,但是達到一定的深度時,梯度消失問題將越來越嚴重,容易出現(xiàn)過度擬合問題,就是所謂的“退化”問題,使得模型效果變差。針對這一問題,本文采用深度殘差網(wǎng)絡(Deep Residual Network)。該網(wǎng)絡模型通過利用殘差學習單元,可以達到比傳統(tǒng)神經(jīng)網(wǎng)絡更深的深度,具有很好的網(wǎng)絡特征提取效果。
1.3 數(shù)據(jù)集的選取
本文選定Deep Globe的數(shù)據(jù)作為實驗數(shù)據(jù)集,其圖像分辨率為1024×1024,它包含訓練數(shù)據(jù)集、測試數(shù)據(jù)集兩部分,其中訓練數(shù)據(jù)集包含6226幅圖像,測試數(shù)據(jù)集包含201幅圖像,圖片來自泰國、印度、印尼等多個國家。圖像場景包括城市、村莊、郊區(qū)、海灘、熱帶雨林等場景。訓練數(shù)據(jù)集樣本量大,包含沙漠、城市、農(nóng)田、村莊等多種地物信息,使得訓練后的網(wǎng)絡模型具有較強的魯棒性和預測性,且與孟加拉國局部區(qū)域具有相似性。
二、實驗結果與分析
在進行神經(jīng)網(wǎng)絡提取時,需要采用一些指標來衡量訓練的網(wǎng)絡模型,常用的評價形式有混淆矩陣,準確率等?;煜仃囍饕糜趯⒎诸惤Y果與實際測量值進行比較。分類結果的準確性可以在混淆矩陣中顯示。準確率(Accuracy):預測正確的所有樣本占所有測試樣本的比例。