時(shí)間:2022年07月13日 分類:科學(xué)技術(shù)論文 次數(shù):229
摘 要:為降低無人機(jī)測繪數(shù)據(jù)異常檢測的誤檢率、漏檢率,縮短檢測時(shí)間,文章提出一種基于數(shù)據(jù)篩選的無人機(jī)測繪數(shù)據(jù)異常檢測方法。采用支持向量機(jī)對無人機(jī)測繪數(shù)據(jù)進(jìn)行數(shù)據(jù)流分塊、豎向規(guī)范化處理及時(shí)間切片處理等預(yù)處理;基于卷積神經(jīng)網(wǎng)絡(luò)分析數(shù)據(jù)確定數(shù)據(jù)潛在規(guī)律;采用無監(jiān)督聚類算法對數(shù)據(jù)進(jìn)行聚類,利用滑動窗口處理得到數(shù)據(jù)流簇心因子并進(jìn)行聚類;根據(jù)判斷標(biāo)準(zhǔn)對異常數(shù)據(jù)分塊處理,確定是否存在異常因子;采用重疊累加值計(jì)算方法對異常數(shù)據(jù)點(diǎn)進(jìn)行篩選,完成無人機(jī)測繪數(shù)據(jù)異常檢測。實(shí)驗(yàn)結(jié)果表明:與傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)方法相比,采用該方法對異常數(shù)據(jù)檢測,其誤檢率降低了約 11%、漏檢率降低約 8.1%,并且檢測時(shí)間縮短了 11.3 min。
關(guān)鍵詞:無人機(jī)測繪;異常數(shù)據(jù);支持向量機(jī);卷積神經(jīng)網(wǎng)絡(luò);簇心因子;滑動窗口
無人機(jī)測繪綜合了無人飛行器、遙感傳感器、通信和圖像處理等多種技術(shù),以實(shí)時(shí)獲取目標(biāo)區(qū)域信息、快速進(jìn)行數(shù)據(jù)處理和繪圖為主要目的[1]。這種方法運(yùn)行成本低、風(fēng)險(xiǎn)小,且數(shù)據(jù)采集周期相對較短,已被廣泛應(yīng)用于相關(guān)領(lǐng)域。無人機(jī)測繪生成的飛行數(shù)據(jù)具有快速、實(shí)時(shí)等特點(diǎn)[2]。采用此技術(shù)獲取的單維特征流數(shù)據(jù)主要反映被測系統(tǒng)的某一狀態(tài)信息,然而多維數(shù)據(jù)庫中異常數(shù)據(jù)是各維度信息綜合作用的結(jié)果,能夠反映無人機(jī)(unmannedaerial vehicle,UAV)的實(shí)際情況,具有更高的參考價(jià)值[3]。
目前,基于無人機(jī)測繪的異常檢測算法已經(jīng)被廣泛應(yīng)用,但大多算法不能滿足無人機(jī)測繪的實(shí)時(shí)檢測需求。為此,本文提出一種基于數(shù)據(jù)篩選的無人機(jī)測繪數(shù)據(jù)異常檢測方法。實(shí)驗(yàn)結(jié)果表明:與傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)方法相比,該方法降低了檢測的漏檢率與誤檢率,并縮短了檢測時(shí)間。該檢測方法能夠滿足無人機(jī)測繪中的異常數(shù)據(jù)檢測需求,可實(shí)際應(yīng)用到異常數(shù)據(jù)檢測中。
1 無人機(jī)測繪過程中異常數(shù)據(jù)挖掘
在異常數(shù)據(jù)檢測過程中,須預(yù)先對無人機(jī)測繪過程中產(chǎn)生的相關(guān)數(shù)據(jù)進(jìn)行挖掘。與其他數(shù)據(jù)挖掘技術(shù)相比,支持向量機(jī)是一種監(jiān)督式的數(shù)據(jù)挖掘方法,其對樣本的依賴性較小,對小樣本、高維數(shù)據(jù)等分類具有較好的應(yīng)用效果[4]。為此,本文將支持向量機(jī)應(yīng)用到無人機(jī)測繪數(shù)據(jù)挖掘中。在上述數(shù)據(jù)分類的基礎(chǔ)上,對無人機(jī)測繪過程中產(chǎn)生的數(shù)據(jù)流進(jìn)行預(yù)處理。即對無人機(jī)測繪異常數(shù)據(jù)進(jìn)行數(shù)據(jù)流分塊、豎向規(guī)范化處理與時(shí)間切片處理,便于對無人機(jī)測繪數(shù)據(jù)潛在規(guī)律的分析。
1)數(shù)據(jù)流分塊。由于無人機(jī)測繪過程中產(chǎn)生的數(shù)據(jù)流可看作是一系列無限的點(diǎn)[6],其存儲相對較難,為此將其劃分為數(shù)據(jù)塊的形式。將數(shù)據(jù)塊的大小定義為 ,將數(shù)據(jù)塊劃分為若干類,并對其進(jìn)行標(biāo)準(zhǔn)化處理。2)豎向規(guī)范化處理。由于采集的數(shù)據(jù)存在屬性差異,導(dǎo)致其屬性難以得到合理的調(diào)配。
2 無人機(jī)測繪中異常數(shù)據(jù)潛在規(guī)律分析
在上述預(yù)處理后,對數(shù)據(jù)潛在規(guī)律進(jìn)行分析。此部分采用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分析處理。該方法的局部特征提取能力較強(qiáng),能夠降低網(wǎng)絡(luò)的計(jì)算復(fù)雜度[12 − 13]。其挖掘過程如下。步驟 1,設(shè)置輸入層。輸入層是整個(gè)網(wǎng)絡(luò)的起始端[14],是整個(gè)網(wǎng)絡(luò)的輸入部分,能夠?qū)σ痪S數(shù)據(jù)或者二維數(shù)據(jù)進(jìn)行挖掘。步驟 2,建立激勵(lì)層函數(shù)。步驟 3,建立池化層。通過該環(huán)節(jié)將數(shù)據(jù)進(jìn)行壓縮,利用池化窗口生成的值生成周圍區(qū)域的統(tǒng)計(jì)量。步驟 4,建立全連接層。該層主要在計(jì)算過程中提供輸送信號的功能,將數(shù)據(jù)的特征值進(jìn)行連接,并連接成一個(gè)長向量。步驟 5,反向傳播。
3 無人機(jī)測繪過程中異常數(shù)據(jù)檢測實(shí)現(xiàn)
3.1 異常數(shù)據(jù)分類
通過上述計(jì)算能夠獲取所有數(shù)據(jù)的潛在規(guī)律,在此基礎(chǔ)上,對異常數(shù)據(jù)進(jìn)行分類處理。在無人機(jī)測繪過程中,較多因素都會引起異常,從而產(chǎn)生異常數(shù)據(jù)[16]。為此,對異常數(shù)據(jù)進(jìn)行分類。由于無人飛行器內(nèi)有較多傳感器,因此產(chǎn)生異常數(shù)據(jù)的因素較多,不僅能產(chǎn)生異常數(shù)據(jù),而且需要及時(shí)發(fā)現(xiàn)異常數(shù)據(jù)。為提高檢測效率,對所生成數(shù)據(jù)進(jìn)行聚類,本文采用無監(jiān)督聚類算法。當(dāng)數(shù)據(jù)流到達(dá)時(shí),該算法能及時(shí)更新,并對數(shù)據(jù)進(jìn)行實(shí)時(shí)聚類。對數(shù)據(jù)進(jìn)行相似性分類,將相似的分類成數(shù)據(jù)簇[17]。在實(shí)際計(jì)算過程中,主要包括 2 個(gè)步驟:首先測量數(shù)據(jù)與數(shù)據(jù)之間相似性,然后利用準(zhǔn)則函數(shù)對結(jié)果進(jìn)行聚類分類[18]。
3.2 異常數(shù)據(jù)檢測實(shí)現(xiàn)在上述數(shù)據(jù)處理的基礎(chǔ)上,對異常數(shù)據(jù)檢測,具體步驟如下。步驟 1,由于無人飛行器測繪所產(chǎn)生的數(shù)據(jù)是飛行數(shù)據(jù),即時(shí)間序列數(shù)據(jù),因此需要對以上聚類后的數(shù)據(jù)進(jìn)行劃分,并將其劃分為時(shí)間序列數(shù)據(jù),從而得到各時(shí)間序列變化情況,并將變化情況插入時(shí)間序列數(shù)據(jù)中,形成相應(yīng)編碼數(shù)。步驟 2,生成數(shù)據(jù)存儲在模式庫中。該模式庫將特定的生成模式與自體發(fā)生相匹配,并將其視為合成檢測器[19]。
4 實(shí)驗(yàn)分析
本文通過實(shí)驗(yàn)來驗(yàn)證該方法是否符合設(shè)計(jì)要求。同時(shí),為檢驗(yàn)該方法的應(yīng)用效果,將該方法與傳統(tǒng)基于卷積神經(jīng)網(wǎng)絡(luò)的異常數(shù)據(jù)檢測方法進(jìn)行了比較。
4.1 實(shí)驗(yàn)數(shù)據(jù)來源及實(shí)驗(yàn)環(huán)境
實(shí)驗(yàn)在 Windows7 操作系統(tǒng)下進(jìn)行,選用 Intel(R) Core (TM)i5 M 520 作為 CPU,其內(nèi)存頻率較快,可以達(dá)到 2.4 GHz,內(nèi)存 8 GB。所用實(shí)驗(yàn)數(shù)據(jù)集通過高斯分布獲取,這些數(shù)據(jù)集共有 1600 個(gè)數(shù)據(jù)點(diǎn),其中包含 1500 個(gè)正常數(shù)據(jù)點(diǎn),100 個(gè)異常數(shù)據(jù)點(diǎn)。
4.2 實(shí)驗(yàn)指標(biāo)
異常檢測的實(shí)時(shí)性也是對比檢測方法性能的一個(gè)重要指標(biāo)。
4.3 實(shí)驗(yàn)結(jié)果分析
對比卷積神經(jīng)網(wǎng)絡(luò)方法與本文方法的誤檢率。本文的異常數(shù)據(jù)檢測方法的誤檢率相比卷積神經(jīng)網(wǎng)絡(luò)方法,平均降低了約 11%。本文方法誤檢率低是由于本文方法在數(shù)據(jù)流上進(jìn)行了分塊和分類處理,并對處理后的數(shù)據(jù)進(jìn)行了綜合聚類分析。常規(guī)檢測方法受數(shù)據(jù)集干擾的影響較大,有些異常數(shù)據(jù)點(diǎn)在正常數(shù)據(jù)波動范圍外,導(dǎo)致其誤檢率較高。對比卷積神經(jīng)網(wǎng)絡(luò)方法和本文方法的漏檢率。
本文方法的漏檢率相比卷積神經(jīng)網(wǎng)絡(luò)方法的平均降低了約 8.1%。常規(guī)卷積神經(jīng)網(wǎng)絡(luò)方法檢測漏檢率高的原因在于異常數(shù)據(jù)的幅度不在正確的數(shù)據(jù)范圍之內(nèi),且往往以片斷形式出現(xiàn),用常規(guī)方法進(jìn)行標(biāo)記時(shí),存在較大的漏檢風(fēng)險(xiǎn)。本文的異常數(shù)據(jù)檢測方法是通過詳細(xì)的檢測流程實(shí)現(xiàn)對異常樣本的有效檢測,從而降低了漏檢現(xiàn)象。最后,對比卷積神經(jīng)網(wǎng)絡(luò)方法與本文方法的檢測時(shí)間。可以看出,卷積神經(jīng)網(wǎng)絡(luò)方法在多個(gè)實(shí)驗(yàn)中所需檢測時(shí)間均高于本文方法,最多相差 16 min。本文方法的整體檢測時(shí)間平均縮短了 11.3 min 左右。本文的異常數(shù)據(jù)檢測方法不僅可以降低誤檢率和漏檢率,而且可以提高檢測的實(shí)時(shí)性。
5 結(jié)束語
本文對無人機(jī)測繪過程中的異常數(shù)據(jù)檢測方法進(jìn)行了設(shè)計(jì),并通過實(shí)驗(yàn)對該方法進(jìn)行了驗(yàn)證。該方法可為相關(guān)測繪領(lǐng)域的異常數(shù)據(jù)檢測提供實(shí)用的解決方案。盡管本次研究取得了一定成果,但無人機(jī)測繪的數(shù)據(jù)范圍比較廣泛,在未來工作中可強(qiáng)化分析數(shù)據(jù)與數(shù)據(jù)之間的關(guān)聯(lián)特征,選擇融合不同的檢測方法,從而實(shí)現(xiàn)多種異常檢測方法的優(yōu)勢互補(bǔ)。
參考文獻(xiàn):
[1] 孫新博, 李英成, 王恩泉, 等. 一種無人機(jī)視頻影像快速配準(zhǔn)方法[J]. 測繪通報(bào), 2019(6): 85 − 88.
[2] 任麗艷, 李英成, 肖金城, 等. 測繪無人機(jī)災(zāi)害現(xiàn)場多源數(shù)據(jù)集成與智能服務(wù)[J]. 測繪科學(xué), 2020, 45(12):143 − 148.
[3] 張欣欣, 王雙亭, 李英成, 等. 輕小型無人機(jī)飛控測姿數(shù)據(jù)輔助測圖精度分析[J]. 測繪科學(xué), 2019, 44(5):102 − 109.
[4] 梅御東, 陳旭, 孫毓忠, 等. 一種基于日志信息和CNN-text 的軟件系統(tǒng)異常檢測方法[J]. 計(jì)算機(jī)學(xué)報(bào),2020, 43(2): 366 − 380.
[5] 連鴻飛, 張浩, 郭文忠. 一種數(shù)據(jù)增強(qiáng)與混合神經(jīng)網(wǎng)絡(luò)的異常流量檢測[J]. 小型微型計(jì)算機(jī)系統(tǒng), 2020,41(4): 116 − 123.
[6] 徐光南, 高智勇, 梁艷杰, 等. 采用壓縮感知的流程工業(yè)異常監(jiān)測數(shù)據(jù)檢驗(yàn)與修復(fù)方法[J]. 西安交通大學(xué)學(xué)報(bào), 2020, 54(2): 59 − 70.
選自期刊《西華大學(xué)學(xué)報(bào)(自然科學(xué)版)》第 41 卷第 4 期
作者信息:張振軍(青海漢圖測繪科技有限公司, 青海 西寧 810001)
鍜屽浗澶栫爺绌跺憳鎴愪负1绡囪鏂囩殑浣滆€咃紝鍏变韩瀛︽湳璧勬簮锛岃妭鐪佹椂闂村拰绮惧姏锛屽彂琛ㄦ湁淇濋殰銆�
閽堝瀛︽湳璁烘枃锛屼粠鎶曞墠璇勪及鍒板綍鐢紝鍏ㄨ繃绋嬫寚瀵煎苟鍗忓姪锛屽噺灏戞氮璐规椂闂淬€�
鍚岄鍩熺爺绌跺憳鎺ㄨ崘鏈熷垔锛屽垎鏋愯鏂囪川閲忋€佷綔鑰呴渶姹傘€佹湡鍒婂緛绋胯姹傜簿鍑嗘帹鑽愩€�
鏂囩珷棰勫璇勪及鏈嶅姟锛岄個璇峰悓棰嗗煙涓撳瀹$ǹ锛岀粰鍑轰慨鏀规剰瑙侊紝鎻愰珮琚帴鏀剁殑鍑犵巼銆�
鏀瑰杽闈炶嫳璇瘝璇鐮斿鑰呮枃绔犺瑷€锛岀‘淇濇枃绔犱笉鍥犺瑷€銆佽娉曠瓑闂鑰岄€€淇敋鑷虫嫆绋裤€�
鍥藉唴澶栭珮鏍″拰绉戠爺鏈烘瀯绮鹃€氫腑鑻卞弻璇殑涓撳缈昏瘧鏂囩珷锛岀‘淇濊嫳鏂囪瘝璇噯纭€с€佷笓涓氭€с€�
浣跨敤鍥介檯鏈熷垔閫氱敤鏁版嵁搴撹繘琛岃嫳鏂囨煡閲嶏紝鑾峰緱涓庡嚭鐗堝晢鐩稿悓閲嶅鐜囦俊鎭紝鎻愬墠闄嶉噸銆�
鏃ㄥ湪甯綔鑰呭皢绋夸欢鎻愪氦鑷崇洰鏍囨湡鍒婃姇绋跨郴缁燂紝浣滆€呴伩鍏嶈€借鏃堕棿锛屾垨鍥犺鎿嶄綔瀵艰嚧閫€绋裤€�