時間:2020年04月22日 分類:科學(xué)技術(shù)論文 次數(shù):
摘要:針對現(xiàn)有的細胞分類方法在準(zhǔn)確率方面無法滿足人們要求的現(xiàn)象,本文提出一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的細胞分類新方法:嵌套殘差網(wǎng)絡(luò)(MultipleResidualNeuralNetwork,M-ResNet)。該方法以深度學(xué)習(xí)理論為基礎(chǔ),在原始ResNet50基礎(chǔ)上添加了更高級別的快捷連接(嵌套快捷連接),以挖掘殘差網(wǎng)絡(luò)的優(yōu)化能力。實驗采取宮頸癌細胞作為數(shù)據(jù)集進行了細胞分類方法測試,其中3528幅作為訓(xùn)練集,350幅作為測試集。通過與ResNet50網(wǎng)絡(luò)模型進行對比實驗,得出測試結(jié)果表明:該方法可以有效提高細胞分類的正確率和工作效率,驗證了該方法的有效性。這些研究對卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用和細胞分類方法的發(fā)展有著重要的意義,有很好的現(xiàn)實價值。
關(guān)鍵詞:宮頸細胞;深度學(xué)習(xí);卷積神經(jīng)網(wǎng)絡(luò);殘差網(wǎng)絡(luò);快捷連接
0引言
在現(xiàn)代醫(yī)學(xué)診斷中,細胞圖像分類發(fā)揮著重要的作用。通過對細胞圖像的分類,可以快速得到細胞的部分狀態(tài)信息,對病理的診斷和確定有著重要的意義。因此,長期以來醫(yī)學(xué)診斷的發(fā)展都是人們關(guān)注的重點研究課題。我國對于醫(yī)學(xué)診斷中的細胞分類研究也十分重視。隨著新技術(shù)的發(fā)展和應(yīng)用,原有的細胞分類方法在分類效率等方面的缺陷逐漸暴露出來。為了推動細胞分類工作的發(fā)展,本文擬通過分析細胞分類方法目前存在的問題,研究一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的細胞分類新方法M-ResNet。
1細胞分類與深度卷積神經(jīng)網(wǎng)絡(luò)
細胞圖像分類是現(xiàn)代醫(yī)學(xué)診斷中常用的一種技術(shù)方法。目前細胞分類方法已經(jīng)發(fā)展的比較成熟,可以滿足不同條件下的需求。在應(yīng)用的過程中,現(xiàn)有的細胞分類方法也存在著一定的不足。
1.1細胞分類方法現(xiàn)存問題
細胞學(xué)檢查法最早應(yīng)用于早期宮頸癌的排查工作。通過對細胞圖像的分析實現(xiàn)對細胞生理信息的判斷,可以有效提高早期宮頸癌的排查效率和準(zhǔn)確率。但該類方法不僅需要大量專業(yè)技術(shù)人員,而且工作效率低下[1]。采用計算機輔助細胞學(xué)檢測的方法不僅可以提高篩選效率,也能夠有效降低誤診率和假陰性率[2]。
經(jīng)過多年發(fā)展,計算機輔助的細胞圖像分類方法已經(jīng)比較成熟。目前應(yīng)用于細胞分類的方法主要有兩種,分別是基于細胞核特征構(gòu)建的分類方法和多圖像裁剪分類方法。但這兩種方法的應(yīng)用都存在一定的局限性。基于細胞核特征構(gòu)建的分類方法缺乏一定的準(zhǔn)確率,而多圖像裁剪分類則容易造成信息冗余或丟失等[3-4]。因此,人們需要推動新的細胞分類方法的發(fā)展。深度卷積神經(jīng)網(wǎng)絡(luò)憑借自身的優(yōu)勢受到了人們的廣泛關(guān)注。
1.2卷積神經(jīng)網(wǎng)絡(luò)發(fā)展現(xiàn)狀
針對原有的細胞分類方法存在的缺陷,人們提出了基于卷積神經(jīng)網(wǎng)絡(luò)的細胞分類方法。作為人工神經(jīng)網(wǎng)絡(luò)的一種,卷積神經(jīng)網(wǎng)絡(luò)(CNN)在降低模型復(fù)雜度和權(quán)值數(shù)量的同時,可以有效保持圖像的高度不變形。因此,卷積神經(jīng)網(wǎng)絡(luò)在圖像識別等領(lǐng)域的應(yīng)用受到了人們的廣泛關(guān)注[5-6]。針對傳統(tǒng)神經(jīng)網(wǎng)絡(luò)存在的向前傳輸神經(jīng)元輸出值持續(xù)增大的問題,Glorot等人提出了Xavier算法初始化CNN[7-8]。但該方法仍未完全克服網(wǎng)絡(luò)的不穩(wěn)定性。因此,蔡楠等人提出了一種基于核主成分分析的方法,用于實現(xiàn)初始化CNN的權(quán)重[9]。這些方法對于卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)優(yōu)化和應(yīng)用都有很重要的意義。
1.3基于深度卷積神經(jīng)網(wǎng)絡(luò)的細胞分類方法
近年來,卷積神經(jīng)網(wǎng)絡(luò)在細胞分類中廣泛應(yīng)用。實踐經(jīng)驗表明:CNN在宮頸癌變的識別中可以發(fā)揮出重要的作用。CNN的應(yīng)用方法比較多樣,例如根據(jù)多模態(tài)數(shù)據(jù)、細胞圖像、陰道鏡圖像等都可以實現(xiàn)癌變識別的目的[10-12]。在重疊圖像的識別方面,CNN也有著獨特的應(yīng)用[13]。為了克服卷積神經(jīng)網(wǎng)絡(luò)在圖像特征提取方面存在的準(zhǔn)確率問題,趙越等人提出了一種將特征提取器和分類器聯(lián)級為整體的CNN分類器,并驗證了其應(yīng)用效果,明顯提升了細胞分類的準(zhǔn)確率[14]。
上述研究都表明CNN可以有效提高細胞分類的效率和質(zhì)量。現(xiàn)有的基于卷積神經(jīng)網(wǎng)絡(luò)的細胞分類方法在復(fù)雜背景和含有雜質(zhì)的細胞分類方向上存在著比較大的局限性。對此,本文以深度學(xué)習(xí)的理論為基礎(chǔ),根據(jù)卷積神經(jīng)網(wǎng)絡(luò)的算法特點,提出了一種適用于細胞分類的深度卷積神經(jīng)網(wǎng)絡(luò)的算法優(yōu)化方法,并進行了其在細胞分類中的應(yīng)用實驗。
2本文算法
2.1ResNet網(wǎng)絡(luò)介紹
CNN提供了一種端到端的深度學(xué)習(xí)模型,模型中的參數(shù)可以通過傳統(tǒng)的梯度下降法進行訓(xùn)練,經(jīng)過訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)到圖像的特征,并且完成對圖像特征的提取和分類。與傳統(tǒng)的機器學(xué)習(xí)算法相比,采用深度學(xué)習(xí)算法可以免去分割提取特征的繁瑣過程,讓算法流程變得簡單,同時也避免了傳統(tǒng)算法中由于預(yù)處理、分割、特征提取等操作造成的誤差,使得細胞的識別率比傳統(tǒng)的機器學(xué)習(xí)要高。模型的深度在圖像分類中發(fā)揮著至關(guān)重要的作用,這導(dǎo)致ImageNet競賽的參賽模型都非常深。在追求網(wǎng)絡(luò)深度的時候,出現(xiàn)了一個新的問題:梯度消失/梯度爆炸。
后來,通過歸一初始化和中間歸一化解決了這一問題,使得數(shù)十層的網(wǎng)絡(luò)在反向傳播的隨機梯度下降上能夠收斂。當(dāng)深層網(wǎng)絡(luò)能夠收斂時,一個退化問題又出現(xiàn)了,ResNet網(wǎng)絡(luò)通過深度殘差框架解決了這個退化問題。ResNet模型的出現(xiàn)是CNN史上一個里程碑事件,ResNet可以訓(xùn)練出更深的CNN模型,從而實現(xiàn)更高的準(zhǔn)確度。變化主要體現(xiàn)在ResNet直接使用stride=2的卷積做采樣,并且用globalaveragepool層替換了全連接層。為了保持網(wǎng)絡(luò)層的復(fù)雜度,ResNet采用了一個重要的設(shè)計原則:當(dāng)特征圖的大小降低一半時,特征圖的數(shù)量將會增加一倍。ResNet模型的核心是通過建立前面層與后面層之間的“短路連接”(shortcuts,skipconnection),這有助于訓(xùn)練過程中梯度的反向傳播,從而訓(xùn)練出更深的CNN網(wǎng)絡(luò)。
2.2M-ResNet網(wǎng)絡(luò)
盡管ResNet模型使用了“短路連接”來實現(xiàn)特征重用(featurereuse),但是由于短連接的數(shù)量比較少,特征重用的作用并沒有達到最好的狀態(tài),通過簡單地堆疊殘余塊來構(gòu)建網(wǎng)絡(luò)不可避免地限制了其優(yōu)化能力。本文提出了深度卷積神經(jīng)網(wǎng)絡(luò)的細胞分類新方法M-ResNet,下面將詳細介紹改進細節(jié)。M-ResNet整體結(jié)構(gòu)圖和ResNet50基本一樣,整體結(jié)構(gòu)由5部分構(gòu)成,分別是:conv1,conv2_x,conv3_x,conv4_x,conv5_x。每部分由指定個數(shù)的block組成,總共有16個block,每個block為3層,所以有16×3=48層。開始有一個7×7×64的卷積,最后有一個用于分類的fc層,所以M-ResNet總共有50層。
相比ResNet,M-ResNet使用了一種比ResNet連接更多的機制,將conv_2x中的前兩個block輸出的特征圖全部疊加到第3個block輸出的特征圖上作為conv_3x的輸入。M-ResNet是將原先的block殘差塊進行再一次的嵌套快捷連接,疊加的方式是通過元素級的相加。conv_2x中有3個普通快捷連接和2個嵌套快捷連接,共5個快捷連接,conv3_x,conv4_x,conv5_x分別有7,11,5個快捷連接,所以M-ResNet共有28個快捷連接,相比ResNet50的16個快捷連接,多出12個嵌套快捷連接。
3實驗及結(jié)果分析
本文通過分析深度學(xué)習(xí)的理論,結(jié)合卷積神經(jīng)網(wǎng)絡(luò)的算法特點,對基于深度卷積神經(jīng)網(wǎng)絡(luò)的細胞分類算法進行了優(yōu)化。為了驗證優(yōu)化后算法MResNet的效果,本文進行了實驗分析。實驗共分為3部分進行,分別是數(shù)據(jù)集預(yù)處理、網(wǎng)絡(luò)訓(xùn)練和結(jié)果分析。該測試方法也是目前廣泛采用的實驗測試方法,可以對實驗效果進行比較全面的分析。
3.1數(shù)據(jù)集
本文采用的數(shù)據(jù)集是來自海萊烏科技大學(xué)(HerlevUniversityHospital,HUH)和丹麥科技大學(xué)(TechnicalUniversityofDenmark,TUD)搜集的Herlev巴氏涂片新版數(shù)據(jù)集。總共917個單獨的巴氏涂片細胞圖像,分別為淺表鱗狀上皮、中層鱗狀上皮、柱狀上皮、輕度中度重度非典型增生和原位癌共7類細胞。
3.2評價指標(biāo)
每類細胞選用50張樣本進行測試,正確率、召回率和F值是評價網(wǎng)絡(luò)優(yōu)劣的重要指標(biāo)。其定義分別為正確率=正確識別的個體總數(shù)識別出的個體總數(shù),(8)召回率=正確識別的個體總數(shù)測試集中存在的個體總數(shù),(9)F值=正確率×召回率×2正確率+召回率,(10)其中,識別出的個體總數(shù)即為識別出的正確細胞個數(shù)加上識別出的判斷錯誤的細胞個數(shù);測試集中存在的個體總數(shù)即為本文選取的各類細胞的樣本(50張)。正確率是評估識別出的細胞中判斷正確的細胞所占的比例;召回率是指召回目標(biāo)類別的比例;F值是綜合前兩者的評估指標(biāo),用于綜合反映整體的指標(biāo)。
3.3網(wǎng)絡(luò)訓(xùn)練
在完成預(yù)處理工作后,本文采用M-ResNet對宮頸細胞數(shù)據(jù)集進行分類識別。設(shè)備要求:①在Window10X64系統(tǒng)上進行;②GeForceGTX1080TiGPU顯卡;③內(nèi)存15G。該實驗在TensorFlow框架下進行訓(xùn)練。本文的迭代次數(shù)為20000,動量為0。9,學(xué)習(xí)率為0。0001。為了防止過擬合,提高模型的泛化能力,在模型訓(xùn)練的過程中,將訓(xùn)練集按照5∶1的比例進一步地劃分為訓(xùn)練集(trainsamples)和驗證集(validationsamples)。在本文中,訓(xùn)練集的數(shù)量為2943,驗證集的數(shù)量為585。本文的M-ResNet模型以宮頸細胞圖像及其標(biāo)簽作為輸入,通過網(wǎng)絡(luò)的學(xué)習(xí),得到一個模型文件,最后輸入測試集,得到帶有標(biāo)簽和概率的結(jié)果圖像。
3.4結(jié)果分析
完成數(shù)據(jù)集預(yù)處理、訓(xùn)練和測試工作后,本文對所得到的圖像數(shù)據(jù)進行了統(tǒng)一處理,并對基于深度卷積神經(jīng)網(wǎng)絡(luò)的細胞分類新方法M-ResNet的應(yīng)用結(jié)果進行了分析。并標(biāo)注該細胞屬于哪種宮頸細胞類型及細胞屬于所標(biāo)類型的概率。所屬細胞類型及其概率分別為:(a)normalSuperficiel1。0,(b)Normalintermediate1。0,(c)Normalcolumnar0。99,(d)Lightdysplastic1。0,(e)Moderatedysplastic0。99,(f)Severedysplastic0。99,(g)Carcinomainsitu0。99。
4結(jié)論
宮頸細胞分類對醫(yī)學(xué)診斷和醫(yī)學(xué)圖像處理有著重要的意義。針對現(xiàn)有的細胞分類方法中存在的效率低、正確率偏低等問題,本文以深度學(xué)習(xí)理論為基礎(chǔ),研究了一種基于深度卷積神經(jīng)網(wǎng)絡(luò)的細胞分類新方法M-ResNet,并采用Herlev數(shù)據(jù)集對該方法進行了測試。測試結(jié)果表明:該方法在提高細胞分類正確率和工作效率方面有著明顯的作用。但對于中度非典型增生和原位癌的具體識別工作還有待進一步提高,可作為下一步研究的主要工作目標(biāo)。
參考文獻:
[1]RustagiAS,KamineniA,WeinmannS,etal。Cervicalscreeningandcervicalcancerdeathamongolderwomen:apopulation-based,case-controlstudy[J]。AmericanJournalofEpidemiology,2014,179(9):1107-1114。[2]NayarR,WilburDC。TheBethesdasystemforreportingcervicalcytology[M]。Heidelberg:SpringerInternationalPublishing,2015。
[3]PlissitiME,NikouC。Cervicalcellclassification
basedexclusivelyonnucleusfeatures[C]。Proceedingsofthe9thInternationalConferenceonImageAnalysisandRecognition。Heidelberg:Springer,2012,PartII:483-490。
[4]ZhaoM,WuAG,SongJJ,etal。Automaticscreeningofcervicalcellsusingblockimageprocessing[J]。BiomedicalEngineeringOnline,2016,15(1):131-151。
[5]許可。卷積神經(jīng)網(wǎng)絡(luò)在圖像識別上的應(yīng)用的研究[D]。杭州:浙江大學(xué),2012。
圖像識別論文范文:試論圖像處理技術(shù)特征及其在網(wǎng)頁制作中的作用
近些年,隨著社會經(jīng)濟的快速發(fā)展,基于網(wǎng)絡(luò)而開展的企業(yè)宣傳、遠程教育、網(wǎng)購等也得到了快速發(fā)展。網(wǎng)頁制作技術(shù)成為網(wǎng)站建設(shè)的重心,人們審美能力也得到了提升,對于網(wǎng)頁也有了更高的要求。美觀的網(wǎng)頁界面成為消費者和網(wǎng)站工作者的共同追求,這就對設(shè)計師提出了更高的要求,設(shè)計師需要借助圖形處理技術(shù)來對其進行美化。本文就對網(wǎng)頁制作過程中圖形處理、技術(shù)設(shè)計等方面進行闡述,以此來說明圖像處理技術(shù)的優(yōu)勢。