時間:2019年04月01日 分類:文學論文 次數:
摘要:圖像檢索研究領域技術和熱點隨著數字圖像技術迅速發展不斷發生變化.以CNKI期刊全文數據庫為數據源,采用文獻計量學方法,利用網絡分析工具Citespace軟件對2008—2017年國內圖像檢索研究進行知識圖譜可視化分析,揭示我國圖像檢索研究現狀和未來發展趨勢.研究結果表明,圖像檢索算法、圖像特征提取和圖像語義研究成為重要的熱點主題,相關反饋研究、多特征融合檢索、深度學習算法以及圖像自動標注技術成為重要的研究前沿。
關鍵詞:圖像檢索,知識圖譜,可視化,CiteSpace
圖像檢索技術是圖像處理和應用的關鍵技術,如何有效、準確地檢索圖像資源,成為學術界研究的熱點之一.基于文本內容的圖像檢索技術(Text-BasedImageRetrieval,TBIR)和基于內容的圖像檢索技術(Content-BasedImageRetrieval,CBIR)是圖像檢索研究領域的重要技術.但這兩種技術無法解決圖像檢索過程中的語義鴻溝問題,一些新的圖像檢索技術不斷出現,如基于聯想和基于深度學習算法的圖像檢索算法等等.
本文以文獻計量學為視角,結合可視化分析軟件Citespace,檢索中國知網2008—2017年發表的圖像檢索文獻,繪制國內圖像檢索研究知識圖譜,揭示近十年來圖像檢索研究領域過去的關注點、現在的熱點以及未來的發展趨勢,為促進圖像檢索領域的快速發展提供數據支撐和理論支持.
1數據來源和研究方法概述
1.1數據來源
CNKI(中國學術文獻網絡出版總庫)是全球最大的中文數據庫,以CNKI數據庫為檢索來源,可以保證研究數據的全面性和準確性.本文研究的檢索期刊論文的時間范圍限定在2008年1月至2017年12月,檢索時間為2018年2月.檢索方式選擇專業檢索;將“圖像檢索”限定在“主題”字段進行精確檢索,共檢索到有關圖像檢索的文獻為2579篇,剔除新聞、期刊目錄、通知、會議等與研究主題無關的文獻7篇.將2572篇圖像檢索文獻數據按照Refworks格式進行保存.
1.2研究方法
本文采用知識圖譜分析方法,揭示學科發展規律和未來態勢.首先從CNKI檢索所需文獻資源,并按照Refworks格式進行保存.研究采用基于Java語言和引文分析理論的可視化軟件Citespace,利用Citespace軟件通過繪制共詞聚類圖譜、時區圖譜等可視化方式,分析學科研究現狀、研究熱點以及學科未來演變趨勢等等.
2國內圖像檢索可視化分析
2.1文獻年代分布
論文載文量的變化,在一定程度上反映該學科的理論水平和發展速度[1].筆者對CNKI數據庫檢索的2572篇文獻進行統計,并利用Excel軟件繪制出圖像檢索文獻年代分布折線圖.2008—2017年圖像檢索研究領域總體呈下降趨勢.雖然平均每年的發文數量約為257篇.但是圖像檢索領域的學術關注度呈下降趨勢,學科領域進入瓶頸期,但不代表圖像檢索領域會停滯,反而會隨著數字圖像技術急速發展,如人臉識別、自動駕駛等技術的發展,圖像檢索領域將會面臨新一輪的發展.
2.2作者-機構分析
核心作者的確定可以依據普賴斯定律,即研究領域最高產作者的發文量來確定核心作者范圍.根據核心作者計算公式,我們將發表3篇或3篇以上論文的作者確定為核心作者.發文量≥8的高產作者和發文數量.孫君頂發文量排名第一,17篇;趙珊發文量排名第二,15篇;木拉提·哈米提排名第三,發文量為12篇;彭進業發文量排名第四,11篇;毋小省排名第五,發文量為11篇.國內圖像檢索研究的機構主要是高校,其中河南理工大學計算機科學與技術學院、遼寧師范大學計算機與信息技術學院、西北大學信息科學與技術學院以及遼寧工程技術大學電子與信息工程學院是主要研究機構.筆者研究的文獻數據從2008—2017年,時間跨度有10年,圖像檢索研究領域的學者和機構有可能會出現研究方向轉移現象,為了更加準確把握圖像檢索最新的研究學者和研究機構,筆者通過Citespace軟件對作者和機構分別進行突現算法檢測.
我們發現,圖像檢索研究領域在2008—2017十年期間,研究作者和研究機構發生了變化.在2013年左右,國內圖像檢索研究形成了一個相對穩定的研究團隊,主要是以河南理工大學計算機科學與技術學院的孫君頂、趙珊和毋小省為主,研究成果頗豐.2014—2017年,國內圖像檢索領域形成了新的研究團隊,主要以新疆醫科大學醫學工程技術學院的阿布都艾尼·庫吐魯克、木拉提·哈米提、伊力扎提·阿力甫、楊芳和員偉康為主,主要研究新疆地區特色草藥和疾病的醫學圖像檢索.同時,南京理工大學計算機科學與工程學院和合肥工業大學計算機與信息學院等機構最近幾年在圖像檢索領域也取得了較多的研究成果.
2.3期刊分析
期刊載文分析主要反映學科研究文獻的期刊分布情況,其中核心期刊的載文量水平較高,更能反映學科研究水平.因此本文的期刊分析,都以核心期刊為主,圖像檢索的期刊總體上都屬于計算機期刊,如《計算機工程與應用》《計算機科學》《計算機應用》等,符合圖像檢索領域的研究特點,圖像檢索離不開計算機技術支撐.同時,在核心期刊發文量是1347篇,而發文總量是2572篇,占比是52.37%,表明圖像檢索領域文獻的研究深度和研究質量都具有較高的水平.
2.4基金分析
統計分析各基金項目尤其是國家級基金項目對某一學術主題的支持情況,可以掌握該領域的學術地位以及受重視程度.通過對文獻基金數據分析,2572篇文獻共有1513項各類基金資助,資助比例達到58.83%;其中,國家級基金項目,如國家自然科學基金和國家社會基金等,共有1133項,資助比例達到44.05%.這些數據表明,圖像檢索研究領域得到國家以及各省市的重視,因為圖像檢索的成果可以直接應用于人工智能、無人駕駛、醫學圖像管理、計算機應用和自然地理等各個方面.
2.5研究熱點和趨勢分析
2.5.1關鍵詞共現知識圖譜
關鍵詞是對文章主題的高度概括和凝練,是文章的核心和精髓.高頻關鍵詞常用來確定研究領域的熱點方向.因此,我們對圖像檢索相關文獻的關鍵詞進行分析,利用Citespace軟件繪制高頻關鍵詞共現圖譜,探尋圖像檢索研究領域熱點方向.每一個圓形節點代表一個關鍵詞,節點越大表示關鍵詞出現的頻次越高;不同顏色的節點代表不同的年份;節點之間的連線,表示關鍵詞之間共現系數,連線越多,表明關鍵詞之間相互聯系越緊密.我們選取2008—2017年間出現頻次在47次以上的關鍵詞,得到圖像檢索研究熱點關鍵詞頻次統計表.
3結語
本文通過文獻計量學方法對2008—2017年國內圖像檢索研究領域進行了可視化知識圖譜分析.我們發現:國內圖像檢索研究領域的研究團隊和研究機構也發生了一定的變化;同時圖像檢索研究領域研究熱點主要圍繞圖像檢索算法、圖像特征提取和圖像語義研究等方面展開,取得了豐碩的研究成果.利用膨脹詞探測(BurstDetection)技術和算法對圖像檢索未來的趨勢進行分析,發現當前圖像檢索領域的相關反饋研究、多特征融合檢索、深度學習算法以及圖像自動標注技術成為新的研究前沿.
參考文獻:
[1]儲節旺,王龍.近10年國內知識管理研究熱點——基于CSSCI數據庫的詞頻分析[J].情報科學,2011(9):1425-1429.
[2]彭天強,栗芳.基于深度卷積神經網絡和二進制哈希學習的圖像檢索方法[J].電子學報,2016,38(8):2068-2075.
[3]周燕,曾凡智,趙慧民,等.一種基于精細化稀疏自適應匹配追蹤算法的圖像檢索方法研究[J].電子學報,2014,42(12):2457-2466.
[4]閆允一,姜帥,郭寶龍.結合穩定興趣點和Gabor小波的圖像檢索[J].西安電子科技大學學報,2014,41(5):118-123.
[5]李軍,呂紹和,陳飛,等.結合視覺注意機制與遞歸神經網絡的圖像檢索[J].中國圖象圖形學報,2017,22(2):241-248.
[6]張鑫,溫顯斌,孟慶霞.基于顏色特征的圖像檢索方法研究[J].計算機科學,2012,39(11):243-245,26.
[7]洪天昊,孫華東,金雪松,等.一種利用局部直角均值模式的圖像檢索算法[J].哈爾濱商業大學學報(自然科學版),2017,33(2):172-174,19
相關刊物推薦:情報科學1980年創刊,本著求實創新的理念,始終站在學科研究的前沿,全面反映學科發展的動態。特別注重追求理論精品,面向行業工作實際,不僅形成了求實創新的學術風格,成為同行之間進行學術研討和業務交流的理想園地,而且也是國內情報學、圖書館學領域影響較大的學術性期刊之一,在國內組織的圖書館學情報學核心期刊評定中名列前茅。