時間:2022年06月22日 分類:科學技術論文 次數:
摘要:[目的/意義]為了梳理國內外認知計算的研究現狀,分析其在圖書情報領域應用狀況,為后續認知計算在圖情領域應用提供借鑒。[方法/過程]首先利用 CiteSpace 可視化軟件,基于文獻計量和比較分析的視角綜合梳理了國內外認知計算的學科分布與研究熱點,然后分析了認知計算在圖書情報領域應用現狀,最后提出認知計算在圖情領域未來實踐應用的相關建議。[結果/結論]研究發現:國內外認知計算研究的學科分布呈現跨學科和多學科形態,國內外共同關注的研究熱點有人工智能、機器學習、大數據與粒計算。國內形成了認知計算與圖情領域相結合的熱門研究方向,主要應用于情報檢索與分析、大數據處理與知識發現、智能人機交互以及學術論文評價等方面。[創新/局限]借助科學計量工具系統性梳理了認知計算的國內外研究現狀,分析了在圖情領域的應用現狀,提出了未來的應用場景和用途。
關鍵詞:認知計算;CiteSpace;知識圖譜;比較分析;圖書情報領域
0 引言
認知計算是認知科學的核心技術子領域之一,是人工智能的重要組成部分,是模擬人腦認知過程的計算機系統,代表了一種全新的計算模式[1]。當前以認知計算為核心的新興智能技術正在持續推動新一輪科技革命的發展,推動人類社會進入人機協同的智能時代。認知計算所具有的輔助、理解、決策和發現的功能開始被重視,并廣泛的被應用到商業、農業、醫學、圖書情報等領域,內外兼具理論深度與現實意義的研究成果呈爆發式增長,引起了業界和學術界的廣泛關注。
目前有關于認知計算研究方面的文獻梳理,都是聚焦于認知計算某一子領域,未從整體、全局視角對認知計算功能、熱點、實踐應用等方面進行系統深入的梳理;從研究方法上來看較為單一,以主觀內容解讀為主,少有研究從科學計量角度對文獻進行深入梳理與分析,并且暫無研究從宏觀角度對國內外研究現狀對比分析,更是少有學者梳理其在圖書情報領域的應用。鑒于此,為了更加清晰的梳理和對比國內外認知計算研究的現狀和發展脈絡,把握其研究熱點及應用現狀。本文運用文獻計量分析軟件 CiteSpace 作為研究工具,繪制科學知識圖譜對國內外研究現狀進行可視化比較分析,了解研究異同并梳理其在圖書情報領域應用,以期為未來國內認知計算在圖書情報領域應用研究提供思路和建議。
1 數據采集與研究方法
為保證數據的準確性和完整性,本文分別從中外兼具代表性與權威性的數據庫中收集了有關認知計算的學術期刊論文,其中中文文獻源自中國知網 CNKI,外文文獻源自 Web ofScience 核心合集數據庫。檢索方式分別為:在 CNKI 數據庫中,以“認知計算”作為關鍵詞進行主題檢索,發文年限設定為 2006 年—2021 年,篩選剔除會議紀要、書刊名稱、廣告等無關信息,檢索得到期刊文獻 270 篇。在 Web of Science 核心合集數據庫中,構造檢索式為“(TS=(cognitive computing or cognitive computation))AND 文獻類型:(Article)”,剔除關聯較小文獻信息后,選取文獻共 474 篇。本文選擇采用陳超美博士研發的當前學界較為認可的科學計量軟件 CiteSpace 作為研究工具。它可以通過生成可視化科學知識圖譜生動形象的從海量文獻中展現某一學科領域最重要、最關鍵的信息,梳理其過去和現在的發展歷程,識別最活躍的研究前沿和發展趨勢。運用 CiteSpace 通過高頻關鍵詞統計和聚類對國內外認知計算研究熱點進行分析,通過對階段突變詞的分析對國內外發展脈絡進行梳理。最后,重點分析認知計算在圖書情報領域的應用現狀,以期為未來國內認知計算在圖書情報領域應用研究提供參考依據。
2 國內外研究發文趨勢及學科分布比較分析
2.1 年發文量總體趨勢比較分析
通過文獻的年度發文量變化圖可以了解國內外認知計算研究的產出情況,并在一定程度上可以反映出該研究方向的學術關注度,了解其發展情況并預測其發展態勢。
2006 年至 2021 年期間國內學者研究發文數量整體呈現不斷增長的發展態勢。其中,在 2008 年國家自然科學基金委員會發布了“視聽覺信息的認知計算”研究計劃,短暫推動了我國認知計算領域的研究發展。2013 年,以“從大數據到認知計算”為主題的認知計算研討會在北京舉行,這一研討會的舉辦進一步推動了國內關于認知計算的研究熱度;但是之后,文獻發文數量也未呈現指數型增加,這說明國內認知計算研究整體還是處于初期探索階段,遇到了無法解決的技術實踐方面的難題或其他瓶頸問題。相比之下,2006 年至 2021 年國外認知計算的論文發文數基本保持指數型持續增長的態勢且發文數量高于國內,尤其在 2018 年后差距對比明顯。2002 年美國國家科學基金會和美國商務部共同提出“聚合四大科技,提高人類能力”的計劃,并把認知計算視作是最優先發展的理論,隨之認知計算的研究熱度開始增加。2006 年,計算機產業領軍者和認知計算的研究先鋒 IBM 公司發起了認知計算會議,推動了認知計算的研究。
在 2011 年,IBM Watson參加美國老牌智力問答節目 Jeopardy!打敗人類紀錄保持者,Watson 作為認知計算的杰出代表及其所具備的認知智能開始受到關注,國外對于認知計算研究進入迅速增長階段。2016年也是一個重要轉折點,2016 年 3 月 AlphaGo 打敗李世石,基于深度增強學習和神經網絡算法的認知計算成為學術界和業界關注焦點,使得國外認知計算的研究發文量呈現指數型增長。
2.2 學科分布比較分析
學科分布能夠在一定程度上反映作者研究視角和研究方法,由學科分布也可以了解某一研究領域的知識基礎。統計梳理認知計算的國內外相關學科分布發現:認知計算研究的學科分布呈現跨學科和多學科形態,計算機科學文獻的比例占據絕對優勢,另外神經科學、工程學、電信技術、心理學相關學科的文獻量也相對較多;從學科整體發展趨勢來看,從最開始的計算機科學等少數學科,到現在包括心理學、電子通信技術、醫學等眾多學科,這說明認知計算的研究是建立在跨學科基礎上的綜合性研究,是以現代自然科學的觀點,結合計算機科學、神經科學、心理學等多領域學科的綜合性科學;當前認知計算領域廣泛借鑒并引入其他學科的知識作為其基礎,其中涉及到的理論學科主要有計算機科學、神經科學、心理學等;涉及到的應用學科主要有電子通信、教育學、醫學、農學、圖書情報等,認知計算作為一項新興技術向更多領域融合也成為未來趨勢。
3 國內外研究熱點主題比較分析
3.1 高頻關鍵詞分析
關鍵詞是文獻內容的精煉與核心觀點的標識,是對一篇文獻精髓內容的總結概括。梳理分析研究領域內高頻關鍵詞可以幫助我們了解領域內的研究重點。在 CiteSpace 中選擇Keyword 功能,策略選擇 Top 50。
為了更清晰展現高頻詞,對比國內外研究差異,整理國內外高頻詞分布對比表,見表 1。國內研究中出現頻次較高的關鍵詞有人工智能、云計算、認知、大數據等,國外研究中出現頻次較高的關鍵詞主要有 model(模型)、system(系統)、artificial intelligence(人工智能)、machine learning(機器學習)、big data(大數據)、管理(management)、算法(algorithm)等。關鍵詞大致分為以下三個類型:第一類是宏觀理論概念主題,包括認知計算、人工智能、認知、認知科學、計算主義等,該類關鍵詞基本上是對認知計算關鍵概念和基礎理論的宏觀描述,具有高度理論性和概括性。第二類是認知計算技術方面,包括云計算、機器學習、粒計算、深度學習、神經網絡、算法等關鍵詞,技術的發展是促進認知計算研究持續深入的最大動力。第三類是認知計算的應用與服務方面,包括 IBM、物聯網、模型、系統、管理、風險預測模型、圖像識別、情感計算、知識服務與管理、認知情報學、教育信息化、醫療決策等,也是當前認知計算研究中比較熱門的方向。
3.2 國內外研究熱點聚類分析
通過 CiteSpace 軟件關鍵詞聚類功能運用 LLR 算法從關鍵詞中提取名詞性術語,實現對聚類的命名,由此得到國內外認知計算研究主題聚類。圖譜參數顯示,兩個聚類圖譜的聚類模塊值 Q 均大于 0.7,遠遠大于 0.3 的臨界值,表示聚類圖譜結構顯著;且聚類平均輪廓值 S 大于 0.5 的臨界值,表示聚類結果合理。粒計算是起源于人工智能、機器學習、數據挖掘與智能系統的一個新興的、多學科交叉的研究領域,是當前計算智能研究領域中模擬人類思維和解決復雜問題的新方法。它覆蓋了所有有關粒度的理論、方法和技術, 是復雜問題求解、海量數據挖掘、模糊信息處理的有效工具[2]。
自 L.A.Zadeh 教授于 1979 年提出并討論模糊集與信息粒化后,國內研究人員對信息粒度化的思想產生了濃厚的興趣,出現了王國胤、米允龍等研究學者。目前國內粒計算的研究也越來越廣泛,在粗糙集與軟計算、粒計算理論與應用以及三支決策模型與分析等方面都有很大成果,特別是在涉及處理模糊、不確定、精確度低的模糊數據方面具有明顯的優勢,提高了機器學習的效率,在圖形圖像處理、文本分類、醫療決策、人臉識別以及航空、生物、農業等方面都有所應用。國外也有學者將粒計算與認知概念結構相結合,提高了概念學習的效率。國內研究熱點主要圍繞以下 6 個方面展開:
(1)認知計算在人工智能領域應用,主要包括聚類#1 人工智能,主要關鍵詞有神經突觸、國際象棋、科大訊飛、智能語音、預報預測、人臉識別等。人工智能旨在代替人類行使智能行為和決策,但是人機之間可能會存在沖突,而認知計算能夠模仿人類的思維和過程,輔助人類進行決策。發源于人工智能的認知計算在很大程度上有助于人工智能研究成果突破。目前我國關于認知計算在人工智能領域的研究主要在一些新興技術的應用探索上,比如將認知計算應用于智能語音、人臉識別、氣象預測、醫療診斷等領域已經取得進展[3]。
(2)人類認知方面研究,主要包括聚類#0 認知計算,#2 認知,#9 認知水平。該聚類包含主要關鍵詞有情感計算、心理模型、人機交互、涉身認知科學、具身認知、認知困境、信息建構等。認知是人類觀察世界、理解世界、改造世界的完整過程,認知科學是研究人類認知的本質及規律,揭示人類心智奧秘的科學[4]。認知計算作為認知科學的研究方向之一,國內認知計算的研究注重以人為中心,構建認知對象、認知架構和認知模擬三者統一的認知模型,研究認知過程中對認知數據進行處理的全部算法,也包括從人的認知過程中進行情感計算、分析情緒反應和情緒狀態。
(3)云計算方面。主要包括聚類#3 云計算。該聚類包含主要關鍵詞有并行計算、媒體神經認知計算、計算機、網絡安全、云安全、分布式計算等。云計算是智能認知服務的基礎,作為大型認知計算系統的底層設施平臺,它的彈性、擴展性和高度分布式特點使認知系統實現了具備高效利用數據資源和實現復雜算法的能力,其中可穿戴設備等人體局域網的產生也促進了云計算的發展。另外云計算背景后的網絡安全與管理問題也越發受到國內學者的重視。
(4)大數據挖掘與分析方面。主要包括聚類#4 大數據分析,#8 數學能力。該聚類包含主要關鍵詞有醫療大數據、基礎架構、社交媒體、大數據平臺、細胞自動機等。大數據分析屬于認知計算的一個維度,實現更高質量的數據分析也是認知計算的目的,包括大量非結構化數據的分析以及構建大數據分析平臺、構建風險預測模型等[5]。目前國內有比較成熟的醫療大數據分析系統進入到醫療健康領域,在精準計算患者臨床數據、為患者提供個性化治療方案等方面有所應用。
(5)認知計算在智能汽車和交通運輸領域應用。主要包含的聚類是#6 高速公路。該聚類包含主要關鍵詞有前置距離、生物視覺機制、計算視覺理論、視覺認知、高速公路、神經影像等。這一聚類主要針對國家自然科學基金委員會提出的“視聽覺信息的認知計算”重大研究計劃,集成視聽覺信息方面的研究成果,結合有關駕駛行為的認知機理等,進行無人駕駛車輛等相關方面的研究[6]。(6)機器學習方面。主要包括聚類#7 機器學習。
該聚類包含主要關鍵詞有深度學習、人工神經網絡、稀疏編碼、學習干預、腦機結構、自適應學習、自然語言等,主要是探討運用機器學習算法實現認知計算功能。國內學者將稀疏編碼與認知計算相結合,并形成稀疏認知計算模型。近年來得益于計算機性能的提升和云計算技術的發展,深度學習的概念從國外被引入并作為一種新的機器學習方法,成為認知計算的研究熱點,深度學習的效果超過了原來的概念學習,提升了機器對數據的認知能力,是機器學習的一個重大突破。其中數據表示是深度學習的基礎,認知模型的構建是其關鍵,高性能的并行計算是其保證,因此國內的研究也多從這三方面展開[7]。國外研究熱點主要圍繞以下方面展開:邊緣認知計算方面。
主要包括聚類#0 邊緣計算(edge computing)。邊緣認知計算是一種將認知計算應用于網絡邊緣的新的計算范式,通過提供用戶認知和網絡環境信息,進而提供彈性認知計算服務,實現比邊緣計算更好的用戶體驗。其與云計算是相互補充、互相依賴的關系,邊緣計算是云計算的進步與延伸,將云計算的能力向邊緣延伸,具有低延遲和高用戶體驗的特性,能夠降低成本、提高效率。神經系統方面,主要包括聚類#3 神經系統(neuromorphic system)。這一聚類主要體現國外認知計算研究中重點關注機器學習中的深度學習算法。
通過關注人類視覺、聽覺、記憶等行為的變化,探尋大腦內部信息處理機制和過程,由此揭示人類處理信息的過程。由最早的神經網絡算法來模仿人類大腦,到使用多層神經網絡結構來模擬人腦分層信息處理的深度學習算法,再到最新提出的卷積神經網絡、尖峰神經網絡,國外認知計算的研究強調在不斷迭代學習過程中提高準確性。認知計算在醫療領域應用方面,主要包括聚類 #4 輕度認知障礙(mild cognitiveimpairment)。隨著認知心理學等領域研究成果的不斷發展,逐漸開始深入研究人類內部心理和認知過程,產生了認知診斷這一新的心理測量理論。這一領域主要涉及關于醫療保健、衛生系統、個性化醫療、處理大量醫療非結構化數據并將其研究成果應用于臨床研究中,其中也包括在對于阿爾茨海默病等人類認知障礙疾病的治療和診斷方面有較大研究進展。認知計算在農業領域應用,主要包含聚類#6 定量計算(quantitative calculation)。這一聚類體現出農業領域是國外認知計算的一大應用方向。
為了實現智慧化農業,對農業生產的全過程提供智慧的支持與服務,離不開計算的幫助與支持。規模化的農業生產與個性化的農業需求是目前智慧農業需要解決的主要矛盾。目前認知計算在農業領域的應用包括智能采集和處理農業生產中的大規模非結構化數據、定量計算精準灌溉量、為人類提供預測決策支持等,依據不同生產場景決定相應技術的情景化、重視農業生產中的個性化、以大數據和物聯網等技術支持下的學習分析技術為支撐的數據驅動是其主要特征。同時這也需要農業領域專家和計算機領域專家進行合作,構建智能的農業生產模型,綜合考慮選擇最合適的生產策略。圖像識別方面,主要包含聚類#7 圖像識別(image recognition)。
近年深度學習理論的不斷發展,計算機在視覺識別、語音識別、自然語言處理等很多領域達到甚至超過人類水平,其中圖像識別是認知計算的一個主要應用領域。機器通過深度學習進行圖像識別與分類時,模仿人類圖像識別的感性方法,通過大量的圖像數據學習,獲得圖像與結果之間的映射關系。國外主要將其技術應用于醫療認知系統和醫療圖像分析中,以及建立相應的預測和分析模型,已使用卷積神經網絡、卷積自編碼、自編碼器等方法對圖像進行識別與分析[8]。智慧家居方面,主要包含聚類#8 智慧家居(smart home)。
認知計算等新技術的出現,引起人類的生活方式也發生了巨大的變化,未來的個人生活將會更加向“差異化”和“個性化”方向發展。智慧家居是認知智能機器人廣泛應用的體現,認知智能機器人要求借助腦科學和類人認知計算的方法,通過云計算、大數據處理等技術,增強機器人感知、環境理解和認知決策能力。智能家居機器人通常能提供智能家居控制、接收語音指令、實時監控及時預警等功能。隨著機器人加入人類認知后,傳統的智能家居系統開始進化成具有認知情感智能的新一代智慧家居系統,除了傳統功能外還能通過感知用戶情緒來調節環境,實現優化用戶情緒的功能。通過國內外研究熱點之間的對比分析發現,目前國內外關于認知計算的研究有一定的差距。一方面在認知計算的底層架構和基礎設施的建設方面,云計算和分布式架構作為大型認知計算系統處理龐大數量異構數據所不可或缺的底層設施,需要不斷進行擴展,目前國外已進入到有關邊緣計算、霧計算等領域,而國內對云計算的延伸這方面的研究剛剛開始。
另一方面在認知計算的相關算法和計算力方面,國外學者堅持不斷完善與創新算法,推動算法在實踐領域得到應用,國內在純算法研究方面還有待提高與進步。從理論與實踐應用的視角來看,國內目前還是注重認知科學等基礎理論方面研究,應用研究則與國家政策的出臺有較為密切的關系,在國家大數據戰略、建設智慧中國的政策背景下,應用研究熱點主要集中在大數據分析、醫療健康以及視聽覺信息識別等方面。國外理論研究熱點主要集中在邊緣計算、深度學習算法等方面,與國內應用相比研究熱點更加廣泛,包括在智慧家居、金融風險預測、醫學臨床診斷、農業環境監測等領域都有所應用,更加注重認知系統的研發。
4 國內外研究主題的演化路徑比較分析
關鍵詞突現度可以反映一段時間內影響力較大的研究領域。通過 Burstness 進行突顯詞檢測,國內外認知計算領域文獻突顯關鍵詞,共檢測到國內研究突顯關鍵詞 13 個,國外研究突顯關鍵詞 21 個。通過對關鍵詞突顯圖譜進行分析,可以把認知計算的研究分為三個階段。第一階段為2006—2011 年的起步階段,重點在于理論基礎研究;第二階段為 2012—2017 年的高速發展階段,實現技術進步和突破;第三階段為 2018—2021 年的平穩發展階段,關注實際應用。結合中外文獻國內外分階段對比分析結果如下:
(1)2006 年—2011 年萌芽階段,這一階段國內的研究成果比較少,出現的突顯詞有認知科學、計算主義等。此階段國內學者對于計算主義“認知可計算”觀點的正確與否存在爭議。例如:商衛星等認為計算的觀點有其無法克服的局限性,并非人類思維和智能的所有方面都是可計算的,否認計算主義算法萬能的觀點[9]。任曉明肯定了派利夏恩計算主義理論的基本觀點,即人就是一部邏輯機器,認知的本質是計算,一切認知過程和智能行為都是可計算的[10]。同時該階段國內屬于認知科學向認知計算演化的階段,主要從哲學、心理學視角研究人的認知過程,與認知科學相結合,形成了一系列認知計算模型,比如視覺認知計算模型、情感計算模型等,并逐漸開始轉向相關技術的研究。例如:酈全民從哲學角度和關于計算的普遍原理出發,在具體研究認知系統的計算特性的基礎上建構起關于認知的計算理論,并獲得認知等價原理、認知模擬原理和認知不可歸約原理三個支配認知過程的基本原理[11]。
另外,關于粒計算的研究也從這一時期開始。張文修等提出基于粒計算的認知計算模型,建立了認知的粒化描述,通過概念的形成過程較準確的描述了人類的認知過程的本質[12],并將粒計算的認知模型引入并用于分析圖像認知過程[13]。此外,王慧強等開始針對物聯網的關鍵技術和應用開展研究,其中包括認知計算與智能控制技術、網絡融合技術和納米技術等,引發了下一階段大量學者對認知計算中重要技術支撐的研究[14]。然而,這一階段國外在理論研究有較大進展的同時,已經進入到認知計算的實踐領域。在理論方面學者對人類大腦進行建模,建立了從感覺、記憶、感知、行動、元認知和更高的認知層六個層次的大腦分層模型,對認知信息學中生理、心理和認知現象的計算解釋具有一定的理論基礎。在實踐應用中,學者們將認知計算相關技術進行在醫學、圖像處理等領域實踐應用,例如:L.Ogiela 等研究了認知計算在智能醫學模式識別系統中的應用,將認知計算應用于語義解釋的相關任務[15]。
E.I.Papageorgiou 等采用無監督學習算法 AHL 和模糊認知圖來表示和建模專家知識,提出一種腫瘤認知和分類診斷決策系統,具有較高的準確度,成為日常臨床實踐中的工具[16]。W.Pedrycz 針對認知地圖的設計和形成地圖的算法進行了研究和探討并用遺傳算法的方法構建模糊認知圖[17]。A.Chohra 等對已有故障診斷系統的研究進行了簡要的綜述,并且從信號表示和圖像表示兩個方面提出一種混合的智能診斷方法,能夠在醫學領域計算機輔助診斷中得以應用[18]。此外,還有學者開始開展機器人與認知系統融合方面的研究,基于大腦的分層參考模型描述了認知機器人的體系結構模型,以及從認知機器人的一般行為模型和行為過程之間的層次關系出發,闡述認知機器人的行為模型并提出一種認知機器人參考模型,在機器人認證、計算智能和自動化系統中有應用前景。
(2)2012 年—2017 年起步階段,這一階段國內的研究文獻數量開始增多,先后出現物聯網、云計算、機器學習、非結構化數據等突顯關鍵詞,但突顯時間都比較短,可以發現這一階段國內的研究主要集中在認知計算的幾個重要技術方面。認知計算是基于云計算、物聯網、5G 網絡、人工智能、大數據分析等技術上發展起來的智能應用,其中物聯網提供了認知計算所需要的信息源基礎,包括各種結構化數據和非結構化數據。同時,該階段也開始將認知計算技術進行應用實踐。例如:認知計算技術與社會的轉型和對接,能夠進入認知商業,實現解決智能語音、智能醫療等領域的問題[19][20]。唐新晨基于機器學習構建了基于認知計算的就業咨詢智慧服務系統,為應屆生選擇求職方向作出正確決策[21]。楊娟結合機器學習構建了認知計算在教育領域的模型,開發了基于案例推理機器學習的配置模型工具[22]。國外這一階段的研究成果主要體現于認知計算技術實現方法,其中在粒計算的研究有突破性進展,例如:J.Li 等提出了通過粒計算進行概念學習的認知觀點,從哲學和認知心理學的原理出發,分析了概念形成的認知機制,提高了概念學習的效率[23]。
Y.Zhao 等通過研究提出認知概念學習的方法,即通過模擬人類思維過程,從給定的線索中學習概念[24]。實踐方面的研究主要集中在認知智能系統開發,例如情感認知系統、各類智能系統、醫療認知訓練系統、自動駕駛系統等。例如:M.Tarafdar 等概述了企業認知計算應用程序,認為企業認知計算應用程序使業務流程更加高效和準確,推動企業良好運營,并描述了實施過程中的挑戰[25]。E.Mezghani 等基于認知物聯網系統的復雜性和對大數據和異構數據的管理,構建了能夠感知收集數據并提供靈活決策的智能物聯網系統,并將此系統用于開發基于異構可穿戴設備的認知檢測系統來管理患者健康[26]。另外認知計算在圖像識別領域也有一定進展。S.Zhang 等指出采用 ICA 算法的圖像特征提取方法存在計算代價過高的問題,提出將 ICA與 ELM 算法相結合的圖像識別認知計算方案,并將此方案應用于人臉識別[27]。
(3)2018 年—2021 年發展階段.該階段國內的研究主要是將理論與各種實踐相結合,嘗試將其應用于教育、醫療、農業等領域,并逐漸向更深層次的文本挖掘、語義推理、智能問答等方面發展。信息融合系統是國內認知計算的一個研究前沿,目前已有學者提出基于卷積神經網絡的認知智能信息融合系統體系結構,使用認知計算分析智能信息融合應用程序收集與處理數據,解決了當下數據智能采集中可擴展性和靈活性差的問題[28]。另外,認知計算在農業領域的應用也是國內一個研究熱點。魏浩冉以綜述的形式分別分析了人工智能在農業領域主要應用技術、應用現狀及其制約因素,并指出農業認知計算系統以有限的人力收集、處理和理解大規模數據,減少人力參與農業工作,提高工作效率,協助農業生產和貿易活動,應用前景十分樂觀[29]。認知計算和農業大數據的結合有效促進了智慧農業的發展[30]。
除此之外,作為突顯程度最強且持續至今的認知情報學也表現出認知計算將會在圖書情報領域帶來新機遇,為知識服務的創新提供新思路。國外這一階段的研究注重認知算法和認知模型應用創新,在物聯網和云計算的基礎上開展對邊緣認知計算的研究。例如:F.Fotis 指出傳統的云計算不能滿足高實時、低延遲的要求,因此提出了邊緣計算的一種新的霧計算范式并應用在工廠預測性維護中,為物聯網邊緣架構存在的問題提出了解決方案[31]。J.H.Park 等基于對認知物聯網進行研究,提出智能城市網絡的體系架構,能夠利用認知計算分析從該系統中收集到的數據并解決了數據采集可擴展性和靈活性等之前未能解決的問題[32]。同時在繼續深入智能系統開發和算法的研究中形成了一些新的認知系統,比如餐飲客流量預測系統、商業客戶概況系統、司法判決系統、地理信息系統等。
5 認知計算在圖書情報領域的應用概述
在我國新一代人工智能發展戰略框架下,圖書情報領域在以用戶服務為導向、推動服務及應用向人類智慧化發展的目的下,逐漸將大數據、互聯網、云計算等新理論和新技術與圖書情報深度融合,未來也會將認知計算的一系列技術引入圖情領域,發揮認知計算在輔助、理解、決策、發現等方面的優勢和潛能,并且其在情報分析、情報檢索、數字圖書館等領域具有很大的研究前景。由于目前認知計算技術尚未成熟、認知計算在圖情領域的應用也依舊處于初級階段。但相關部門和越來越多領域內學者已經開始關注并致力于研究認知計算技術在圖情領域的應用實現,從理論與技術層面對這一目標的實現做出貢獻。2009 年美國的 IEEE 召開第一屆認知情報學國際年會上正式提出“認知情報學”這一認知計算與圖書情報學交叉結合的新概念與新研究領域。作為新興且交叉融合了計算機科學、認知科學、情報學、心理學等不同領域的認知情報學迅速受到國內學者的關注。
布魯克斯情報科學基本知識方程、貝津的“知識非常態”理論、德文的意義建構理論等基于認知科學的情報科學理論為認知情報學的發展起到理論支撐的基礎作用。國內學者徐峰首次將認知計算引入圖書情報領域,認為認知計算的發展將會對情報檢索技術、信息組織及情報分析方法與技術等領域的發展產生深遠的影響[33];嚴貝妮等論述了認知情報學產生的必然性,后詳細闡述了認知情報學科的理論框架,包含理論研究、數理研究、應用研究三個方面[34]。王祥麗介紹了認知計算在圖書情報學中的具體應用場景[35]。最近幾年,也有部分學者梳理了認知情報學的緣起和發展脈絡[36],并對認知情報學的國內外研究現狀進行了可視化分析,以期激發學界對認知情報學領域的關注與興趣,推動國內相關研究的深化發展[37]。
5.1 認知計算在圖書情報領域應用維度
國外學者 Paul Roma 細分了認知計算的三種主要應用方式,分別是認知自動化、認知洞察力和認知參與,這一應用角度被廣泛認同并借鑒于認知計算在圖情領域的應用中,目前認知計算在圖書情報領域的應用也從這三個維度展開。認知自動化為大數據情報分析提供解決方案。大數據時代中的情報檢索工作往往會出現大量數據閑置沒有很好利用的狀況,認知計算則可以通過整合海量數據資源實現數據資源的有效利用。隨著數據產生與更新的速度越來越快,傳統人工情報分析不再能滿足用戶的需求,認知計算的自動化特征可以通過從互動中、從環境中不斷學習的方法,模擬人類認知思維,自動且高效的對大量數據進行分析處理,并產生較為科學的決策建議。
另外,目前需要分析利用的大數據逐漸由單一的結構化數據趨向各類圖像、音頻、視頻等非結構化富媒體數據,而認知計算中的計算機視覺技術、音頻處理技術以及自然語言處理技術等能夠實現對大量非結構化數據的分析和跨數據類型的檢索。認知洞察力重新定義知識發現。基于自然語言處理的知識挖掘與知識發現在情報分析工作中處于越來越重要的地位,如何擺脫傳統的檢索瀏覽信息服務階段進入到知識增值服務階段、如何自動挖掘并提取非結構化大數據中的深層含義并形成人類的智慧也是目前的一大難題。目前非結構化數據占到所有數據的 80%,已出現社交媒體分析、文本挖掘、觀點分析、地理空間分析等專門處理非結構化數據的技術。目前,國內圖情領域學者也開始運用認知計算的認知洞察力開展知識發現和組織工作。
例如:孫坦等學者通過研究和實驗發現基于傳統知識組織構建方法和基于深度學習的方法都無法實現精準的知識發現,并因此提出了融合知識組織與認知計算的新一代開放知識服務系統,分析其所需的相關技術,這一研究成果對重新定義知識發現具有重要指導意義[38]。認知計算具有高度的洞察力,能通過機器學習、自然語言檢索、文本語義挖掘、智能推理等相關技術模仿人類認知思維過程,實現基于語義和基于內容的信息組織與知識挖掘,并通過對某一特定領域內的知識進行訓練,在人機交互和環境中不斷迭代學習,實現細粒度實體層面和整個結構層面的自動知識發現。然而在知識發現中,不同行業、不同學科的自然語言處理是認知計算面臨的挑戰之一。
目前自然語言處理卻存在著諸如中文文本分析中同義詞、同音異義詞難區分、多義詞具體含義難以確定以及對標注數據依賴性較高、需要耗費大量的數據資源進行訓練、缺乏獨立的運用場景等問題。這一問題的解決一方面需要構建該領域足夠充分的語料庫,選擇合適的訓練數據,從質量和數量上保證數據的準確性和可用性,另一方面在構建知識組織體系時,盡可能嘗試或結合不同的知識組織方法和不同的搜索引擎、關鍵詞抽取的算法,將機器學習和深度學習技術更好的與圖情領域相融合。認知參與搭建新型的人機交互環境。在信息技術的推動下,圖情領域的許多服務場景都依賴于智能的人機交互,從人工參考咨詢到智能咨詢問答平臺,從人工管理到無人化智能服務方式,以及智能搜索、智能導航系統的出現,認知計算技術的應用通過構建新型人機交互環境開創了新的服務方式。
在不同的領域構建專家系統也是重要應用之一,認知計算基于機器學習、信息檢索、專家經驗與自然語言處理等技術,通過將專家級別的理解能力與解決方案植入到與用戶的交互中,直接為用戶提供高效且科學的決策方案,這一系統使認知計算技術從理論實驗走向實踐,可以大大降低人工成本的同時滿足用戶情報檢索與情報分析的需求,目前已成熟應用于網絡教育、醫療健康等領域之外,在圖情領域文獻分類、編目、圖書館管理等方面也開始應用。隨著認知計算應用的逐漸深入,我們也需要意識到認知計算只是人類的一個工具,通過不斷訓練、優化和人機協同來輔助人類決策,最終實現為用戶服務的目標,是永遠不能代替人類智慧的。另外在人機交互的過程中難免會涉及到用戶隱私與安全的相關問題,也存在著用戶隱私信息被盜取的風險,因此要更加注重信息安全問題,利用數據脫敏技術降低隱私泄露風險,保護用戶個人隱私,做好檢測、預警等用戶信息保密工作。
6 結語
本文從年發文量、學科分布、研究熱點和演化趨勢等方面對國內外認知計算的研究開展可視化比較分析,并對認知計算在我國圖書情報領域的應用現狀、前景和建議方面進行了探究。以期為我國學者將認知計算應用于圖情領域提供參考依據。結合國內外研究的進展與前沿,未來我國認知計算研究首先應該注重基礎理論研究,不斷完善與創新算法,提升計算能力。算法和計算力是認知計算發展的強大驅動力,目前國內在純算法的研究上還有待深入,爭取實現技術性的突破。其次,加快認知計算在實踐領域的應用,推動從模型構建走向實際的問題解決。
模型的構建是對實踐應用的歸納和總結,但研究不能僅停留在理論模型構建的層面而缺乏具體應用研究,因此需要推動研究成果從理論到實踐的轉變,向多元化和縱深化發展。另外,還需要關注認知計算帶來的安全隱患。隨著大數據時代的到來,對于用戶和個人數據的隱私也漸漸成為關注的話題,發展和使用認知計算的同時應注重數據管理、隱私保護、算法偏見等技術上不可回避的問題。因此相關部門要關注到認知計算可能帶來的負面效應和社會問題,做好治理工作,關注數據管理,保證算法透明性,建立健全審計與問責機制等,另外也要注意解決技術所帶來的社會安全與倫理問題,推動認知計算在國內實現安全發展。
參考文獻
[1] 陳敏.認知計算導論[M].武漢:華中科技大學出版社,2017.
[2] 王國胤,張清華,胡軍.粒計算研究綜述[J].智能系統學報,2007(06):8-26.
[3] 王志宏,楊震.人工智能技術研究及未來智能化信息服務體系的思考[J].電信科學,2017,33(05):1-11.
[4] 馮康.認知科學的發展及研究方向[J].計算機工程與科學,2014,36(05):906-916.
[5] 米允龍,米春橋,劉文奇.海量數據挖掘過程相關技術研究進展[J].計算機科學與探索,2015,9(06):641-659.
[6] 王國胤,陳喬松,王進.智能車技術探討[J].計算機科學,2012,39(05):1-8.
[7] 陳偉宏 , 安 吉 堯 , 李 仁 發 , 李 萬 里 . 深 度 學 習 認 知 計 算 綜 述 [J]. 自 動 化 學報,2017,43(11):1886-1897.
[8] Chen L , R Zhang, Ahmad A , et al. An image super-resolution method forbetter cognition of images in cognition computing system[J]. Journal of Intelligent and FuzzySystems, 2020, 39(6):8043-8055.
[9] 商衛星.科學認知與計算主義的反思[J].青海師范大學學報(哲學社會科學版),2007(01):39-42.
作者:劉爰媛 郭順利 房旭輝