亚洲女同精品中文字幕-亚洲女同japan-亚洲女人网-亚洲女人天堂a在线播放-极品小帅哥连坏挨cao记-极品销魂一区二区三区

學術咨詢

讓期刊論文更省時、省事、省心

知識圖譜在犯罪情報分析中的應用

時間:2021年02月08日 分類:電子論文 次數:

摘 要 隨著大數據和人工智能技術的發展,知識圖譜以其豐富的語義表達和推理給公安情報業務帶來深刻的變革。本文梳理了知識圖譜和犯罪情報的基本概念和特點,進而闡述基于知識圖譜的犯罪情報圖譜的構建流程和推理技術,介紹相關技術的重點難點及存在的問題,

  摘 要 隨著大數據和人工智能技術的發展,知識圖譜以其豐富的語義表達和推理給公安情報業務帶來深刻的變革。本文梳理了知識圖譜和犯罪情報的基本概念和特點,進而闡述基于知識圖譜的犯罪情報圖譜的構建流程和推理技術,介紹相關技術的重點難點及存在的問題,給出后續發展的方向。文本旨在為構建犯罪情報圖譜提供整體思路,為犯罪情報圖譜的各環節提供現有的可行技術,為犯罪情報圖譜的實現和應用提供有益的借鑒。

  關鍵詞 知識圖譜 情報分析 犯罪情報 犯罪情報圖譜

知識圖譜

  現今信息技術日新月異,信息呈爆炸式增長,如何快速實現犯罪情報的要素提取、組織、和分析,輔助偵查是公安大數據和智慧警務的發展方向。知識圖譜作為一種刻畫大規模數據關聯的利器,在犯罪情報分析應用中價值極大。

  一、知識圖譜概述

  (一)知識圖譜表示與建模知識圖譜源于語義網絡,由Google公司于2012年提出,采用圖模型對現實世界的事物及關聯建模。知識圖譜將實體及關系表示為三元組G=(ε,R,ξ),ε表示實體集合,R表示實體關系的集合,ξ=R×ε×ε表示圖譜三元組集合[1]。

  三元組的表示規范主要有資源描述框架(ResourceDescriptionFramework,RDF)、RDFs(RDFSchema)和網絡本體語言(WebOntologyLanguage,OWL)。RDF是W3C提出用于描述實體的標準,對每個資源使用統一資源標識符(URI)標識,以網絡形式連接各實體,可用多個三元組表示復雜語義,但最多僅能表述二元謂詞,表示能力有限。RDFs是描述RDF的輕量級語言,增加對實體的類和屬性描述,可描述實體和屬性的關系。OWL基于XML和RDF/RDFs采用含頭部和主體的二元結構。頭部存儲命名空間,主體則描述本體的類別、實例和屬性間的關聯。OWL還提供類、屬性和實例的等價、互逆、對稱等聲明,表達能力更強,是W3C表示本體的推薦語言。

  (二)知識圖譜的應用

  1.優化搜索引擎知識圖譜最早應用于提升搜索引擎的能力。傳統搜索引擎通過關鍵字實現網頁搜,無法有效應對具有歧義的檢索。知識圖譜利用其強大的實體概念表述能力,能夠利用數據的語義較為準確識別用戶的需求,提高了用戶搜索的準確性,成為新一代智能搜索引擎的強大動力。

  2.突破智能問答瓶頸在自動問答方面,知識圖譜基于關聯關系,實現自然語言的語義結構化,可提高自動問答系統的智能化和精確性。目前,智能問題系統能較好應對事實性單點問題,效果接近真人。結合知識圖譜和機器學習的智能問答系統可提高對問題的語義理解,增強對詞組合問題的探索[2]。

  3.實現機器推理

  結合邏輯謂詞和圖搜索等技術,知識圖譜可完成基于關系邏輯的硬邏輯規則提取,完成精確型問題的機器推理工作,符合人類的推理邏輯,結果的可解釋性最好[3]。將機器學習與知識圖譜結合,把圖譜映射為神經網絡,通過優化算法提取實體鄰接關系,實現圖譜的多步推理[4]。

  4.增強推薦系統

  面對海量電商信息,知識圖譜可增強商品與用戶的信息語義關聯,解決系統冷啟動問題,增強商品推薦效果。Trans系列[5]嵌入法可獲得實體和關系的低維稠密向量,進而確定實體的相似性以實現推薦。不同類別實體或關系構成的異質知識圖譜使用圖卷積網絡可取得較好效果[6]。基于元路徑的挖掘方法也可用于異質圖譜推薦,利用路徑相似性獲得物品和用戶的偏好特征,通過特征向量點積的加權累積進行推薦[7]。文獻[8]使用元圖替代元路徑對異質網絡進行特征提取,更全面展示其中的復雜特征,提升推薦效果。

  二、犯罪情報

  (一)犯罪情報的類型

  犯罪情報按來源可分為境內和境外情報。境內情報是從國內獲取的犯罪情報;境外情報則通過各種方式從國外或境外獲取的犯罪情報。犯罪情報按其地位分為戰略情報和戰術情報。戰略情報是指對犯罪偵查工作具有重大影響的情報,而戰術情報是指感知片面情況或局部情況的情報。在載體方面,犯罪情報可分為文字情報、聲像情報和實物情報。從內容角度,犯罪情報分為人員、案件和犯罪組織情報等。犯罪情報屬性分為線索型、資料型和預測型情報三類。線索型情報為犯罪偵查提供引導信息,資料型情報為犯罪偵查提供基礎信息,預測型情報則指用于預測犯罪活動在特定時空范圍內演變趨勢。近年來,開源情報作為新情報源已嶄露頭角。

  (二)犯罪情報的特點

  犯罪情報具有知識性、有序性、傳遞性和實用性等基本屬性。知識性表明情報是偵查人員對客觀犯罪活動的認知。有序性是指犯罪情報處理需要一個漸進的加工過程。傳遞性是指犯罪情報必須在進行傳遞才能發揮價值。實用性則表明犯罪情報必須服務實戰。犯罪情報的特性表現為社會性、累積性、時效性、隨機性和秘密性等。犯罪活動是人類的行為,社會性是其與生俱來的天性。犯罪情報的價值只有積累到一定規模才能發揮作用。犯罪情報的實時性是捕捉戰機的關鍵。隨機性表明單條犯罪情報僅能反映特定犯罪活動在某個時空截面的情況。秘密性是指犯罪情報僅能以隱蔽方式在特定范圍獲取、傳遞和運用。

  三、犯罪情報的知識圖譜構建及運用

  (一)基于知識圖譜的犯罪情報圖譜構建

  1.涉案實體識別

  實體識別是犯罪圖譜的基礎,旨在從情報中抽取實體。實體識別的對象分為實體、時間和數字三大類,細分為人名、機構名、地名、時間、日期、貨幣、交通工具和武器等。實體識別分人工識別和自動識別。人工識別相對準確,但效率低,僅適用少量樣本的處理。自動識別分為兩大類:基于規則的實體識別和基于機器學習的實體識別,機器學習識別又分為基于特征和基于神經網絡。基于規則的方法適用于英文環境,國外早期系統均采用此法。基于詞典方法依靠匹配規則簡單有效,對中文支持較好,但構建詞典耗時耗力[9]。

  機器學習方法則利用已標注的語料庫訓練模型,獲得特定字或詞作為命名實體整體或部分的概率,常用方法有基于上下文[10]和基于序列化標注[11]等。其后,基于LSTMCRF[12]的深度學習被用于實體識別。由于任務和需求不同,實體識別的粒度也不同。實體識別粒度越小則難度和開銷越大,但指導意義更大。當前,困擾實體識別的要素包括實體命名形式多變、語言環境復雜和實體存在歧義等。

  2.實體消歧

  由于形式和語義復雜,實體識別后需進行一致性校驗,即實體消歧。其原因在于:同一實體可能有不同的稱謂,同一名稱在上下文中可能表示不同的實體。消歧的一般方法為有監督的機器學習[13]。分類方法通過構建正負實例、指稱-實體對等形式通過有監督方式進行學習,獲取二元分類模型以實現實體消歧。機器學習排序方法分三類,PointWise使用近似回歸模型計算候選匹配實體的得分并排序,得分越高則越傾向為同一實體。

  PairWise將候選項匹配成對,利用項與項間的相對位置關系構建訓練樣本,采用分類方法訓練排序感知機實現消歧;ListWise則將査詢結果排序列表視為訓練實例,利用ListNet算法訓練排序模型進行消歧。基于圖的方法將情報中的實體指稱及其候選實體構成圖結構,利用兩者的關聯完成協同消歧[14]。混合模型綜合運用多種模型獲得各自消歧結果,最后通過比較得到最優結果,效果好于單模型。實體消歧過程要避免實體的遺漏和流失,以免情報失真。

  3.實體關聯提取

  實體關聯是構建犯罪知識圖譜的核心環節,將情報信息從語言層面上升到內容層面。在犯罪情報方面,實體關系主要體現人(組織)、物或事為中心的兩方或多方關聯,需要時還可加入時間或地點。其難點在于同一關系表述不同、關系涉及實體多、同一詞匯表達不同關系和存在隱性關聯等。基于模板的方法是關系抽取的傳統方法,根據實體指稱的上下文關系參照模板提取關系[15]。

  基于機器學習的方法分為有監督學習和弱監督學習兩類。有監督學習方法通過分類算法學習人工標注的實體指稱關聯樣本進行模型訓練,形成語義關系分類器用于關系提取[16]。基于弱監督學習方法以距離監督為假設,對人工標注的部分圖譜三元組樣本進行學習以形成分類器,進而自動完成其他內容的關系抽取[17]。Hasegawa等提出基于無監督技術的關系抽取,按實體特征進行全連通聚類,通過關系相似性確定實體關系的類型[18]。視頻、圖片、語言等類型的情報信息進行關系抽取將是今后的發展方向。

  (二)基于知識圖譜的犯罪情報分析與挖掘當前的“情報主導警務”強調情報對警務活動的指導,要求警方有效融合情報,全面深入挖掘情報內涵,知識圖譜正好滿足需求。

  1.基于圖譜的犯罪信息搜索

  傳統的信息檢索通過關鍵字匹配方式完成查找,未考慮關鍵字的語義和上下文關系,檢索質量不高。基于知識圖譜的實體檢索同時考慮語義相似性和結構相似性,計算每個實體相關的三元組與用戶查詢之間的相關度,排序后得到候選實體[19]。此外,知識圖譜作為一種存在邏輯結構的有向連通圖,可通過圖模型進行建模檢索,用檢索對象的特征建立子圖并構建圖譜的圖索引[20],通過子圖篩選技術實現犯罪信息檢索。

  當檢索目標較復雜時可綜合多個圖譜進行搜索,基于圖譜的問答技術用于提高搜索效果[21]。基于詞典-文法的語義解析方法通過分析問句,構建由節點、邊和操作符組成的語義圖,視其為圖譜子圖并映射到圖譜中,通過圖匹配完成檢索[22]。目前,基于知識圖譜的簡單問題檢索基本成熟,但深層挖掘問題、大規模搜索和長尾問題等仍待研究。

  2.基于圖譜的案件推理

  知識圖譜的結構化形式是其強于數據庫的最大優勢,支持信息推理,可用于情報的補齊、質檢和挖掘,輔助研判。知識圖譜推理著眼實體和關系,進行演繹推理和基于歸納的推理,由已有信息推斷未知信息。歸納推理用于推理具體事實,利用邏輯規則獲得某個事件的過程;演繹推理則著重提取知識圖譜中的邏輯規則。演繹推理包括基于謂詞邏輯的關系推理[23]、基于概率邏輯的規則提取[24]和基于隨機游走的規則挖掘[25]等。歸納推理包括基于置信規則推理的關系預測[26],基于路徑的關系推理[27]等。知識圖譜推理技術可輔助事件規律挖掘、人員畫像構建、特定群體發現、人物關系梳理等犯罪情報分析。

  情報論文投稿刊物:《圖書與情報》始刊于1981年,由甘肅省圖書館、甘肅省科技情報研究所聯合主辦。自創刊以來一直以學術質量建設為核心,關注圖情業界的最新學術熱點與動態,注重刊發理論與實踐相結合、國內與國外相融匯的科研學術成果,是一份圖情界非常有影響的兩棲類學術刊物。

  四、結語

  本文概述知識圖譜和犯罪情報的相關概念和特點,介紹犯罪情報圖譜的構建步驟和方法,梳理存在的問題和發展方向,為相關研究提供思路。在大數據和人工智能等新興技術不斷發展的今天,犯罪情報圖譜賦能公安機關占據信息制高點,對維護國家安全和公共安全具有重要作用,是我國構建治理體系和治理能力現代化的重要抓手,在公安情報工作中大有作為。

  參考文獻:

  [1] 趙軍,劉康,何世柱,等.知識圖譜[M].北京:高等教育出版社,2018:2-5.

  作者:張美璟

主站蜘蛛池模板: 日本一卡精品视频免费 | 国产在线精品亚洲另类 | 最近免费中文字幕MV免费高清 | 伦理 电影在线观看百度影音 | YELLOW视频直播在线观看 | 欧美美女性生活 | 成人精品视频在线观看 | 接吻吃胸摸下面啪啪教程 | 久久成人伊人欧洲精品AV | 久久精品国产99欧美精品亚洲 | 国产成人mv 在线播放 | 国产精品久久毛片A片软件爽爽 | 国产成人在线视频免费观看 | 美女白虎穴 | 看80后操 | 精品久久久久久无码人妻国产馆 | 国产亚洲精品香蕉视频播放 | 99热这里只有的精品 | 国产Av男人的天堂精品良久 | 亚洲日本欧美国产在线视 | 国内高清在线观看视频 | 亚洲精品资源网在线观看 | 亚洲香蕉视频在线播放 | 99视频一区| 国产日韩欧美三级 | 一区二区不卡在线视频 | 视频在线免费观看 | 啪啪激情婷婷久久婷婷色五月 | 欧美激情精品久久久久 | 亚洲中文 字幕 国产 综合 | 擼擼擼麻豆密臀AV | 国产在线观看的 | 男女疯狂一边摸一边做羞羞视频 | 9420高清免费观看在线大全 | 帝王被大臣们调教高肉 | 青草影院天堂男人久久 | 成人在线高清不卡免费视频 | 亚洲精品久久久久久偷窥 | 亚洲高清视频免费 | 日韩欧美中文字幕在线二视频 | 国产精品久久久久婷婷五月色 |