時間:2022年04月19日 分類:電子論文 次數:
道路交通安全一直為人們所重視,但是道路上違章行人數量巨大,并沒有得到很好的管控,為此我們設計了一款交通路口執勤機器人。它可以完成對行人交通行為的有效管控,實現對臉部信息的采集、抓拍、上傳、記錄等,并設有問路和語音提示功能。本項目旨在通過管控行人方面來降低交通事故的發生頻率,保障交通安全,維護出行健康,具有一定的實際應用價值。
近年來,隨著城市化的發展和交通管理需求的不斷增長,城市交通樞紐壓力不斷增大,道路交通安全管理面臨著技術要求的提升。大數據技術在新一代智慧城市交通管理系統中得到了廣泛應用,為整個社會提供了海量的數據資源。現階段我們所面臨的主要交通問題已經從機動車違法方面轉化為了行人違法行為的管制,比如闖紅燈行為。本項目主要在于開發已有道路交通管制中未進行完全開發的公共設施,設計一款基于視頻檢測技術的交通路口執勤機器人,保障交通安全,利于行人出行。
1. 交通路口執勤機器人系統設計及功能
1.1 系統設計
交 通 路 口 執 勤 機 器 人 通 過 Python 語 言 編 寫, 以 樹莓派 4B 作為硬件載體,通過 OpenCV 計算機視覺庫和OneNET 云平臺等軟件,對闖紅燈的行人進行人臉識別和拍照處理,上傳到該路口對面機器人身后的顯示屏和云平臺上,實現對行人闖紅燈行為的警示與記錄。同時調用高德地圖 API,通過語音輸入模塊實現行人語音輸入功能,通過機械臂模擬交通指揮手勢,結合語音輔助指揮,以此完成為行人指路的人機交互方案。
機器人技術論文:堆外核探測器安裝機器人設計與底盤運動分析
1.2 功能設計
交通路口智能執勤機器人通過圖像處理達到對人臉的精準識別,并對闖紅燈人員抓拍,上傳到后端云平臺網絡作為記錄闖紅燈人員的依據;通過機械臂動作提醒行人的行為;行人可語音向機器人詢問目標地點,具有導航功能,一定程度上實現了人機交互功能。交警可通過后端云平臺網絡直接查看到有闖紅燈行為的行人信息,機器人通過機械臂的手勢變換進行一定程度上的交通指揮,可以減輕交警的勞動量。
對于行人,行人會在紅綠燈時得到對應的語音提醒,紅燈時“紅燈,禁止通行”,同時機器人開啟人臉識別系統,抓拍闖紅燈人員信息;綠燈時提醒“綠燈,請按交規通行”。同時,行人可點擊問路按鍵,語音詢問如何去往目的地,機器人將通過高德地圖 API 和語音模塊予以回答。該機器人不僅增強了對行人的監管和保護能力,減少了交警的工作量,也方便了人們的出行,保障了行人的安全,適用于人流量與車流量較大的交通路口,具有一定的現實應用價值。
2.硬件電路設計該系統
通過 Python 語言編寫實現以樹莓派 4B 作為硬件載體,通過高清攝像頭實時捕捉人行道上的行人面部圖像,通過舵機控制機械臂動作模擬交通指揮手勢提醒行人的行為;通過 WiFi 模塊進行聯網以完成信息傳輸;通過語音模塊完成語音輸入和語音指揮功能;顯示屏用來顯示行人的問路信息與導航地圖。
2.1 核心控制模塊由于交通路口執勤機器人需要進行實時目標抓拍識別、上傳數據等任務,采用普通單片機難以滿足設計要求,所以核心控制器采用樹莓派 4B 微型計算機。樹莓派開發板不僅體積小,而且具有豐富的內部資源,既能保證較高的運算速度,又能簡化系統外圍電路設計,因此我們選用樹莓派 4B作為核心控制器。
2.2 攝像頭模塊本模塊是機器人圖像識別系統的硬件部分。圖像識別模塊選擇使用小型 USB 高清攝像頭以確保拍攝圖像清晰,能夠很好地滿足交通路口執勤機器人對圖像采集的要求。
2.3 語音識別模塊語音識別過程主要分為三步:首先把幀通過模塊識別為一種狀態,再把這種狀態進行組合為音素,最后把這些組合形成的音素合成為具體詞匯。聲音是一種波,在識別之前,為了減少干擾,靜音區段會被切除。然后利用移動窗函數對聲音進行分幀等預處理后,將聲音轉化成數字信號傳送至特征提取模塊。特征提取模塊接收到信號后,把能有效反映語音特征的信息轉化成一離散型矢量序列,將其壓縮打包后傳遞至百度智能云 API 完成語音識別搜索。本系統采用該模塊實現行人語音問路和機器人紅綠燈語音提醒功能。
2.4 機械臂機械臂是一款新興的能夠模仿人類手臂部分動作的裝置,可按照設置好的代碼執行相應的動作,實現基礎位移和對物品的抓取等行為。一個完整的機械臂系統包含電源、控制系統、機械機構等諸多單元。本機器人所使用的六自由度機械臂以平面運行動作為主,由運動元件、關節和手臂組成。運動元件起驅動作用,關節能通過旋轉和轉動實現機械手臂全方位的移動,手臂起到支持、連接的作用。機械手的指揮手勢我們通過控制舵機旋轉固定角度來實現本系統使用六自由度仿生機械臂模擬交通指揮手勢輔助警察指導行人。
3.軟件設計
本系統利用 OpenCV 進行人臉檢測,使用 YOLOv3算法及優化改進算法保障行人的人臉檢測的時效性和準確性,采用百度 AI 開放平臺提供的 API 接口實現語音控制,并且將指示文字合成為聲音完成機器人的語音提醒功能。違法行人的圖像信息及時會上傳至 OneNET 云平臺中,交警可在 OneNET 云平臺進行查看并下載記錄。
3.1 OpenCV 的人臉檢測OpenCV 是一個跨平臺計算機軟件庫,能夠實現圖像處理和計算機視覺方面的多種計算機算法。目前,人臉識別已經在各個方面都得到了廣泛且深遠的應用。人臉識別主要分為兩個階段,首先設備調用攝像頭搜索圖像尋找人臉區域,獲取行人面部視頻流數據后進行圖像處理,提取到視頻流中的人臉圖像集合,接著清理面部圖像排除其他干擾以進行更好的識別。然后對集合中單幀人臉圖像進行處理,之后與云數據庫中的人臉信息進行匹配從而確定對應的行人信息。在本系統中,我們使用 Python 語言編寫、優化代碼和啟用 imutils 庫,利用 OpenCV 進行人臉檢測完成違規行人信息的識別。
3.2 百度智能 AI 語音合成本設計通過使用百度 AI 開放平臺提供的語音 API 接口進行語音功能的設計。語音轉換組件可以將文字精準識別為語音,包含中文普通話輸入法、英語、粵語等模型。除此之外,它還可以實現計算機、機器人等智能設備終端間的信號響應。本系統利用百度智能 AI 語音合成將輸入文字轉化為聲音達到機器人的語音提醒功能。
3.3 YOLO 算法實現視頻流中的目標檢測YOLO 是一種兼具良好的準確性與實時性的一階段目標檢測算法。其算法原理是將原始圖像輸入網絡后,采用regression(回歸)的方法完成坐標框的檢測及分類,通過損失計算預測出物體的類別和位置信息,將目標檢測問題變成一種回歸問題求解。YOLO 算法原理為把輸入圖像劃分成 S 為邊長的正方形網格,然后對每個格子都預測 B 個 bounding boxes,每 個 bounding box 都 包 含 有 5 個 預 測 值:x,y,w,h 和 confidence。
其 中,confidence 定 義 為 P r( O bj e c t )* I O U p r e d t r u t h P_r(Object)*IOU_{pred}^{truth},如果不存在檢測物體,那么 confidence 為0,否則期望其為 IOU。而 bounding box 為:[x,y,w,h],其中(x,y)為 object 中心點坐標,與 grid cell 對齊,使范圍變成 0-1;w 和 h 進行歸一化處理。YOLO 在 測 試 過 程 中 將 confidence 與 C 類 的probability 相乘,如:P r ( C l a s s i | O b j e c t )*P r (O b j e c t )*I O U p r e d t r u t h = P r ( C l a s s i )*I O U _{pred}^{truth},就可以得到類別概率及其準確度。YOLO 在訓練和檢測的時候可以看到全局圖像,優化于其他算法,本智能執勤機器人依靠此算法提高在實時監測過程中人臉識別的速度和精確度。
4.結語
交通路口執勤機器人以樹莓派 4B 為控制核心,通過機械臂完成手勢指揮功能,通過語音模塊和百度智能語音合成API進行人機交互;設有問路指路功能、紅綠燈通行提醒功能、行人檢測和人臉識別功能,能對違反交規的行人進行精準識別與處理。通過 OneNET 云平臺與交警信息網連接,大大減輕了交警的工作量,為維護交通安全提供了保障。
作者:袁瑋含 1 耿莽河 2 王新宇 3