自助銀行人員聚集檢測技術(shù)的應用案例
智能視覺監(jiān)控系統(tǒng)在ATM機上的應用就成為維護銀行自助服務的安全、有效措施。
隨著《銀行營業(yè)場所風險等級和防護級別的規(guī)定》及《銀行自助設(shè)備、自助銀行安全防范規(guī)定》的頒布實施,銀行營業(yè)廳、自助設(shè)備、自助銀行等場所的安全均以法規(guī)的形式得到進一步加強。而在安全防范技術(shù)方面;自助銀行采取了人員聚集、面部遮擋、人員徘徊等智能檢測技術(shù)進行自動預警和防范,以確保用戶的生命和財產(chǎn)安全。
二、人員檢測技術(shù)的原理和分類
目前,人員檢測技術(shù)逐漸被應用在自動銀行中,主要針對自助銀行和ATM的大場景的應用,其算法主要有兩類:一類是基于整個人群的群體模式分析,通過建立人群特征與目標場景中人員數(shù)量之間的關(guān)系得到估計結(jié)果;另一類是基于個體特征的檢測方法,以人體模式為研究對象,通過檢測單個人員,最終統(tǒng)計得到人員個數(shù)。但是,在自助銀行的場景下,環(huán)境的變化因素往往對算法產(chǎn)生一定的影響,如光線變化、攝像頭的移動等,因此需要算法對環(huán)境變化有較強的魯棒性。
三、基于群體模式的人群聚集檢測算法
基于人群的模式主要是指以整個人群作為分析目標,然后通過訓練得到單個人的量化特征,進而估算出人群中個體的數(shù)量。這類算法主要有兩種估算方式:一種是由高斯背景模型得到前景人群目標,而后經(jīng)過訓練建立前景目標面積(圖像像素點數(shù)量)與人群中人員數(shù)量的對應關(guān)系估算出人員數(shù)量。在自助銀行或ATM的場景中,由于透視現(xiàn)象的存在,人群與鏡頭之間的相對距離嚴重影響了對人員數(shù)量估計的準確性,并不適合銀行場景。因此,該方法較適合于更大場景中且對人群擁擠狀況判斷較為簡單的場所。
另一種方式考慮到了透視現(xiàn)象的影響,通過得到人群和單人在實際空間中所占真實面積(非圖像像素點數(shù)量)估算人員數(shù)量。分別在人體的頭頂部和腳底部得到兩個平行于地面的平面,將人體在兩個平面上分別投影,則得到兩個投影區(qū)域。兩個區(qū)域進行重疊得到交置區(qū)域,此區(qū)域即為人體在真實場景中所占面積。此方法有效地改善了透視現(xiàn)象對算法造成的影響,能夠精確得到人群在真實場景中所占面積。而對于單個人在真實場景中所占面積是通過取多個單人在目標場景中不同位置的視頻序列樣本進行訓練,得到單個人面積的平均值和標準差。
從以上兩種算法方式可以看出,算法的實現(xiàn)過程必須要滿足以下條件:(1)攝像頭位置和角度標準化;(2)目標場景內(nèi)光線不可快速變化;(3)人群中人與人之間的距離不可差異過大。首先,由于環(huán)境的不同,攝像頭安裝很難做到位置和角度的標準化,因此限制了本算法應用的泛化性;其次,受外面環(huán)境的影響很難保證銀行環(huán)境光線的穩(wěn)定性;最后,其精度依賴于人與人之間距離的均勻性,如果人群疏密不均可能會造成較大誤差。因此,本算法雖然在精度上有所提高,但仍不能滿足自助銀行或ATM環(huán)境的需求。
四、基于個體模式的人群聚集檢測算法
1.基于顏色的檢測算法
基于顏色的檢測方法一般通過檢測人臉部的膚色以確定人臉;進而統(tǒng)計在預先設(shè)定目標區(qū)域內(nèi)的人員數(shù)量。首先,需要建立膚色模型,其方法主要有:基于顏色空間YCgCb或YCgCr的高斯膚色模型、適應亮度分段橢圓膚色模型以及基于HSV和RGB混合膚色模型。其次,利用顏色信息把彩色圖像分割為膚色區(qū)域和非膚色區(qū)域。最后,運用數(shù)學形態(tài)學或低通濾波等對膚色區(qū)域進行去噪處理,實現(xiàn)臉部區(qū)域的具體定位和標記,最終統(tǒng)計得到人員個數(shù)。
此方法雖然實現(xiàn)算法并不復雜,但是其對視頻采集質(zhì)量、環(huán)境光照等影響因素較為敏感,魯棒性差。另外,當人臉背對時幾乎不能采集到膚色區(qū)域,方法失效。所以,基于膚色的人員統(tǒng)計方法存在環(huán)境要求較高、適用范圍較小和準確度較低等缺陷。
2.基于移動目標的檢測算法
目標檢測算法主要是基于場景中人員移動的特點,首先通過對圖像序列的分析提取出運動前景區(qū)域,然后通過處理前景區(qū)域得到人員目標。對于運動前景的提訊主要通過背景減除的方法,其包括背景建模、檢測前景和背景更新三個方面。
背景建模即從一系列視頻圖像中準確找到屬于背景的部分,并且存儲為背景圖像,目前單高斯背景建模是較為常用的一種方法。檢測前景是將當前視頻圖像與背景建模進行比較,找到前景目標、減除背景、背景更新就是某些變化導致原來的背景建模不再適合當前視頻圖像時,實時地更新背景模型。
但是,此方法有其自身的弱點,在檢測運動目標的過程中,由于光照的影響容易在運動目標周圍產(chǎn)生陰影,陰影伴隨著運動目標也是運動著的,所以其與運動目標一起以前景方式被提取出來。由于背景以當前幀作為基礎(chǔ)進行更新,運動目標會部分融入背景;產(chǎn)生更新背景和實際背景存在一定的誤差,從而造成“拖尾現(xiàn)象”。上述問題對人員檢測或人員數(shù)量的統(tǒng)計均會產(chǎn)生影響,使其在處理諸如重疊等問題中略顯劣勢,但是亦有不少算法對其進行了不同程度的改進。本算法多與其他算法相結(jié)合進行人員檢出;另外,對于存在目標區(qū)域內(nèi)長時間沒有運動的人員目標,本算法會將其融入背景中進而當作背景處理,后續(xù)算法將無法進行提取。
3.基于頭肩的檢測算法
基于頭肩的檢測算法是以人體特征為研究對象,通過提取圖像中人體的特征來判斷人員個數(shù)。在自助銀行或ATM場景視頻中,人員多為站立姿態(tài)或行走姿態(tài),所以頭肩部位的外部輪廓較為穩(wěn)定,可以將其作為人體特征進行提取。
HOG(HistogramsofOrientedGradients)算法主要對人員頭肩進行特征提取。HOG算法主要是對圖像邊界的方向進行直方圖統(tǒng)計得到特征向量,然后利用支持向量對特征向量進行分類,進而得到頭肩區(qū)域和非頭肩區(qū)域,最終達到檢測頭肩的目的。此方法不僅避免了使用顏色作為特征的局限性,而且對于靜止目標也能夠檢測到,所以相對于移動人員檢測法魯棒性更強、準確性更高。另外,對于聚集在一起的人群,本算法不受人群疏密程度的影響,只要能夠觀察到人員頭肩部位,本算法就可以適用,這也符合了人眼觀察的視覺特點。
(1)區(qū)域塊歸一化
為了提高精確度,還可以把這些局部直方圖在圖像的區(qū)域塊中進行對比度歸一化,此方法通過先計算各直方圖在這個區(qū)域塊中的密度,然后根據(jù)這個密度值對區(qū)域塊中的各個方格單元做歸一化,通過這個歸一化后,能對光照變化和陰影獲得更好的穩(wěn)定性。
(2)合成特征向量
由于選定區(qū)域塊為處理對象,所以以區(qū)域塊為單位形成特征向量,其組合方式把區(qū)域塊中三個等級的小單元格形成的直方圖按次序排列成特征向量,就構(gòu)成了直方圖描述子。這些區(qū)域塊互有重疊,每一個細胞單元的輸出都多次作用于最終的描述子,并且以不同的值出現(xiàn)在最終的特征向量中,大大地改善了分類結(jié)果。
(3)梯度計算
由于本算法是對邊界信息的統(tǒng)計,即對目標梯度圖像分布的描述,所以首先利用一維模板[-1,0,1]及其轉(zhuǎn)置對原圖像進行梯度化以得到圖像邊緣信息。
(4)構(gòu)建方向直方圖
從已有的梯度圖像中分割出一個區(qū)域塊為處理對象;此區(qū)域塊可以遍歷整個圖像以搜索圖像中的頭肩區(qū)域。每個區(qū)域塊可以劃分為三種大小不同等級的小單元格,區(qū)域塊可以劃分為2x2的一級矩形小單元格,一級小單元格又可以劃分為2X2的M級矩形小單元格,依次類推,共分為三個等級。
(5)支持向量機(SVM)分類器
首先,將樣本的HOG特征向量輸入到SVM中;利用正負訓練集對SVM進行訓練,尋找一個最優(yōu)超平面作為決策函數(shù),進而得到SVM分類器,最后再利用訓練得到的SVM對輸出圖像進行分類以得到頭肩區(qū)域和非頭肩區(qū)域。
五、結(jié)語
綜上所述,基于個體的算法與基于人群的算法相比較精確度較高,更適合自助銀行場景中對人數(shù)的精確度要求。鑒于HOG算法并不依賴于顏色。