加勒比一本heyzo高清视频-免费精品无码av片在线观看-无码国产精品一区二区免费模式-去干成人网-成在人线av无码免费

物聯(lián)傳媒 旗下網(wǎng)站
登錄 注冊

人臉識別技術(shù)分析

作者:本站收錄
來源:人臉識別技術(shù)專家
日期:2018-05-28 10:13:26
摘要:人臉圖像的采集不同于指紋、掌紋需要接觸指掌紋專用采集設(shè)備,指掌紋的采集除了對設(shè)備有一定的磨損外,也不衛(wèi)生,容易引起被采集者的反感,而人臉圖像采集的設(shè)備是攝像頭,無須接觸。
關(guān)鍵詞:人臉識別生物識別
人臉識別技術(shù)分析

  1、人臉識別(FR技術(shù))產(chǎn)品的優(yōu)勢

  1)非接觸:

  人臉圖像的采集不同于指紋、掌紋需要接觸指掌紋專用采集設(shè)備,指掌紋的采集除了對設(shè)備有一定的磨損外,也不衛(wèi)生,容易引起被采集者的反感,而人臉圖像采集的設(shè)備是攝像頭,無須接觸。

  2)非侵擾:

  人臉照片的采集可使用攝像頭自動拍照,無須工作人員干預(yù),也無須被采集者配合,只需以正常狀態(tài)經(jīng)過攝像頭前即可。

  3)友好:

  人臉是一個人出生之后暴露在外的生物特征,因此它的隱私性并不像指掌紋、虹膜那樣強,因此人臉的采集并不像指掌紋采集那樣難以讓人接受。

  4)直觀:

  我們判斷一個人是誰,通過看這個人的臉就是最直觀的方式,不像指掌紋、虹膜等需要相關(guān)領(lǐng)域?qū)<也趴梢耘袆e。

  5)快速:

  從攝像頭監(jiān)控區(qū)域進行人臉的采集是非??焖俚?,因為它的非干預(yù)性和非接觸性,讓人臉采集的時間大大縮短。

  6)簡便:

  人臉采集前端設(shè)備——攝像頭隨處可見,它不是專用設(shè)備,因此簡單易操作。

  7)可擴展性好:

  它的采集端完全可以采用現(xiàn)有視頻監(jiān)控系統(tǒng)的攝像設(shè)備,后端應(yīng)用的擴展性決定了人臉識別可以應(yīng)用在出入控制、黑名單監(jiān)控、人臉照片搜索等多領(lǐng)域。

  2、FR三大識別場景

  1)人臉確認(1:1):

  (1)簡介:

  將某人面像與指定人員面像進行一對一的比對,根據(jù)其相似程度來判斷二者是否是同一人,相似 程度一般以能否超過某一量化閥值為依據(jù)。簡單的說就是A/B兩張照片比對,產(chǎn)生的計算數(shù)值是否達到要求。

  (2)產(chǎn)品應(yīng)用:

  快速的人臉識別比對,移動支付認證、安全性身份核對、作為身份確認的一種新方式,比如考生身份確認、公司考勤確認、各種證件照和本人確認。

  (3)實際問題:

  產(chǎn)品在系統(tǒng)設(shè)計的邏輯上,需要先考慮調(diào)取已儲存對象信息的先驗條件。通過界面/語音的提示,使得待認證者預(yù)先知道自己正處于被核對的過程中,且已預(yù)先了解擬核對對象的身份。

  (4)比對來源的三種主要方式:

  1. 用戶自傳照片,比如支付寶的人臉比對,用戶自傳的照片最大的問題是照片質(zhì)量的合格率太低,拍照的光線、角度等因素會導致采集源的質(zhì)量下降,不利于后期的大批量人臉特征碼管理。

  2. 使用身份證讀卡器,讀取身份證上的照片,遺憾的是這張照片2K的大小,不過也是目前用最多的源照片提取方式,比較適合簽到場合。

  3. 使用公安部旗下NCIIC的人臉比對接口(注意,不是網(wǎng)紋照片接口,這個接口已經(jīng)不對外),使用的是直接的人臉比對接口。

  2)人臉辨認(1:N):

  (1)簡介:

  將某人面像與數(shù)據(jù)庫中的多人的人臉進行比對,并根據(jù)比對結(jié)果來鑒定此人身份,或找到其中最相似的人臉,并按相似程度的大小輸出檢索結(jié)果。

  (2)產(chǎn)品應(yīng)用:

  人臉開門、人臉檢索,排查犯罪嫌疑人、失蹤人口的全庫搜尋、一人多證的重復排查等。

  (3)實際問題:

  1、走失兒童的項目中去: 這一類系統(tǒng)的部署需要兩個條件:A. BCD基本庫(比如1000萬人) B. 強大的算法硬件

  2、零售店中的刷臉支付長江,需要用戶預(yù)先輸入全手機號,確定用戶身份再進行人臉識別,將原本為1:N的問題轉(zhuǎn)化為了1:1的問題。

  (4)產(chǎn)品難點:

  1、1:N中的N能夠支持多大

 ?、?場景多樣化

  從一個班級百號人刷臉簽到,到一個公司千號人的刷臉打卡,再到一個學校的幾萬人,一個四線城市幾十 萬人,一個一線城市的幾千萬人,難度是呈指數(shù)上升的。

 ?、?公司實際情況

  目前各家公司的成熟人臉識別應(yīng)用能夠支持幾萬到幾百萬人不等的應(yīng)用場景,而且還有一個錯誤率的概念。比如,公司宣稱千萬分之一的錯誤率的情況下(1/10000000),人臉通過率其實只有93%,這是因為很難做到一定不發(fā)生錯誤,而且每個人都能識別通過。(假如一家公司說自己能做到億分之一的錯誤率,通過率能做到98%以上,多半是虛假宣傳,在實際使用中是很難達到的)

  2、非配合場景

  在配合場景下:比如ATM機刷臉取款,用戶會自主配合,將人臉以一個理想的角度通過識別。

  而在非配合應(yīng)用場景下,比如監(jiān)控視頻下的人臉識別,追蹤違法犯罪分子的身份信息,情況就要困難得多。這種情況下,用戶臉部會發(fā)生角度偏大,遮擋,光線不可控等問題。

  3、跨人種,跨年齡識別問題

  研究發(fā)現(xiàn),在一個數(shù)據(jù)集上訓練好的模型,想到遷移到另外一個人種上,效果會出現(xiàn)較大程度的下降。另 外,人臉隨著年齡的變化帶來的改變也給人臉識別帶來不小的挑戰(zhàn)。

  要改善這樣的問題,一個必要條件是需要建立一個足夠完備的跨人種,跨年齡的人臉數(shù)據(jù)庫;在國內(nèi)的話,是 以漢族人為主,同時跨年齡的人臉數(shù)據(jù)庫也比較難收集,需要不短的時間跨度。

  4、產(chǎn)品體驗

  ① 近來備受關(guān)注的刷臉支付,很多時候都會要求用戶輸入全手機號,或手機號后四位,以縮小用戶搜索庫大 小,實際上這是比較影響體驗的。

 ?、?西安一高校晨讀刷臉簽到,由于系統(tǒng)實際響應(yīng)匹配時間過長,導致學生排百米長隊。

  3)多人臉檢索(N:N):

  (1)簡介:

  1:N同時作業(yè)就是N:N了,同時相應(yīng)多張照片檢索需求。

  (2)實際產(chǎn)品問題中:

  1、在視頻級N:N的校驗中,如果要提高通過率,很多時候是采取降低準確率的方式,降低算法隊列數(shù)量;同樣在一些比賽中為了降低誤識率,大大提高了準確率,所以算法在校驗的過程中必須遵循至少一個固定標準,追求的是速度效率還是最高準確率。

  2、視頻流的幀處理所用,對服務(wù)器的計算環(huán)境要求嚴苛,目前的算法系統(tǒng)所支撐的輸出率非常有限。

  主要的限制如下:

  海量的人臉照片解析需要大量運算(目前很少看到在采集端直接解析的,都是照片剪裁) 海量的人臉照片傳輸需要大量的帶寬(常見的720布控攝像頭抓取最小的人臉照片為20K) 海量的人臉照片在后臺檢索需要耗費大量的運算(國內(nèi)主流主機為例,最多到24路攝像頭

人臉識別技術(shù)分析

  3、產(chǎn)品實戰(zhàn)中的物理問題:

  1)光照問題

  (1)簡介:

  光照問題是機器視覺重的老問題,在人臉識別中的表現(xiàn)尤為明顯。由于人臉的3D結(jié)構(gòu),光照投射出的陰影,會加強或減弱原有的人臉特征。

  (2)解決思路:

  A、對其進行包括光照強度和方向、人臉反射屬性的量化,面部陰影和照度分析等,嘗試建立數(shù)學模型,以利用這些光照模型,在人臉圖像預(yù)處理或者歸一化階段盡可能的補償乃至消除其對識別性能的影響,將固有的人臉屬性(反射率屬性、3D表面形狀屬性)和光源、遮擋及高光等非人臉固有屬性分離開來。

  B、基于光照子空間模型的任意光照圖像生成算法,用于生成多個不同光照條件的訓練樣本,然后利用具有良好的學習能力的人臉識別算法,如子空間法,SVM等方法進行識別。

  2)人臉姿態(tài)問題

  (1)簡介:

  與光照問題類似,姿態(tài)問題也是目前人臉識別研究中需要解決的一個技術(shù)難點。姿態(tài)問題涉及頭部在三維垂直坐標系中繞三個軸的旋轉(zhuǎn)造成的面部變化,其中垂直于圖像平面的兩個方向的深度旋轉(zhuǎn)會造成面部信息的部分缺失。針對姿態(tài)的研究相對比較的少,目前多數(shù)的人臉識別算法主要針列正面、準正而人臉圖像,當發(fā)生俯仰或者左右側(cè)而比較厲害的情況下,人臉識別算法的識別率也將會急劇下降。面部幅度較大的哭、笑、憤怒等表情變化同樣影像著面部識別的準確率。

  (2)解決思路:

  1、第一種思路:

  是學習并記憶多種姿態(tài)特征,這對于多姿態(tài)人臉數(shù)據(jù)可以容易獲取的情況比較實用,其優(yōu)點是算法與正面人臉識別統(tǒng)一,不需要額外的技術(shù)支持,其缺點是存儲需求大,姿態(tài)泛化能力不能確定,不能用于基于單張照片的人臉識別算法中等。

  2、第二種思路:

  是基于單張視圖生成多角度視圖,可以在只能獲取用戶單張照片的情況下合成該用戶的多個學習樣本,可以解決訓練樣本較少的情況下的多姿態(tài)人臉識別問題,從而改善識別性能。

  3、第三種思路:

  是基于姿態(tài)不變特征的方法,即尋求那些不隨姿態(tài)的變化而變化的特征。中科院計算所的思路是采用基于統(tǒng)計的視覺模型,將輸入姿態(tài)圖像校正為正面圖像,從而可以在統(tǒng)一的姿態(tài)空間內(nèi)作特征的提取和匹配。

  3)遮擋問題

  對于非配合情況下的人臉圖像采集,遮擋問題是一個非常嚴重的問題。特別是在監(jiān)控環(huán)境下,往往彼監(jiān)控對象都會帶著眼鏡,帽子等飾物,使得被采集出來的人臉圖像有可能不完整,從而影響了后面的特征提取與識別,甚至會導致人臉檢測算法的失效。

  4)年齡變化

  隨著年齡的變化,面部外觀也在變化,特別是對于青少年,這種變化更加的明顯。對于不同的年齡段,人臉識別算法的識別率也不同。一個人從少年變成青年,變成老年,他的容貌可能會發(fā)生比較大的變化,從而導致識別率的下降。對于不同的年齡段,人臉識別算法的識別率也不同。

  5)人臉相似性

  不同個體之間的區(qū)別不大,所有的人臉的結(jié)構(gòu)都相似,甚至人臉器官的結(jié)構(gòu)外形都很相似。這樣的特點對于利用人臉進行定位是有利的,但是對于利用人臉區(qū)分人類個體是不利的

  6)圖像質(zhì)量

  人臉圖像的來源可能多種多樣,由于采集設(shè)備的不同,得到的人臉圖像質(zhì)量也不一樣,特別是對于那些低分辨率、噪聲大、質(zhì)量差的人臉圖像(如手機攝像頭拍攝的人臉圖片、遠程監(jiān)控拍攝的圖片等)如何進行有效地人臉識別是個需要關(guān)注的問題。同樣的,對于高分辨圖像對人臉識別算法的影響也需要進一步的研究。

  7)樣本缺乏

  基于統(tǒng)計學習的人臉識別算法是目前人臉識別領(lǐng)域中的主流算法,但是統(tǒng)計學習方法需要大量的訓練。由于人臉圖像在高維空間中的分布是一個不規(guī)則的流形分布,能得到的樣本只是對人臉圖像空間中的一個極小部分的采樣,如何解決小樣本下的統(tǒng)計學習問題有待進一步的研究。

  8)海量數(shù)據(jù)

  傳統(tǒng)人臉識別方法如PCA、LDA等在小規(guī)模數(shù)據(jù)中可以很容易進行訓練學習。但是對于海量數(shù)據(jù),這些方法其訓練過程難以進行,甚至有可能崩潰。

  9)大規(guī)模人臉識別

  隨著人臉數(shù)據(jù)庫規(guī)模的增長,人臉算法的性能將呈現(xiàn)下降

  10)動態(tài)識別

  非配合性人臉識別的情況下,運動導致面部圖像模糊或攝像頭對焦不正確都會嚴重影響面部識別的成功率。在地鐵、高速公路卡口、車站卡口、超市反扒、邊檢等安保和監(jiān)控識別的使用中,這種困難明顯突出;

  11)人臉防偽

  偽造人臉圖像進行識別的主流欺騙手段是建立一個三維模型,或者是一些表情的嫁接。隨著人臉防偽技術(shù)的完善、3D面部識別技術(shù)、攝像頭等智能計算視覺技術(shù)的引入,偽造面部圖像進行識別的成功率會大大降低。

  12)丟幀和丟臉問題

  需要的網(wǎng)絡(luò)識別和系統(tǒng)的計算機識別可能會造成視頻的丟幀和丟臉現(xiàn)象,特別是監(jiān)控人流量大的區(qū)域,由于網(wǎng)絡(luò)傳輸?shù)膸拞栴}和計算能力問題,常常引起丟幀和丟臉問題。

  13)攝像機的頭像問題

  攝像機很多技術(shù)參數(shù)影響視頻圖像的質(zhì)量,這些因素有感光器(CCD、CMOS)、感光器的大小、DSP的處理速度、內(nèi)置圖像處理芯片和鏡頭等,同時攝像機內(nèi)置的一些設(shè)置參數(shù)也將影響質(zhì)量,如曝光時間、光圈、動態(tài)白平衡等參數(shù)。

  4、實戰(zhàn)中的數(shù)據(jù)標注

  1)數(shù)據(jù)標注

  (1)一般來說,數(shù)據(jù)標注部分可以有三個角色

  1. 標注員:標注員負責標記數(shù)據(jù)。

  2. 審核員:審核員負責審核被標記數(shù)據(jù)的質(zhì)量。

  3. 管理員:管理人員、發(fā)放任務(wù)、統(tǒng)計工資。

  只有在數(shù)據(jù)被審核員審核通過后,這批數(shù)據(jù)才能夠被算法同事利用。

  (2)數(shù)據(jù)標記流程

  1. 任務(wù)分配:假設(shè)標注員每次標記的數(shù)據(jù)為一次任務(wù),則每次任務(wù)可由管理員分批發(fā)放記錄,也可將整個流程做成“搶單式”的,由后臺直接分發(fā)。

  2. 標記程序設(shè)計:需要考慮到如何提升效率,比如快捷鍵的設(shè)置、邊標記及邊存等等功能都有利于提高標記效率。

  3. 進度跟蹤:程序?qū)俗T、審核員的工作分別進行跟蹤,可利用“規(guī)定截止日期”的方式淘汰怠惰的人。

  4. 質(zhì)量跟蹤:通過計算標注人員的標注正確率和被審核通過率,對人員標注質(zhì)量進行跟蹤,可利用“末位淘汰”制提高標注人員質(zhì)量。

  2)模型訓練

  數(shù)據(jù)標記完成后,交由算法同學進行模型的訓練,期間發(fā)現(xiàn)的問題可與產(chǎn)品一起商討。訓練過程中,最好能可視化一些中間結(jié)果。一來可以檢測代碼實現(xiàn)是否有Bug,二來也可以通過這些中間結(jié)果,來幫助自己更好的理解這個算法的過程。

  3)模型測試

  測試同事(一般來說算法同事也會直接負責模型測試)將未被訓練過的數(shù)據(jù)在新的模型下做測試。

  如果沒有后臺設(shè)計,測試結(jié)果只能由人工抽樣計算,抽樣計算繁瑣且效率較低。模型的效果,需要在精確率(識別為正確的樣本數(shù)/識別出來的樣本數(shù))和召回率(識別為正確的樣本數(shù)/所有樣本中正確的數(shù))中達到某一個平衡。

  測試同事需要關(guān)注特定領(lǐng)域內(nèi)每個類別的指標,比如針對識別人臉的表情,里面有喜怒哀樂等分類,每一個分類對應(yīng)的指標都是不一樣的。測試同事需要將測試的結(jié)果完善地反饋給算法同事,算法同事才能找準模型效果欠缺的原因。同時,測試同事將本次模型的指標結(jié)果反饋給產(chǎn)品,由產(chǎn)品評估是否滿足上線需求。

  (1)測試環(huán)境說明

  例如:

  CPU:Intel(R) Core(TM) i7-4790 CPU @ 3.60 GHz

  內(nèi)存:8GB

  系統(tǒng):Ubuntu 14.04 x86_64/Windows 7 SP1 64bit

  GCC版本:4.8.2

  (2)測試集和測試需求說明(比如“圖片包含人臉大小應(yīng)超過96*96像素,測試結(jié)果達到XX程度滿足需求)

  1. 經(jīng)典人臉身份識別測試集LFW,共包含13233 張圖片 5749 種不同身份;世界記錄99.7%。

  2. CK+ (一個人臉表情數(shù)據(jù)集),包含固定表情和自發(fā)表情,包含123個人的593個表情序列。每個序列的目標表情被FACS編碼,同時添加了已驗證的情感標簽(生氣、厭惡、害怕、快樂、悲傷、驚訝)。

  (3)需要說明“有效距離,左右角度,上下角度,速度”等參數(shù)值(范圍)

  注:這和“部署的靈活性”相關(guān)——由于不同客戶不同場景的需求不同,所以技術(shù)方的人臉檢測模塊,一般可以通過調(diào)整參數(shù)得到N種亞型,以適應(yīng)不同應(yīng)用場景(光照、角度、有效距離、速度) 下對運算量和有效檢測距離的需求。

  (4)測試結(jié)果——欠擬合

  1、定義:模型沒有很好地捕捉到數(shù)據(jù)特征,不能夠很好地擬合數(shù)據(jù)

人臉識別技術(shù)分析
人臉識別技術(shù)分析

  欠擬合

  左圖表示size與prize關(guān)系的數(shù)據(jù),中間的圖就是出現(xiàn)欠擬合的模型,不能夠很好地擬合數(shù)據(jù),如果在中間的圖的模型后面再加一個二次項,就可以很好地擬合圖中的數(shù)據(jù)了,如右面的圖所示。

  2、解決方法:

  1)添加其他特征項,有時候我們模型出現(xiàn)欠擬合的時候是因為特征項不夠?qū)е碌?,可以添加其他特征項來很好地解決。例如,“組合”、“泛化”、“相關(guān)性”三類特征是特征添加的重要手段,無論在什么場景,都可以照葫蘆畫瓢,總會得到意想不到的效果。

  2)添加多項式特征,這個在機器學習算法里面用的很普遍,例如將線性模型通過添加二次項或者三次項使模型泛化能力更強。例如上面的圖片的例子。

  3)減少正則化參數(shù),正則化的目的是用來防止過擬合的,但是現(xiàn)在模型出現(xiàn)了欠擬合,則需要減少正則化參數(shù)。

  4)嘗試非線性模型,比如核SVM 、決策樹、DNN等模型。

  (5)測試結(jié)果——過擬合

  1、定義:模型把數(shù)據(jù)學習的太徹底,以至于把噪聲數(shù)據(jù)的特征也學習到了,這樣就會導致在后期測試的時候不能夠很好地識別數(shù)據(jù),即不能正確的分類,模型泛化能力太差。例如下面的例子。

人臉識別技術(shù)分析
人臉識別技術(shù)分析

  過擬合

  上面左圖表示size和prize的關(guān)系,我們學習到的模型曲線如右圖所示,雖然在訓練的時候模型可以很好地匹配數(shù)據(jù),但是很顯然過度扭曲了曲線,不是真實的size與prize曲線。

  二、解決方法:

  從產(chǎn)品角度

  1)重新清洗數(shù)據(jù),導致過擬合的一個原因也有可能是數(shù)據(jù)不純導致的,噪音太多影響到模型效果,如果出現(xiàn)了過擬合就需要我們重新清洗數(shù)據(jù)。

  2)增大數(shù)據(jù)的訓練量,還有一個原因就是我們用于訓練的數(shù)據(jù)量太小導致的,訓練數(shù)據(jù)占總數(shù)據(jù)的比例過小。

  從算法角度

  1)交叉檢驗,通過交叉檢驗得到較優(yōu)的模型參數(shù);

  2)特征選擇,減少特征數(shù)或使用較少的特征組合,對于按區(qū)間離散化的特征,增大劃分的區(qū)間;

  3)正則化,常用的有 L1、L2 正則。而且 L1正則還可以自動進行特征選擇;

  4)如果有正則項則可以考慮增大正則項參數(shù) lambda;

  5)增加訓練數(shù)據(jù)可以有限的避免過擬合;

  6)Bagging ,將多個弱學習器Bagging 一下效果會好很多,比如隨機森林等.

  4)標注流程中遇到的問題

  (1)項目過程中的不確定性:

  1、出現(xiàn)原因:

  一般情況下,只要數(shù)據(jù)標注的規(guī)范清晰,對規(guī)則的界定從一而終,標注工作的流程還是比較簡單的。

  數(shù)據(jù)標注規(guī)范可能會在測試后根據(jù)結(jié)果情況進行調(diào)整,那么,規(guī)則修改前后“數(shù)據(jù)標注的一致性”就出現(xiàn)了問題,會導致多次返工,在時間和人工成本上頗有影響。

  2、解決方法:

  1)如是分類性質(zhì)的解析工作,建議標注規(guī)則先從非??隙ǖ姆呛诩窗组_始;規(guī)則設(shè)定由簡到繁,帶有疑慮數(shù)據(jù)再另外作記號。隨著規(guī)則一步步深入,可能會出現(xiàn)交叉影響,此時就需要放棄一些低頻問題的規(guī)則,余下的未標注的數(shù)據(jù)就根據(jù)新的規(guī)則標注。

  2)如是多類規(guī)則同時進行的標注工作,需要把每類規(guī)則定得足夠細致。

  3)實例:

  1、如詢問機器人會干什么的語料中出現(xiàn),“你說你會干什么?”可以理解為詢問,也可能是嫌棄,這兩類應(yīng)對的策略不同,有歧義,所以不能把它歸納如詢問類,需要把它從訓練集里剔除。

  2、如人臉情緒識別中,一個人在流眼淚,有時可以理解為傷心落淚,有時可以理解為喜極而泣,還有時可以理解為激動落淚,甚至是感動落淚等,所以在看到此類照片時,不能簡單的憑借慣性化思維將其歸納到悲傷一類中,當人眼都很難判別清楚時,需要把它從訓練集里剔除。

  5、實際案例分析

  1)某領(lǐng)域的人臉識別監(jiān)測與身份確認

  (1)案例問題:

  光照影響:過暗或過亮等非正常光照環(huán)境,會對模型的效果產(chǎn)生很大干擾。在解決光照影響這個問題上,可以通過兩種方式:

  (2)解決方案:

  1、從產(chǎn)品角度控制

  A. 在用戶可以更換環(huán)境的前提下(比如銀行刷臉取錢等),可語音/界面提示用戶目前環(huán)境不理想(頭歪、頭發(fā)、眼鏡等),建議進行正確的正臉取照。

  B. 在用戶不能控制更換環(huán)境的情況下(比如人臉識別、車輛識別等攝像頭固定的場景),只能通過調(diào)試硬件設(shè)施彌補這個問題。

  C. 晚上:由于攝像頭在晚上會自動切換到黑夜場景(從圖片上看就是從彩色切換為黑白),因此在晚上強光下(例如路燈照射)人臉就會過曝,這時,我們可以通過強制設(shè)置攝像頭環(huán)境為白天(圖像為彩色)來避免。而過暗的情況,從節(jié)省成本角度看,可以在攝像頭旁邊增加一個光線發(fā)散、功率不高的燈來彌補。當然這兩個問題也可以通過購買高質(zhì)量的攝像頭解決,但這樣做也意味著更高的成本。

  D. 白天:白天也會出現(xiàn)光線過亮的情況,這種情況可以考慮用濾光片等等。

  2、從算法角度控制

  用算法將圖片進行處理,可以將圖片恢復得讓人眼看清的程度。

  2)某款人臉年齡識別產(chǎn)品

  (1)案例問題:

  一款識別人臉年齡的產(chǎn)品對女性某個年齡階段(25—35)的判斷,誤差較大,經(jīng)過發(fā)現(xiàn),是因為該年齡階段有以下特點:

  A. 女性在這個年齡階段面貌變化不是很大,有時人眼給出的判斷誤差都很離譜。

  B. 在這個年齡層次的女性注重打扮,化妝品很大程度上掩蓋了其真實年齡,有時30多的跟20歲沒多大差別;

  C. 精裝打扮的和素顏的差別有時變化不大、有時變化很大。

  (2)解決方案:

  1. 補充數(shù)據(jù):針對該年齡層次的人臉圖片數(shù)據(jù)做補充。不僅補充正例(“XXX”應(yīng)為多少歲),還應(yīng)補充負例(“XXX”不應(yīng)為多少歲)。

  2. 優(yōu)化數(shù)據(jù):修改大批以往的錯誤標注。

  3. 數(shù)據(jù)總結(jié):對化妝和不化妝的人臉圖片進行分析,以便調(diào)整算法參數(shù)。

  (3)需求研究:

  1. 自拍:如女性群體一般都希望自拍時,年齡的判別在心里預(yù)期中能越小越好,當在和一群人自拍中可以適當?shù)膶⒅魅斯哪挲g判別結(jié)果調(diào)低至達到用戶心理滿足感。此時可適當降低算法的參照度。

  2. 婚戀交友:在婚戀網(wǎng)站交友過程中,雙方都希望知道彼此的真實年齡信息,此時運用人臉年齡識別可以分析雙方的年齡、皮膚等物理信息為彼此提供參考。此時的信息就不能以達到心理滿足感為主了,應(yīng)當追求準確度。

  3)某款A(yù)R美顏相機

  (1)無法定位出人臉:

  在背景出現(xiàn)多人或?qū)櫸飼r,相機有時并未能精確定位出目標用戶,而定位到背景圖片中的人、寵物、身旁的其他人;有時屏幕一片漆黑;有時顯示未檢測出人臉。

  1、從產(chǎn)品角度:

  界面提醒用戶遠離復雜背景,或美顏時最好屏幕中只出現(xiàn)一人,或給出方框圖讓用戶自己手動選擇主要定位區(qū)域進行AR美顏;屏幕一片漆黑時可提醒用戶是否是光線太暗,或是攝像頭被障礙物遮擋等;

  2、從算法角度:

  可對人臉關(guān)鍵點進行定位,計算目標用戶與攝像頭的距離或計算人臉在頻幕的區(qū)域占比來確定目標用戶(一般幾何距離近的、頻幕區(qū)域占比較大的為美顏目標),結(jié)合活體檢測來排除背景圖片人物的干擾等。

  (2)圖像模糊昏暗:

  光線太暗、運動、對焦等造成模糊(攝像頭距離因素,造成圖像低頻存在,高頻流失等)

  1、從產(chǎn)品角度:

  可提醒用戶在光線較溫和的區(qū)域進行美顏操作;或是擦除前置攝像頭的障礙物;或文字提示動作太快;或是更換高清前置攝像頭;或提示對焦失敗,給與對焦框圖讓用戶手動對焦等。

  2、從算法角度:

  在美顏前可在后臺中調(diào)取手機亮度調(diào)節(jié)功能,用算法調(diào)節(jié)光線的亮暗程度以適應(yīng)美顏所需的物理條件;用算法設(shè)法補齊高頻部分從而減少對照片的干擾。

  (3)人臉關(guān)鍵動作抓捕太慢:

  在進行AR美顏搞怪時(如張嘴動作,屏幕出現(xiàn)音符、唾沫星子等)對動作抓捕太慢(半天才抓捕到張嘴動作)。

  1、從產(chǎn)品角度:

  文字提示不支持快速移動或提示緩慢移動(如,親!您的動作太快了,奴家還未反應(yīng)過來等)

  2、從算法角度:

  人臉姿態(tài)估計、關(guān)鍵點定位來捕捉人臉動作。

  (4)關(guān)鍵位置添加虛擬物品失敗(如在嘴上叼煙、耳朵吊耳環(huán)、眼鏡戴墨鏡、臉顯紅暈)

  1、從產(chǎn)品角度:

  文字/圖片提醒用戶擺正人臉位置。

  2、從算法角度:

  可利用算法對人臉關(guān)鍵區(qū)域進行分割并定位,來達到人臉精準定位添加虛擬物品

  4)人臉開門和人臉檢索

  (1)人臉開門等跨網(wǎng)方案需要關(guān)注的因素

  1、遠程算法更新:

  遠程算法更新必然會造成本地局域網(wǎng)功能暫時性無法使用。因此遠程算法更新的頻率、時間、更新效果都需要產(chǎn)品在更新前精確評估。

  2、增刪改人臉數(shù)據(jù)與本地數(shù)據(jù)的同步:

  本地局域網(wǎng)和互聯(lián)網(wǎng)是無法直接交互的,因此用戶在互聯(lián)網(wǎng)一旦對人臉數(shù)據(jù)庫進行增刪改的操作,下發(fā)程序的穩(wěn)定性和及時性都需要重點關(guān)注。

  3、硬件環(huán)境:

  本地存儲空間的大小和GPU直接影響到本地識別的速度。服務(wù)器的穩(wěn)定性影響到功能地正常使用。

  4、守護程序:

  斷電等外置情況意外情況發(fā)生又被處理完善后,程序能自動恢復正常。

  (2)人臉檢索等某一局域網(wǎng)方案需要關(guān)注的因素

  1、速度:

  除了算法識別需要消耗一定時間外,該局域網(wǎng)下的網(wǎng)速會影響到識別結(jié)果輸出的速度。

  2、數(shù)據(jù)庫架構(gòu):

  通過檢索結(jié)果關(guān)聯(lián)結(jié)構(gòu)化數(shù)據(jù)。

  3、閾值的可配置性:

  在界面設(shè)置閾值功能,從產(chǎn)品層面輸入閾值后,改變相對應(yīng)的結(jié)果輸出。

  4、輸出結(jié)果排序:

  根據(jù)相似度排序或結(jié)構(gòu)化數(shù)據(jù)排序內(nèi)容地抉擇

  5、云服務(wù)的穩(wěn)定性。

人物訪談