不懂這些技術(shù) 未來就沒法證明“我是我”

曾有學(xué)者預(yù)言,人類正在進行有史以來第二次最重要的遷徙:第一次是數(shù)萬年前人類祖先走出非洲;現(xiàn)在,他們正面臨從物理世界步入數(shù)字世界的“大移民”。
而在第二次“移民”過程中,就像人類在現(xiàn)實生活里對“我是誰”的循環(huán)追問,自信息文明誕生伊始,人類就非常清楚安全告知機器“我是誰”的重要性,并不斷在身份認證方式上推陳出新,發(fā)明各種密碼和數(shù)字證書。
然而,隨著人類與機器共享的“秘密”越來越多(十年前丟手機就是換一張卡那么簡單,現(xiàn)在意味著整個數(shù)字世界的重構(gòu)),安全系數(shù)越來越大,基于密碼的識別方式已日趨無力——如今,學(xué)術(shù)界也已達成共識,身份識別的下一幕,來自每個人的生物體征。
今天的智能手機——這一人類的“外掛大腦”上,已配有指紋識別,人臉識別和虹膜識別,而隨著十年之后整個IOT產(chǎn)業(yè)的井噴,以及安防領(lǐng)域的日趨重要,生物體征勢必成為人類分身數(shù)字世界時最嚴苛的身份認證。
大體來說,生物特征包括生理特征和行為特征:前者包括指紋,虹膜,人臉和眼紋等;后者對大眾稍顯陌生,包括步態(tài)和唇語等。這些生物特征都具備很強的穩(wěn)定性和唯一性,可匹配于不同應(yīng)用場景。今天,不妨從中選取幾種代表性生物識別,其中有的你可能熟悉,有的不熟悉,但不管怎樣,它們都將在未來,成為人類移民數(shù)字世界時最重要的關(guān)卡,也是保衛(wèi)人們在現(xiàn)實世界安全的重要利器。
跨年齡人臉識別
拋去指紋識別不談,人臉識別是最為大眾熟知的認證方式。
其實人臉識別并非易事。人類的臉部結(jié)構(gòu)存在極大相似性,且表情頗具易變性,更何況不同的觀察角度,光照條件,遮蓋物(墨鏡,頭發(fā),胡須等)都會增加機器識別難度。
不過,當現(xiàn)如今AI已發(fā)展到“只要人類正常情況下1秒就能做的事,它幾乎也能做到”的地步,人臉識別的技術(shù)進步也令人欣喜。AI可以將人類進化而來的“直覺系統(tǒng)”轉(zhuǎn)為為數(shù)據(jù)分析,根據(jù)眼睛,眉毛,嘴巴,鼻子等器官特征和幾何位置關(guān)系檢測人臉,將待識別的人臉特征與已得到的人臉特征模板進行比較認證。
當然,得益于iPhoneX出色的市場教育工作,上面的事你可能都知道了,但頗值一提的是,iPhoneX那般“實時識別”遠非人臉識別的全部,當機器記住一張人類面孔,它其實可以做到更多,比如“跨年齡識別”。
舉個例子,還記得八月底,由中央電視臺和中國科學(xué)院共同主辦的人工智能節(jié)目《機智過人》在CCTV1周末黃金時段首播(足以見得人工智能在大眾認知中的滲透度……),第一集中的“御眼重明”系統(tǒng)便呈現(xiàn)了“跨年齡人臉識別”技能,用1秒就從36張圖片中選出了撒貝寧和江一燕兒時的照片。
常識是,在影響人臉識別率的一切因素里,時間是最難對抗的部分。為了實現(xiàn)跨年齡識別,“御眼重明”從1000多萬人的2億張人臉圖片中學(xué)習(xí)了人臉的600多個特征,再搜集幾萬對成年人與其本人小時候照片的人臉數(shù)據(jù),提取人臉特征后,通過雙層異構(gòu)網(wǎng)絡(luò)進行特征遷移學(xué)習(xí),找到成年人臉和兒童照的特征空間映射關(guān)系,準確率在人臉特征清晰情況下可達95%以上。
跨年齡人臉識別有什么用?舉一個例子,你知道,許多失蹤兒童長大后,連親生父母都認不出他的樣子,但機器認得,你完全可以想象:借助“御眼重明”系統(tǒng),電影《失孤》中的父母就可以不再通過持續(xù)多年的滿城尋覓,而是到公安機關(guān)錄入孩子照片,機器通過數(shù)據(jù)庫對比,尋找到匹配對象。
人臉識別技術(shù),正在為這個社會帶去更多福祉。
遠距離生物識別
事實上,除了人臉識別,其他更“小眾”的識別方式,也在不同場景下漸次綻放,譬如在《機智過人》中出現(xiàn)的“步態(tài)識別”。
如果你看過《碟中諜5》,一定會對電影中“最后一道安保系統(tǒng)”——步態(tài)識別印象深刻:它可以對生物體的身體和步態(tài)進行360度無死角掃描,識別進入者身份。
嗯,所謂步態(tài)識別,就是只通過走路姿勢,在極短時間內(nèi),攝像頭就可識別特定對象。不同于人臉識別需要“主動配合”,哪怕一個人在幾十米外背對攝像頭,機器也可通過算法把你認出來。在《機智過人》節(jié)目里,來自銀河水滴科技的步態(tài)識別就與記憶大師袁夢PK,識別10個身高體型相似的“嫌疑犯”,21只體型毛色相似的金毛犬,以及金毛犬剪影,最終銀河水滴獲勝。
與人臉識別一樣,步態(tài)精準識別,也受益于在海量數(shù)據(jù)加持下的人工智能技術(shù)。銀河水滴就組建了自己的數(shù)據(jù)團隊,并對約十萬張不同背景下,姿勢穿著各異的人形進行了精細分割標注,如今的跨視角步態(tài)識別精度高達94%左右。你可以想象,這項技術(shù)會在安防領(lǐng)域大有作為。
而“遠距離生物識別”不只一種,除了腳下步態(tài),來自人類嘴唇的“唇語識別”亦可發(fā)揮威力。唇語識別是一項集機器視覺與自然語言處理于一體的技術(shù):通過機器視覺從圖像中連續(xù)識別出人臉,提取口型連續(xù)變化特征,隨即將連續(xù)變化的特征輸入到識別模型中,識別出講話人口型對應(yīng)的發(fā)音,計算出可能性最大的表達語句。
事實上,谷歌人工智能公司DeepMind去年在AlphaGo擊敗人類后,就把與人類的下一個競賽場切換至讀唇術(shù)上:他們與牛津大學(xué)的研究者使用總長超過5000小時完成了對人工智能的訓(xùn)練,然后使用去年 3 月至9 月間播出的節(jié)目進行測試,結(jié)果發(fā)現(xiàn),給予相同的視頻素材,專業(yè)唇語識別專家能達到12.4%的正確率,而AI系統(tǒng)識別正確率則是46.8%,高出大概3倍。而唇語識別在國內(nèi)的領(lǐng)跑者海云數(shù)據(jù)也已訓(xùn)練了超過1萬小時的新聞類節(jié)目。
與步態(tài)識別一樣,唇語識別在安全領(lǐng)域意義重大。要知道,公安系統(tǒng)中的視頻信息量非常龐大,但很多都以“默片”方式存在,只看得清嘴型,卻不知說些什么。而當機器學(xué)會“讀唇術(shù)”,即可判斷視頻中的人講出來的關(guān)鍵性內(nèi)容。
總之不難發(fā)現(xiàn),“遠距離生物識別”正在構(gòu)筑一張“數(shù)字天網(wǎng)”,俯視現(xiàn)實世界。難怪有人會說,如今人類犯罪率整體下降最根本的原因,就是技術(shù)進步提升了犯罪成本。
另一種關(guān)于眼睛的識別
當然,談及生物識別,尤其是基于生理特征的生物識別,虹膜是一個大眾熟知的名字。相互錯雜的細絲,斑點和條紋,讓虹膜具備天然不可復(fù)制性,相信你多少有些了解。所以今天不妨重點介紹另一種與眼睛有關(guān),卻稍顯陌生的識別方式:眼紋識別。
在新一集《機智過人》中,來自螞蟻金服的生物識別機器人“螞蟻佐羅”迎來全球首發(fā)。后者具備金融級別的人臉識別技術(shù),其中很重要的識別點位就是人類眼紋——在節(jié)目錄制現(xiàn)場,“螞蟻佐羅”成功識別同卵四胞胎兄弟的關(guān)鍵,就是利用了人類眼紋的唯一性。
什么是眼紋?
最通俗地話說,虹膜識別是識別眼睛中“黑眼仁”的紋理,眼紋識別則是識別“眼白”的血管排布情況(鞏膜部分)。與虹膜一樣,每個人的眼紋也具有唯一性,而這種唯一性也意味著,如何從普通攝像頭拍攝到的圖像中提取血管分布細節(jié);如何從血管排布中提取出區(qū)分每一個人特定的生物特征;如何應(yīng)對眼球反光,眨眼和眼睫毛等干擾因素……都是擺在“螞蟻佐羅”面前的道道難關(guān)。
不過問題來了:既然虹膜識別技術(shù)已相對成熟,市場教育工作也已完成,為何還要另辟蹊徑,完成對眼紋的識別探索?
誠然,虹膜識別在容錯率,信息量及穩(wěn)定性方面更有優(yōu)勢,但在工業(yè)界,“脫離成本談技術(shù)”并非睿智之舉。拿手機來說,虹膜識別需要專業(yè)硬件支持(遠紅外攝像頭),這對智能手機的改造以及規(guī)?;逃檬莻€挑戰(zhàn)——這也是為什么早在90年代虹膜識別就已商用,但多年來主要應(yīng)用場景只是軍用和一些特定領(lǐng)域。
另外,人類虹膜的采集過程需要用戶較高的配合度,這對普通小白用戶來說學(xué)習(xí)成本更高。相較之下,眼紋識別對攝像頭沒有特殊要求,手機前置攝像頭就能滿足要求,采集過程中只需要用戶自然看著手機就可以。所以,從用戶體驗和成本上來說,都更有利于規(guī)?;逃煤痛蟊娖占?。
那么下一個問題是:眼紋識別的應(yīng)用場景有哪些?
如你所知,對于螞蟻金服這種互聯(lián)網(wǎng)金融服務(wù)巨頭來說,身份認證是無比重要的環(huán)節(jié)。目前眼紋識別最重要的應(yīng)用場景,就是通過眼紋識別疊加人臉識別,在不增加用戶負擔情況下,對識別對象進行多維度交叉驗證,提高識別的準確度和安全性。目前,螞蟻金服研發(fā)的眼紋識別技術(shù)還是實驗室產(chǎn)品,但被業(yè)內(nèi)視為是中國或者說是全球生物識別技術(shù)研發(fā)的標志性突破。 “螞蟻佐羅”今年的工作重點和目標,是將應(yīng)用于線下場景的眼紋技術(shù)也能基本研發(fā)成熟并開始試點。要知道,人臉識別的線下金融級應(yīng)用場景,譬如刷臉支付,用的是1:N驗證,即從N張照片中找出相符的一張,這比1:1驗證的難度要高,出錯概率也會大一些,而在疊加眼紋識別后,除了提高準確率,還能大大提高1:N中N的數(shù)量級??傊?,疊加了眼紋識別后的面部識別,可能是人們邁向虛擬世界最安全的通行證——要知道,“螞蟻佐羅(ZOLOZ)”的讀音,與西班牙語“SOLOS”相同,而“SOLOS”的古意,正是“ONE”和“唯一”。
結(jié)語:“無密碼”社會的來臨
今年2月,科技媒體《MIT科技評論》公布了2017年全球十大突破性技術(shù)榜單,將螞蟻金服、曠視科技、百度人臉識別技術(shù)納入榜單,理由是:作為全世界首批上線人臉識別技術(shù)的國家,中國的人臉識別技術(shù)精度已達到金融交易的級別,刷臉支付進入成熟期。
嗯,時至今日,沒人會懷疑,中國生物識別技術(shù)已整體性領(lǐng)先世界,且如上所述,中國擁有全球最豐富的識別方式和應(yīng)用場景。而值得一提的是,《機智過人》中出現(xiàn)的人工智能團隊,都已在各自領(lǐng)域達到國際領(lǐng)先水準(螞蟻金服是唯一一家掌握眼紋識別核心技術(shù)的公司;銀河水滴在步態(tài)數(shù)據(jù)和算法方面處于世界領(lǐng)先,戶外步態(tài)數(shù)據(jù)庫超過第二大數(shù)據(jù)庫近100倍),也算見證了中國當今最新銳人AI技術(shù)的崛起。
最后想說,其實縱觀整個人機交互的歷史,就是一個人機交互難度下降的過程,在未來,隨著生物識別的日趨主流,人類與機器之間的“信任關(guān)系”勢必將邁向一個新篇章。
我相信會有一天,“密碼”將成為過去式,人類歷史上那些與密碼驚心動魄的故事,也將成為未來博物館講解員的談資。我也相信,就像“無現(xiàn)金”在中國的飛速普及,人們期許中的“無密碼”社會,也將在中國率先來臨。