步態(tài)識別:50米外 秒讀你的“活體密碼”


在央視大型科技挑戰(zhàn)節(jié)目《機智過人》中,由中科院自動化所研發(fā)出的步態(tài)識別系統(tǒng),先后對10個身高、體型相似的蒙面人“嫌疑犯”與21只體型、毛色相似的金毛犬進行識別,在與“最強人類”袁夢(國際記憶大師,曾成功從168條音軌中辨識出TFBOYS三位的音軌)的挑戰(zhàn)中,均取得了成功。
憑借“遠距離步態(tài)識別系統(tǒng)研究與應用”項目,中國科學院自動化研究所及其所孵化的人工智能企業(yè)銀河水滴科技(北京)有限公司,獲得2018年度北京市科學技術獎二等獎。
又快又準,不看臉也能快速辨認
步態(tài)識別是一種非接觸的生物特征識別技術。顧名思義,就是通過人們走路的姿態(tài)進行身份識別?!霸O想這樣一個情景:某人頭戴帽子口罩,臉部被遮擋,并離攝像頭很遠,這時已經(jīng)無法根據(jù)臉部信息識別其身份,然而仍然可以分析他的步態(tài)信息,通過步態(tài)識別系統(tǒng)識別他的身份?!表椖控撠熑?、中科院自動化所研究員王亮舉例說,與其他生物識別技術相比,步態(tài)識別具有遠距離、非接觸、不易偽裝等優(yōu)點。
首先是步態(tài)識別適用距離更遠。通常情況下,為達到良好識別效果,虹膜識別需要目標在60厘米以內;人臉識別需要目標在3米以內;而步態(tài)識別的目標可以遠達50米。其次是步態(tài)識別為非受控識別,無需識別對象主動配合與參與。指紋識別、虹膜識別、人臉識別等都需要識別對象主動配合。步態(tài)是遠距離、非受控場景下唯一可清晰成像的生物特征,即便一個人在幾十米外背對普通攝像頭隨意走動,步態(tài)識別算法也可對其進行身份判斷。再者,步態(tài)難以偽裝。不同的體型、肌肉骨骼特點、運動神經(jīng)靈敏度、走路姿態(tài)等特征共同決定了步態(tài)具有較好的區(qū)分能力,通過精巧設計的算法和海量數(shù)據(jù)的訓練,機器可以更好地識別這些細節(jié)特征。
黑科技滿滿的《碟中諜5》中,最吸睛的當屬安保系統(tǒng)的最后一道防線——步態(tài)識別,通過分析人的身體體型和行走姿態(tài)來識別身份,這道防線讓阿湯哥也難以瞞天過海?!懊總€人的肌肉力量、肌腱和骨骼長度和密度,以及每個人的神經(jīng)靈敏程度、協(xié)調能力、體重、重心等生理條件都是不同的,所以,每個人走路的姿勢都是不同的。人們可以借助道具將自己的外形甚至是性別進行翻天覆地的改變,卻沒辦法改變自己的走路姿態(tài)。”王亮表示。
而相較于依靠人力從海量監(jiān)控視頻中快速查找目標人物的做法,步態(tài)識別不僅能實現(xiàn)對人海戰(zhàn)術的替代,極大提升檢索和識別的效率和準確度,而且當出現(xiàn)遠距離、非配合、全視角(如只有側面和背面身形)、弱光線、人臉隱蔽/遮擋、目標人物多次換裝等一種或多種情況時,用步態(tài)識別技術也能成功搜檢目標人物。
精確的圖像分割和數(shù)據(jù)算法支撐
然而,要精確地通過步態(tài)特征識別出人的身份信息,需要復雜的系統(tǒng)支撐。步態(tài)識別系統(tǒng)包含了檢測、跟蹤、分割、識別等部分,任何一個模塊都將對整體系統(tǒng)產(chǎn)生影響。
“遠距離步態(tài)識別系統(tǒng)研究與應用”項目在算法層面對步態(tài)識別系統(tǒng)的4個關鍵模塊分別進行研發(fā),通過行人檢測算法,將行人從背景中找出來,檢測算法需要能夠處理遠距離、復雜背景以及部分遮擋等情況;與人臉識別只對一張圖片識別不同,步態(tài)識別需要收集同一個人行走的視頻序列,且實際場景中通常有多個人需要同時識別,因此需要使用在線多目標跟蹤技術將同一個人的序列收集起來;步態(tài)能夠去除著裝顏色的干擾,只關注人走路的方式,因此需要使用人形分割算法將人從背景中分離出來;最后,對一系列分割序列通過步態(tài)識別算法進行識別。
在中科院自動化所的模式識別國家重點實驗室,記者看到了項目的“高精度人形圖像分割方法”演示。無論是復雜的背景、多樣的姿態(tài)、不同的尺度變化以及不同的衣著,系統(tǒng)都能夠非??焖贉蚀_地分割出人像。
“我們采用的是人形區(qū)域內像素點的多尺度上下文信息來表達人形目標,通過多通道深度學習網(wǎng)絡來描述人形局部區(qū)域的不同尺度上下文信息?!蓖趿林v道,這種方法以模式識別和計算機視覺理論為指導,結合最新的深度學習算法,融合各個尺度的圖像信息,能夠將目標人物從背景中快速準確地分離出來。與傳統(tǒng)的圖模型方法需要對像素點之間建模,導致計算量大、難以收斂等問題相比,該方法具有很強的語義信息,并在由百度公司懸賞的人形圖像分割大賽中,以絕對優(yōu)勢獲得冠軍。
此外,他們借助傳統(tǒng)的步態(tài)識別的先驗知識,結合最新的深度學習方法,能夠在只給定某個視角的情況下,跨視角地識別出該人在其他視角的步態(tài)序列。“使用基于“正負對”的訓練方式,可以充分地擴充樣本數(shù)量,即使對很少的訓練數(shù)據(jù)也能達到很高的結果。這種方式在人臉識別、行人再識別領域也有廣泛應用。”在此基礎上,項目組還提出了一種基于拓撲表達的跨視角步態(tài)識別方法來描述步態(tài)的整體時空結構,在跨視角和遮擋的條件下,比傳統(tǒng)方法表現(xiàn)出了更強的魯棒性和更高的識別精度;對跨著裝以及跨背包的場景,也都能獲得更好的結果。
除了算法以外,充足的數(shù)據(jù)支持是步態(tài)識別系統(tǒng)“聰明與否”的后盾保障。目前基于深度學習的步態(tài)識別相關算法都需要大量的數(shù)據(jù),因此算法和數(shù)據(jù)之間的不斷迭代是十分必要的。王亮告訴記者,中科院自動化所的CASIA步態(tài)數(shù)據(jù)庫有三個數(shù)據(jù)數(shù)據(jù)集,即Dataset A(小規(guī)模庫), Dataset B(多視角庫)和Dataset C(紅外庫)。其中,Dataset B是一個大規(guī)模、多視角的步態(tài)庫,世界知名,而銀河水滴的步態(tài)數(shù)據(jù)庫則已經(jīng)超過Dataset B近100倍,命名為“CASIA—E”。
產(chǎn)學研緊密結合,不斷拓展新應用場景
得益于中科院自動化所在計算機視覺領域20多年的技術積累,銀河水滴在中科院“技術+團隊”的離崗創(chuàng)業(yè)政策激勵下成立。銀河水滴聯(lián)合中科院自動化所目前已經(jīng)啟動人工智能人才聯(lián)合培養(yǎng)計劃,聯(lián)合打造中國頂級人工智能實習基地。該人才計劃將配備強大的導師隊伍,每位實習生配備至少一名中科院自動化所老師和銀河水滴高級工程師做指導,銀河水滴的技術應用場景將全部開放,供實習生研究和實地演練。
“在產(chǎn)、學、研緊密結合下,參與該人才計劃的實習生,其人工智能算法和產(chǎn)品能力將得到巨大提升。”作為中國首個步態(tài)識別博士、模式識別國家重點實驗室副主任,以及銀河水滴聯(lián)合創(chuàng)始人,王亮對于步態(tài)識別的產(chǎn)業(yè)化充滿了信心。他表示,不要僅僅發(fā)表論文,通過銀河水滴,把科研成果變成產(chǎn)品形成產(chǎn)業(yè),提供世界領先的視覺大數(shù)據(jù)分析技術,是對年輕人很大的激勵。
基于項目的一系列人工智能關鍵技術研發(fā),銀河水滴目前已經(jīng)在公共安全以及智能家居領域取得了很好的進展。王亮介紹,項目所開發(fā)的步態(tài)檢索系統(tǒng),在維護公共安全方面發(fā)揮了重要作用;銀河水滴在實現(xiàn)步態(tài)識別基本技術的基礎上,還將全類型人臉識別以及人群計算應用于泛身份識別構建之中,以達到更精確的識別結果?!澳壳叭四樧R別方案在主流數(shù)據(jù)庫上達到99%的識別率并可保持實時性;在遠距離人臉識別方面,可對普通2K攝像機中25米外的人群進行實時人臉識別?!?/p>
在商業(yè)化應用方面,銀河水滴科技已經(jīng)基于產(chǎn)品雛形,面向安防、油田和家電等領域進行推廣,尋找更多適合步態(tài)識別應用的客戶,推動了傳統(tǒng)行業(yè)的智能化升級:石油企業(yè)引入步態(tài)識別技術完善防控網(wǎng)絡,防范非法闖入者對油田安全的威脅和對油田經(jīng)濟利益的損害;在智能家居領域,步態(tài)識別可很好地區(qū)分用戶屬性,開發(fā)的嵌入式模組,具有很大的成本優(yōu)勢及體積優(yōu)勢,不僅能替代遙控器等傳統(tǒng)操作工具,還可以讓家電感知更加智能化、服務更加個性化?!捌┤?,根據(jù)家庭成員的步態(tài)特征,空調可以及時識別老人、小孩等特殊人群的活動范圍,能夠根據(jù)不同人群調整空調的出風角度、出風量及溫度,讓溫度控制更適合人群需求。”王亮說。
與此同時,步態(tài)識別也面臨著很多挑戰(zhàn)亟須解決:比如在人群密集場所,如何解決遮擋情況下的身份識別?智能深度傳感硬件Kinect等又會對步態(tài)識別產(chǎn)生什么影響?王亮表示,這一系列的問題仍然需要我們在未來去深入探索。接下來,銀河水滴科技還將選擇一兩個屬于藍海市場的細分領域深挖下去,與中科院自動化所緊密配合,做好科技成果的產(chǎn)業(yè)化。
