近期,業(yè)內(nèi)幾大主流AI企業(yè)相繼曝出在三大權(quán)威主流ReID公開數(shù)據(jù)集CUHK03、DUKE-MTMC和Market1501刷新新記錄的好消息。
以Market1501公開數(shù)據(jù)集的首位命中率測試結(jié)果為例,相較于前兩年平均值在96.5%+的評(píng)測記錄,2020年各企業(yè)ReID算法關(guān)鍵指標(biāo)首位命中率(RANK1 Accuracy)和平均精度均值(Mean Average Precision,mAP)最新記錄均有了較為明顯的提升,平均值分別逼近98.6%+、97%+。
數(shù)據(jù)提升的背后,預(yù)示著業(yè)界關(guān)于行人重識(shí)別ReID算法的研究迎來了持續(xù)的新突破,諸多實(shí)際應(yīng)用場景有望憑借算法的突破升級(jí)迎來進(jìn)一步的落地應(yīng)用。
行人重識(shí)別(Person ReID)是指對(duì)不同攝像機(jī)捕捉到的行人圖像建立身份對(duì)應(yīng)關(guān)系(即關(guān)聯(lián)行人ID),對(duì)行人實(shí)現(xiàn)在整個(gè)場景下的行動(dòng)路線的全面刻畫。簡單來說,在看不到人臉的復(fù)雜多場景下也能通過體態(tài)、著裝、配飾等細(xì)節(jié)特征等對(duì)人進(jìn)行跟蹤識(shí)別。
相較于人臉識(shí)別技術(shù),ReID對(duì)人體圖像的遮擋、朝向和清晰度具有較高的魯棒性,很大程度上降低了對(duì)攝像頭的清晰度、架設(shè)位置、角度等局限性要求,在實(shí)戰(zhàn)過程可以發(fā)揮更好的技術(shù)突圍作用。ReID技術(shù)也正被看做是繼人臉識(shí)別之后計(jì)算機(jī)視覺領(lǐng)域的又一熱門課題。
ReID技術(shù)推進(jìn)的現(xiàn)實(shí)意義
ReID技術(shù)的不斷突破,對(duì)推進(jìn)該項(xiàng)技術(shù)在諸多場景的實(shí)際應(yīng)用有著極大的現(xiàn)實(shí)意義。筆者對(duì)此也特別咨詢了在ReID技術(shù)研究方面取得重大的突破的云從科技,云從科技舉例表示,以公安視頻偵查的應(yīng)用為例,安防視頻監(jiān)控系統(tǒng)點(diǎn)位眾多,但有的因?yàn)榘惭b角度、分辨率等因素的影響,攝像頭拍不到人臉只能拍到大概的體態(tài)影像,可以基于ReID技術(shù)通過體態(tài)、衣著等特征找尋嫌疑人。
與此同時(shí),ReID可實(shí)現(xiàn)跨鏡頭、跨時(shí)間、跨空間的目標(biāo)人物追蹤,結(jié)合人像大數(shù)據(jù)技術(shù),可快速勾畫出嫌疑人的行蹤軌跡,有效助力公安部門通過視頻監(jiān)控系統(tǒng)來展開案件偵查。
另外,近年來伴隨著商業(yè)領(lǐng)域精細(xì)化營銷的展開,ReID技術(shù)在商業(yè)領(lǐng)域還可以用于顧客行為軌跡追蹤分析,協(xié)助商家分析客戶行為,理解商業(yè)意圖。
值得一提的是,在今年度爆發(fā)的新冠疫情當(dāng)中,ReID技術(shù)的投入使用也為疫情防控帶來了創(chuàng)新的技術(shù)手段,對(duì)超溫、疑似/確診病例的追蹤起到了很好的技術(shù)輔助作用,及時(shí)阻斷疫情傳播,降低風(fēng)險(xiǎn)。
行人重識(shí)別ReID技術(shù)難點(diǎn)
也正是因?yàn)镽eID技術(shù)有著極高的實(shí)戰(zhàn)應(yīng)用價(jià)值,目前業(yè)內(nèi)主流的AI企業(yè)基本都有展開關(guān)于ReID技術(shù)的研究,圍繞著ReID算法、算力、數(shù)據(jù)及應(yīng)用等各方面展開積極探索。不過,技術(shù)研究仍然存在很高的復(fù)雜性,據(jù)云從科技提到,目前行人重識(shí)別ReID技術(shù)研發(fā)難點(diǎn)主要在這些方面:
(1)現(xiàn)實(shí)中行人照片會(huì)存在各種困難,例如遮擋,黑白到彩色,換裝等,比較會(huì)影響算法效果;
(2)ReID因?yàn)橐罂鐢z像頭,隱私等原因,數(shù)據(jù)采集難度大,對(duì)算法提出了在少數(shù)據(jù)上訓(xùn)練出高魯棒性的模型的極高的要求;
(3)商業(yè)落地需要圍繞ReID打造一些列相關(guān)技術(shù)矩陣,涉及到工程、算法、硬件、產(chǎn)品形態(tài)等多方面,對(duì)于小公司來說難度較高。
此前,騰訊優(yōu)圖也表示,跨場景識(shí)別的難點(diǎn)在于,不同場景由于環(huán)境光照、攝像頭角度、背景等因素,例如室內(nèi)大型商場、小型門店的側(cè)面和高俯角相機(jī)、室外道路、社區(qū)的強(qiáng)光和夜晚環(huán)境等,都會(huì)對(duì)人體圖像的視覺特征造成影響。
小結(jié)
如何讓ReID技術(shù)適應(yīng)復(fù)雜多變的場景,實(shí)現(xiàn)跨場景行人圖像的檢索,是一項(xiàng)重大的技術(shù)挑戰(zhàn),也是實(shí)現(xiàn)室內(nèi)外行人動(dòng)線聯(lián)動(dòng)、全城聯(lián)動(dòng)的關(guān)鍵性技術(shù)。突破此技術(shù)難點(diǎn)對(duì)拓展ReID的落地場景和業(yè)態(tài),實(shí)現(xiàn)大規(guī)模行人識(shí)別有巨大的作用。