杭電自動化學院博一學生鄭錦凱的一項研究成果,通過可遷移鄰域發(fā)現(xiàn)算法,在跨域場景下的步態(tài)識別精度上,大大超過了目前普遍使用的聚類賦偽標簽識別方法,有望在刑偵破案、尋找丟失兒童等領域一顯身手。
鄭錦凱的論文名為《TraND: Transferable Neighborhood Discovery for Unsupervised Cross-domain Gait Recognition》,發(fā)表在不久前召開的ISCAS(IEEE International Symposium on Circuits and Systems)這一國際學術會議上,并在IEEE 多媒體系統(tǒng)與應用技術專委會(IEEE MSA-TC)年度會議上做口頭報告,榮獲2021年度IEEE MSA-TC最佳論文提名獎(2021 MSA-TC Best Paper Award - Honorable Mention)。
據了解,目前普遍使用的深度學習算法依賴數據標注,換言之,通過步態(tài)識別誰是誰,首先得在數據庫里知道具體的步態(tài)是怎樣的。這意味著,標注的準確性和數量直接影響著最終的識別精度。在實際應用中,人們往往受限于這種既昂貴又費時費力的數據標注上。如果數據庫里沒有具體人的標注數據,那怎么辦?
為此,鄭錦凱提出可遷移鄰域發(fā)現(xiàn)算法,首先找出高置信度樣本,并通過最近鄰算法找出這些樣本的領域樣本,之后通過損失函數拉近高置信度樣本與其領域樣本在特征空間中的距離,采用從易到難、循序漸進的方式更新深度學習模型。整個過程由近到遠、由易到難、由已知到未知,逐漸識別“哪些步態(tài)是誰的”,從而鎖定目標人物。
什么是可遷移鄰域發(fā)現(xiàn)算法?鄭錦凱打了個比方:“如果想讓一個小孩識別國內的動物種類,你會給他一些動物圖片和對應的動物名字。通過學習,小孩能認出許多動物。你可能覺得還不夠,希望小孩能識別國外的動物,于是給小孩一些國外動物的圖片,讓他把屬于同一物種的圖片都放到一起進行分類?!?/p>
鄭錦凱進一步解釋道,由于小孩之前學習了很多國內的動物,一開始會比較順利,能夠挑選出一張或者幾張長得最像老虎的放一組、像獅子的放一組,等等。接著,小孩可能會繼續(xù)尋找那些還長得比較像老虎、獅子等的圖片,直到他再也找不到自己學過的圖片之后,他發(fā)現(xiàn)剩余那些之前沒見過的圖片里,有好幾張長得很類似,于是猜測它們屬于一個新物種。小孩可能同時發(fā)現(xiàn)好幾個新物種,把它們分別放一組,接著繼續(xù)尋找和這些新物種長得很像的圖片。
“可遷移鄰域發(fā)現(xiàn)算法模擬了上述一過程,直到所有圖片都被找完為止。”鄭錦凱說,“可遷移鄰域發(fā)現(xiàn)算法與傳統(tǒng)聚類賦偽標簽識別不一樣,有望在步態(tài)識別領域拓展新的應用。
鄭錦凱來自杭電自動化學院智能信息處理實驗室,該實驗室由顏成鋼教授領銜,與美國北卡羅來納大學教堂山分校、中國科學院、清華大學、京東AI研究院等國內外多家科研院所有長期密切的合作,近年來培養(yǎng)出多名優(yōu)秀學生,多人多次在國際重要學術會議上獲得最佳論文獎。鄭錦凱是智能信息處理實驗室培養(yǎng)的第四位碩博連讀研究生,導師為張繼勇教授。