【安防知識(shí)網(wǎng)】:隨著科技的進(jìn)步與發(fā)展,人臉識(shí)別技術(shù)得到了飛速的發(fā)展與突破,且具有廣闊的應(yīng)用前景。上一次為讀者介紹了人臉識(shí)別的五點(diǎn)創(chuàng)新特點(diǎn),我們將繼續(xù)為讀者們介紹人臉識(shí)別技術(shù)的發(fā)展路線描述和具體的創(chuàng)新實(shí)現(xiàn)方法。
人臉識(shí)別技術(shù)路線描述
動(dòng)態(tài)實(shí)時(shí)人臉智能監(jiān)控布控系統(tǒng)從系統(tǒng)結(jié)構(gòu)上分為:前端視頻Client和后臺(tái)搜索Server兩大部分(如圖1)。
Client部分
1、視頻采集系統(tǒng)(VideoCapture)
采集攝像機(jī)模擬視頻流并進(jìn)行處理,得到VFW/Directshow等標(biāo)準(zhǔn)格式的數(shù)字視頻流輸入人臉檢測(cè)定位系統(tǒng)。
2、動(dòng)態(tài)人臉檢測(cè)定位系統(tǒng)(FaceCapture)
對(duì)每秒20~30幀的數(shù)字視頻流進(jìn)行逐幀分析,用連續(xù)自適應(yīng)Boost強(qiáng)分類(lèi)器構(gòu)造的瀑布式檢測(cè)器,以及姿態(tài)預(yù)估計(jì)和多分辨率搜索策略進(jìn)行快速的人臉檢測(cè)定位,并對(duì)畫(huà)面中定位的人臉?lè)謩e根據(jù)約定的規(guī)格化尺寸進(jìn)行剪切,得到標(biāo)準(zhǔn)的人臉圖像,然后通過(guò)網(wǎng)絡(luò)轉(zhuǎn)送到后臺(tái)Server。
Server部分
1、人臉圖像接收管理系統(tǒng)(FaceReceiver)
從網(wǎng)絡(luò)不斷接收前端Client傳送來(lái)的人臉圖像,按順序進(jìn)行隊(duì)列緩存。
2、人臉圖片導(dǎo)入系統(tǒng)(FaceInput)
單張?zhí)峤换蚺繉?dǎo)入注冊(cè)用的人臉照片并進(jìn)行人臉檢測(cè)定位和規(guī)格化處理。[nextpage]
3、人臉特征分析提取系統(tǒng)(TemplateGen)
對(duì)來(lái)自Client或者注冊(cè)提交的人臉圖像進(jìn)行光線預(yù)處理,用全局光照子空間方法進(jìn)行歸一化處理,并用基于圖像序列的極大似然估計(jì)算法和梯度光照子空間進(jìn)行陰影消除。然后根據(jù)LFA算法和SIFT算法,提取基于局部幾何骨骼特征的人臉數(shù)據(jù),得到標(biāo)準(zhǔn)的人臉特征模板(Template)。
4、人臉特征模板存儲(chǔ)系統(tǒng)(TemplateDB)
對(duì)人臉特征模板進(jìn)行存儲(chǔ)管理,與其對(duì)應(yīng)的人臉照片,以及相關(guān)文字說(shuō)明信息進(jìn)行數(shù)據(jù)庫(kù)關(guān)聯(lián)。
5、人臉特征數(shù)據(jù)快速運(yùn)算系統(tǒng)(FaceEngine)
利用瀑布式的多層搜索運(yùn)算策略,對(duì)人臉特征模板進(jìn)行快速的一對(duì)多批量匹配運(yùn)算,并對(duì)通過(guò)最后一層細(xì)化搜索的每個(gè)人臉對(duì)象和現(xiàn)場(chǎng)人臉之間的匹配分值進(jìn)行排序。
6、報(bào)警提示系統(tǒng)(AlertCenter)
根據(jù)搜索匹配的結(jié)果,根據(jù)最高匹配分值是否超過(guò)系統(tǒng)設(shè)置的報(bào)警閾值,判定是否需要報(bào)警提示,并按系統(tǒng)設(shè)定進(jìn)行本地或遠(yuǎn)程報(bào)警,報(bào)警信息包括匹配雙方的照片和文字信息。
7、人臉?biāo)阉饕婀芾硐到y(tǒng)(SysAdmin)
對(duì)核心算法性能參數(shù)以及系統(tǒng)參數(shù)進(jìn)行集中配置管理。
8、搜索報(bào)警記錄管理系統(tǒng)(LogDB)
對(duì)人臉圖片和報(bào)警日志進(jìn)行記錄存儲(chǔ)和管理,提供按條件進(jìn)行查詢檢索,以及數(shù)據(jù)備份恢復(fù)等功能。
人臉識(shí)別技術(shù)創(chuàng)新實(shí)現(xiàn)
人臉識(shí)別從基于特征點(diǎn)的方法發(fā)展到了目前主流的基于二維圖像的方法,并開(kāi)始逐步走向基于三維模型的算法。作為人工智能和計(jì)算機(jī)視覺(jué)的最困難的研究領(lǐng)域之一,人臉識(shí)別在過(guò)去的十多年里得到了長(zhǎng)足的發(fā)展,并開(kāi)始在國(guó)防、金融和商務(wù)等眾多領(lǐng)域中走向?qū)嶋H應(yīng)用。
國(guó)內(nèi)的人臉識(shí)別技術(shù)研究和應(yīng)用嘗試起步相對(duì)較晚,但是卻在近期幾年取得了非??捎^的進(jìn)展,并在室內(nèi)正面人臉光照、模糊人臉圖片處理、紅外人臉光線處理等諸多方面提出了有效的算法和理論,為人臉識(shí)別技術(shù)的性能提高以及實(shí)際應(yīng)用奠定了堅(jiān)實(shí)的基礎(chǔ)。
以人臉識(shí)別技術(shù)的創(chuàng)新研發(fā)和應(yīng)用推廣為己任,在國(guó)內(nèi)外先進(jìn)人臉識(shí)別研究理論的基礎(chǔ)上,結(jié)合實(shí)際應(yīng)用的需求和條件,努力提出創(chuàng)造性的解決方法,使人臉技術(shù)能夠完美的同實(shí)際應(yīng)用相結(jié)合并發(fā)揮作用。在目前的LFA特征分析算法、多姿態(tài)人臉檢測(cè)算法、光線歸一化和陰影消除、SIFT算法等先進(jìn)理論的基礎(chǔ)上,結(jié)合視頻監(jiān)控中進(jìn)行動(dòng)態(tài)實(shí)時(shí)人臉智能布控的需求和實(shí)施特點(diǎn),創(chuàng)造性地提出了進(jìn)一步提高人臉識(shí)別效果并解決實(shí)際應(yīng)用問(wèn)題的方法。
人臉骨骼架構(gòu)特征是人臉特征的唯一性
從理論上講,雖然從人眼辨別的角度人臉的面貌會(huì)受到發(fā)型、膚色、表情、胡須、胖瘦等諸多不穩(wěn)定因素的影響,從數(shù)字圖像分析和模式識(shí)別的角度也會(huì)受到光線變化和角度變化以及長(zhǎng)時(shí)間跨度面部變化帶來(lái)的影響,但是人臉骨骼架構(gòu)特征確實(shí)含有了足以將每個(gè)人區(qū)分開(kāi)的信息,而且以某種形式表現(xiàn)在采集到的數(shù)字照片的大量像素中,可以通過(guò)算法和技術(shù)的不斷改善和優(yōu)化來(lái)提高建模和匹配運(yùn)算的精確度,從而達(dá)到通過(guò)可見(jiàn)的人臉特征準(zhǔn)確辨認(rèn)身份的作用。[nextpage]
在具體的算法設(shè)計(jì)和實(shí)現(xiàn)上,研究人員還可以進(jìn)行多種優(yōu)化嘗試,提高識(shí)別的精確度和速度。在實(shí)時(shí)動(dòng)態(tài)多角度人臉檢測(cè)方面,采用連續(xù)自適應(yīng)Boost算法學(xué)習(xí)強(qiáng)分類(lèi)器并構(gòu)造出逐層淘汰非人臉樣本的瀑布式檢測(cè)器,同時(shí)通過(guò)姿態(tài)預(yù)估計(jì)和金字塔式多分辨率搜索策略對(duì)檢測(cè)過(guò)程進(jìn)行加速,并用局部直方圖特征提高檢測(cè)的穩(wěn)定性;在光線預(yù)處理方面,從三維的角度出發(fā),在商圖像理論基礎(chǔ)上用基于全局光照子空間的方法進(jìn)行光線歸一化,并通過(guò)基于圖像序列的極大似然估計(jì)算法和水平垂直梯度光照子空間消除圖像中的光照陰影,減少光線的影響;在有限分辨識(shí)別方面,基于SIFT算法提取與尺度大小無(wú)關(guān)的關(guān)鍵特征點(diǎn),并通過(guò)多尺度濾波實(shí)現(xiàn)尺度不變性,通過(guò)8個(gè)方向的梯度直方圖實(shí)現(xiàn)旋轉(zhuǎn)不變性和部分仿射不變,在實(shí)際視頻監(jiān)控中獲取到的分辨率較低的人臉圖像中實(shí)現(xiàn)精確的識(shí)別;在時(shí)間跨度處理上,通過(guò)非線性流形學(xué)習(xí)策略和大量樣本的統(tǒng)計(jì)分析,減少年齡因素對(duì)人臉識(shí)別的影響。
此外還可以在以上原有的算法進(jìn)行進(jìn)一步的深入和優(yōu)化,并不斷嘗試更具有創(chuàng)造性的有效策略和方法。
針對(duì)大量樣本數(shù)據(jù)的統(tǒng)計(jì)分析學(xué)習(xí)
不同的光線照明造成的不同臉部陰影,以及不同角度不同時(shí)間造成的各種人臉的信息變化,不同年齡的時(shí)間跨度帶來(lái)的面部變化等等,都會(huì)模糊同一個(gè)人自身人臉變化范圍和與他人人臉特征區(qū)別程度的界限。但是,除了上述的各種算法優(yōu)化策略外,人們還可以通過(guò)收集大量的不同光照組合及包含各種變化因素的人臉圖片樣本,只要樣本信息足夠多,就可以基于統(tǒng)計(jì)分析方法,通過(guò)不斷訓(xùn)練學(xué)習(xí)不斷修正的方法得出最優(yōu)的算法模型,找到在各種不同實(shí)際應(yīng)用情況下能夠準(zhǔn)確區(qū)別不同身份之間的人臉差異的尺度。并且,還可以嘗試讓算法動(dòng)態(tài)自適應(yīng)學(xué)習(xí)來(lái)針對(duì)每個(gè)具體應(yīng)用場(chǎng)合的條件和特定人臉樣本庫(kù)達(dá)到最優(yōu)化的性能。
在此基礎(chǔ)上,人們還可以采用非線性流形學(xué)習(xí)的方法(Nonlinear Manifold Learning),將同一個(gè)人不同時(shí)間段的樣本用最近鄰的方法,連接成為一個(gè)復(fù)雜的流形,這樣每個(gè)人都有一個(gè)流形。然后,采用區(qū)分分析法,尋求不同人的流形的最佳投影方向,從而達(dá)到良好的分類(lèi)效果。
特征數(shù)據(jù)表達(dá)格式和搜索運(yùn)算的可優(yōu)化性
通過(guò)不斷的特征提取算法優(yōu)化和科學(xué)數(shù)值表達(dá)方法與技巧的運(yùn)用,總是能夠用更加有效更加精準(zhǔn)更加少的數(shù)據(jù)來(lái)表示每張人臉的特征信息。另外,人臉模板的存儲(chǔ)和檢索管理,以及大批量的搜索運(yùn)算,均可以通過(guò)行之有效的系統(tǒng)設(shè)計(jì)方法和技術(shù)實(shí)現(xiàn)技巧進(jìn)行優(yōu)化。從而提高一對(duì)多人臉?biāo)阉髌ヅ涞乃俣?,使系統(tǒng)達(dá)到實(shí)時(shí)響應(yīng)的速度要求。
針對(duì)人臉模板的讀取延遲,可以事先將所有布控對(duì)象的人臉模板快速導(dǎo)入內(nèi)存并進(jìn)行有效的空間地址分配,從而可以在目標(biāo)人臉模板中進(jìn)行快速的搜索對(duì)比運(yùn)算。同時(shí),還可以根據(jù)匹配運(yùn)算的強(qiáng)度遞增,進(jìn)行多層的瀑布式搜索,先用粗略而又快速的匹配運(yùn)算,對(duì)全局模板空間進(jìn)行粗略搜索,排除掉那些相似程度明顯較低的人臉模板,然后在剩下的候選對(duì)象中進(jìn)行更為精細(xì)的搜索對(duì)比,直到完成人臉的定位。
并行處理及軟件系統(tǒng)設(shè)計(jì)
另外,還可以通過(guò)對(duì)硬件運(yùn)算資源的合理高效利用,實(shí)現(xiàn)對(duì)系統(tǒng)整體資源和性能的合理配置。在同時(shí)輸入的監(jiān)控視頻流數(shù)量和布控對(duì)象人數(shù)都比較多的的時(shí)候(如同時(shí)支持100路攝像機(jī)對(duì)50萬(wàn)人進(jìn)行實(shí)時(shí)布控),可以運(yùn)用計(jì)算機(jī)并行處理技術(shù)構(gòu)建服務(wù)器組,用多個(gè)計(jì)算節(jié)點(diǎn)并行處理特征分析和識(shí)別運(yùn)算工作。同時(shí),通過(guò)數(shù)據(jù)庫(kù)優(yōu)化等諸多應(yīng)用軟件層面上的設(shè)計(jì)方法和技巧,提高整個(gè)系統(tǒng)的性能。
此外,還可以將部分算法運(yùn)算映射到CPU顯卡上,分擔(dān)服務(wù)器CPU的運(yùn)算負(fù)荷和速度壓力。(本文作者:黃曉斌 現(xiàn)任職于北京時(shí)代鼎典信息技術(shù)有限公司)