網絡攝像機作為一個特殊的混合產品,由于橫跨網絡與安防兩大之前關系不大的行業(yè),搞網絡的不太懂監(jiān)控、搞監(jiān)控的不太懂網絡,這給網絡攝像機蒙上了一層神秘的面紗。本文將介紹網絡攝像機核心技術——數字視頻壓縮技術。
網絡攝像機是IP網絡監(jiān)控的前端產品,其主要結構就是通過內置一個嵌入式ARM芯片 + 硬件編碼芯片,將圖像傳感器(CCD,COMS)采集的光電信號經數字轉換后進行壓縮,把高數據量的非壓縮視頻信號轉變?yōu)?常見的壓縮協(xié)議包括M-JPEG,MPEG-4,以及最新的H.264壓縮技術)壓縮信號進行網絡傳輸的設備。除了具備傳統(tǒng)模擬攝像機所有的圖像捕捉功能外,機內通過內置數字壓縮控制器和基于WEB的操作系統(tǒng),使得視頻數據經壓縮加密后,通過局域網,Internet或無線網絡送至終端用戶。網絡攝像機可以直接接入到TCP/IP、UDP網絡中,因此這種系統(tǒng)主要的功能就是在聯(lián)網上面,通過互聯(lián)網或者局域網進行視音頻傳輸。同樣相對于模擬攝像機,網絡攝像機能更簡單地實現(xiàn)監(jiān)控,特別是遠程監(jiān)控,能更簡單地施工和維護、更好地支持報警聯(lián)動、更靈活的錄像存儲、更豐富的產品選擇、更高清的視頻效果和更完美的監(jiān)控管理。另外,網絡攝像機支持WIFI無線接入、3G接入、POE供電(網絡供電)和光纖接入。
網絡攝像機主要包括三個技術層次,即成像(光電轉換)、數字壓縮和網絡傳輸。
而本文談的主要就是網絡攝像機的視頻壓縮技術部分。壓縮技術的好壞將會直接影響到整個網絡監(jiān)控成本。較高的碼流會對網絡傳輸交換機系統(tǒng),以及存儲系統(tǒng),圖像還原部分帶來巨大的壓力,所以壓縮算法的優(yōu)劣直接影響到整個網絡監(jiān)控系統(tǒng)的成本和最終的用戶體驗效果。
圖像壓縮編碼標準
目前,網絡攝像機采用的圖像壓縮編碼標準主要有MPEG4、H.263、H.264、M-JPEG等。
MPEG4
所謂MPEG標準就是指由ISO的活動圖像專家組制定的一系列關于音視頻信號以及多媒體信號的壓縮與解壓縮技術的標準。到目前為止,已經制定完成并批準執(zhí)行的有:1991年批準的MPEG1、MP3;1994年批準的MPEG2;1999年批準的MPEG4和MP4。正在制定的標準有:MPEG7和MEPG21。
H.263
H.263是ITU-T提出的作為H.324終端使用的視頻編解碼建議,H.263經過不斷完善和多次的升級已經日臻成熟,如今已經大部分代替了H.261,而且H.263由于能在低帶寬上傳輸高質量的視頻流而日益受到歡迎。
H.263是基于運動補償的DPCM的混合編碼,在運動搜索的基礎上進行運動補償,然后運用DCT變換和“之”字形掃描編碼,從而得到輸出碼流。H.263在H.261建議的基礎上,將運動矢量的搜索增加為半像素點搜索;同時又增加了無限制運動矢量、基于語法的算術編碼、高級預測技術和PB幀編碼等四個高級選項,從而達到了進一步降低碼速率和提高編碼質量的目的。
H.264
隨著HDTV的興起,H.264規(guī)范頻頻出現(xiàn),HD-DVD和藍光DVD均計劃采用這一標準進行節(jié)目制作。而且自2005年下半年以來,無論是NVIDIA還是ATI都把支持H.264硬件解碼加速作為自己最值得夸耀的視頻技術,H.264到底是何方“神圣”呢?
H.264,同時也是MPEG-4第十部分,是由ITU-T視頻編碼專家組(VCEG)和ISO/IEC動態(tài)圖像專家組(MPEG)聯(lián)合組成的聯(lián)合視頻組(JVT,Joint Video Team)提出的高度壓縮數字視頻編解碼器標準。
什么是H.264?H.264是一種高性能的視頻編解碼技術。目前國際上制定視頻編解碼技術的組織有兩個,一個是“國際電聯(lián)(ITU-T)”,它制定的標準有H.261、H.263、H.263+等,另一個是“國際標準化組織(ISO)”它制定的標準有MPEG-1、MPEG-2、MPEG-4等。而H.264則是由兩個組織聯(lián)合組建的聯(lián)合視頻組(JVT)共同制定的新數字視頻編碼標準,所以它既是ITU-T的H.264,又是ISO/IEC的MPEG-4高級視頻編碼(Advanced Video Coding,AVC),而且它將成為MPEG-4標準的第10部分。因此,不論是MPEG-4 AVC、MPEG-4 Part 10,還是ISO/IEC 14496-10,都是指H.264。[nextpage]
M-JPEG
M-JPEG技術即運動靜止圖像壓縮技術,它把運動的視頻序列作為連續(xù)的靜止圖像來處理,這種壓縮技術方式單獨完整地壓縮每一幀,在編輯過程中可隨機存儲每一幀,可進行精確到幀的編輯。但M-JPEG只對幀內的空間冗余進行壓縮,不對幀間的時間冗余進行壓縮,故壓縮效率不高,圖1、2為單幀/多幀技術示意圖。
對于不同壓縮算法我們也可以通過下面的圖進行很直觀的認識。
就以D1分辨率的網絡攝像機來說,通過圖3我們就能很直觀地比較出在畫面質量不變的情況下不同壓縮算法對于碼流的影響。
通過上面的壓縮格式、幀率、碼流對應圖表1可以看到在D1的分辨率30FPS的情況下,采用H.264壓縮算法的碼流可以控制在1.3Mb以下;而如果采用M-JPEG壓縮算法的話,碼流將要達到7Mb。二種算法對于網絡和存儲部分的壓力相差達到了5.3倍,從中也可以看出H.264相對其他壓縮算法有著巨大的優(yōu)勢,也是客觀的成本支出的比較。
目前,網絡攝像機所采用的壓縮算法的變化如圖4所示。
從圖4可知,到2012年以后,H.264壓縮算法將占到80%以上的份額。
按現(xiàn)在網絡攝像機的分辨率趨勢來說,百萬高清必然成為2012年的主題,其市場份額也將占到80%以上的份額。下圖5是各種分辨率對應屏幕尺寸。
高清在圖像的表現(xiàn)上也體現(xiàn)了其突出的優(yōu)勢。通過上面的表1也可以看出未來網絡攝像機將必然采用H.264進行高清圖像的壓縮和傳輸,而H.264最大的優(yōu)勢是具有很高的數據壓縮比率,在同等圖像質量的條件下,H.264的壓縮比是MPEG-2的2倍以上,是MPEG-4的1.5~2倍。舉個例子,原始文件的大小如果為88GB,采用MPEG-2壓縮標準壓縮后變成3.5GB,壓縮比為25∶1,而采用H.264壓縮標準壓縮后變?yōu)?79MB,從88GB到879MB,H.264的壓縮比達到驚人的102∶1! H.264為什么有那么高的壓縮比?低碼率(Low Bit Rate)起了重要的作用,和MPEG-2和MPEG-4 ASP等壓縮技術相比,H.264壓縮技術將大大節(jié)省用戶的下載時間和數據流量收費。尤其值得一提的是,H.264在具有高壓縮比的同時還擁有高質量流暢的圖像。
H.264算法的優(yōu)勢
H.264是在MPEG-4技術的基礎之上建立起來的,其編解碼流程主要包括5個部分:幀間和幀內預測(Estimation)、變換(Transform)和反變換、量化(Quantization)和反量化、環(huán)路濾波(Loop Filter)、熵編碼(Entropy Coding)。
H.264/MPEG-4 AVC(H.264)是1995年自MPEG-2視頻壓縮標準發(fā)布以后,最新、最有前途的視頻壓縮標準。H.264是由ITU-T和ISO/IEC聯(lián)合開發(fā)組共同開發(fā)的最新國際視頻編碼標準。通過該標準,在同等圖象質量下的壓縮效率比以前的標準提高了2倍以上,因此,H.264被普遍認為是最有影響力的行業(yè)標準。
H.264與以前的國際標準如H.263和MPEG-4相比,最大的優(yōu)勢體現(xiàn)在以下四個方面:
1、將每個視頻幀分離成由像素組成的塊,因此視頻幀編碼處理的過程可以達到塊的級別。
2、采用空間冗余的方法,對視頻幀的一些原始塊進行空間預測、轉換、優(yōu)化和熵編碼(可變長編碼)。
3、對連續(xù)幀的不同塊采用臨時存放的方法,這樣,只需對連續(xù)幀中有改變的部分進行編碼。該算法采用運動預測和運動補償來完成。對某些特定的塊,在一個或多個已經進行了編碼的幀執(zhí)行搜索來決定塊的運動向量,并由此在后面的編碼和解碼中預測主塊。
4、采用剩余空間冗余技術,對視頻幀里的殘留塊進行編碼。例如,對于源塊和相應預測塊的不同,再次采用轉換、優(yōu)化和熵編碼。[nextpage]
H.264的特征和高級優(yōu)勢
H.264是國際標準化組織(ISO)和國際電信聯(lián)盟(ITU)共同提出的繼MPEG4之后的新一代數字視頻壓縮格式,它既保留了以往壓縮技術的優(yōu)點和精華,又具有其他壓縮技術無法比擬的許多優(yōu)點:
1、低碼流(Low Bit Rate):和MPEG2和MPEG4 ASP等壓縮技術相比,在同等圖像質量下,采用H.264技術壓縮后的數據量只有MPEG2的1/8, MPEG4的1/3。顯然,H.264壓縮技術的采用將大大節(jié)省用戶的下載時間和數據流量收費。
2、高質量的圖象:H.264能提供連續(xù)、流暢的高質量圖象(DVD質量)。
3、容錯能力強:H.264提供了解決在不穩(wěn)定網絡環(huán)境下容易發(fā)生的丟包等錯誤的必要工具。
4、網絡適應性強:H.264提供了網絡抽取層(Network Abstraction Layer), 使得采用H.264壓縮的視頻圖像能容易地在不同網絡上傳輸(例如互聯(lián)網,CDMA,GPRS,WCDMA,CDMA2000等)。
而針對網絡攝像機視頻需要網絡傳輸的特性,H.264算法在概念上可以分為兩層:視頻編碼層(VCL:Video Coding Layer)負責高效的視頻內容表示,網絡提取層(NAL:Network Abstraction Layer)負責以網絡所要求的恰當的方式對數據進行打包和傳送。在VCL和NAL之間定義了一個基于分組方式的接口,打包和相應的信令屬于NAL的一部分。這樣,高編碼效率和網絡友好性的任務分別由VCL和NAL來完成。
VCL層包括基于塊的運動補償混合編碼和一些新特性。與前面的視頻編碼標準一樣,H.264沒有把前處理和后處理等功能包括在草案中,這樣可以增加標準的靈活性。
NAL負責使用下層網絡的分段格式來封裝數據,包括組幀、邏輯信道的信令、定時信息的利用或序列結束信號等。例如,NAL支持視頻在電路交換信道上的傳輸格式,支持視頻在Internet上利用RTP/UDP/IP傳輸的格式。NAL包括自己的頭部信息、段結構信息和實際載荷信息,即上層的VCL數據。(如果采用數據分割技術,數據可能由幾個部分組成)。
H.264 規(guī)范中包含了用于差錯消除的工具,便于壓縮視頻在誤碼、丟包多發(fā)環(huán)境中傳輸,如移動信道或IP信道中傳輸的健壯性。
為了抵御傳輸差錯,H.264視頻流中的時間同步可以通過采用幀內圖像刷新來完成,空間同步由條結構編碼(slice structured coding)來支持。同時為了便于誤碼以后的再一次同步,在一幅圖像的視頻數據中還提供了一定的重同步點。另外,幀內宏塊刷新和多參考宏塊允許編碼器在決定宏塊模式的時候不僅可以考慮編碼效率,還可以考慮傳輸信道的特性。
除了利用量化步長的改變來適應信道碼率外,在H.264中,還常利用數據分割的方法來應對信道碼率的變化。從總體上說,數據分割的概念就是在編碼器中生成具有不同優(yōu)先級的視頻數據以支持網絡中的服務質量 QoS。例如采用基于語法的數據分割(syntax-based data partitioning)方法,將每幀數據按其重要性分為幾部分,這樣允許在緩沖區(qū)溢出時丟棄不太重要的信息。還可以采用類似的時間數據分割方法,通過在P幀和B幀中使用多個參考幀來完成。
在無線通信的應用中,可以通過改變每一幀的量化精度或空間/時間分辨率來支持無線信道的大比特率變化??墒牵诙嗖サ那闆r下,要求編碼器對變化的各種比特率進行響應是不可能的。因此,不同于MPEG-4中采用的精細分級編碼FGS(Fine Granular Scalability)的方法(效率比較低),H.264采用流切換的SP幀來代替分級編碼。
結語
隨著網絡攝像機視頻壓縮技術的日益完善并深入人心,網絡建設基本完成,平安城市如火如荼開展,更加說明網絡攝像機的潛在市場。2008年北京奧運會 網絡監(jiān)控項目的成功實施; 2010年上海世博會 的成功實施;2011年深圳大運會中的大展手腳,中國這個世界人口最多的國家將營造一個史無前例的監(jiān)控市場,而網絡攝像機作為第三代網絡監(jiān)控技術的新寵將走在風口浪尖,尤其高清H.264網絡攝像機的市場需求,將會獲得長足的發(fā)展。