a&s專業(yè)的自動化&安全生態(tài)服務平臺

公眾號

安全自動化

安防知識網

手機站

大安防供需平臺

搜索
登錄
|
注冊

搜索

全站搜索
AI應用搜索

首頁 > 資訊 > 正文

南京大學教授申富饒：圖像識別的發(fā)展與挑戰(zhàn)

2019-12-17 09:36 閱讀 2477 來源：OFweek物聯(lián)網評論區(qū)

在本次大會中，南京大學人工智能學院教授、博士生導師申富饒給我們帶來《機器學習應用于圖像識別：發(fā)展與挑戰(zhàn)》主題分享，詳細介紹和分析了圖像識別的實現原理、主要算法類型，以及面臨的挑戰(zhàn)等研究成果，讓我們更清晰地了解人工智能的發(fā)展現狀。

　　12月13日，由中共肥東縣委、肥東縣人民政府、億達中國控股有限公司主辦，肥東縣投資促進中心、合肥東部新城核心區(qū)綜合管理辦公室、合肥東部新城建設投資有限公司、億達合肥智慧科技城發(fā)展有限公司承辦，中國高科技行業(yè)門戶OFweek維科網協(xié)辦的“2019中國(合肥 · 肥東)AIoT產業(yè)發(fā)展論壇”在肥東安徽水利和順大酒店隆重開幕。

　　在本次大會中，南京大學人工智能學院教授、博士生導師申富饒給我們帶來《機器學習應用于圖像識別：發(fā)展與挑戰(zhàn)》主題分享，詳細介紹和分析了圖像識別的實現原理、主要算法類型，以及面臨的挑戰(zhàn)等研究成果，讓我們更清晰地了解人工智能的發(fā)展現狀。

　　機器學習的原理

　　在生活當中，人類可以根據自身的經驗進行總結，歸納出一些規(guī)律，當遇到新問題時，人類會利用這些規(guī)律來進行預測，從而做出適當的反應。

　　而機器學習中的歷史數據就相當于人類的經驗，將這些歷史數據通過訓練得到機器學習模型，當機器要解決實際問題時可以根據學習模型進行預測，從而得到關于未知數據的一些屬性以做出恰當的反應。在現實生活中，機器學習有很多重要的應用，而圖像識別是其中一個極其重要而又相當具有挑戰(zhàn)性的課題。

　　圖像識別的模式分類

　　圖像識別是一個模式分類問題，它的目標是識別圖像中的物體，劃分到不同的類別，實現最小的分類誤差。現實生活中的圖像大致可分為語義級圖像、細粒度圖像、實例級圖像3種，申教授認為，各個類別屬于不同的物種，往往具有較大的類間方差，而類內則具有較小的類內誤差。例如識別普適物體的小型數據集CIFAR-10，包含了6種動物與4種交通工具。

　　對于圖像識別而言，人類可以輕易地判斷出圖像中的顏色、形狀、部件等特征，作為識別目標的依據，然而圖像在計算機中被保存為數字格式。申教授分析道：機器學習方法可行的前提條件是訓練數據中包含對預測任務有意義的特征，這些特征隱藏在看似毫無意義的數字之中，因此必須先進行特征的提取。

　　深度卷積網絡的發(fā)展

　　在圖像識別的研究歷程當中，最主流的算法當屬卷積神經網絡。卷積神經網絡(CNN)以卷積核為基本結構單元，通過局部連接、權值共享，模擬生物視覺系統(tǒng)的感受野機制，自動學習圖像的特征表示。

　　LeNet5是早期的卷積神經網絡模型，共有 7 層，具備了卷積層、池化層等深度卷積網絡中的核心結構；AlexNet對卷積神經網絡的結構和訓練算法進行了大量創(chuàng)新，奠定了深度學習在計算機視覺領域的優(yōu)勢地位；ResNet通過引入殘差連接，基本消除了增加深度帶來的退化現象，能夠通過單純地增加網絡深度，來提高網絡性能；DenseNet將殘差連接的思想發(fā)展到極致，實現了資源的最大化利用和計算量的壓縮；Google提出的MobileNets是一個輕量級的深層神經網絡，面向移動應用設計，大幅提升了計算速度。

　　圖像識別的三大挑戰(zhàn)

　　在人眼看來，一張圖片就是一幅彩色的圖畫，但是在機器看來，它就是一大串數字，在機器學習的各種應用中，圖像識別是一個特別困難的任務，申教授認為主要面臨以下三個挑戰(zhàn)。

　　第一個挑戰(zhàn)是嵌入式深度學習。深度卷積網絡在圖像識別算法中占據了統(tǒng)治地位，模型精度也在不斷提升，然而相應地也帶來了計算復雜度的提升。目前有很多嵌入式應用需要使用圖像識別技術，但嵌入式平臺往往受到芯片性能、內存容量等硬件資源的限制，無法運行當前主流的深度神經網絡，或者無法滿足速度要求。

　　第二個挑戰(zhàn)是可解釋性。申教授分析道：圖像識別程序像是一個黑盒子，只給出結果，而不能說明結果是如何產生的。我們能做的就是把數據丟給識別算法，期望它能夠給出正確的答案。但是當答案發(fā)生錯誤時，我們無法得知錯誤產生的原因，只能寄望于調節(jié)參數之類的手段能讓程序得到改善。目前，算法的可解釋性問題正在逐漸得到重視。

　　第三個挑戰(zhàn)是對抗樣本問題。深度學習中可解釋性的缺失帶來了另一個問題，在某些應用環(huán)境中，圖像識別程序可能會受到惡意攻擊，攻擊者試圖“欺騙”圖像識別程序，使程序的預測出錯。這就要求我們設計可靠的神經網絡，能夠具有防止惡意攻擊的能力。

　　未來——不斷發(fā)展與完善

　　總的來說，即便仍然面臨著非常多的挑戰(zhàn)，圖像識別還是取得了很大的成功?，F在的神經網絡都是由人來設計，在未來，或許會讓程序自己進行設計，讓機器進行增量學習、終身學習，到那時，機器在應用的過程當中會不斷感知環(huán)境的變化，然后不斷調整自己的行為以適應環(huán)境需要。

　　總之，圖像識別是人工智能的一個重要領域，隨著技術的不斷發(fā)展，圖像識別也會不斷進行完善以適應更多的需求。

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網共享平臺。如使用任何字體和圖片文字有冒犯其版權所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網絡碰瓷及敲詐勒索，將不予任何的法律和經濟賠償！敬請諒解！

您可能也喜歡這些文章

參與評論

回復：

0/300

文明上網理性發(fā)言，評論區(qū)僅供其表達個人看法，并不表明a&s觀點。

0

推薦專題

熱門排行

關于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團旗下的專業(yè)媒體平臺，自1994年品牌成立以來，一直專注于安全&自動化產業(yè)前沿產品、技術及市場趨勢的專業(yè)媒體傳播和品牌服務。從安全管理到產業(yè)數字化，a&s傳媒擁有首屈一指的國際行業(yè)展覽會資源以及豐富的媒體經驗，提供媒體、活動、展會等整合營銷服務。

全球網站
法蘭克福
asmag.com
asmag.com.cn
中國臺灣智慧安防網

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網共享平臺。如使用任何字體和圖片文字有冒犯其版權所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網絡碰瓷及敲詐勒索，將不予任何的法律和經濟賠償！敬請諒解！

粵公網安備 44030402000264號

用戶
反饋

久久久18,天天躁夜夜躁狠狠躁婷婷,国产成人三级一区二区在线观看一,最近的2019中文字幕视频 ,最新免费av在线观看

南京大學教授申富饒：圖像識別的發(fā)展與挑戰(zhàn)