神經(jīng)網(wǎng)絡通過分析大量的訓練數(shù)據(jù)來學習并執(zhí)行計算任務,是構(gòu)成當前人工智能(AI)系統(tǒng)的關(guān)鍵,應用領域覆蓋語音識別系統(tǒng)到自動翻譯系統(tǒng),以及自動駕駛汽車。
神經(jīng)網(wǎng)絡通過分析大量的訓練數(shù)據(jù)來學習并執(zhí)行計算任務,是構(gòu)成當前
人工智能(AI)系統(tǒng)的關(guān)鍵,應用領域覆蓋語音識別系統(tǒng)到自動翻譯系統(tǒng),以及自動駕駛汽車。
然而,神經(jīng)網(wǎng)絡卻如同黑盒一般,一旦受過訓練,即使是他們的設計師也很少能知道它們正在處理或如何處理哪些數(shù)據(jù)元素,以及它們究竟在做什么。而麻省理工學院(MIT)最近揭示的一項研究成果表明了可通過新技術(shù)理解訓練視覺數(shù)據(jù)的神經(jīng)網(wǎng)絡的內(nèi)在運作。
兩年前,麻省理工學院(MIT)計算器科學和人工智能實驗室(CSAIL)的計算器視覺研究團隊描述了一種用于訓練識別視覺場景神經(jīng)網(wǎng)絡的黑盒方法。該方法提供了一些有趣的見解,但它仍需要人工判斷。
(圖片來源:Christine Daniloff/MIT)
MIT稍早前發(fā)布的文件指出,在今年的計算器視覺和模式識別會議上,CSAIL研究人員提供了一個完全自動化的系統(tǒng),新論文說明了執(zhí)行20多個任務進行訓練的四種神經(jīng)網(wǎng)絡分析,包括識別場景和物體、對灰色圖像著色以及解決困難的問題。其中一些新網(wǎng)絡的規(guī)模非常龐大,若采用舊方法做分析的成本將非常高昂。
研究人員還在網(wǎng)絡上進行了幾項實驗,不僅揭示了幾種計算器視覺和計算器攝影算法的性質(zhì),而且還提供了有關(guān)人類大腦組織的一些證據(jù)。
之所以稱為神經(jīng)網(wǎng)絡,是由于其與人類神經(jīng)系統(tǒng)相似,具有大量相當簡單而密集的信息處理“節(jié)點”。如同神經(jīng)元,神經(jīng)網(wǎng)絡的節(jié)點接收來自鄰居的信息信號,而后再發(fā)出自己的信號(或不發(fā)出)。和神經(jīng)元一樣,節(jié)點發(fā)出信號的響應強度可以變化。
在新的論文和之前發(fā)表的文章中,麻省理工學院的研究人員都讓訓練有素的神經(jīng)網(wǎng)絡執(zhí)行計算器視覺任務,并披露對不同輸入圖像響應的單個節(jié)點發(fā)射強度。他們選擇了10個輸入圖像,這些圖像激發(fā)了每個節(jié)點的最強響應。
在早先發(fā)布的論文中,研究人員將圖像發(fā)送給通過Mechanical Turk招募的工作人員,他們被要求確定圖像的共同點。而在新的論文中則是使用計算器系統(tǒng)來執(zhí)行。
“我們分類出了1,100個視覺概念,如綠色、漩渦紋理、木材、人臉、自行車車輪或雪山頂?shù)取?rdquo;麻省理工學院電氣工程研究生David Bau說表示,“我們汲取了其他人開發(fā)的幾個數(shù)據(jù)集,并將它們合并成一個廣泛而密集的視覺概念數(shù)據(jù)集。它有許多卷標,對于每個卷標,我們都知道哪個圖像的像素對應于哪個標簽。”
研究人員也得知了哪些圖像的像素對應于給定網(wǎng)絡節(jié)點的最強響應。今天的神經(jīng)網(wǎng)絡是層狀組織,數(shù)據(jù)被饋送到最低層,經(jīng)過處理后再傳遞到下一層。使用可視數(shù)據(jù),輸入圖像會被分解成小塊,每個塊被饋送到單獨的輸入節(jié)點。
針對網(wǎng)絡中的高層節(jié)點的強烈反應,研究人員可以反向追溯到其觸發(fā)模式,從而識別出響應的特定圖像像素。因為他們的系統(tǒng)能夠頻繁地識別出與精確的像素集群相對應的標簽,這些像素簇激發(fā)了來自給定節(jié)點的強烈響應,所以它可以良好地表征節(jié)點的行為。
研究人員將數(shù)據(jù)庫中的視覺概念組織成一個層次結(jié)構(gòu)。層次結(jié)構(gòu)的每個層次都結(jié)合了以下級別的概念,從顏色開始,向上依次是紋理、材料、部件、對象和場景。通常情況下,較低層次的神經(jīng)網(wǎng)絡會響應更簡單的視覺屬性,如顏色和紋理,而高層則會響應更復雜的屬性而觸發(fā)。
層次結(jié)構(gòu)也允許研究人員將網(wǎng)絡訓練的重點量化為在不同視覺屬性下執(zhí)行不同的任務。如一個網(wǎng)絡可能被訓練為將大部分節(jié)??點的黑白圖像著色以識別紋理。另一個網(wǎng)絡,當訓練跟蹤多個視頻幀的對象時,將其較高比例的節(jié)點用于場景識別,而不是在訓練時識別場景;在這種情況下,其許多節(jié)點實際上都專門用于對象檢測。
研究人員的一項實驗可以揭示神經(jīng)科學中的棘手問題。通過在人腦中植入電極以控制嚴重神經(jīng)系統(tǒng)疾病,似乎表明大腦中的單個神經(jīng)元會對特定的視覺刺激產(chǎn)生反應。這一假說最初被稱為“祖母神經(jīng)元假說”,是最近一代神經(jīng)科學家所熟知的詹妮弗·安妮斯頓神經(jīng)元假說,即發(fā)現(xiàn)幾個神經(jīng)系統(tǒng)疾病的患者似乎只對特定好萊塢名人有反應。
但許多神經(jīng)科學家對這種解釋提出異議。他們認為所謂的珍妮弗·安妮斯頓神經(jīng)元只是許多神經(jīng)元之一,它們是響應詹妮弗·安妮斯頓(Jennifer Aniston)的圖像而共同觸發(fā)的。這個神經(jīng)元可能是許多其他神經(jīng)元集群的一部分,還未對其他測試做出響應。
由于新提出的分析技術(shù)是完全自動化的,研究人員能夠測試在訓練識別視覺場景的神經(jīng)網(wǎng)絡中是否發(fā)生類似的事情。除了識別調(diào)整到特定視覺概念的單個網(wǎng)絡節(jié)點之外,他們還考慮了隨機選擇的節(jié)點組合,但節(jié)點組合卻比選擇個別節(jié)點的視覺概念少了約80%。
對此Bau表示,這表明神經(jīng)網(wǎng)絡實際上正在試圖接近祖母神經(jīng)元。它們并不想傳播祖母神經(jīng)元的想法,而是試圖把它分配給一個神經(jīng)元。但大多數(shù)人不相信是如此簡單正是這個結(jié)構(gòu)的有趣之處。
免責聲明:本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的,皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方,且不允許本站使用您的字體和圖片文字等素材,請聯(lián)系我們,本站核實后將立即刪除!任何版權(quán)方從未通知聯(lián)系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網(wǎng)絡碰瓷及敲詐勒索,將不予任何的法律和經(jīng)濟賠償!敬請諒解!