神經網絡通過分析大量的訓練數據來學習并執(zhí)行計算任務,是構成當前人工智能(AI)系統的關鍵,應用領域覆蓋語音識別系統到自動翻譯系統,以及自動駕駛汽車。
神經網絡通過分析大量的訓練數據來學習并執(zhí)行計算任務,是構成當前
人工智能(AI)系統的關鍵,應用領域覆蓋語音識別系統到自動翻譯系統,以及自動駕駛汽車。
然而,神經網絡卻如同黑盒一般,一旦受過訓練,即使是他們的設計師也很少能知道它們正在處理或如何處理哪些數據元素,以及它們究竟在做什么。而麻省理工學院(MIT)最近揭示的一項研究成果表明了可通過新技術理解訓練視覺數據的神經網絡的內在運作。
兩年前,麻省理工學院(MIT)計算器科學和人工智能實驗室(CSAIL)的計算器視覺研究團隊描述了一種用于訓練識別視覺場景神經網絡的黑盒方法。該方法提供了一些有趣的見解,但它仍需要人工判斷。
(圖片來源:Christine Daniloff/MIT)
MIT稍早前發(fā)布的文件指出,在今年的計算器視覺和模式識別會議上,CSAIL研究人員提供了一個完全自動化的系統,新論文說明了執(zhí)行20多個任務進行訓練的四種神經網絡分析,包括識別場景和物體、對灰色圖像著色以及解決困難的問題。其中一些新網絡的規(guī)模非常龐大,若采用舊方法做分析的成本將非常高昂。
研究人員還在網絡上進行了幾項實驗,不僅揭示了幾種計算器視覺和計算器攝影算法的性質,而且還提供了有關人類大腦組織的一些證據。
之所以稱為神經網絡,是由于其與人類神經系統相似,具有大量相當簡單而密集的信息處理“節(jié)點”。如同神經元,神經網絡的節(jié)點接收來自鄰居的信息信號,而后再發(fā)出自己的信號(或不發(fā)出)。和神經元一樣,節(jié)點發(fā)出信號的響應強度可以變化。
在新的論文和之前發(fā)表的文章中,麻省理工學院的研究人員都讓訓練有素的神經網絡執(zhí)行計算器視覺任務,并披露對不同輸入圖像響應的單個節(jié)點發(fā)射強度。他們選擇了10個輸入圖像,這些圖像激發(fā)了每個節(jié)點的最強響應。
在早先發(fā)布的論文中,研究人員將圖像發(fā)送給通過Mechanical Turk招募的工作人員,他們被要求確定圖像的共同點。而在新的論文中則是使用計算器系統來執(zhí)行。
“我們分類出了1,100個視覺概念,如綠色、漩渦紋理、木材、人臉、自行車車輪或雪山頂等。”麻省理工學院電氣工程研究生David Bau說表示,“我們汲取了其他人開發(fā)的幾個數據集,并將它們合并成一個廣泛而密集的視覺概念數據集。它有許多卷標,對于每個卷標,我們都知道哪個圖像的像素對應于哪個標簽。”
研究人員也得知了哪些圖像的像素對應于給定網絡節(jié)點的最強響應。今天的神經網絡是層狀組織,數據被饋送到最低層,經過處理后再傳遞到下一層。使用可視數據,輸入圖像會被分解成小塊,每個塊被饋送到單獨的輸入節(jié)點。
針對網絡中的高層節(jié)點的強烈反應,研究人員可以反向追溯到其觸發(fā)模式,從而識別出響應的特定圖像像素。因為他們的系統能夠頻繁地識別出與精確的像素集群相對應的標簽,這些像素簇激發(fā)了來自給定節(jié)點的強烈響應,所以它可以良好地表征節(jié)點的行為。
研究人員將數據庫中的視覺概念組織成一個層次結構。層次結構的每個層次都結合了以下級別的概念,從顏色開始,向上依次是紋理、材料、部件、對象和場景。通常情況下,較低層次的神經網絡會響應更簡單的視覺屬性,如顏色和紋理,而高層則會響應更復雜的屬性而觸發(fā)。
層次結構也允許研究人員將網絡訓練的重點量化為在不同視覺屬性下執(zhí)行不同的任務。如一個網絡可能被訓練為將大部分節(jié)??點的黑白圖像著色以識別紋理。另一個網絡,當訓練跟蹤多個視頻幀的對象時,將其較高比例的節(jié)點用于場景識別,而不是在訓練時識別場景;在這種情況下,其許多節(jié)點實際上都專門用于對象檢測。
研究人員的一項實驗可以揭示神經科學中的棘手問題。通過在人腦中植入電極以控制嚴重神經系統疾病,似乎表明大腦中的單個神經元會對特定的視覺刺激產生反應。這一假說最初被稱為“祖母神經元假說”,是最近一代神經科學家所熟知的詹妮弗·安妮斯頓神經元假說,即發(fā)現幾個神經系統疾病的患者似乎只對特定好萊塢名人有反應。
但許多神經科學家對這種解釋提出異議。他們認為所謂的珍妮弗·安妮斯頓神經元只是許多神經元之一,它們是響應詹妮弗·安妮斯頓(Jennifer Aniston)的圖像而共同觸發(fā)的。這個神經元可能是許多其他神經元集群的一部分,還未對其他測試做出響應。
由于新提出的分析技術是完全自動化的,研究人員能夠測試在訓練識別視覺場景的神經網絡中是否發(fā)生類似的事情。除了識別調整到特定視覺概念的單個網絡節(jié)點之外,他們還考慮了隨機選擇的節(jié)點組合,但節(jié)點組合卻比選擇個別節(jié)點的視覺概念少了約80%。
對此Bau表示,這表明神經網絡實際上正在試圖接近祖母神經元。它們并不想傳播祖母神經元的想法,而是試圖把它分配給一個神經元。但大多數人不相信是如此簡單正是這個結構的有趣之處。
免責聲明:本站所使用的字體和圖片文字等素材部分來源于互聯網共享平臺。如使用任何字體和圖片文字有冒犯其版權所有方的,皆為無意。如您是字體廠商、圖片文字廠商等版權方,且不允許本站使用您的字體和圖片文字等素材,請聯系我們,本站核實后將立即刪除!任何版權方從未通知聯系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網絡碰瓷及敲詐勒索,將不予任何的法律和經濟賠償!敬請諒解!