近日,斯坦福大學李飛飛組的研究者發(fā)表論文《Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation》,提出了Auto-DeepLab,其在圖像語義分割問題上超越了很多業(yè)內最佳模型,甚至可以在未經過預訓練的情況下達到預訓練模型的表現。Auto-DeepLab開發(fā)出與分層架構搜索空間完全匹配的離散架構的連續(xù)松弛,能夠顯著提高架構搜索的效率,降低算力需求。
據了解,該論文主要貢獻如下:
?這是首次將 NAS 從圖像分類任務擴展到密集圖像預測任務的嘗試之一。
?該研究提出了一個網絡級架構搜索空間,它增強和補充了已經得到深入研究的單元級架構搜索,并對網絡級和單元級架構進行更具挑戰(zhàn)性的聯(lián)合搜索。
?本研究提出了一種可微的連續(xù)方式,保證高效運行兩級分層架構搜索,在一個 GPU 上僅需 3 天。
?在未經 ImageNet 預訓練的情況下,Auto-DeepLab 模型在 Cityscapes 數據集上的性能顯著優(yōu)于 FRRN-B 和 GridNet,同時也和 ImageNet 預訓練當前最佳模型性能相當。在 PASCAL VOC 2012 和 ADE20K 數據集上,最好的 Auto-DeepLab 模型優(yōu)于多個當前最優(yōu)模型。
據悉,在回歸斯坦福大學當教授之前,李飛飛曾擔任谷歌中國AI負責人,并在擔任谷歌云負責人與首席科學家的兩年間,建立了一個高效的團隊,幫助 Google 加速將人工智能和機器學習引入自己的云服務中。