a&s專業(yè)的自動(dòng)化&安全生態(tài)服務(wù)平臺(tái)

公眾號(hào)

安全自動(dòng)化

安防知識(shí)網(wǎng)

手機(jī)站

大安防供需平臺(tái)

搜索
登錄
|
注冊(cè)

搜索

全站搜索
AI應(yīng)用搜索

首頁(yè) > 資訊 > 正文

物體識(shí)別數(shù)據(jù)集顛覆了世界上最好的計(jì)算機(jī)視覺(jué)模型

作者：麻省理工學(xué)院Kim Martineau 2019-12-12 10:35 閱讀 2630 來(lái)源：安防知識(shí)網(wǎng) 評(píng)論區(qū)

ObjectNet是由MIT和IBM研究人員創(chuàng)建的照片數(shù)據(jù)集，它以不同的角度，以不同的角度顯示對(duì)象，并具有不同的背景，以更好地表示3D對(duì)象的復(fù)雜性。研究人員希望數(shù)據(jù)集能夠帶來(lái)在現(xiàn)實(shí)生活中表現(xiàn)更好的新計(jì)算機(jī)視覺(jué)技術(shù)。

　　ObjectNet是由MIT和IBM研究人員創(chuàng)建的照片數(shù)據(jù)集，它以不同的角度顯示對(duì)象，并具有不同的背景，以更好地表示3D對(duì)象的復(fù)雜性。研究人員希望數(shù)據(jù)集能夠帶來(lái)在現(xiàn)實(shí)生活中表現(xiàn)更好的新計(jì)算機(jī)視覺(jué)技術(shù)。

圖片來(lái)源：麻省理工學(xué)院

　　計(jì)算機(jī)視覺(jué)模型已經(jīng)學(xué)會(huì)了準(zhǔn)確地識(shí)別照片中的對(duì)象，從而使某些對(duì)象在某些數(shù)據(jù)集上的表現(xiàn)優(yōu)于人類。但是，當(dāng)那些相同的物體檢測(cè)器在現(xiàn)實(shí)世界中變得松懈時(shí)，它們的性能會(huì)明顯下降，這會(huì)給自動(dòng)駕駛汽車和其他使用機(jī)器視覺(jué)的對(duì)安全至關(guān)重要的系統(tǒng)帶來(lái)可靠性方面的擔(dān)憂。

　　為了彌合這種性能差距，麻省理工學(xué)院和IBM研究人員組成的團(tuán)隊(duì)著手創(chuàng)建一種非常不同的對(duì)象識(shí)別數(shù)據(jù)集。它被稱為ObjectNet，是ImageNet上的一部戲，ImageNet是眾包的照片數(shù)據(jù)庫(kù)，負(fù)責(zé)引發(fā)現(xiàn)代人工智能的繁榮。

　　與ImageNet具有從Flickr和其他社交媒體網(wǎng)站拍攝的照片不同，ObjectNet具有由付費(fèi)自由職業(yè)者拍攝的照片。顯示的對(duì)象是側(cè)面傾斜的，以奇數(shù)角度拍攝，并顯示在雜亂的房間中。當(dāng)在ObjectNet上測(cè)試領(lǐng)先的對(duì)象檢測(cè)模型時(shí)，其準(zhǔn)確率從ImageNet上的97%的高位下降到50-55%。

　　麻省理工學(xué)院計(jì)算機(jī)科學(xué)與人工智能實(shí)驗(yàn)室(CSAIL)和腦，腦與機(jī)器中心(CBMM)的研究科學(xué)家鮑里斯·卡茨(Boris Katz)說(shuō)：“我們創(chuàng)建了這個(gè)數(shù)據(jù)集來(lái)告訴人們對(duì)象識(shí)別問(wèn)題仍然是一個(gè)難題?！??！拔覀冃枰茫悄艿乃惴??！? Katz和他的同事將在神經(jīng)信息處理系統(tǒng)會(huì)議(NeurIPS)上介紹ObjectNet及其結(jié)果。

　　深度學(xué)習(xí)是推動(dòng)AI最新發(fā)展的技術(shù)，它使用人工“神經(jīng)元”層在大量原始數(shù)據(jù)中查找模式。在訓(xùn)練了數(shù)百至數(shù)千個(gè)示例之后，它學(xué)會(huì)在照片中挑選椅子。但是，即使具有數(shù)百萬(wàn)個(gè)圖像的數(shù)據(jù)集也無(wú)法以每個(gè)可能的方向和設(shè)置顯示每個(gè)對(duì)象，這在模型在現(xiàn)實(shí)生活中遇到這些對(duì)象時(shí)也會(huì)造成問(wèn)題。

　　ObjectNet在另一個(gè)重要方面與常規(guī)圖像數(shù)據(jù)集不同：它不包含訓(xùn)練圖像。大多數(shù)數(shù)據(jù)集都分為用于訓(xùn)練模型和測(cè)試其性能的數(shù)據(jù)。但是訓(xùn)練集通常與測(cè)試集有著細(xì)微的相似之處，實(shí)際上使模型在測(cè)試時(shí)達(dá)到了潛行高峰。

　　乍看之下，擁有 1400萬(wàn)張圖像的ImageNet看起來(lái)是巨大的。但是，如果不包括訓(xùn)練集，則其大小可與ObjectNet媲美(50,000張照片)。

　　研究合著者CSAIL和CBMM的研究作者Andrei Barbu說(shuō)：“如果我們想知道算法在現(xiàn)實(shí)世界中的表現(xiàn)如何，我們應(yīng)該在無(wú)偏見(jiàn)且從未見(jiàn)過(guò)的圖像上對(duì)其進(jìn)行測(cè)試。” 。

　　試圖捕獲現(xiàn)實(shí)世界對(duì)象的復(fù)雜性的數(shù)據(jù)集

　　很少有人會(huì)考慮與他們的朋友分享ObjectNet的照片，這就是重點(diǎn)。研究人員從Amazon Mechanical Turk聘請(qǐng)了自由職業(yè)者，為數(shù)百?gòu)堧S機(jī)擺放的家用物品拍照。工人們?cè)趹?yīng)用程序上收到了照片分配，并帶有動(dòng)畫(huà)說(shuō)明，告訴他們?nèi)绾味ㄏ蚍峙涞膶?duì)象，從哪個(gè)角度拍攝以及是否將對(duì)象擺放在廚房，浴室，臥室或客廳中。

　　他們希望消除三個(gè)常見(jiàn)的偏見(jiàn)：正面朝上，在標(biāo)志性位置和高度相關(guān)的設(shè)置中顯示的對(duì)象，例如廚房中堆疊的盤子。

　　花費(fèi)了三年的時(shí)間來(lái)構(gòu)思數(shù)據(jù)集并設(shè)計(jì)一個(gè)可標(biāo)準(zhǔn)化數(shù)據(jù)收集過(guò)程的應(yīng)用程序。研究合著者，麻省理工學(xué)院電氣工程和計(jì)算機(jī)科學(xué)系研究生David Mayo說(shuō)：“發(fā)現(xiàn)如何以控制各種偏差的方式收集數(shù)據(jù)是非常棘手的?！?“我們還必須進(jìn)行實(shí)驗(yàn)，以確保我們的指示清晰明了，并確保工人確切知道他們的要求?！?/p>

　　又花了一年的時(shí)間收集實(shí)際數(shù)據(jù)，最后，由于不符合研究人員的要求，所有自由職業(yè)者提交的照片中有一半被丟棄了。為了提供幫助，一些工人在他們的物體上添加了標(biāo)簽，將它們放在白色背景上，或者試圖改善分配給他們拍攝的照片的美觀性。

　　許多照片是在美國(guó)以外拍攝的，因此，有些物體可能看起來(lái)很陌生。成熟的橘子是綠色的，香蕉的大小不同，衣服的形狀和質(zhì)地也各不相同。

　　Object Net與ImageNet：領(lǐng)先的對(duì)象識(shí)別模型的比較

　　當(dāng)研究人員在ObjectNet上測(cè)試最新的計(jì)算機(jī)視覺(jué)模型時(shí)，他們發(fā)現(xiàn)ImageNet的性能下降了40-45個(gè)百分點(diǎn)。研究人員說(shuō)，結(jié)果表明，物體檢測(cè)器仍然難以理解物體是三維的并且可以旋轉(zhuǎn)并移動(dòng)到新的環(huán)境中。研究合著者，IBM研究人員Dan Gutfreund說(shuō)：“這些概念并未內(nèi)置在現(xiàn)代物體檢測(cè)器的體系結(jié)構(gòu)中。”

　　為了證明ObjectNet很難精確地歸因于如何查看和定位對(duì)象，研究人員允許模型訓(xùn)練ObjectNet數(shù)據(jù)的一半，然后再對(duì)其余一半進(jìn)行測(cè)試。在同一數(shù)據(jù)集上進(jìn)行訓(xùn)練和測(cè)試通?？梢蕴岣咝阅?，但此處的模型僅稍有改善，這表明對(duì)象檢測(cè)器尚未完全理解現(xiàn)實(shí)世界中對(duì)象的存在方式。

　　自2012年以來(lái)，計(jì)算機(jī)視覺(jué)模型已逐步得到改善，當(dāng)時(shí)稱為AlexNet的物體檢測(cè)器在年度ImageNet競(jìng)賽中擊敗了比賽。隨著數(shù)據(jù)集變得越來(lái)越大，性能也得到了提高。

　　但是研究人員警告說(shuō)，設(shè)計(jì)更大版本的ObjectNet并增加視角和方向并不一定會(huì)帶來(lái)更好的結(jié)果。ObjectNet的目的是激勵(lì)研究人員提出下一波革命性技術(shù)，就像ImageNet挑戰(zhàn)最初的啟動(dòng)一樣。

　　卡茲說(shuō)：“人們?yōu)檫@些探測(cè)器提供了大量數(shù)據(jù)，但是回報(bào)卻在減少?！? “您不能從任何角度和每種情況下查看一個(gè)對(duì)象。我們希望這個(gè)新的數(shù)據(jù)集將產(chǎn)生強(qiáng)大的計(jì)算機(jī)視覺(jué)，而不會(huì)在現(xiàn)實(shí)世界中造成令人驚訝的故障?！?/p>

注：本文編譯自外網(wǎng)

免責(zé)聲明：本站所使用的字體和圖片文字等素材部分來(lái)源于互聯(lián)網(wǎng)共享平臺(tái)。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無(wú)意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請(qǐng)聯(lián)系我們，本站核實(shí)后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟(jì)賠償！敬請(qǐng)諒解！

上一篇

5000張人臉信息網(wǎng)上10元賣出，刷臉支付還安全嗎？
下一篇

需要及時(shí)安裝使用的商鋪專用火災(zāi)報(bào)警器

您可能也喜歡這些文章

參與評(píng)論

回復(fù)：

0/300

文明上網(wǎng)理性發(fā)言，評(píng)論區(qū)僅供其表達(dá)個(gè)人看法，并不表明a&s觀點(diǎn)。

0

推薦專題

熱門排行

關(guān)于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團(tuán)旗下的專業(yè)媒體平臺(tái)，自1994年品牌成立以來(lái)，一直專注于安全&自動(dòng)化產(chǎn)業(yè)前沿產(chǎn)品、技術(shù)及市場(chǎng)趨勢(shì)的專業(yè)媒體傳播和品牌服務(wù)。從安全管理到產(chǎn)業(yè)數(shù)字化，a&s傳媒擁有首屈一指的國(guó)際行業(yè)展覽會(huì)資源以及豐富的媒體經(jīng)驗(yàn)，提供媒體、活動(dòng)、展會(huì)等整合營(yíng)銷服務(wù)。

全球網(wǎng)站
法蘭克福
asmag.com
asmag.com.cn
中國(guó)臺(tái)灣智慧安防網(wǎng)

微信

a&s官方微信
QQ
微博
百家號(hào)
頭條號(hào)
知乎號(hào)

免責(zé)聲明：本站所使用的字體和圖片文字等素材部分來(lái)源于互聯(lián)網(wǎng)共享平臺(tái)。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無(wú)意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請(qǐng)聯(lián)系我們，本站核實(shí)后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟(jì)賠償！敬請(qǐng)諒解！

粵公網(wǎng)安備 44030402000264號(hào)

用戶
反饋

久久久18,天天躁夜夜躁狠狠躁婷婷,国产成人三级一区二区在线观看一,最近的2019中文字幕视频 ,最新免费av在线观看

物體識(shí)別數(shù)據(jù)集顛覆了世界上最好的計(jì)算機(jī)視覺(jué)模型