優(yōu)異AI挑戰(zhàn)賽落幕 阿里達(dá)摩院奪冠
過去,AI走向落地需要大量樣本數(shù)據(jù)進(jìn)行訓(xùn)練。記者獲知,阿里達(dá)摩院AI團(tuán)隊(duì)正在解決這一難題。在即將落幕的人工智能頂會(huì)ECCV 2020上,達(dá)摩院AI團(tuán)隊(duì)獲三項(xiàng)全球挑戰(zhàn)賽冠軍,并對(duì)外展示全新算法方案,在訓(xùn)練集規(guī)模縮減到十五分之一,長尾類目最少僅出現(xiàn)6次的情況下,依然保證了AI訓(xùn)練結(jié)果的準(zhǔn)確性,該研究成果將大幅降低AI數(shù)據(jù)標(biāo)注成本。
ECCV全稱歐洲計(jì)算機(jī)視覺國際會(huì)議,每兩年舉辦一次,是計(jì)算機(jī)視覺三大優(yōu)異會(huì)議之一。在ECCV 2020上,AI挑戰(zhàn)賽Visual Inductive Priors備受關(guān)注,該比賽今年領(lǐng)先次舉辦,因提供訓(xùn)練樣本數(shù)很少、類目分布極不均衡,堪稱“AI界極限挑戰(zhàn)”。比賽旨在鼓勵(lì)業(yè)界提升AI神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)效率,降低傳統(tǒng)數(shù)據(jù)標(biāo)注成本及計(jì)算能耗。
在該挑戰(zhàn)賽分割賽道上,比賽數(shù)據(jù)MiniCity基于經(jīng)典城市數(shù)據(jù)集Cityscape抽取,僅含200張樣本圖片,包含19個(gè)類別,最頭部類目“道路”包含像素?cái)?shù)為最尾部類目“電車”427倍,“電車”類目總共僅出現(xiàn)6次,且多次在復(fù)雜環(huán)境中被遮擋或難以辨別。比賽要求參賽團(tuán)隊(duì)在4個(gè)月內(nèi),從零完成對(duì)深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,測(cè)試時(shí)要求識(shí)別100張1024*2048圖片中每一個(gè)像素對(duì)應(yīng)類目。達(dá)摩院AI團(tuán)隊(duì)融合對(duì)長尾類目多級(jí)cutmix的數(shù)據(jù)增強(qiáng)算法、層次多尺度注意力機(jī)制及層次級(jí)聯(lián)解碼結(jié)構(gòu),在2周內(nèi)完成任務(wù),識(shí)別成績排名世界領(lǐng)先,超出基準(zhǔn)線50%以上。
△長尾類目“電車”在比賽數(shù)據(jù)集中僅出現(xiàn)6次,且多次被遮擋或難以辨別
達(dá)摩院視覺AI團(tuán)隊(duì)專家陳偉濤表示,新技術(shù)方案能大幅提升AI學(xué)習(xí)小樣本數(shù)據(jù)的效果,在視覺領(lǐng)域有廣闊的普適性應(yīng)用前景。目前,該技術(shù)已應(yīng)用到阿里遙感AI項(xiàng)目中,解決了識(shí)別水利設(shè)施變化、海岸線變化等特定復(fù)雜場景時(shí)圖像樣本過少的難題。
在ECCV 2020上,達(dá)摩院還獲得了混合虛擬與真實(shí)數(shù)據(jù)樣本的VISDA挑戰(zhàn)賽、多目標(biāo)追蹤領(lǐng)域TAO挑戰(zhàn)賽冠軍。
關(guān)注我們



