JDD大賽獲獎團隊專訪:京東金融是我們最需要的平臺
12月17日,首屆“JDD-2017京東金融全球數(shù)據(jù)探索者大賽”算法組全球總決賽和商業(yè)組中國區(qū)決賽落下帷幕。算法組四大賽題冠軍分別是啦啦隊(登錄行為識別)、小虎隊(信貸需求預(yù)測)、百變豬豬俠(豬臉識別)、小麻貓(店鋪銷量預(yù)測),進擊的巨豬、翔創(chuàng)科技和熵商科技分獲商業(yè)組中國賽區(qū)冠、亞、季軍。五支冠軍團隊均獲得了創(chuàng)下國內(nèi)AI賽事新紀錄的30萬元獎金。同時,獲獎團隊也贏得了加入京東金融的機會,可以讓自己的數(shù)據(jù)和AI能力得到更好的發(fā)揮。
賽后,我們有幸采訪到了本次JDD大賽商業(yè)組和算法組的獲獎團隊,作為參賽選手中的佼佼者們,他們對本次JDD大賽,以及數(shù)據(jù)探索領(lǐng)域發(fā)表了非常重要的看法。
商業(yè)組季軍-熵商科技隊:京東金融強大的數(shù)據(jù)支持能讓我們創(chuàng)造奇跡
雖然這是JDD的第一屆比賽,但是京東金融給我們的算法提供了強有力的模型支撐,讓我們認識到正在做的項目可以真正的去落實,而不是停留在算法的表面。來參加這次比賽并且拿到了獎,也從側(cè)面證實了我們的實力。
做海歸貸這個產(chǎn)品,也是因為我們看到了背后潛在的商業(yè)潛力。目前大環(huán)境下海歸回國發(fā)展是大趨勢,我們?yōu)楹w打造了一個專屬社區(qū),有組織很多的線下的活動,引入很多的海龜組織,這個社群在不斷的壯大的過程中,給我們帶來了很多用戶的群體,同時又能將利率做到比較低的程度,這就是我們的優(yōu)勢所在,將來希望能和京東金融展開更加深度的合作。
商業(yè)組亞軍-翔創(chuàng)科技隊:一心一意做一個項目 團隊的力量是獲獎的關(guān)鍵
大家都知道只要設(shè)定了一個團隊成員都想努力實現(xiàn)的目標,排除其它干擾后往往就能事半功倍。 豬臉識別是我們公司目前唯一在做的業(yè)務(wù),10個員工從3月份開始采集數(shù)據(jù)、設(shè)計商業(yè)模型,現(xiàn)在模型基本完成,正處于技術(shù)試點的階段。
到目前為止我們還沒有進行融資,希望完成產(chǎn)品的驗證后再進行融資。我們希望應(yīng)用能真正的落地,有真正的商業(yè)需求,有付費買單的客戶。我們發(fā)現(xiàn)的牲畜作為可抵押的信貸模式,這個模式確實要2-3年才有可能完全覆蓋,產(chǎn)生大量的收入,這個是非常大的市場。我們對自己的項目很有信心,這次拿獎后可以說是更加自信了。
商業(yè)組冠軍-進擊的巨豬隊:心態(tài)放松,準備充分、臨危不亂
我們團隊三個人都是在校的學(xué)生,這次能在一起組成團隊本來就很有緣分。奪冠的原因我想是因為合作很融洽,時間剛剛好,該做的都做到位了,運氣很不錯,各方面得到很多人的幫助,沒有走彎路,當(dāng)然我們?nèi)齻€人也是非常的努力。這次比賽也沒有很多人想象中的黑箱操作,足夠公平、客觀。
我們的初賽其實做的是人臉識別,因為機器學(xué)習(xí)其實已經(jīng)從手工特征向一種自動特征轉(zhuǎn)變了,在深度學(xué)習(xí)的概念下,機器在認識人和豬的時候都是自動提取的,對機器而言沒有差別。其實算法組冠軍出來后我也跟他們交流,都是利用一些現(xiàn)有的學(xué)術(shù)上性能非常好的模型,對它稍微加以改進就可以了。
這次參加JDD比賽,也是想看看像京東這樣的新時代IT巨頭到底是如何運作的,在它的內(nèi)部食堂,員工,真正地來感受一下,如果我真的入職一家像這樣的大企業(yè)的話,會有什么樣的生活,對未來有一些憧憬。
信貸需求預(yù)測算法組冠軍-小虎隊:拿到冠軍靠的是平時的積累
感謝京東金融給了我們這次比賽的機會,拿到第一個冠軍后很興奮,以后要專心把這個項目做下去,然后看看能否有一個工作機會。我們團隊三個人都比較有實力,也有很多參賽經(jīng)驗,積累的不少,所以這次得到冠軍也是意料之中。、
豬臉識別算法組冠軍-百變豬豬隊:兩種算法相結(jié)合讓我們拿到冠軍
我們的核心算法是深度學(xué)習(xí),現(xiàn)在圖像應(yīng)用非常廣泛。豬臉識別涉及到圖像領(lǐng)域的兩個算法,一個是物體檢測,一個是圖像識別。物體檢測需要定位出這張圖片豬在哪里,圖像識別需要這頭到底是哪頭,我們把這兩種算法都進行了實現(xiàn),所以最終效果要比其他團隊要好。
登錄行為識別算法組冠軍-啦啦隊:發(fā)現(xiàn)有用的特征是最大挑戰(zhàn)
登錄識別牽扯到應(yīng)用識別分析的算法,最困難的還是發(fā)現(xiàn)比較有用的特征,我們對那些特征做一些分類,比如一個IP,一個ID,或者一個CT,歷史長期的行為,短期的行為,以及跟它近似的。我們也做一些CT,IT,做一個聚類,比如以前有過一個ID在這些CD,有一些行為,可能也是異常的異常庫,我們想得比較全,所以最后結(jié)果比較好。
我們隊在特征上做到了極致,最后我們在模型上不需要做事情了就領(lǐng)先很多了,在數(shù)據(jù)挖掘中,數(shù)據(jù)大于(MODO),數(shù)據(jù)量一定的情況下應(yīng)該去找特征,這樣才能獲得最大的收益。
關(guān)注我們
