京東技術(shù)破局:“語音購物”重新定義電商
著名的互聯(lián)網(wǎng)預(yù)言家,凱文·凱利在今年的多個公開演講中,都談到了人工智能將會是未來社會格局的改變者。他甚至認為,人工智能有可能重新定義人類。
當然,這種理解本身并不是在渲染,人工智能對人類智能的超越,我相信凱文·凱利的意思是:人工智能的技術(shù),在重新定義人類的生活方式。想象空間是不是很大,比如購物?
實際上,作為一位叮咚(DingDong)智能音箱的用戶,我深刻體會過語音識別技術(shù)對固有生活方式的改變,當一位 “癱”在沙發(fā)上的消費者,習(xí)慣了用語音去操控音樂的播放,天氣的查詢等一些基本的人工智能應(yīng)用后,我們當然會希望得到的更多。
就像凱文·凱利在他的新書《必然》里總結(jié)的未來發(fā)展十二大趨勢中,所描述的幾個關(guān)鍵屬性一樣,認知(Cognitive)和互動(Interacting)正是代表著人工智能形成了新鮮的人機互動,而語音顯然要比按鍵、鼠標更為原始,更加真實。
那么,如果通過人工智能的技術(shù),讓語音購物成為新的應(yīng)用場景。這是不是可以重新定義,今天的電商呢?
京東正在打開這個腦洞
是的,京東現(xiàn)在正在打開這個腦洞。
最近,京東在人工智能領(lǐng)域又邁出了重要的一步——在中國領(lǐng)先的將語音技術(shù)、電商服務(wù)、人工智能技術(shù)以及智能硬件相結(jié)合,實現(xiàn)智能語音購物全流程體驗。已全面支持購物服務(wù)的叮咚(DingDong)智能音箱,有望成為萬物互聯(lián)時代京東購物的新入口。

語音購物實際上,是通過叮咚(DingDong)音箱為載體,使用簡單的語音指令來便捷查詢訂單狀態(tài)、物流相關(guān)信息,隨時知曉商品送達時間,查詢搜索用戶關(guān)注商品的優(yōu)惠、活動信息,輕松網(wǎng)羅京東的低價好物;同時,叮咚(DingDong)音箱還可根據(jù)用戶在京東商城的訂單記錄、關(guān)注瀏覽、用戶畫像等大數(shù)據(jù),為用戶個性化智能推薦商品。用戶可通過最快捷、最智能的語音交互下達確認購買的指令,方便高效地完成購物下單。
那么,語音購物的流程在技術(shù)上,有哪些關(guān)鍵點?我們逐一來解讀一下。
首先,需要從多個領(lǐng)域?qū)τ脩粽Z音輸入進行分析和理解,按照場景進行分類(購買商品,查詢訂單,點餐,知識問答等);然后更加深入的對輸入做細粒度的分析和理解,不僅要知道這是一個下單指令,還需要理解到用戶的購買需求。通過這兩方面技術(shù)結(jié)合達到多層次的精確語義理解。
其次,多輪對話能力。由于語義理解比一問一答的搜索技術(shù)要更復(fù)雜和困難,針對購物,音箱采用的AIUI技術(shù)可靈活的實現(xiàn)多輪人機交互,來了解用戶購物需求,從而幫助用戶快速選定商品并完成下單。由于,很多場景的對話是不能通過做一輪交互來完成的。所以,需要根據(jù)上下文、用戶的使用偏好和購買習(xí)慣做更為精準的引導(dǎo)和推薦,這種智能的應(yīng)答,一直是技術(shù)上的難點。
最后,是遠場識別技術(shù)。這個技術(shù)是基于硬件基礎(chǔ),目的是為了抑制用戶語音之外的噪聲和混響效應(yīng)。做到在95%以上的場景中可以有效地進行遠場拾音一直是個技術(shù)難點。而叮咚(DingDong)音箱則融入了科大訊飛的遠場識別技術(shù),讓語音購物的體驗得到保障。
我們知道,不久前,美國亞馬遜推出了Echo音箱,谷歌推出了Google Home。兩者均都瞄準了家庭入口的位置,而叮咚(DingDong)作為國內(nèi)率先上線語音購物功能的家庭助手,顯然已經(jīng)將入口布局更加深入。
這也是語音購物的意義所在,因為語音交互只是人機互動的第一步,而在叮咚(DingDong)音箱的背后,則是京東大數(shù)據(jù)、智能云平臺的優(yōu)勢整合,將先進的語音技術(shù)、自然語意理解、電商服務(wù)和創(chuàng)新硬件相結(jié)合,最終才演變成了語音購物這一應(yīng)用場景的誕生。
更適用于家庭場景的“主動”模式
毫無疑問,語音購物就是針對家庭的應(yīng)用場景的。
首先,必須承認,因為語音對條件的要求相對是比較苛刻的,噪音或者雜音對它的應(yīng)用會產(chǎn)生很大的影響。但是在家庭環(huán)境相對來說是比較可控一點的,所以家庭的場景是比較切合的。
其次,不同于雙11那種集中爆發(fā)式的購物,其實購物的本質(zhì)就是日常生活所需,比如說洗發(fā)水用完了,需要補充,或者家里的衛(wèi)生紙、油鹽醬醋需要購買,圍繞這些最基本的購物需求,完全可以直接通過語音購物來實現(xiàn)。
第三,家庭的應(yīng)用場景下,我們可能會同步進行不同的操作。比如,一邊看電視一邊掃地,或是一邊做飯,一邊聽歌。家庭的應(yīng)用場景中,這種同步的模式最為常見,也就是說我們會遇到很多無法面對顯示屏的應(yīng)用場景,這就為語音購物提供了鮮活的場景。比如,掃著地,通過語音購物的方式,完成對一瓶洗發(fā)水的購買。
本質(zhì)上,語音購物不是簡單“語音處理、理解技術(shù)”和“交易系統(tǒng)”簡單結(jié)合問題,而是需要針對語音的特殊場景,對基于屏幕的交互體驗流程進行相應(yīng)調(diào)整,以適應(yīng)語音購物場景。
過去,我們常談?wù)撝悄芗揖拥娜肟?,其實很多?yīng)用場景都是被動的。比如,對智能燈泡、空調(diào)、電視等家電的控制,每一個設(shè)備都渴望成為入口,所以標準林立,沒有誰希望主動被“控制”。
但是語音購物卻不一樣,購物的需求是客觀存在的,語音購物的應(yīng)用場景是從根本上,解決了無屏化購物的痛點。而我認為這種主動的方式,更容易讓用戶產(chǎn)生信任感和粘合性。從這個角度看,叮咚(DingDong)音箱,無疑已經(jīng)站在了行業(yè)的領(lǐng)導(dǎo)地位。
從語音購物看京東的人工智能格局
不久前,劉強東在京東未來12年的戰(zhàn)略規(guī)劃中提到,“京東會進一步走向開放,將已有的供應(yīng)鏈、數(shù)據(jù)、物流優(yōu)勢充分向社會開放,帶動全行業(yè)、全社會效率的進一步提升,成為中國商業(yè)零售領(lǐng)域基礎(chǔ)設(shè)施的提供商。同時,將通過AR/VR技術(shù)、深度學(xué)習(xí)、人工智能、機器人自動化等創(chuàng)新科技”。
事實上,劉強東已經(jīng)不止一次的談到京東在智能電商上的發(fā)展思路。而語音購物則可以看作是京東在利用人工智能技術(shù)改變電商的又一次有力的探索。
京東在利用人工智能技術(shù)推動電商轉(zhuǎn)型也是不遺余力。比如,加入了人工智能技術(shù)之后,可以做到自動尋址的無人機物流;基于場景化購物,融合門箱互拍、圖像識別、RFID識別、光譜分析等識別技術(shù)的智能冰箱;結(jié)合用戶畫像主動的進行關(guān)懷交流,從售前到售后對用戶體驗給予改善的JIMI機器人;利用京東大數(shù)據(jù)推出的動態(tài)定價和個性化推薦工具;利用圖形識別技術(shù)的拍照購;再有京東對VR購物的研發(fā)和創(chuàng)新,形成了京東整體,基于人工智能的布局。
所以,在語音這種交互方式背后,其實是京東人工智能技術(shù)的綜合體現(xiàn)。京東也將在人工智能,特別是自然語言的語義理解領(lǐng)域繼續(xù)深耕,將京東自有的強大電商優(yōu)勢與人工智能技術(shù)密切結(jié)合,為用戶提供更加簡單快樂的生活體驗。
從未來的想象空間看,京東未來將采用人工智能技術(shù),不斷提升語音交互的能力,創(chuàng)造更加自然、智能的交互體驗,以及深化京東大數(shù)據(jù)的應(yīng)用,為用戶提供更精準、更個性化的購物服務(wù)。另外,在叮咚(DingDong)上正在接入多樣的第三方服務(wù),未來打造開放服務(wù)平臺,讓用戶使用語音即可非常便捷的獲取各種各樣的服務(wù)。這也將是京東的又一個開放的平臺,未來的語音購物,不僅可以在叮咚上實現(xiàn),還可以在接入京東智能云的多種智能設(shè)備上來實現(xiàn)。
總體而言,小小的音箱背后是京東人工智能的大格局觀。正如劉強東的判斷一樣,“未來的零售將全面智能化”,而語音購物則像是一個支點,輕輕的撬動了現(xiàn)在與未來的平衡。
關(guān)注我們


