微鯨科大訊飛 出門問問合作 TA的語音功能怎么樣?
首先科大訊飛成立于1999年,近二十年的科技研發(fā)和技術(shù)積累讓其成為中國最大的智能語音技術(shù)提供商,在智能語音技術(shù)領(lǐng)域有著長期的研究積累,并在中文語音合成、語音識別、口語評測等多項技術(shù)上擁有國際領(lǐng)先的成果。
而出門問問成立于2012年,相比于科大訊飛來說實在是太年輕了,但是谷歌投資了這家中國人工智能公司。擁有自主研發(fā)的語音識別、語義分析、垂直搜索、基于視覺的ADAS和機器人SLAM等核心技術(shù)。
其實,在此之前,出門問問在業(yè)內(nèi)已經(jīng)小有名氣。微鯨電視已經(jīng)和出門問問達成了技術(shù)合作,致力于智能語音的開發(fā)。當(dāng)然,微鯨不光光是與出門問問合作,和科大訊飛及微軟都有語音技術(shù)方面的合作。
訊飛將語音技術(shù)授權(quán)給第三方使用,相當(dāng)于給對方一個黑盒,它里邊操作什么都不知道,技術(shù)不可控。微鯨電視的系統(tǒng)團隊選擇自己做了一個語音引擎,并且引入多個合作型的語音商,目前引入了三個,出門問問、百度度秘、驀然?,F(xiàn)在對接的正是出門問問。
新的語音引擎將會幫助微鯨電視實現(xiàn):
1、語音識別率的提高,這個歸功于ai服務(wù)提供商同微鯨的大力合作,問問基于微鯨遙控器的聲學(xué)模型重新訓(xùn)練了它的語音識別模型,而不是想一代用的一個公用模型,這相當(dāng)于定制西裝,非常合身。
2、語義理解的準(zhǔn)確率提升,這個提升主要是歸功于雙方在媒資庫云端同步,讓問問能夠準(zhǔn)確的識別到最新的內(nèi)容名字,而原來是采用的一個月同步一次,最新的電影或綜藝節(jié)目不能馬上被老方案識別,這個影響還是很大的。
3、語義服務(wù)速度提升以及自身搜索能力的提升,用戶從說話完到內(nèi)容完全呈現(xiàn),從原來的2秒多到現(xiàn)在的1秒多,提高差不多60%,這個節(jié)省用戶等待時間,體驗較第一代有很大的提升,真正的1秒召喚。
微鯨電視不光是在智能語音方面不斷的做嘗試以達到更好的用戶體驗效果,他們的技術(shù)團隊還在不斷開發(fā)適用于生活場景的實用性功能,目前已經(jīng)上線的QQ視頻通話就受到了廣泛的關(guān)注。
用戶使用這項功能,可以全家人做在沙發(fā)上面對電視和另一端的人進行視頻通話,不需要一直按住藍牙遙控器的語音鍵,只需要將遙控器放在身邊即可。大屏通話,輕松面對面。
這個功能實現(xiàn),在音頻通訊方面是依賴騰訊開發(fā)的QQ視頻通話軟件,目前只授權(quán)給了海信和微鯨兩家,另一方面是微鯨在本地音頻的采集和播放方面有很強的技術(shù)實力,在騰訊排名的14家第三方播放器中,微鯨自主開發(fā)的神奇播放器,用戶體驗排第一。還要得益于新的藍牙語音遙控器架構(gòu)的引進,微鯨將繼續(xù)用這個新的架構(gòu)開發(fā)卡拉OK等功能。
注:本文觀點僅代表作者本人觀點,與本網(wǎng)站無關(guān),本網(wǎng)站亦不對其真實性負責(zé)?!?/p>
關(guān)注我們
