生成式AI進(jìn)入下一階段,高通在MWC上海指出AI發(fā)展新趨勢(shì)
6月18日,GSMA 2025 MWC上海正式拉開帷幕。本屆為期三天的盛會(huì)在上海新國(guó)際博覽中心(SNIEC)舉行,匯聚約400位演講嘉賓與思想領(lǐng)袖,帶來主旨演講、峰會(huì)論壇及前沿技術(shù)展示等精彩內(nèi)容。今年大會(huì)圍繞四大核心主題展開:5G融合、人工智能+、行業(yè)互聯(lián)與賦能互聯(lián)。
在大會(huì)首日的代理式人工智能峰會(huì)上,高通技術(shù)公司AI/生成式AI產(chǎn)品管理副總裁Vinesh Sukumar博士指出,AI發(fā)展正在進(jìn)入全新階段,AI發(fā)展重心正在向邊緣終端轉(zhuǎn)移。當(dāng)前,AI正在向智能體AI領(lǐng)域轉(zhuǎn)型,高通相信AI將成為新的UI,并覆蓋廣泛終端。與此同時(shí),為實(shí)現(xiàn)這一愿景,高通公司已經(jīng)構(gòu)建了覆蓋廣泛邊緣終端的硬件和軟件技術(shù),為智能體AI體驗(yàn)在終端側(cè)的發(fā)展打造了堅(jiān)實(shí)基礎(chǔ)。
以下為演講全文:
大家下午好,我是Vinesh Sukumar。在高通,我們主要致力于在感知AI、生成式AI、智能體AI以及物理AI(Physical AI)等領(lǐng)域,賦能從手機(jī)到汽車等不同終端實(shí)現(xiàn)激動(dòng)人心的AI體驗(yàn)。今天我們要討論生成式AI,高通在中國(guó)和全球AI產(chǎn)業(yè)生態(tài)中扮演的重要角色,以及我們將在不久的將來推出的一些激動(dòng)人心的體驗(yàn)。
那么首先,縱觀AI的發(fā)展歷程,早期AI技術(shù)主要集中在分割、檢測(cè)、分類、圖像增強(qiáng)等感知AI領(lǐng)域,這些技術(shù)為賦能智能手機(jī)體驗(yàn)奠定了基礎(chǔ)。但隨著時(shí)間的推移,這些體驗(yàn)也發(fā)生了很大的演變,類似技術(shù)也擴(kuò)展到了汽車、PC等市場(chǎng),以及XR和工業(yè)網(wǎng)絡(luò)等新興領(lǐng)域。在這些領(lǐng)域中,我們都在探討從感知數(shù)據(jù)到多模態(tài)數(shù)據(jù)的轉(zhuǎn)變,多模態(tài)數(shù)據(jù)可以是文本、圖像或視頻形式,且全部都基于提示(prompt)生成。我們將這些技術(shù)匹配到不同的應(yīng)用賽道上,從而幫助在生產(chǎn)力、游戲甚至內(nèi)容生成領(lǐng)域打造全新的用戶體驗(yàn)。而在高通,我們正在將這些知識(shí)積累應(yīng)用到所有相關(guān)領(lǐng)域。
正如我之前提到的,高通非常重視生成式AI和智能體AI。實(shí)際上我們是最早展示大模型可以完全在邊緣運(yùn)行的芯片平臺(tái)廠商之一,早在2023年的MWC巴塞羅那上我們就演示了在端側(cè)基于提示生成對(duì)話內(nèi)容,或基于提示生成1K x 1K分辨率的圖像。
那AI未來的發(fā)展方向如何呢?在高通,我們非常重視與眾多的模型開發(fā)者合作,致力于推動(dòng)大型基礎(chǔ)模型向更加垂直行業(yè)或任務(wù)專用型模型轉(zhuǎn)變,并助力實(shí)現(xiàn)邊緣終端運(yùn)行。這些行業(yè)專用模型可能會(huì)非常龐大,參數(shù)量可能達(dá)到70-100億,我們已經(jīng)開始推動(dòng)這些模型在不同形態(tài)的終端上運(yùn)行。
在模型領(lǐng)域,過去人們通常認(rèn)為更大的模型意味著更好的質(zhì)量,但縱觀大模型的發(fā)展過程,從通義千問、Meta、Google或微軟推出的模型中可以看出,小模型的質(zhì)量正在快速提升并追趕大模型的能力。以模型智能指數(shù)對(duì)比為例,眾多的小語言模型(SLM)已經(jīng)達(dá)到了Llama 3 700億參數(shù)大模型的水平。
為何邊緣模型正在變得愈發(fā)重要和關(guān)鍵呢?它們能夠在生產(chǎn)力或內(nèi)容創(chuàng)作領(lǐng)域?yàn)橛脩籼峁┴S富的體驗(yàn)。過去,模型會(huì)面臨如何真正實(shí)現(xiàn)終端側(cè)部署的挑戰(zhàn)。針對(duì)這一挑戰(zhàn),高通提供了高通AI軟件棧,能夠支持模型完全在邊緣平臺(tái)部署。我們始終致力于為包括開發(fā)者在內(nèi)的生態(tài)系統(tǒng)合作伙伴提供機(jī)會(huì),讓應(yīng)用能夠?qū)崿F(xiàn)云端訓(xùn)練,并在高通平臺(tái)賦能的終端上運(yùn)行。
在過去的12到18個(gè)月里,我們?cè)谶吘堿I領(lǐng)域?qū)崿F(xiàn)了諸多關(guān)鍵用例的商業(yè)化應(yīng)用。過去,高通每年賦能大約200到300個(gè)AI應(yīng)用。在過去的12個(gè)月左右,我們更加重視生成式AI領(lǐng)域。在消費(fèi)領(lǐng)域,邊緣AI已經(jīng)能夠支持內(nèi)容創(chuàng)作、照片編輯、圖像修復(fù)、圖像擴(kuò)展等諸多應(yīng)用;在企業(yè)領(lǐng)域,還有代碼生成等更多應(yīng)用。這一切都是可行的,因?yàn)槲覀冊(cè)诨A(chǔ)技術(shù)構(gòu)建方面投入了大量精力,以確保這些應(yīng)用可以在各類終端上高效運(yùn)行且實(shí)現(xiàn)全面優(yōu)化。
在過去,生成式AI已經(jīng)帶來了諸多助力,但其僅支持單一模態(tài)。現(xiàn)在,我們正在向所謂的智能體AI領(lǐng)域轉(zhuǎn)型。我們相信,AI將成為新的UI(用戶界面),并覆蓋廣泛終端。
要如何實(shí)現(xiàn)這一目標(biāo)?首先要看我們期望打造什么樣的用戶體驗(yàn)。為此,我們致力于融合多種數(shù)據(jù)模態(tài)。這些數(shù)據(jù)模態(tài)可能基于圖像、音頻、文本、語音甚至視頻。基于這些模態(tài)支持,我們可以理解用戶意圖,并匹配連接多個(gè)應(yīng)用以調(diào)用AI處理能力,從而滿足用戶需求。這就催生了AI智能體這個(gè)概念。智能體AI側(cè)重于解讀需求并采取行動(dòng),從而走向自動(dòng)化。實(shí)現(xiàn)智能體體驗(yàn)頗具挑戰(zhàn)性,但高通正在不斷強(qiáng)化基礎(chǔ)技術(shù)構(gòu)建,為這些智能體AI用例筑牢根基。
我們可以推動(dòng)包括娛樂、電商、禮賓服務(wù)、地圖導(dǎo)航甚至音樂等多種領(lǐng)域的智能體AI用例發(fā)展。為了實(shí)現(xiàn)這些目標(biāo),需要廣泛的邊緣側(cè)布局,能夠理解用戶需求且將其轉(zhuǎn)化為恰當(dāng)操作的強(qiáng)大軟件棧。
在將用戶意圖轉(zhuǎn)化為恰當(dāng)?shù)牟僮鲿r(shí),總會(huì)出現(xiàn)某一設(shè)備可能無法回答或響應(yīng)用戶查詢(query)的情況。這時(shí)如果用戶需要進(jìn)行設(shè)備間通信,我們可以通過高通AI軟件棧來實(shí)現(xiàn)。高通的產(chǎn)品覆蓋廣泛的邊緣終端,涵蓋從手機(jī)到PC、XR等多種產(chǎn)品形態(tài),因此這對(duì)我們來說更容易。此外,憑借在這些終端上收集到的海量用戶數(shù)據(jù),我們也能更成功地解讀用戶意圖并采取行動(dòng)。
智能體AI在進(jìn)行商用部署時(shí)也面臨許多挑戰(zhàn),比如智能體AI的準(zhǔn)確性、可預(yù)測(cè)性、一致性表現(xiàn)如何?它是否能夠精準(zhǔn)匹配用戶需求?為此,擁有必要的軟件棧支持至關(guān)重要。我們的高通AI軟件棧非常強(qiáng)大,經(jīng)過長(zhǎng)期技術(shù)積累,可以支持針對(duì)特定任務(wù)的多種小語言模型。
其次,要實(shí)現(xiàn)更好的服務(wù)質(zhì)量意味著當(dāng)用戶提出特定提示(prompt)時(shí),AI能夠以最快速度響應(yīng),這需要在硬件方面大力投入。為實(shí)現(xiàn)這一目標(biāo),高通打造了CPU、GPU等通用計(jì)算單元,以及Hexagon NPU這樣的專用加速器。
最后但同樣重要的是如何實(shí)現(xiàn)規(guī)模化擴(kuò)展,為開發(fā)者社區(qū)提供靈活性。這一關(guān)鍵在于提供必要的工具和軟件支持,使開發(fā)者可以更輕松適應(yīng)不同的環(huán)境和情況。
而我們已經(jīng)為這些需求打造了技術(shù)基礎(chǔ)設(shè)施。各位將在未來6個(gè)月內(nèi),看到更多來自高通公司的發(fā)布,我們將助力推出更豐富的面向消費(fèi)者的應(yīng)用,敬請(qǐng)關(guān)注。
前面我簡(jiǎn)要提到了該如何提高智能體AI的服務(wù)質(zhì)量,我們能夠做到這一點(diǎn),是因?yàn)槲覀儞碛懈咄℉exagon NPU這樣的專用引擎。作為一個(gè)專用引擎,它能夠支持矩陣運(yùn)算、張量運(yùn)算等任務(wù),這針對(duì)需要降低續(xù)航影響的持續(xù)型用例尤為重要。
現(xiàn)在,隨著我們向AI推理時(shí)代邁進(jìn),正如我一直在說的,我們總是會(huì)面臨邊緣平臺(tái)因性能受限而無法解決用戶查詢(query)的問題。在這種情況下,如何確保用戶體驗(yàn)不受影響?在高通,我們已經(jīng)將邊緣推理進(jìn)行了跨多個(gè)終端的分布式部署。如果某些查詢無法通過終端側(cè)算力解決,我們就轉(zhuǎn)而使用基于高通平臺(tái)的本地邊緣服務(wù)器來繼續(xù)查看、理解和回答查詢;如果本地邊緣平臺(tái)無法解決,AI會(huì)獲取用戶的上下文信息,然后將任務(wù)轉(zhuǎn)移到中央云子系統(tǒng),根據(jù)用戶的個(gè)人知識(shí)圖譜來處理查詢,然后給出更合理的回復(fù)。
非常感謝這次演講機(jī)會(huì),謝謝大家!
關(guān)注我們
