直擊2024 GTC,NVIDIA數(shù)字人技術讓AI角色栩栩如生!
3月19日,備受全球科技愛好者矚目的 2024 GTC 大會正式開幕,來自全球的科技從業(yè)者共襄盛舉,為推動 AI 發(fā)展協(xié)力前行。

會上,NVIDIA 表示領先的AI應用開發(fā)者正使用 NVIDIA 數(shù)字人技術,為商業(yè)應用和動態(tài)游戲角色創(chuàng)建栩栩如生的化身。

以 AI 驅動的 NVIDIA 數(shù)字人技術包括——用于語音和動畫的 NVIDIA ACE (NVIDIA Avatar Cloud Engine) 、用于語言功能的 NVIDIA NeMo? 以及用于光線追蹤渲染的 NVIDIA RTX?。
不了解數(shù)字人技術?沒關系,接下來會進行詳細介紹:
● NVIDIA ACE — 可幫助開發(fā)者通過由NVIDIA Audio2Face?驅動的面部動畫以及由NVIDIA Riva自動語音識別(ASR)和文本轉語音(TTS)驅動的語音交流,讓數(shù)字人栩栩如生。ACE 微服務非常靈活,允許模型根據(jù)本地 GPU 的性能在云端和 PC 上運行,以確保用戶獲得最 佳體驗。
● NVIDIA NeMo — 一個端到端平臺,可幫助開發(fā)者提供企業(yè)級的生成式AI模型,包括精確的數(shù)據(jù)管護、先進的模型個性化定制、檢索增強生成和加速性能。
● NVIDIA RTX — RTX全局光照 (RTXGI) 和 DLSS 等渲染技術的集合,可在游戲和應用中實現(xiàn)實時路徑追蹤。對創(chuàng)作者來說,NVIDIA RTX 能帶來實時照片級渲染和AI增強圖形。
開發(fā)者能通過以上技術,創(chuàng)建能進行 AI 驅動的自然語言交互的數(shù)字人,并應用與游戲、設計、醫(yī)療、科研等多個領域。

現(xiàn)在,數(shù)字人能擁有更復雜的動畫和更擬真的對話,互動的真實感得到了極大的增強。目前,應用成果已經(jīng)在 Inworld AI、Hippocratic AI、UneeQ 等公司的技術Demo中得到展示。
Inworld AI引擎采用多模態(tài)方法來展示非玩家角色(NPC),將認知、感知和行為系統(tǒng)集成在一起,在精心制作的環(huán)境中呈現(xiàn)令人驚嘆的 RTX 渲染角色,以實現(xiàn)身臨其境的敘事效果。

Inworld AI引擎集成NVIDIA Riva 和NVIDIA Audio2Face,前者可實現(xiàn)精確的語音轉換文字,后者可提供逼真的面部表情。

Inworld AI公司首席執(zhí)行官Kylan Gibbs表示:“NVIDIA ACE微服務與Inworld引擎的結合使開發(fā)者能創(chuàng)建可以推動動態(tài)敘事的數(shù)字化身,為玩家解密、推理和玩游戲開辟全新可能性?!?/p>

Hippocratic AI 已打造了一個以安全為重點、由 LLM 驅動、針對特定任務的醫(yī)療代理。該代理可給患者打電話、跟進護理協(xié)調(diào)任務、提供術前指導、執(zhí)行出院后管理等,展示了生成式AI醫(yī)療數(shù)字人的潛力。

UneeQ是一個自主數(shù)字人平臺,專門為客戶服務和互動應用創(chuàng)建AI驅動的化身。它的數(shù)字人在線代表品牌與客戶實時溝通,增強客戶購買信心。UneeQ 將NVIDIA Audio2Face 微服務集成到其平臺中,并將其與 Synanim ML相結合,以創(chuàng)建高度逼真的數(shù)字人,從而獲得更好的客戶體驗和參與度。
現(xiàn)在,全球游戲發(fā)行商正評估 NVIDIA ACE 如何改善游戲體驗。其他行業(yè)諸如醫(yī)療、金融服務、媒體娛樂以及零售行業(yè)的開發(fā)者都在使用 ACE,嘗試用 AI 提升效率及服務體驗。

有關 NVIDIA ACE 的更多信息,請訪問 https://developer.nvidia.com/ace ,平臺開發(fā)者可將數(shù)字人交互技術套件或單個微服務整合到他們的產(chǎn)品中。
總結來說,在2024 GTC大會中,我們看到了加速計算、生成式AI及機器人領域的最 新突破性成果。

近年來,大批AI應用的涌現(xiàn),推動了整個行業(yè)迅速發(fā)展。我們能看到各種大模型正以前所未有的速度進行迭代。這一趨勢,也吸引了許多還沒入門的用戶主動去了解AI、運用AI。

為了更好地普及 AI 知識,讓更多的使用者和開發(fā)者了解 AI、運用 AI,NVIDIA 官方還推出了每月一更的專欄——《解碼AI》系列欄目,感興趣的小伙伴可以通過 NVIDIA 官網(wǎng)或微博賬號@英偉達GeForce 獲取最 新的資訊。
而對于普通用戶來說,可以通過最 新的 GeForce RTX 40 系列顯卡,進行 AI 應用的探索及體驗。

推薦使用索泰 GeForce RTX 4090 D PGF,這款顯卡擁有14592個CUDA流處理器、以及24GB的GDDR6X高速顯存,算力基礎十分強悍。

其搭載 TSMC 4N 工藝制成的 GPU 芯片,內(nèi)嵌有專為 AI 優(yōu)化而生的第四代 Tensor core,不僅能針對 AI 繪圖、游戲畫面進行專門的 AI 優(yōu)化,還能應用本地大語言模型——Chat with RTX。
對于開發(fā)者來說,NVIDIA 的 CUDA 指令集也很大程度上提高了開發(fā)者的效率,GeForce RTX 4090 D PGF 支持NVIDIA的CUDA-X軟件堆棧。

此外,GeForce RTX 4090 D PGF 還適用于需要高質(zhì)量圖形和視頻處理的中等規(guī)模 AI 訓練和推理工作負載。支持諸如 TensorFlow、PyTorch、MXNet、Caffe2 等多個深度學習框架,為 AI 應用開發(fā)提供了超強的適配和優(yōu)化。
隨著數(shù)字人技術的發(fā)展,我們在不久的將來就能看到——游戲中智能 NPC 到處跑,生活中虛擬數(shù)字人隨處見的場景了。

快跟上 AI 時代,從使用 GeForce 顯卡打造專屬于你的 AI PC 開始!
關注我們


