最新一期權(quán)威大模型榜單:豆包1.5、商湯日日新V6并列國(guó)內(nèi)第 一
分享
5月28日,權(quán)威大模型測(cè)評(píng)機(jī)構(gòu)SuperCLUE《中文大模型基準(zhǔn)測(cè)評(píng)2025年5月報(bào)告》全新出爐!
豆包1.5·深度思考模型(Doubao-1.5-thinking-pro)和商湯日日新 V6多模態(tài)模型(SenseNova-V6 Reasoner)共同摘得金牌,超越Gemini 2.5 Flash Preview,在國(guó)內(nèi)大模型第 一梯隊(duì)領(lǐng)跑。
位居第二梯隊(duì)的大模型包括DeepSeek-R1、NebulaCoder-V6、Hunyuan-T1以及DeepSeek-V3。
來(lái)自SuperCLUE
報(bào)告指出,國(guó)內(nèi)外第 一梯隊(duì)大模型在中文領(lǐng)域的通用能力差距正在縮小。在國(guó)產(chǎn)大模型中,Doubao-1.5-thinking-pro-250415、SenseNova V6 Reasoner表現(xiàn)最為亮眼。國(guó)內(nèi)推理模型競(jìng)爭(zhēng)格局初露端倪。
SuperCLUE是行業(yè)權(quán)威的通用大模型的綜合性測(cè)評(píng)基準(zhǔn)。本次2025年5月報(bào)告聚焦通用能力測(cè)評(píng),涵蓋數(shù)學(xué)推理、科學(xué)推理、代碼生成、智能體Agent、精確指令遵循、文本理解與創(chuàng)作六大任務(wù),總量為1579道多輪簡(jiǎn)答題。
特別提醒:本網(wǎng)信息來(lái)自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。本站不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。如若本網(wǎng)有任何內(nèi)容侵犯您的權(quán)益,請(qǐng)及時(shí)聯(lián)系我們,本站將會(huì)在24小時(shí)內(nèi)處理完畢。
0人已贊
關(guān)注我們


