國內(nèi)首個通過主任醫(yī)師評測的大模型,已在夸克AI搜索上線
7月23日消息,夸克健康大模型成功通過中國 12 門核心學(xué)科的主任醫(yī)師筆試評測,成為國內(nèi)首個完成這一挑戰(zhàn)的大模型。目前,“主任級 AI 醫(yī)生”能力已全面集成至夸克的AI搜索中,用戶在查詢健康問題時,選擇深度搜索即可調(diào)用。
這是繼 5 月通過副主任醫(yī)師職稱考試后,夸克健康大模型能力的又一次躍升。在垂類模型與通用模型對比中,夸克健康大模型呈現(xiàn)出難度越高、領(lǐng)先優(yōu)勢越明顯的性能曲線,展現(xiàn)出在復(fù)雜醫(yī)學(xué)推理任務(wù)中的突破。
這揭示了在醫(yī)學(xué)領(lǐng)域研發(fā)垂類模型的巨大潛力??淇私】荡竽P鸵酝x千問為基礎(chǔ),走出了一條面向垂直場景的深度工程化路線?!拔覀儾皇窃谟?xùn)練AI回答醫(yī)學(xué)問題,而是在訓(xùn)練它學(xué)會醫(yī)學(xué)思維”,夸克健康算法負(fù)責(zé)人徐健說。
夸克健康大模型的核心突破之一,是構(gòu)建出“慢思考能力”。該能力融合了鏈?zhǔn)酵评砼c多階段臨床演繹路徑建模,驅(qū)動模型在面對復(fù)雜醫(yī)療問題時,能夠分階段、層層深入地推導(dǎo)出最終回答。
構(gòu)建慢思考能力的前提,是擁有高質(zhì)量推理訓(xùn)練數(shù)據(jù)。為此,夸克構(gòu)建了“雙數(shù)據(jù)產(chǎn)線 + 雙獎勵機(jī)制”的工程體系。一方面,將醫(yī)學(xué)數(shù)據(jù)劃分為“可驗(yàn)證”和“不可驗(yàn)證”兩類,分別對應(yīng)診斷類任務(wù)和健康建議類任務(wù);另一方面,在訓(xùn)練方法上引入“過程獎勵模型”和“結(jié)果獎勵模型”,分別評估模型推理鏈的合理性與最終結(jié)論的準(zhǔn)確性,顯著提升模型的臨床可解釋性和推理一致性。
該體系還設(shè)計(jì)了多階段強(qiáng)化學(xué)習(xí)流程,包括冷啟動數(shù)據(jù)的嚴(yán)格人工校驗(yàn)、多輪樣本篩選與難度遞進(jìn)訓(xùn)練策略,以及用于防止“高分投機(jī)”的作弊識別機(jī)制。通過真實(shí)醫(yī)生標(biāo)注、“問—思—答”整組數(shù)據(jù)驅(qū)動強(qiáng)化學(xué)習(xí),夸克健康大模型不僅學(xué)會了醫(yī)學(xué)知識,更掌握了醫(yī)學(xué)思維的路徑選擇、證據(jù)整合與多解平衡能力。底層的權(quán)威醫(yī)學(xué)知識庫確保了模型輸出內(nèi)容專業(yè)、及時。
安貞醫(yī)院心臟外科主任醫(yī)師謝進(jìn)生認(rèn)為,夸克在一些問題上回答專業(yè)度比專業(yè)醫(yī)生還要強(qiáng)。這一成果背后是專業(yè)醫(yī)師團(tuán)隊(duì)的深度參與。目前,夸克健康大模型擁有千人規(guī)模的專業(yè)醫(yī)師標(biāo)注團(tuán)隊(duì),其中超過400名均為副主任醫(yī)師及以上的高資歷醫(yī)療專家。
憑借在醫(yī)學(xué)領(lǐng)域的專業(yè)性,夸克AI搜索吸引了一大批醫(yī)學(xué)生和醫(yī)生群體??淇私】颠\(yùn)營負(fù)責(zé)人趙存忠介紹,目前平臺在全國醫(yī)學(xué)生中月活用戶已突破 200 萬,覆蓋率過半,他們廣泛使用夸克用于基礎(chǔ)知識搜索、考試備考和臨床輔助診療。
關(guān)注我們
