第一!醫(yī)渡科技大模型登頂上海AI實驗室權(quán)威評測榜
2024-05-10
5月9日,面向中文醫(yī)療大語言模型的開放評測平臺MedBench更新評測榜單,醫(yī)渡科技大模型(評測名:HH-YIDU-Med)以綜合得分61.3分的出色成績登頂榜首,成為榜單中首個綜合評分超過60的醫(yī)療大模型。
MedBench評測榜單節(jié)選
MedBench是由上海AI實驗室和上海市數(shù)字醫(yī)學創(chuàng)新中心推出的權(quán)威評測平臺,依托頂級醫(yī)療機構(gòu)的專家經(jīng)驗和知識儲備,設(shè)置了醫(yī)學語言理解、醫(yī)學語言生成、醫(yī)學知識問答、復雜醫(yī)學推理和醫(yī)療安全和倫理等5大維度,共包含15項任務、20個數(shù)據(jù)集及30萬道題目,為中文醫(yī)療大模型提供客觀科學的性能評測參考。
MedBench榜單評測維度
醫(yī)療行業(yè)因其獨有的專業(yè)度和嚴謹性,對醫(yī)療大模型的能力提出了極高要求。盡管GPT-4已經(jīng)在通用大模型領(lǐng)域取得了顯著的突破,但由于醫(yī)療文本和知識的特殊性,即使是GPT-4在處理醫(yī)療場景的真實問題時,如果未經(jīng)專門訓練也無法取得很好的成績。醫(yī)渡科技大模型在醫(yī)學知識問答、醫(yī)學語言理解、醫(yī)療安全和倫理三大關(guān)鍵維度中都拔得頭籌,充分展現(xiàn)了其在專業(yè)性、理解力、邏輯性和安全性等方面的醫(yī)療專業(yè)實力。
作為國內(nèi)醫(yī)療智能行業(yè)的頭部企業(yè),醫(yī)渡科技在醫(yī)療智能領(lǐng)域深耕近10年,其“醫(yī)療智能大腦”YiduCore經(jīng)授權(quán)處理分析了超過40多億份醫(yī)療記錄,沉淀了大量多維度可量化的知識圖譜。醫(yī)渡科技大模型的構(gòu)建不僅基于對大量臨床實踐指南、醫(yī)學文獻的篩選治理,還應用自研的數(shù)據(jù)生成技術(shù),將多年實踐積累的知識圖譜用于大模型訓練,從而顯著提升了模型在醫(yī)學領(lǐng)域的專業(yè)性能和準確性,增強了大模型生成內(nèi)容的真實性和可解釋性。
醫(yī)渡科技大模型的優(yōu)秀表現(xiàn),得益于公司在醫(yī)療知識和知識圖譜方面的積累,也離不開其在模型架構(gòu)和算法方面的不斷創(chuàng)新。醫(yī)渡科技具備從硬件組網(wǎng)到訓練微調(diào)、推理的完整技術(shù)能力,國內(nèi)外主流芯片軟硬件全棧適配。并且自研了針對醫(yī)療數(shù)據(jù)特點的專利技術(shù),進一步提升了模型在醫(yī)學語言理解、醫(yī)療安全等方面的專業(yè)能力。此外,醫(yī)渡科技還采用了數(shù)據(jù)增強和對抗訓練等技術(shù),以提升模型的魯棒性。
作為“醫(yī)療大腦”YiduCore的核心算法,醫(yī)渡科技大模型為醫(yī)療健康產(chǎn)業(yè)各應用場景提供易使用、高質(zhì)量、可定制的強大賦能。面向B端,醫(yī)渡科技大模型能夠利用強大的專業(yè)能力助力“醫(yī)、教、研、管”等場景各個環(huán)節(jié)提質(zhì)增效,公司原有的數(shù)據(jù)治理、醫(yī)院管理、臨床科研、臨床診療等多個場景的解決方案都基于大模型技術(shù)進行了升級;面向C端用戶,醫(yī)渡科技大模型提供專業(yè)醫(yī)學級別的個性化服務,包括報告解讀、健康問答、導診咨詢等等。目前醫(yī)渡科技大模型正由大語言模型向多模態(tài)大模型升級,從而滿足更多場景的應用需求。
此次登頂MedBench評測榜,醫(yī)渡科技大模型從理解生成“基礎(chǔ)”能力,到復雜推理“進階”能力,再到倫理把控“高級”能力的模型性能都得到了驗證和肯定。醫(yī)渡科技表示,目前取得的成績只是一個開始,醫(yī)療大模型還有很長的路要走。公司將繼續(xù)穩(wěn)步前行,不斷突破創(chuàng)新,以實現(xiàn)醫(yī)療人工智能的更大潛力,推動大模型技術(shù)向更高水平發(fā)展,實現(xiàn)大模型技術(shù)在多領(lǐng)域場景下的滲透和應用,加速推動醫(yī)療行業(yè)的智能化轉(zhuǎn)型升級。
本文為原創(chuàng)內(nèi)容,僅供知識分享之目的,若存在侵權(quán)行為或疏漏,請與本平臺聯(lián)系,我們將及時處理。如需轉(zhuǎn)載請后臺留言,需征得本平臺同意且注明來源轉(zhuǎn)載。