第一！醫(yī)渡科技大模型登頂上海AI實驗室權(quán)威評測榜

2024-05-10

5月9日，面向中文醫(yī)療大語言模型的開放評測平臺MedBench更新評測榜單，醫(yī)渡科技大模型（評測名：HH-YIDU-Med）以綜合得分61.3分的出色成績登頂榜首，成為榜單中首個綜合評分超過60的醫(yī)療大模型。

MedBench評測榜單節(jié)選

MedBench是由上海AI實驗室和上海市數(shù)字醫(yī)學創(chuàng)新中心推出的權(quán)威評測平臺，依托頂級醫(yī)療機構(gòu)的專家經(jīng)驗和知識儲備，設(shè)置了醫(yī)學語言理解、醫(yī)學語言生成、醫(yī)學知識問答、復雜醫(yī)學推理和醫(yī)療安全和倫理等5大維度，共包含15項任務、20個數(shù)據(jù)集及30萬道題目，為中文醫(yī)療大模型提供客觀科學的性能評測參考。

MedBench榜單評測維度

醫(yī)療行業(yè)因其獨有的專業(yè)度和嚴謹性，對醫(yī)療大模型的能力提出了極高要求。盡管GPT-4已經(jīng)在通用大模型領(lǐng)域取得了顯著的突破，但由于醫(yī)療文本和知識的特殊性，即使是GPT-4在處理醫(yī)療場景的真實問題時，如果未經(jīng)專門訓練也無法取得很好的成績。醫(yī)渡科技大模型在醫(yī)學知識問答、醫(yī)學語言理解、醫(yī)療安全和倫理三大關(guān)鍵維度中都拔得頭籌，充分展現(xiàn)了其在專業(yè)性、理解力、邏輯性和安全性等方面的醫(yī)療專業(yè)實力。

作為國內(nèi)醫(yī)療智能行業(yè)的頭部企業(yè)，醫(yī)渡科技在醫(yī)療智能領(lǐng)域深耕近10年，其“醫(yī)療智能大腦”YiduCore經(jīng)授權(quán)處理分析了超過40多億份醫(yī)療記錄，沉淀了大量多維度可量化的知識圖譜。醫(yī)渡科技大模型的構(gòu)建不僅基于對大量臨床實踐指南、醫(yī)學文獻的篩選治理，還應用自研的數(shù)據(jù)生成技術(shù)，將多年實踐積累的知識圖譜用于大模型訓練，從而顯著提升了模型在醫(yī)學領(lǐng)域的專業(yè)性能和準確性，增強了大模型生成內(nèi)容的真實性和可解釋性。

醫(yī)渡科技大模型的優(yōu)秀表現(xiàn)，得益于公司在醫(yī)療知識和知識圖譜方面的積累，也離不開其在模型架構(gòu)和算法方面的不斷創(chuàng)新。醫(yī)渡科技具備從硬件組網(wǎng)到訓練微調(diào)、推理的完整技術(shù)能力，國內(nèi)外主流芯片軟硬件全棧適配。并且自研了針對醫(yī)療數(shù)據(jù)特點的專利技術(shù)，進一步提升了模型在醫(yī)學語言理解、醫(yī)療安全等方面的專業(yè)能力。此外，醫(yī)渡科技還采用了數(shù)據(jù)增強和對抗訓練等技術(shù)，以提升模型的魯棒性。

作為“醫(yī)療大腦”YiduCore的核心算法，醫(yī)渡科技大模型為醫(yī)療健康產(chǎn)業(yè)各應用場景提供易使用、高質(zhì)量、可定制的強大賦能。面向B端，醫(yī)渡科技大模型能夠利用強大的專業(yè)能力助力“醫(yī)、教、研、管”等場景各個環(huán)節(jié)提質(zhì)增效，公司原有的數(shù)據(jù)治理、醫(yī)院管理、臨床科研、臨床診療等多個場景的解決方案都基于大模型技術(shù)進行了升級；面向C端用戶，醫(yī)渡科技大模型提供專業(yè)醫(yī)學級別的個性化服務，包括報告解讀、健康問答、導診咨詢等等。目前醫(yī)渡科技大模型正由大語言模型向多模態(tài)大模型升級，從而滿足更多場景的應用需求。

此次登頂MedBench評測榜，醫(yī)渡科技大模型從理解生成“基礎(chǔ)”能力，到復雜推理“進階”能力，再到倫理把控“高級”能力的模型性能都得到了驗證和肯定。醫(yī)渡科技表示，目前取得的成績只是一個開始，醫(yī)療大模型還有很長的路要走。公司將繼續(xù)穩(wěn)步前行，不斷突破創(chuàng)新，以實現(xiàn)醫(yī)療人工智能的更大潛力，推動大模型技術(shù)向更高水平發(fā)展，實現(xiàn)大模型技術(shù)在多領(lǐng)域場景下的滲透和應用，加速推動醫(yī)療行業(yè)的智能化轉(zhuǎn)型升級。

本文為原創(chuàng)內(nèi)容，僅供知識分享之目的，若存在侵權(quán)行為或疏漏，請與本平臺聯(lián)系，我們將及時處理。如需轉(zhuǎn)載請后臺留言，需征得本平臺同意且注明來源轉(zhuǎn)載。

新聞中心

第一！醫(yī)渡科技大模型登頂上海AI實驗室權(quán)威評測榜

第一！醫(yī)渡科技大模型登頂上海AI實驗室權(quán)威評測榜