日期:2024-10-18 14:59
中新經(jīng)緯10月17日電 近期,中國(guó)信通院對(duì)包括GPT-4Turbo、GPT-4O等國(guó)際通用大模型,文心一言、通義千問(wèn)、混元和智譜清言ChatGLM等國(guó)內(nèi)通用大模型,以及靈醫(yī)Bot、夸克健康助手、訊飛星火醫(yī)療大模型和華佗GPT II等醫(yī)療健康行業(yè)大模型進(jìn)行了效能評(píng)估。通過(guò)構(gòu)建測(cè)試數(shù)據(jù)集、開展符合性驗(yàn)證和模擬實(shí)際應(yīng)用場(chǎng)景,邀請(qǐng)醫(yī)療健康、人工智能領(lǐng)域十余位專家形成評(píng)估小組,對(duì)參測(cè)大模型的多輪問(wèn)詢結(jié)果進(jìn)行準(zhǔn)確性、完整性、流暢性、可解釋性等維度的綜合評(píng)分,考察大模型在多學(xué)科知識(shí)問(wèn)答、多形式語(yǔ)言理解、多場(chǎng)景文書生成、多環(huán)節(jié)輔助診療、多輪對(duì)話交