日期:2024-10-18 14:59
中新經(jīng)緯10月17日電 近期,中國信通院對包括GPT-4Turbo、GPT-4O等國際通用大模型,文心一言、通義千問、混元和智譜清言ChatGLM等國內(nèi)通用大模型,以及靈醫(yī)Bot、夸克健康助手、訊飛星火醫(yī)療大模型和華佗GPT II等醫(yī)療健康行業(yè)大模型進行了效能評估。通過構(gòu)建測試數(shù)據(jù)集、開展符合性驗證和模擬實際應(yīng)用場景,邀請醫(yī)療健康、人工智能領(lǐng)域十余位專家形成評估小組,對參測大模型的多輪問詢結(jié)果進行準(zhǔn)確性、完整性、流暢性、可解釋性等維度的綜合評分,考察大模型在多學(xué)科知識問答、多形式語言理解、多場景文書生成、多環(huán)節(jié)輔助診療、多輪對話交