近日,在国际权威医学多模态推理评测集MedXpertQA的MM子集测试中,我国自主研发的医疗人工智能体MentX表现卓越,综合得分位居全球第二、中国区第一,展现出其在医疗人工智能领域的重要技术突破。
MedXpertQA是一项面向全球开放的标准化医学多模态能力评测体系,涵盖复杂临床场景下的影像识别、文本理解与诊断推理任务,测试数据来自多国临床案例,具有高度的专业性与国际公信力。此次评测吸引了包括美国多家科技巨头在内的主流AI模型参与,竞争激烈。
评测结果显示,MentX在“多模态推理”(Reasoning)和“医学理解”(Understanding)两项核心指标上分别取得69.38%和72.36%的高分,综合成绩仅次于GPT-5(72.18%),领先GPT-4o(42.8%)、GPT-5-mini(60.94%)及人类预执业专家平均水平(45.53%)。
尤为突出的是,MentX由国内企业缘启智慧(北京)科技有限公司自主研发,其训练与优化深度依托国家卫健委临床医学指南和医学共识,涵盖电子病历、医学影像、实验室检查等多源信息。
有行业专家认为,MentX在保持国际先进技术水平的同时,具备更强的本土适配性,将为提升基层医疗诊断能力、推动智慧医院建设提供助力。
据悉,MentX采用链式思维(Chain-of-Thought)推理架构,可模拟医生循证医学决策过程,输出可解释的诊断逻辑链,将在全科辅助医疗中展现出良好的临床适用性与安全性。
据了解,下一步,相关企业将持续优化模型在真实医疗环境中的泛化能力,推动AI辅助诊断系统在各级医疗机构落地应用。
来源:新华网,若涉及侵权,请立刻联系删除