两款专业医疗AI工具在受控模拟测试中展现出超越人类医生的临床表现,但研究人员和独立专家均警告,这一结果尚不意味着相关工具已准备好用于真实临床环境。
据英国《金融时报》周三报道,两项研究结果于周三发表在学术期刊《自然》上。其中,由德国研究人员开发的Mira在包括胰腺癌和肺炎在内的多种疾病分析中超越了医生;谷歌开发的Amie则在治疗方案和检查计划的制定上比人类医生更为精准。这是专业医疗大语言模型在证明临床价值方面迈出的最新一步。
上述研究结果对医疗AI赛道具有重要的市场信号意义,表明专业医疗AI工具在特定场景下已能提供优于通用消费级AI模型的医疗建议。不过,研究人员和独立专家均强调,测试在受控模拟条件下进行,两款工具目前均不具备直接应用于真实临床场景的条件。
Mira由德累斯顿工业大学和海德堡大学的学术团队联合开发,能够调取电子健康档案系统中的患者数据,并从逾85000个选项中做出决策,涵盖诊断检测、药物处方及手术安排等。
研究团队以超过500个急诊科临床病例的信息对Mira进行测试,这些信息通过模拟患者的AI代理以对话形式传递给系统。根据《自然》论文,Mira在阑尾炎、肺栓塞等八种病症上的综合诊断准确率达到87.1%,而由六位跨专科医生组成的评审小组的准确率为78.1%。