收起左侧
发新帖

“主任级AI医生”,来了

时间:2025-8-8 11:02 0 33 | 复制链接 |

马上注册,结交更多好友

您需要 登录 才可以下载或查看,没有账号?立即注册

x

参观者在北京科博会上体验AI健康筛查服务系统。
陈晓根摄(人民视觉)


在夸克APP搜索糖尿病该如何治疗。
受访者供图


在江苏省无锡市滨湖区一家养老院,一名老人在使用AI健康检测仪。
新华社记者 柳文惠 摄


江西省宜春市人民医院的医生在智慧病房利用患者床头交互系统查房,并与患者交流治疗方案。
周亮 摄(人民视觉)


在山东省东营市东营区一家智慧健康驿站,老人在医护人员指导下使用5G智能健康一体机体检。
刘智峰 摄(人民视觉)


武汉大学人民医院精神卫生中心主任、主任医师王惠玲讲述“医疗与AI如何结合”。
受访者供图

7月23日,夸克健康大模型成功通过12门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。继5月通过副主任医师考试后,该模型实现能力再跃升,并已全面集成至夸克AI搜索,提供“主任级AI医生”服务,用户在查询健康问题时,选择深度搜索即可调用。

很多临床专家对其表现给予高度评价,并指出它在辅助诊疗、患者教育、心理支持等方面展现出巨大潜力。在垂类模型与通用模型对比中,国产健康大模型呈现出难度越高领先优势越明显的性能曲线,展现出在复杂医学推理任务中的突破。

“给医生提供更多的探索空间”

主任医师的考试非常细致,此次夸克模型选取了12门最核心的学科作为模拟测试,如全科医学等。在12门考试里,夸克健康大模型全部过关。

主任医师考试难度很高。比如,其中的多选题,不仅要判断各选项的概率,还要理解正确性的边界,否则很容易漏选或错选。而案例分析题,更是需要直接解决很细微的、辩证的问题,对于大模型来说一直都是个难点。

夸克健康算法负责人徐健介绍,理解夸克健康大模型,有三个关键点:一是知识性,构建优质的大规模数据资源库;二是正确性,通过技术系统性解决正确性这个大问题;三是推理能力,通过医疗慢思考推理能力解决复杂问题。

实现这三个关键点都不简单。比如知识性,在这一模型中数据被分为四大类,资料、病例、知识以及在此基础上的合成数据。这就要求将大量网页数据、书籍、指南、药品说明书等专业类数据,将临床上积攒的病例,将医学专家结构化思维的结晶,统一进行合成。

“我们不是在训练AI回答医学问题,而是在训练它学会医学思维。”徐健说。“我们的AI大模型可以做到从表象判断到深度分析,这样答题会更好,解释性更强。”

这一成果背后是专业医师团队的深度参与,让大模型有高质量数据支撑。目前,夸克健康大模型拥有千人规模的专业医师标注团队,其中超过400名均为副主任医师及以上的高资历医疗专家,构建了十几万条精标的样本数据。

前不久,大模型产业应用技术联盟医疗专业委员会发布报告,推出了基于大模型的患者医疗服务能力分级框架,并将其分为五级——L1级是信息辅助,L2级是单任务智能辅助,L3级是多任务智能辅助,L4级是高级协同决策辅助,L5级是智慧协同创新辅助。

“确实可以看到在一些疑难病上,AI可以辅助医生,给医生提供更多的探索空间和建议。”徐健说。

数据显示,在有检验检查的疾病上,这一模型的回答准确率已经达到90.78%,接近专科医生水平;在疑难疾病上,其准确率达到85.51%。

凭借在医学领域的专业性,夸克AI搜索已经吸引了一大批医学生和医生群体。夸克健康运营负责人赵存忠介绍,目前平台在全国医学生中月活用户已突破200万,覆盖率过半。

“医生跟AI的结合是大趋势”

对于这位“主任级AI医生”的水平,多位主任医师给出了高度评价。

“用完之后,感到确实会改变诊疗的过程。”北京大学医学部皮肤与性病学系主任、北京大学人民医院主任医师李厚敏说。

李厚敏分享了她与健康大模型的一次互动。某一患者目前既要控制疾病,又需治疗瘢痕,而且此前治疗对患者皮肤屏障的破坏已经影响到其生活质量,在向夸克提供了该患者的年龄、性别、诊断、用药情况后,夸克给出了让李厚敏觉得“非常全面”的四方面建议——既包括对治疗方案的调整,也给出了对瘢痕、色素的管理建议,最后还提出要对这位患者进行心理疏导。“治疗方案合理,用药方案规范,还有疾病的长期管理和患者的心理疏导。”

李厚敏认为,对皮肤科来说,与AI的结合非常容易取得成果。现有的4000多种皮肤疾病都长在皮肤表面,甚至可以通过AI进行识别,很多疾病在AI指导下可以获得很好的处理结果。她说,全国范围内只有1万多名皮肤科医生,但皮肤科患者很多,而且有疾病种类多、发病率高的突出特点。她认为,在AI帮助下,大量全科医生、基层医生对皮肤问题的诊疗水平会大大提高,可以做好随访管理、慢病管理。

“以后AI可能取代不了医生,但医生跟AI的结合是大趋势。”武汉大学人民医院精神卫生中心主任、主任医师王惠玲说。

王惠玲认为,对于抑郁症患者来说,因为医生很忙,很难时刻回答,可以有效借助健康大模型寻找答案。比如,有些患者顾虑是否会吃药成瘾,有些患者顾虑药物的副反应,在应对这些问题的过程中,原本需要医生反复告知,如今AI可以常伴左右。

在李厚敏看来,患者使用健康大模型同样很重要。比如,面对皮肤科医生经常开出的激素药物,很多患者会很犹豫,这时候AI反而可以通过详细解释,缓解大家的激素焦虑。“对于患者来讲,AI既可以缓解焦虑,也传递了更好的慢病管理理念。”

此外,不少患者对于心理疾病存在耻感,不好意思告诉医生。王惠玲说,这种情况下患者可以去问AI,在其帮助之下正确找到方向,比如哪些问题自己锻炼可以起效,哪些问题需要去看医生,能够有效帮助患者避免走弯路。

应用场景日渐广泛

夸克健康以阿里巴巴通义千问大模型为基础,走出了一条面向垂直场景的深度工程化路线。

其核心突破之一,是构建出“慢思考能力”。该能力融合了链式推理与多阶段临床演绎路径建模,驱动模型在面对复杂医疗问题时,能够分阶段、层层深入地推导出最终回答。

构建慢思考能力的前提,是拥有高质量推理训练数据。据了解,夸克构建了“双数据产线+双奖励机制”的工程体系。一方面,将医学数据划分为“可验证”和“不可验证”两类,分别对应诊断类任务和健康建议类任务;另一方面,在训练方法上引入“过程奖励模型”和“结果奖励模型”,分别评估模型推理链的合理性与最终结论的准确性,显著提升模型的临床可解释性和推理一致性。

该体系还设计了多阶段强化学习流程,包括冷启动数据的严格人工校验、多轮样本筛选与难度递进训练策略,以及用于防止“高分投机”的作弊识别机制。通过真实医生标注、“问—思—答”整组数据驱动强化学习,大大强化了这一健康大模型的能力。

对于患者来说,通过AI的判断,可以减少医患信息差,让他们更积极地参与到诊疗过程中。

赵存忠曾经是一名医生,如今做健康大模型的运营负责人,对于患者的需求有了新的看法。他发现随着AI本身的发展,用户尤其是年轻人表达出的需求正在变化。在医疗大模型出现初期,用户搜索的都是简单问题,但在深度思考技术发展之下,用户表达越来越精细。“他们在没去医院之前已经与AI交流过,这样可以迅速了解医生在说什么,降低了沟通成本,有效提高了医疗资源的可用率和普及性。”

医学生们也受益于健康大模型。赵存忠介绍,医学生在夸克上面搜索了很多问题,比如专业的量表、泛知识的内容、临床指南等。很多医学生在做规培或者实习阶段,遇到临床案例分析时,会大量用到大模型的搜索功能。

随着能力不断提升、应用场景日渐广泛,更多健康大模型正逐步走出“模拟考场”,走入真实诊疗场景。(记者 刘少华)

《人民日报海外版》(2025年08月08日 第 08 版)

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条

扫码添加微信客服
快速回复 返回列表 返回顶部