炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!
(来源:网易科技)
记者|董温淑
编辑|高宇雷
7月23日,「电厂」获悉,夸克健康大模型已成功通过中国12门核心学科的主任医师笔试评测,成为国内首个完成这一挑战的大模型。
当下“主任级AI医生”能力已全面集成至夸克的AI搜索中,用户在查询健康问题时,选择深度搜索即可调用。
另据夸克健康运营负责人赵存忠介绍,凭借在医学领域的专业性,夸克AI搜索已吸引了一大批医学生和医生群体。目前平台在全国医学生中月活用户已突破 200 万,覆盖率过半,他们广泛使用夸克用于基础知识搜索、考试备考和临床辅助诊疗。
对于健康大模型而言,如何提高正确率、尽可能降低幻觉,是一个尤为重要的命题。夸克健康算法负责人徐健举例说,孕妇妊娠期是不能吃布洛芬的,属于禁忌用药。围绕禁忌症的正确性问题,在Pretrain阶段夸克准备好药品说明书,在SFT阶段夸克构造一个禁忌症问答的有监督学习任务提升模型做得对的概率,再在RLHF阶段构造错和对的对比例子,告诉模型区分错误的边界。
“当我们在模型训练的3大环节上都掌握了对指定细微错误的解决技术,我们就可以全面的去解决好医疗中最重要的幻觉问题”,徐健说。
值得一提的是,本次的能力升级,是夸克健康大模型继5月通过副主任医师职称考试后实现的再次突破。与DeepSeek-R1(0528)模型、O3-mini模型的对比测评结果显示,随着医师资格考试等级趋高、试题难度提升,夸克健康大模型呈现出领先优势增大的趋势。
在发布会上,夸克团队介绍了健康大模型本次升级前在数据、训练方法、训练流程等方面进行的设计。
比如构建“双数据产线 + 双奖励机制”的工程体系。一方面,将医学数据划分为“可验证”和“不可验证”两类,分别对应诊断类任务和健康建议类任务。并且,夸克健康大模型搭建了拥有千人规模的专业医师标注团队,其中超过400名均为副主任医师及以上的高资历医疗专家。
赵存忠补充道:“除了技术产品策略,我们也根据用户侧的问题,在产品上进行了分层处理,比如偏严肃医疗的问题,会对回答的准确性进行明确界定,但是如果是偏健康饮食类的问题,比如‘吃西瓜会不会中毒’,则会进行相对差异化的设计。在产品上线前,我们针对效果会进行评价,满意度准确率至少达到90%以上才允许产品上线。”
在训练方法上引入“过程奖励模型”和“结果奖励模型”,分别评估模型推理链的合理性与最终结论的准确性,显著提升模型的临床可解释性和推理一致性。
徐健总结称,本次夸克健康大模型的一大创新是构建出了“慢思考能力”。该能力融合了链式推理与多阶段临床演绎路径建模,驱动模型在面对复杂医疗问题时,能够分阶段、层层深入地推导出最终回答。
在发布会后的媒体沟通环节,夸克健康产品负责人姚垚等人对「电厂」强调,夸克健康大模型聚焦在提升用户价值。
“这是我们业务方面的共识,商业化方面,我们和一些服务机构有一些轻度尝试,比如说服务机构在用药分等级方向上结合,但并不是作为主要推进方向。”姚垚讲道。