您好,欢迎您

基于医学的Medical based Harness Engineering配合32B国产大模型实现肺癌分期精准判读

04月16日
来源:肿瘤资讯

近日,由良医汇团队联合智谱AI及多家三甲医院资深医生组成的多学科团队,在32B国产模型GLM-4-Air基础上,通过符合医学规则的Medical based Harness Engineering和小样本精准数据,实现非小细胞肺癌的精准分期判断。提出融合医学逻辑的Harness Engineering与选择性监督微调的混合优化框架,在非小细胞肺癌TNM分期的自动化精准判断上,其表现优于通用大模型。相关成果发表于国际知名医学信息学期刊JMIR AI,为基层医疗机构提供了一套可及性高、经济高效的AI辅助分期解决方案。

据悉,良医汇基于自有的Medical based Harness Engineering架构的医生问答工具MedSeek.Ai全面上线,涵盖所有临床科室的专业内容,目前已经服务超10万中国医生,在大家还在争相学习美国OpeneVidence的时候,良医汇团队用更符合医疗原理的Medical based Harness Engineering框架的MedSeek努力实现对国外竞品的超越,更好地服务中国广大医生。文末图片扫码,免费下载使用MedSeek。

肺癌是我国发病率和死亡率最高的恶性肿瘤,其中非小细胞肺癌(NSCLC)占比超过85%。TNM分期——涵盖肿瘤大小(T)、淋巴结转移(N)和远处转移(M)——是制定个体化治疗方案和判断预后的核心依据。然而,TNM分期规则复杂,对医生经验和指南熟悉度要求极高,基层医院常面临精确判断分期的现实挑战。

论文截图2.jpg

核心思路:专业化适配,而非盲目追求参数规模

与通用大模型领域“参数为王”的普遍思路不同,研究团队选择了一款参数规模为32B的中等规模国产模型GLM-4-Air,通过两项策略实现专业化适配:

Medical based Harness Engineering:让AI遵循医学规则

团队将TNM分期拆解为T、N、M三个独立模块,分别设计链式推理流程,并明确注入“侵犯”“癌结节”“淋巴结转移”等关键术语的严格临床定义。模块化设计降低了不同分期标准间的干扰,使模型的每一步判断清晰可追溯。

选择性监督微调(SFT):按需优化,降本增效

研究团队精准识别出T分期和N分期为“推理密集型任务”,针对性应用低秩适应(LoRA)技术进行参数高效微调;而对于更依赖信息检索的M分期,则保留模型原始能力,仅通过提示工程引导。这一“按需优化”策略在提升复杂推理准确率的同时,有效控制了训练成本与过拟合风险。
 
核心启示: 在垂直医疗场景中,模型的专业化适配可能比单纯扩大参数规模更具临床价值。

性能亮眼:多项指标超越通用大模型GPT-4o,兼顾安全与可解释性

在由三甲医院资深医师依据AJCC第8版指南严格标注的独立测试集上,优化后的GLM-4-Air交出优异成绩单:
 ·T分期准确率:92%(GPT-4o为87%)
·N分期准确率:86%(GPT-4o为70%)
·M分期准确率:92%(GPT-4o为78%)
·整体临床分期准确率:90%(GPT-4o为80%)

宏观平均F1分数等综合指标同样全面占优。

可解释性:输出完整推理链条

与仅给出结论的AI不同,该框架在每次分期中均输出完整的推理过程。例如在T分期中,模型会逐条列出“是否侵犯椎体”“肿瘤直径范围”“是否存在同侧不同肺叶癌结节”等判断依据,并引用AJCC指南具体条款。临床医生对推理过程的人工验证显示,模型的中期推理步骤与专家共识具有高度一致性。透明化的“思考过程”让医生可审核、可信赖。

临床安全:重大错误显著减少

分期错误的临床后果差异悬殊。将“无远处转移”(M0)误判为“有远处转移”(M1),可能使患者从根治性治疗直接转向姑息治疗,属重大错误。研究团队对所有错误进行三级临床影响分类,结果显示:

·优化后模型在M分期实现零重大错误;
·在T分期和N分期中,重大错误数量亦明显低于对照的通用大模型GPT-4o。

这表明该框架在关键临床决策节点具备更高的安全性。

部署经济:消费级硬件即可本地运行

与依赖云端API、参数量巨大且运营成本高昂的通用大模型不同,优化后的GLM-4-Air可在4张消费级显卡(如NVIDIA RTX 4090)上流畅运行,单例完整TNM分期推理延迟仅需数秒,完全具备嵌入临床工作流的潜力。

所有数据处理在院内本地完成,无需上传云端,严格满足患者隐私保护与数据安全要求。这一特性对IT预算有限、专科医生不足的基层医院、民营医疗机构及发展中国家医疗系统尤为关键。

研究基础与方法回顾

研究团队构建了492份经资深医师严格标注的真实世界影像报告数据集,以GLM-4-Air为基座,融合结构化提示工程与参数高效监督微调技术:对T/N分期采用低秩适应(LoRA)针对性微调,对M分期通过提示工程优化。最终形成一套高精度、低成本、可本地化部署的混合框架。

结语:让精准分期惠及更多患者

该研究充分表明,通过Medical based Harness Engineering结构化提示工程与按需微调,一个参数规模适中的领域优化模型,能够在NSCLC TNM分期任务上达到领先准确率,并在多项指标上优于通用大模型。更重要的是,该框架充分考虑了真实世界的部署约束——消费级硬件可运行、数据本地化处理、推理延迟满足临床要求——显著降低了AI辅助诊断的应用门槛。

良医汇团队表示:“本次成果是我们在医学智能化管理领域迈出的重要一步。未来我们将持续推动AI技术与临床实践的深度融合,让高水平、标准化的肿瘤分期能力惠及更多医院和患者,为癌症诊疗的标准化与同质化贡献力量。”

责任编辑:肿瘤资讯-lcm
排版编辑:肿瘤资讯-lcm

20260416-181429.jpg

版权声明
版权归肿瘤资讯所有。欢迎个人转发分享,其他任何媒体、网站如需转载或引用本网版权所有内容,须获得授权,且在醒目位置处注明“转自:良医汇-肿瘤医生APP”。

评论
04月16日
杨蔷
溧阳市中医医院 | 肿瘤科
通过Medical based Harness Engineering结构化提示工程与按需微调,一个参数规模适中的领域优化模型,能够在NSCLC TNM分期任务上达到领先准确率,并在多项指标上优于通用大模型。