对于已问世的中医药大语言模型,笔者觉得这条“留言”点评最到位:“生的随机,死的模糊”。用“大模型幻觉”对抗“大世界玄学”。当然这篇主要目的是总结下目前的中医药大语言模型,了解下喂了这么资料后,从医学角度还能怎么提高大模型效果。
先来看看目前已问世的中医药大模型:
表:目前已问世中医药大语言模型一览
大模型 | 联合开发单位 | 部分特色功能 | |
1 | 仲景 | 复旦大学、同济大学 | 中医方剂数据及诊断思维逻辑的推理 |
2 | 海河·岐伯 | 天津智图、天津中医药大学、现代中药高等实验室等 | 智能问诊、生成电子病历等 |
3 | 数智岐黄 | 华东师范大学、上海中医药大学、华东理工大学等 | 中医药知识智能问诊、健康咨询、中医药知识建构态交互 |
4 | 数智本草 | 天士力、华为云 | 发现天然药物,生成新方剂 |
5 | TCMLLM | 北京交通大学计算机与信息技术学院医学智能团队 | 实现中医临床辅助诊疗(病证诊断、处方推荐等)中医药知识问答等任务 |
6 | 神农中医药大模型 | 华东师范大学计算机科学与技术学院智能知识管理与团队服务 | 医疗问诊 |
7 | Huang-Di | 由南京大学信息管理学院及郑州大学人工智能学院合作完成 | 中医古籍知识问答 |
8 | 本草智库·中医药大模型 | 成都中医药大学、药数据圈、天府中药数据仓 | 中药知识提取与生成、中药重金属领域解决方案输出 |
9 | 盘古大模型 | 九方健策、华为云 | 药物研发、智慧医疗等 |
10 | “华佗”中医药大模型 | 室州市场监管、华为 | 药物研发、智慧医疗等 |
11 | “歧黄问道”大模型 | 太经中医院 | 临床治疗,中医养生调理方案等 |
12 | “讯飞星火”大模型 | 科大讯飞 | 辅助诊疗,健康咨询 |
13 | “聪宝素问”大模型 | 中医聪宝 | 辅助诊疗,诊后随访,疗效评估,健康管理 |
14 | “天河灵枢”大模型 | 国家超级计算天河中心、天津中医药大学等 | 量身定制针灸治疗方案 |
15 | 中医药横琴大模型 | 横琴安头智能 | 辅助诊疗,提供个性化治疗方案 |
先简单总结下模型:
1. 具体构建方法
-
各个模型使用预训练和微调策略进行构建,如“仲景”模型基于Qwen1.5-1.8B-Chat模型,通过在专有医疗数据集上的多次迭代训练,并严格设置prompt模板实现模型在中医领域的推理能力。
-
大多数模型,如"数智岐黄"和"数智本草",采用了预训练+检索增强生成的方式,同时结合了插件调用技术以实现特定功能。
2. 所使用的语料
-
这些模型广泛采用了中医经典文献、医学教科书、临床病历等作为核心语料。
-
例如,“数智岐黄”模型的语料包括《黄帝内经》、《伤寒杂病论》等1000余本中医古籍,以及相关中医药知识图谱,而“数智本草”结合了数千万条中药成分、靶点、专利等内容,确保涵盖了药物、方剂、病理等多方面信息。
3. 应用场景
-
这些大模型广泛应用于中医药知识问答、临床辅助诊疗、药物研发及健康管理等场景。
-
如“海河·岐伯”大模型基于古医书记载的场景模拟了中医问诊,为中医药数智化转型提供了支持;“天河灵枢”大模型则在针灸治疗方案个性化推荐方面发挥作用,进一步推动针灸领域的智能化发展。
现存的主要问题
申明:如果大模型是骗投资人钱,那当我什么都没说,这些大模型岁月静好!
从实际医学应用角度出发,以下问题要供同行考虑的,尤其是工科同行考量:
1. 高质量语料
这些模型在构建过程中,虽然广泛使用了中医典籍和临床文献,但缺乏严格的循证医学评估,也大量使用低质量的证据(见下金字塔)。循证医学强调通过系统性评估和科学实验证据验证治疗效果,而许多中医药大模型所使用的数据尚未经过现代循证医学的严格审查。因此,模型给出的诊疗建议可能未经过充分的科学验证,缺少临床随机对照试验的支持,导致其在临床应用中可靠性和有效性难以得到保证。最终就是“幻觉”+“垃圾结论” = 错上加错。
如果不想让大模型还要做META分析,那高质量的结论性语料主要得综合程度很高的循证证据,这个是非常耗费人力和财力的领域,是无数医学科研同行研究成果的结晶。那如何获得这些高质量的语料证据,这就是完全是“循证医学”的问题。
- 模型透明度与可解释性
目前中医药大语言模型在决策过程中往往缺乏透明度和可解释性,这使得模型给出的诊断或治疗建议变得难以理解和验证。特别是在推荐具体治疗方案时,模型是基于哪些数据和逻辑进行推理,医务人员很难获得详细解释。
因此,医生无法明确知道模型决策的依据和过程,也难以对模型的推荐进行合理性判断和干预。这种不透明性可能严重影响医务人员对模型结果的信任和接受度,进而限制模型在实际临床中的应用。尤其在医疗领域,医生对患者的治疗负有直接责任,如果无法解释诊断依据和治疗逻辑,医务人员可能倾向于不依赖模型的建议。这种情况不仅削弱了模型对医学实践的支持作用,也可能使模型的应用风险增加。
在中医药大语言模型甚至是医学大模型的开发中,需要特别关注提高模型的可解释性,让模型的推理和来源过程更加透明,以便医务人员能够理解和信任模型的建议,从而更有效地将其应用于患者的诊疗决策中。
3. 决策所提供的信息和内在逻辑
这些中医药大语言模型在构建时,可能忽视了医学中的一些重要内在逻辑。例如,在医学中,症状与病因的联系是通过长期积累的临床经验和系统性研究建立起来的,而这些模型可能无法有效理解和把握这种联系的因果关系。此外,疾病的诊断和治疗过程往往涉及多个复杂的因素,包括个体差异、并发症的存在、药物的交互作用等,而大模型的推理方式可能不具备足够的细致性,无法如医生一般整合多维度的信息做出精准的医疗决策。此外,医学中的许多概念是抽象和动态的,无法通过简单的文字描述完全传达,如机体的病理变化、疾病进展的过程、患者的整体健康状况等,这些方面在模型的训练和推理中可能缺乏深入体现,从而限制了模型在医学中的实用性。
从医疗决策角度来看,医学不仅需要考虑诊断的精确性,还需要评估不同治疗方案的风险、收益及患者特征。大模型在这方面往往缺乏细致的推理能力,尤其是在面对多种治疗方案时,难以权衡并给出个性化的建议。而医学决策的核心在于循证,需基于科学实验和临床数据,当前这些模型在循证医学方面仍存在明显不足,影响其应用于临床决策的安全性。
简单一句话结论
交互应答类专科医学大模型真要落地应用,还有一些路要走(但未必很长)。
读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用
对于0基础小白入门:
如果你是零基础小白,想快速入门大模型是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。
包括:大模型学习线路汇总、学习阶段,大模型实战案例,大模型学习视频,人工智能、机器学习、大模型书籍PDF。带你从零基础系统性的学好大模型!
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费
】🆓
👉AI大模型学习路线汇总👈
大模型学习路线图,整体分为7个大的阶段:(全套教程文末领取哈)
第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉大模型实战案例👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
👉大模型视频和PDF合集👈
观看零基础学习书籍和视频,看书籍和视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费
】🆓