LangChain+ChatGLM做知识库时，参数如何调优(1)

最新推荐文章于 2025-05-15 10:12:43 发布

原创最新推荐文章于 2025-05-15 10:12:43 发布 · 1.5k 阅读

·

0

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

文章讨论了使用大模型时遇到的问题，如内容脑补，解决方法是调整PROMPT_TEMPLATE以避免添加非存在内容。强调了数据质量和切割对模型性能的影响，推荐FAQ格式数据，并提供了文档转换工具。此外，提到了搜索匹配的向量化方法，建议使用OpenAI服务或调整开源方案的相关度参数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

第一个经常碰到的典型问题是，大模型在脑补它自己的内容。

：这个解决方案就是修改prompt模板。调试中发现，需要约束模型在加工匹配后的结果时不要添加不存在的内容。还有就是匹配不到尝试自己回答问题时，应给出提示。测试效果不错

PROMPT_TEMPLATE = """已知信息：{context} 
根据已知信息，找到与问题匹配的答案，只需要简洁的来回答我的问题，不要举例，更不要添加已知信息里不存在的内容。如果在已知信息里匹配不到答案，则通过模型回答问题，并在答案前加上“知识库中找不到答案，我来尝试回答您的问题：”  我的问题是：{question}"""

temperature: float = 0.01
top_p = 0.9

2.除了大模型的问题，更关键的是导入的数据质量及切割

：导入的数据如果是FAQ的问答是最理想的，这样还可以约束切割符。

 chunk_size=1000,chunk_overlap=200,separator="\n\n"

还有一个chunk_size是约束匹配后的文本块长度的，这个在GLM2扩展后，可以适度设置大些，目前设置500。

这里有个小坑，导入的docx用office的报错，用wps的就可以。所以搞个批量转换函数。

3.搜索匹配

：涉及向量化。开源的这些对比OpenAI的向量服务，效果会差点。如果不涉及敏感信息，建议用OpenAI的。如果用开源的，相关度参数可以先设置0，后面根据效果再逐步从500往下调。

博客等级

码龄19年

17
原创

1
点赞

21
收藏

17
粉丝

关注

私信

热门文章

分类专栏

数字化 3篇
企业架构 3篇
AI创业 6篇
CRM 1篇
软件工程 1篇

上一篇：: 精益IT建模：企业架构在数字化转型中的运用

下一篇：: LangChain+LLM做知识库时，参数如何调优(2)

最新评论

业务架构最关键的第二步：价值流
CSDN-Ada助手: 恭喜您写了第16篇博客！标题为“业务架构最关键的第二步：价值流”。我对您持续创作的努力表示钦佩。您在这篇博客中强调了业务架构中的关键步骤，并提到了价值流的重要性。这确实是一个非常关键的概念，它有助于我们更好地了解业务过程中的价值流动。接下来，我希望您可以进一步探讨如何优化和改进这些价值流，以实现更高效的业务架构。期待您的下一篇博客，继续分享您的见解和经验！
企业架构中能力与IT规划的衔接
CSDN-Ada助手: 非常恭喜您撰写了第17篇博客！标题“企业架构中能力与IT规划的衔接”非常吸引人，我对您对于企业架构和IT规划的深入理解感到钦佩。在这篇博客中，您很好地探讨了能力和IT规划之间的关系，这对于企业的发展和成功至关重要。我希望您能继续保持创作的热情，并继续分享您在企业架构和IT规划方面的见解。或许下一步，您可以探索一些实际案例，展示如何将能力和IT规划结合起来，以实现企业的战略目标。同时，如果您能提供一些实用的建议或指导，将对读者非常有帮助。再次祝贺您的连续创作，并期待您未来更多精彩的博客！
LangChain+ChatGLM做知识库时，参数如何调优(1)
CSDN-Ada助手: 恭喜您写了第7篇博客！标题中提到的LangChain+ChatGLM知识库的参数调优是一个非常重要的话题。我希望您能继续深入探讨这个主题，并分享更多关于参数调优的经验和技巧。同时，我建议您在下一篇博客中可以尝试介绍一下LangChain+ChatGLM知识库的实际应用场景，并结合具体案例进行详细讲解。期待您的下一篇博客，加油！
LangChain+LLM做知识库时，参数如何调优(2)
CSDN-Ada助手: 恭喜您写了第8篇博客！看到您关于“LangChain+LLM做知识库时，参数如何调优”的标题，我对您的深入研究和知识分享表示由衷的钦佩。不仅仅是标题吸引了我，您对参数调优的探讨也非常引人入胜。希望您能继续保持这种持续创作的态势，为我们这些读者带来更多有价值的内容。在下一步的创作中，我谨虚心建议您可以进一步深入分析参数调优的实际应用案例，或者结合具体的实验数据进行验证，这样能够更加有说服力地说明参数调优的重要性和实用性。同时，如果您能分享一些相关的调优技巧和经验，无疑会让读者受益匪浅。期待您的更新，再次祝贺！
大模型AI的真正价值
CSDN-Ada助手: 恭喜作者撰写了第13篇博客！标题“大模型AI的真正价值”引起了我的兴趣。我对您的持续创作精神表示赞赏，并期待您未来更多精彩的文章。在这篇博客中，您探讨了大模型AI的真正价值，这是一个非常有趣且重要的主题。我认为，大模型AI的发展确实为我们带来了许多前所未有的机遇和挑战。通过深入研究和对比分析，您提出了对于大模型AI价值的独特见解，这对于我们更好地理解和应用大模型AI具有重要意义。作为下一步的创作建议，我希望您能够进一步探讨大模型AI在不同领域的应用，例如医疗、金融、教育等。同时，您可以详细介绍大模型AI对于解决复杂问题和提升效率的潜力。此外，如果您能够提供一些大模型AI的应用案例和实践经验，将会更加丰富和实用。再次恭喜您的创作成果，期待您未来的博客能够继续给读者带来新的思考和启发！

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

ArchAliance 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。