前言
测试开发工程师在日常工作中需要处理大量测试文档,并且这些文档需要被高效分类、清洗和管理,同时结合强大的 AI 推理能力(如 DeepSeek 模型)进行智能化处理和分析。为此,我们开发了一款基于 PyQt5 的 GUI 工具,集 文件分类、内容清洗、内容展示、DeepSeek推理 和 结果导出 于一体。本地的deepseek-r1由于硬件受限,推理能力难以达到预期。使用三方提供的免费API接口,生成的结果较为满意。由于各位宝子所在公司模板要求不一,这里会将用例导出为json格式输出。
由于阿里云百炼的deepseek-r1接口不支持返回json格式,代码里进行了简单的适配。所有在输入提示词的时候,最好是加入以json格式输出。这样代码可以拿来即用。
本文将详细介绍这款工具的功能实现,并提供完整的源码,让测试工程师轻松实现测试文档的智能化管理与分析。
功能特点
-
智能文档分类:
- 支持常见文本格式:
docx
、xlsx
、md
、txt
、pdf
。 - 使用
阿里云百炼的deepseek-r1
模型API推理,更加智能。 - 使用
NLTK
进行智能清洗,仅保留有效内容。 - 支持用户手动修正分类。
self.template_phrases = [ "请参考以下格式", "本段用于描述", "请参照", "示意图", "文档信息", "版本记录", "目 录", "运行维护", "终端设备", "网络需求", "其他", "【注:以下内容,请做 标注】", "不涉及", "【注:需求规格说明书经业务、开发确认后可形成定版需求,版本号统一为V1.0】", "其他", "【注:以下内容,请做 标注】"
- 支持常见文本格式: