Qwen 系列模型(如 Qwen-1.8B、Qwen-72B 等)的分词器(Tokenizer)设置
目录
整体配置说明
该配置属于 Qwen 系列模型(如 Qwen-1.8B、Qwen-72B 等)的分词器(Tokenizer)设置,主要定义了特殊标记、输入格式、截断规则等。Qwen 是阿里巴巴开发的开源语言模型,尤其在对话和工具调用场景中表现突出。
核心字段解析
1. 特殊标记相关配置
"added_tokens_decoder": {
该配置属于 Qwen 系列模型(如 Qwen-1.8B、Qwen-72B 等)的分词器(Tokenizer)设置,主要定义了特殊标记、输入格式、截断规则等。Qwen 是阿里巴巴开发的开源语言模型,尤其在对话和工具调用场景中表现突出。
"added_tokens_decoder": {