如何在dify中添加自定义reranker模型

由数入道

已于 2025-04-16 22:01:47 修改

阅读量3k

点赞数 35

CC 4.0 BY-SA版权

文章标签：语言模型 dify

于 2025-04-16 13:59:12 首次发布

由数入道-易牧阳

本文链接：https://blog.csdn.net/cxr828/article/details/147275525

思路概述

将Xinference中的reranker模型集成到Dify中，主要思路是先在Xinference中部署reranker模型，使其能提供稳定的推理服务，然后通过Dify的模型供应商配置功能，将Xinference作为自定义模型供应商添加到Dify中，从而让Dify可以调用Xinference中的reranker模型进行相关的重排序任务。

技术路径

环境准备：安装并配置好Xinference和Dify的运行环境。
部署reranker模型：在Xinference中启动reranker模型。
配置Dify：编写Dify所需的模型供应商配置文件，并在Dify界面中添加Xinference作为模型供应商。
验证集成效果：在Dify中使用配置好的reranker模型进行测试。

方法步骤

1. 环境准备

安装Xinference：可以通过pip或者Docker进行安装。
- 使用pip安装：

pip3 install "xinference(all)"
- **使用Docker安装**：
docker run -d --name xinference -v "C:\xinference:/xinference" -e XINFERENCE_HOME="/xinference" -p 9997:9997 --gpus all xprobe/xinference:latest xinference-local -H 0.0.0.0 --log-level debug

安装Dify：按照Dify的官方文档进行安装部署，可参考Dify官方安装指南。

2. 部署reranker模型到Xinference

启动Xinference服务：

export XINFERENCE_MODEL_SRC=modelscope
xinference-local --host 0.0.0.0 --port 6006

启动reranker模型：以bge-reranker-v2-m3模型为例，使用以下命令启动：

xinference launch --model-name bge-reranker-v2-m3 --model-type rerank

启动后，记录下模型的UID，后续配置Dify时会

最低0.47元/天解锁文章

200万优质内容无限畅学