本项目旨在解决Qwen3-Reranker-4B模型无法通过Vllm平台直接部署的问题。
自从Qwen3-Reranker系列模型发布以来,迅速在向量模型和重排模型中掀起了使用热潮,但遗憾的是,无法正常使用Vllm部署Qwen3-Reranker-4B模型,截止目前,Vllm官方也没有更新补丁支持,预计官方最快在Vllm v0.9.2中才支持Qwen3-Reranker。作为过渡,于是做了这个版本供大家暂时使用。
https://www.modelscope.cn/models/dengcao/Qwen3-Reranker-4B
https://github.com/dengcao/Qwen3-Reranker-4B
注意:2025年6月20日之前已下载本项目的,请删除后重新使用此方法部署,即可完美在Vllm上运行Qwen3-Reranker-4B模型。
Docker desktop(Windows用户)使用方法如下:
(前提是先在windows部署好Docker desktop)
1、下载本项目到windows任意目录。比如:C:\Users\Administrator\vLLM。
2、打开:Windows PowerShell,输入:wsl,确定后进入WSL。依次执行下列命令:
cd /mnt/c/Users/Administrator/vLLM
docker compose up -d
等待下载docker镜像和加载容器完成即可。
当然以上命令也可以直接在windows命令窗口这样执行:
cd C:\Users\Administrator\vLLM
docker compose up -d
Linux用户的Docker版本,可参考以上方法。
调用Qwen3-Reranker-4B模型API接口:
Docker内的容器APP调用:
API请求地址:http://host.docker.internal:8011/v1/rerank
请求Key:NOT_NEED
Docker外部的APP调用:
API请求地址:http://localhost:8011/v1/rerank
请求Key:NOT_NEED