rasa高并发_rasa 并发度-CSDN博客

本文链接：https://blog.csdn.net/weixin_46375180/article/details/143670261

你可以通过编写一个高并发的入口服务来实现请求的转发，将请求均匀地分发到四个Rasa实例（端口 6001-6004）。以下是一个简单的实现思路，使用Python的 `FastAPI` 和 `httpx` 实现：

### 1. 启动 4 个 Rasa 实例
首先，你需要确保 Rasa 实例在端口 6001-6004 启动，Rasa 的配置文件中可以指定各自的端口来分别启动这些实例。例如，运行以下命令启动每个实例：

```bash
rasa run --port 6001
rasa run --port 6002
rasa run --port 6003
rasa run --port 6004
```

### 2. 编写一个入口服务
可以使用 `FastAPI` 创建一个入口服务，通过轮询或负载均衡的方式将请求分发到不同的实例上。`httpx` 可以帮助进行异步请求以提高并发性。

```python
from fastapi import FastAPI, Request
import httpx
import itertools

app = FastAPI()

# 配置 Rasa 服务的端口列表
rasa_ports = [6001, 6002, 6003, 6004]
rasa_urls = [f"http://localhost:{port}/webhooks/rest/webhook" for port in rasa_ports]

# 轮询指针
rasa_cycle = itertools.cycle(rasa_urls)

# 定义转发函数
async def forward_request_to_rasa(data: dict):
    rasa_url = next(rasa_cycle)
    async with httpx.AsyncClient() as client:
        response = await client.post(rasa_url, json=data)
    return response.json()

# 定义接收消息的端点
@app.post("/chat")
async def chat(request: Request):
    data = await request.json()
    rasa_response = await forward_request_to_rasa(data)
    return rasa_response
```

### 3. 启动入口服务
保存此脚本并通过以下命令启动该入口服务：

```bash
uvicorn app:app --host 0.0.0.0 --port 8000
```

这样，所有请求都会先发送到入口服务（端口 8000），然后由服务均匀分发到 Rasa 实例上，利用轮询策略平衡负载。