基于 Ray 架构,封装了多机集群连接、任务调度与服务部署的复杂逻辑,只需传入自定义算法类,即可一键部署多机多卡服务,尤其适用于通过 HTTP 接口对外提供的算法服务。
🌟 核心能力 ✅ 支持多种 Ray cluster 连接模式:本地启动、自动连接、远程连接 ✅ 一键部署算法或 FastAPI 服务 ✅ 自动负载均衡与弹性伸缩,基于资源使用情况自动扩缩容 ✅ 提供同步与异步推理接口,提供跨进程调用接口 ✅ 提供部署状态管理,查看前集群状态、已部署服务信息,支持统一关停与资源释放。
📁 目录结构
.
├── src
│ ├── multinode_deployment.py # 多机部署核心接口
│ └── inference.py # 批量推理任务调度与管理
└── examples # 使用示例:服务部署与调度
🚀 使用示例 示例代码位于 examples/ 目录,涵盖以下使用场景:
- 自定义算法类与FastAPI服务的部署与推理调用
- 模型并行的推理服务部署
- 指定环境依赖的服务部署
- 跨进程调用与集群任务管理