Skip to content

jisyST/MultiNode-Deployment

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

4 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

MultiNode Deployment

基于 Ray 架构,封装了多机集群连接、任务调度与服务部署的复杂逻辑,只需传入自定义算法类,即可一键部署多机多卡服务,尤其适用于通过 HTTP 接口对外提供的算法服务。

🌟 核心能力 ✅ 支持多种 Ray cluster 连接模式:本地启动、自动连接、远程连接 ✅ 一键部署算法或 FastAPI 服务 ✅ 自动负载均衡与弹性伸缩,基于资源使用情况自动扩缩容 ✅ 提供同步与异步推理接口,提供跨进程调用接口 ✅ 提供部署状态管理,查看前集群状态、已部署服务信息,支持统一关停与资源释放。

📁 目录结构

.

├── src

│ ├── multinode_deployment.py # 多机部署核心接口

│ └── inference.py # 批量推理任务调度与管理

└── examples # 使用示例:服务部署与调度

🚀 使用示例 示例代码位于 examples/ 目录,涵盖以下使用场景:

  • 自定义算法类与FastAPI服务的部署与推理调用
  • 模型并行的推理服务部署
  • 指定环境依赖的服务部署
  • 跨进程调用与集群任务管理

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages