Metaflow vLLM Extension

A Metaflow decorator for running vLLM inference servers as task sidecars. This package is a thin wrapper around vLLMs robust batch inference APIs. The primary functionalities are to:

automate runtime operation,
make complex profiling routines easy, and
provide templates for designing scalable batch inference deployments.

Key Design Principles

One Model Per Server: vLLM's OpenAI-compatible server serves one model per instance
Multiple Models: Use separate @vllm decorators on different steps to serve multiple models
Local Backend: Runs vLLM server as a subprocess on the task machine

Usage

from metaflow import FlowSpec, step, vllm

class MyFlow(FlowSpec):
    
    @vllm(model="meta-llama/Llama-3.2-1B")
    @step
    def start(self):
        import openai
        client = openai.OpenAI(
            base_url="http://localhost:8000/v1",
            api_key="token-abc123"
        )
        
        response = client.completions.create(
            model="meta-llama/Llama-3.2-1B",
            prompt="Hello, world!",
            max_tokens=50
        )
        
        print(response.choices[0].text)
        self.next(self.end)
        
    @step
    def end(self):
        pass

Multiple Models

To use multiple models, create separate steps with separate @vllm decorators:

@vllm(model="meta-llama/Llama-3.2-1B")
@step
def step_a(self):
    # Use Llama model
    pass

@vllm(model="Qwen/Qwen2.5-0.5B")  
@step  
def step_b(self):
    # Use Qwen model
    pass

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
.github/workflows		.github/workflows
examples		examples
metaflow_extensions/vllm/plugins		metaflow_extensions/vllm/plugins
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Metaflow vLLM Extension

Key Design Principles

Usage

Multiple Models

About

Uh oh!

Releases

Packages

Uh oh!

Languages

License

outerbounds/metaflow-vllm

Folders and files

Latest commit

History

Repository files navigation

Metaflow vLLM Extension

Key Design Principles

Usage

Multiple Models

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages