Skip to content

vllm 支持流式的batch推理吗? #5

@yungangwu

Description

@yungangwu

我看源码好像vllm还是一条一条的推理的,并不是一次计算所有的输入的。也没有看到文档说能否支持stream的batching推理。

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions