vllm.v1.sample.metadata ¶

SamplingMetadata `dataclass` ¶

Source code in vllm/v1/sample/metadata.py

@dataclass
class SamplingMetadata:
    temperature: torch.Tensor | None
    all_greedy: bool
    all_random: bool

    top_p: torch.Tensor | None
    top_k: torch.Tensor | None

    generators: dict[int, torch.Generator]

    # None means no logprobs, 0 means sampled token logprobs only
    max_num_logprobs: int | None

    no_penalties: bool
    prompt_token_ids: torch.Tensor | None
    frequency_penalties: torch.Tensor
    presence_penalties: torch.Tensor
    repetition_penalties: torch.Tensor

    output_token_ids: list[list[int]]

    # `allowed_token_ids_mask` is a 2D bool tensor of shape (max batch size,
    # vocab size).
    allowed_token_ids_mask: torch.Tensor | None

    # req_index -> bad_words_token_ids
    bad_words_token_ids: dict[int, list[list[int]]]

    # Loaded logits processors
    logitsprocs: LogitsProcessors

    # Speculative token ids
    spec_token_ids: list[list[int]] | None = None

all_greedy `instance-attribute` ¶

all_greedy: bool

all_random `instance-attribute` ¶

all_random: bool

allowed_token_ids_mask `instance-attribute` ¶

allowed_token_ids_mask: Tensor | None

bad_words_token_ids `instance-attribute` ¶

bad_words_token_ids: dict[int, list[list[int]]]

frequency_penalties `instance-attribute` ¶

frequency_penalties: Tensor

generators `instance-attribute` ¶

generators: dict[int, Generator]

logitsprocs `instance-attribute` ¶

logitsprocs: LogitsProcessors

max_num_logprobs `instance-attribute` ¶

max_num_logprobs: int | None

no_penalties `instance-attribute` ¶

no_penalties: bool

output_token_ids `instance-attribute` ¶

output_token_ids: list[list[int]]

presence_penalties `instance-attribute` ¶

presence_penalties: Tensor

prompt_token_ids `instance-attribute` ¶

prompt_token_ids: Tensor | None

repetition_penalties `instance-attribute` ¶

repetition_penalties: Tensor

spec_token_ids `class-attribute` `instance-attribute` ¶

spec_token_ids: list[list[int]] | None = None

temperature `instance-attribute` ¶

temperature: Tensor | None

top_k `instance-attribute` ¶

top_k: Tensor | None

top_p `instance-attribute` ¶

top_p: Tensor | None

init ¶

__init__(
    temperature: Tensor | None,
    all_greedy: bool,
    all_random: bool,
    top_p: Tensor | None,
    top_k: Tensor | None,
    generators: dict[int, Generator],
    max_num_logprobs: int | None,
    no_penalties: bool,
    prompt_token_ids: Tensor | None,
    frequency_penalties: Tensor,
    presence_penalties: Tensor,
    repetition_penalties: Tensor,
    output_token_ids: list[list[int]],
    allowed_token_ids_mask: Tensor | None,
    bad_words_token_ids: dict[int, list[list[int]]],
    logitsprocs: LogitsProcessors,
    spec_token_ids: list[list[int]] | None = None,
) -> None

vllm.v1.sample.metadata ¶

SamplingMetadata dataclass ¶

all_greedy instance-attribute ¶

all_random instance-attribute ¶

allowed_token_ids_mask instance-attribute ¶

bad_words_token_ids instance-attribute ¶

frequency_penalties instance-attribute ¶

generators instance-attribute ¶

logitsprocs instance-attribute ¶

max_num_logprobs instance-attribute ¶

no_penalties instance-attribute ¶

output_token_ids instance-attribute ¶

presence_penalties instance-attribute ¶

prompt_token_ids instance-attribute ¶

repetition_penalties instance-attribute ¶

spec_token_ids class-attribute instance-attribute ¶

temperature instance-attribute ¶

top_k instance-attribute ¶

top_p instance-attribute ¶

__init__ ¶

SamplingMetadata `dataclass` ¶

all_greedy `instance-attribute` ¶

all_random `instance-attribute` ¶

allowed_token_ids_mask `instance-attribute` ¶

bad_words_token_ids `instance-attribute` ¶

frequency_penalties `instance-attribute` ¶

generators `instance-attribute` ¶

logitsprocs `instance-attribute` ¶

max_num_logprobs `instance-attribute` ¶

no_penalties `instance-attribute` ¶

output_token_ids `instance-attribute` ¶

presence_penalties `instance-attribute` ¶

prompt_token_ids `instance-attribute` ¶

repetition_penalties `instance-attribute` ¶

spec_token_ids `class-attribute` `instance-attribute` ¶

temperature `instance-attribute` ¶

top_k `instance-attribute` ¶

top_p `instance-attribute` ¶

init ¶