Qwen: Qwen3.5-Flash Qwen

Los modelos Flash de lenguaje de visión nativo Qwen3.5 se basan en una arquitectura híbrida que integra un mecanismo de atención lineal con un modelo de mezcla escasa de expertos, logrando una mayor eficiencia de inferencia.

Architecture

Modality: text+image+video->text
InputModalities: text, image, video
OutputModalities: text
Tokenizer: Qwen3

ContextAndLimits

ContextLength: 1000000 Tokens
MaxResponseTokens: 65536 Tokens
Moderation: Disabled

Pricing

Prompt1KTokens: 6.5e-08 ₽
Completion1KTokens: 2.6e-07 ₽
InternalReasoning: ₽
Request: ₽
Image: ₽
WebSearch: ₽