Qwen: Qwen3.5-Flash Qwen

Los modelos Flash de lenguaje de visión nativo Qwen3.5 se basan en una arquitectura híbrida que integra un mecanismo de atención lineal con un modelo de mezcla escasa de expertos, logrando una mayor eficiencia de inferencia.

Architecture

  • Modality: text+image+video->text
  • InputModalities: text, image, video
  • OutputModalities: text
  • Tokenizer: Qwen3

ContextAndLimits

  • ContextLength: 1000000 Tokens
  • MaxResponseTokens: 65536 Tokens
  • Moderation: Disabled

Pricing

  • Prompt1KTokens: 6.5e-08 ₽
  • Completion1KTokens: 2.6e-07 ₽
  • InternalReasoning: ₽
  • Request: ₽
  • Image: ₽
  • WebSearch: ₽