Qwen: Qwen3.5-Flash Qwen
Los modelos Flash de lenguaje de visión nativo Qwen3.5 se basan en una arquitectura híbrida que integra un mecanismo de atención lineal con un modelo de mezcla escasa de expertos, logrando una mayor eficiencia de inferencia.
Architecture
- Modality: text+image+video->text
- InputModalities: text, image, video
- OutputModalities: text
- Tokenizer: Qwen3
ContextAndLimits
- ContextLength: 1000000 Tokens
- MaxResponseTokens: 65536 Tokens
- Moderation: Disabled
Pricing
- Prompt1KTokens: 6.5e-08 ₽
- Completion1KTokens: 2.6e-07 ₽
- InternalReasoning: ₽
- Request: ₽
- Image: ₽
- WebSearch: ₽