Qwen: Qwen3.5-Flash Qwen

Los modelos Flash de lenguaje de visión nativo Qwen3.5 se basan en una arquitectura híbrida que integra un mecanismo de atención lineal con un modelo de mezcla escasa de expertos, logrando una mayor eficiencia de inferencia.

Arquitectura

Modalidad: text+image+video->text
Modalidades de entrada: text, image, video
Modalidades de salida: text
Tokenizador: Qwen3

Contexto y límites

Longitud del contexto: 1000000 tokens
Máx. tokens de respuesta: 65536 tokens
Moderación: Deshabilitada

Precios

Prompt (1K tokens): 6.5e-08 ₽
Completion (1K tokens): 2.6e-07 ₽
Razonamiento interno: ₽
Solicitud: ₽
Imagen: ₽
Búsqueda web: ₽