Qwen: Qwen3.5-Flash Qwen
Los modelos Flash de lenguaje de visión nativo Qwen3.5 se basan en una arquitectura híbrida que integra un mecanismo de atención lineal con un modelo de mezcla escasa de expertos, logrando una mayor eficiencia de inferencia.
Arquitectura
- Modalidad: text+image+video->text
- Modalidades de entrada: text, image, video
- Modalidades de salida: text
- Tokenizador: Qwen3
Contexto y límites
- Longitud del contexto: 1000000 tokens
- Máx. tokens de respuesta: 65536 tokens
- Moderación: Deshabilitada
Precios
- Prompt (1K tokens): 6.5e-08 ₽
- Completion (1K tokens): 2.6e-07 ₽
- Razonamiento interno: ₽
- Solicitud: ₽
- Imagen: ₽
- Búsqueda web: ₽