Qwen: Qwen3 VL 32B Instruct
Qwen3-VL-32B-Instruct es un modelo de visión y lenguaje multimodal a gran escala diseñado para la comprensión y el razonamiento de alta precisión en texto, imágenes y videos.
Descripción
Qwen3-VL-32B-Instruct es un modelo de visión y lenguaje multimodal a gran escala diseñado para la comprensión y el razonamiento de alta precisión en texto, imágenes y videos.
ArquitecturaАрхитектура
- Modalidad:
- text+image->text
- Modalidades de entrada:
- text, image
- Modalidades de salida:
- text
- Tokenizador:
- Qwen
Contexto y límites
- Longitud del contexto:
- 262144 tokens
- Máx. tokens de respuesta:
- 262144 tokens
- Moderación:
- Deshabilitada
Precios (RUB)
- Solicitud:
- ₽
- Imagen:
- ₽
- Búsqueda web:
- ₽
- Razonamiento interno:
- ₽
- Prompt (1K tokens):
- ₽
- Completion (1K tokens):
- ₽
Parámetros por defecto
- Temperatura:
- 0
Comentarios de usuarios