Meta: Llama 3.2 90B Vision Instruct
El modelo LLAMA 90B Vision es un modelo multimodal de primer nivel de nivel superior de 90 mil millones de parámetros diseñado para las tareas de razonamiento visual y lingüístico más desafiantes.
Descripción
El modelo LLAMA 90B Vision es un modelo multimodal de primer nivel de nivel superior de 90 mil millones de parámetros diseñado para las tareas de razonamiento visual y lingüístico más desafiantes.
ArquitecturaАрхитектура
- Modalidad:
- text+image->text
- Modalidades de entrada:
- text, image
- Modalidades de salida:
- text
- Tokenizador:
- Llama3
- Tipo de instrucción:
- llama3
Contexto y límites
- Longitud del contexto:
- 32768 tokens
- Máx. tokens de respuesta:
- 16384 tokens
- Moderación:
- Deshabilitada
Precios (RUB)
- Solicitud:
- ₽
- Imagen:
- ₽
- Búsqueda web:
- ₽
- Razonamiento interno:
- ₽
- Prompt (1K tokens):
- ₽
- Completion (1K tokens):
- ₽
Parámetros por defecto
- Temperatura:
- 0
Comentarios de usuarios