Meta: Llama 3.2 90B Vision Instruct
El modelo LLAMA 90B Vision es un modelo multimodal de primer nivel de nivel superior de 90 mil millones de parámetros diseñado para las tareas de razonamiento visual y lingüístico más desafiantes.
Description
El modelo LLAMA 90B Vision es un modelo multimodal de primer nivel de nivel superior de 90 mil millones de parámetros diseñado para las tareas de razonamiento visual y lingüístico más desafiantes.
ArchitectureАрхитектура
- Modality:
- text+image->text
- InputModalities:
- text, image
- OutputModalities:
- text
- Tokenizer:
- Llama3
- InstructionType:
- llama3
ContextAndLimits
- ContextLength:
- 32768 Tokens
- MaxResponseTokens:
- 16384 Tokens
- Moderation:
- Disabled
PricingRUB
- Request:
- ₽
- Image:
- ₽
- WebSearch:
- ₽
- InternalReasoning:
- ₽
- Prompt1KTokens:
- ₽
- Completion1KTokens:
- ₽
DefaultParameters
- Temperature:
- 0
UserComments