Meta: Llama 3.2 90B Vision Instruct

El modelo LLAMA 90B Vision es un modelo multimodal de primer nivel de nivel superior de 90 mil millones de parámetros diseñado para las tareas de razonamiento visual y lingüístico más desafiantes.

Description

El modelo LLAMA 90B Vision es un modelo multimodal de primer nivel de nivel superior de 90 mil millones de parámetros diseñado para las tareas de razonamiento visual y lingüístico más desafiantes.

ArchitectureАрхитектура

Modality:
text+image->text
InputModalities:
text, image
OutputModalities:
text
Tokenizer:
Llama3
InstructionType:
llama3

ContextAndLimits

ContextLength:
32768 Tokens
MaxResponseTokens:
16384 Tokens
Moderation:
Disabled

PricingRUB

Request:
Image:
WebSearch:
InternalReasoning:
Prompt1KTokens:
Completion1KTokens:

DefaultParameters

Temperature:
0
StartChatWith Meta: Llama 3.2 90B Vision Instruct

UserComments