Meta: Llama 3.2 90B Vision Instruct
Модель Vision Llama 90B представляет собой мультимодальную мультимодальную модель с 90 миллиардами параметра, предназначенная для наиболее сложных визуальных рассуждений и языковых задач.
Описание
Модель Vision Llama 90B представляет собой мультимодальную мультимодальную модель с 90 миллиардами параметра, предназначенная для наиболее сложных визуальных рассуждений и языковых задач.
Архитектура
- Модальность:
- text+image->text
- Входные модальности:
- text, image
- Выходные модальности:
- text
- Токенизатор:
- Llama3
- Тип инструкции:
- llama3
Контекст и лимиты
- Длина контекста:
- 32768 токенов
- Макс. токенов ответа:
- 16384 токенов
- Модерация:
- Отключена
Ценообразование (RUB)
- Запрос:
- ₽
- Изображение:
- ₽
- Веб-поиск:
- ₽
- Внутреннее рассуждение:
- ₽
- Prompt (1K токенов):
- ₽
- Completion (1K токенов):
- ₽
Параметры по умолчанию
- Temperature:
- 0
Комментарии пользователей