Meta: Llama 3.2 11B Vision Instruct

Llama 3.2 11b Vision - это мультимодальная модель с 11 миллиардами параметров, предназначенная для обработки задач, объединяющих визуальные и текстовые данные.

Описание

Llama 3.2 11b Vision - это мультимодальная модель с 11 миллиардами параметров, предназначенная для обработки задач, объединяющих визуальные и текстовые данные.

Архитектура

Модальность:
text+image->text
Входные модальности:
text, image
Выходные модальности:
text
Токенизатор:
Llama3
Тип инструкции:
llama3

Контекст и лимиты

Длина контекста:
131072 токенов
Макс. токенов ответа:
16384 токенов
Модерация:
Отключена

Ценообразование (RUB)

Запрос:
Изображение:
Веб-поиск:
Внутреннее рассуждение:
Prompt (1K токенов):
Completion (1K токенов):

Параметры по умолчанию

Temperature:
0
Начать чат с Meta: Llama 3.2 11B Vision Instruct

Комментарии пользователей