DeepSeek: R1 Distill Qwen 32B

DeepSeek R1 Distill QWEN 32B-это дистиллированная модель большого языка, основанная на [QWEN 2.5 32B] (https://huggingface.co/qwen/qwen2.5-32b), используя выходы из [deepseek r1] (/deepseek/deepseek-r1).

Описание

DeepSeek R1 Distill QWEN 32B-это дистиллированная модель большого языка, основанная на [QWEN 2.5 32B] (https://huggingface.co/qwen/qwen2.5-32b), используя выходы из [deepseek r1] (/deepseek/deepseek-r1).

Архитектура

Модальность:
text->text
Входные модальности:
text
Выходные модальности:
text
Токенизатор:
Qwen
Тип инструкции:
deepseek-r1

Контекст и лимиты

Длина контекста:
131072 токенов
Макс. токенов ответа:
16384 токенов
Модерация:
Отключена

Ценообразование (RUB)

Запрос:
Изображение:
Веб-поиск:
Внутреннее рассуждение:
Prompt (1K токенов):
Completion (1K токенов):

Параметры по умолчанию

Temperature:
0
Начать чат с DeepSeek: R1 Distill Qwen 32B

Комментарии пользователей