DeepSeek: R1 Distill Qwen 14B

DeepSeek R1 Distill QWEN 14B-это дистиллированная модель большого языка, основанная на [QWEN 2.5 14B] (https://huggingface.co/deepseek-ai/deepseek-r1-distill-qwen-14b), используя выходы из [deepseek r1] (/deepseek/debseek-r1).

Описание

DeepSeek R1 Distill QWEN 14B-это дистиллированная модель большого языка, основанная на [QWEN 2.5 14B] (https://huggingface.co/deepseek-ai/deepseek-r1-distill-qwen-14b), используя выходы из [deepseek r1] (/deepseek/debseek-r1).

Архитектура

Модальность:
text->text
Входные модальности:
text
Выходные модальности:
text
Токенизатор:
Qwen
Тип инструкции:
deepseek-r1

Контекст и лимиты

Длина контекста:
32768 токенов
Макс. токенов ответа:
16384 токенов
Модерация:
Отключена

Ценообразование (RUB)

Запрос:
Изображение:
Веб-поиск:
Внутреннее рассуждение:
Prompt (1K токенов):
Completion (1K токенов):

Параметры по умолчанию

Temperature:
0
Начать чат с DeepSeek: R1 Distill Qwen 14B

Комментарии пользователей