DeepSeek: R1 Distill Qwen 32B
DeepSeek R1 Distill QWEN 32B-это дистиллированная модель большого языка, основанная на [QWEN 2.5 32B] (https://huggingface.co/qwen/qwen2.5-32b), используя выходы из [deepseek r1] (/deepseek/deepseek-r1).
Описание
DeepSeek R1 Distill QWEN 32B-это дистиллированная модель большого языка, основанная на [QWEN 2.5 32B] (https://huggingface.co/qwen/qwen2.5-32b), используя выходы из [deepseek r1] (/deepseek/deepseek-r1).
Архитектура
- Модальность:
- text->text
- Входные модальности:
- text
- Выходные модальности:
- text
- Токенизатор:
- Qwen
- Тип инструкции:
- deepseek-r1
Контекст и лимиты
- Длина контекста:
- 131072 токенов
- Макс. токенов ответа:
- 16384 токенов
- Модерация:
- Отключена
Ценообразование (RUB)
- Запрос:
- ₽
- Изображение:
- ₽
- Веб-поиск:
- ₽
- Внутреннее рассуждение:
- ₽
- Prompt (1K токенов):
- ₽
- Completion (1K токенов):
- ₽
Параметры по умолчанию
- Temperature:
- 0
Комментарии пользователей