DeepSeek: R1 Distill Qwen 14B

DeepSeek R1 Distill QWEN 14B-это дистиллированная модель большого языка, основанная на [QWEN 2.5 14B] (https://huggingface.co/deepseek-ai/deepseek-r1-distill-qwen-14b), используя выходы из [deepseek r1] (/deepseek/debseek-r1).

Description

DeepSeek R1 Distill QWEN 14B-это дистиллированная модель большого языка, основанная на [QWEN 2.5 14B] (https://huggingface.co/deepseek-ai/deepseek-r1-distill-qwen-14b), используя выходы из [deepseek r1] (/deepseek/debseek-r1).

ArchitectureАрхитектура

Modality:
text->text
InputModalities:
text
OutputModalities:
text
Tokenizer:
Qwen
InstructionType:
deepseek-r1

ContextAndLimits

ContextLength:
32768 Tokens
MaxResponseTokens:
16384 Tokens
Moderation:
Disabled

PricingRUB

Request:
Image:
WebSearch:
InternalReasoning:
Prompt1KTokens:
Completion1KTokens:

DefaultParameters

Temperature:
0
StartChatWith DeepSeek: R1 Distill Qwen 14B

UserComments