DeepSeek: R1 Distill Qwen 14B

Deepseek R1 Distill Qwen 14B es un modelo de lenguaje grande destilado basado en [Qwen 2.5 14b] (https://huggingface.co/deepseek-ai/deepseek-r1-distill-qwen-14b), usando salidas de [Deepseek R1] (/Deepseek/Deepseek-R1).

Descripción

Deepseek R1 Distill Qwen 14B es un modelo de lenguaje grande destilado basado en [Qwen 2.5 14b] (https://huggingface.co/deepseek-ai/deepseek-r1-distill-qwen-14b), usando salidas de [Deepseek R1] (/Deepseek/Deepseek-R1).

ArquitecturaАрхитектура

Modalidad:
text->text
Modalidades de entrada:
text
Modalidades de salida:
text
Tokenizador:
Qwen
Tipo de instrucción:
deepseek-r1

Contexto y límites

Longitud del contexto:
32768 tokens
Máx. tokens de respuesta:
16384 tokens
Moderación:
Deshabilitada

Precios (RUB)

Solicitud:
Imagen:
Búsqueda web:
Razonamiento interno:
Prompt (1K tokens):
Completion (1K tokens):

Parámetros por defecto

Temperatura:
0
Iniciar chat con DeepSeek: R1 Distill Qwen 14B

Comentarios de usuarios