DeepSeek: R1 Distill Qwen 32B

Deepseek R1 Distill Qwen 32b es un modelo de lenguaje grande destilado basado en [Qwen 2.5 32b] (https://huggingface.co/qwen/qwen2.5-32b), utilizando salidas de [Deepseek R1] (/Deepseek/Deepseek-R1).

Descripción

Deepseek R1 Distill Qwen 32b es un modelo de lenguaje grande destilado basado en [Qwen 2.5 32b] (https://huggingface.co/qwen/qwen2.5-32b), utilizando salidas de [Deepseek R1] (/Deepseek/Deepseek-R1).

ArquitecturaАрхитектура

Modalidad:
text->text
Modalidades de entrada:
text
Modalidades de salida:
text
Tokenizador:
Qwen
Tipo de instrucción:
deepseek-r1

Contexto y límites

Longitud del contexto:
131072 tokens
Máx. tokens de respuesta:
16384 tokens
Moderación:
Deshabilitada

Precios (RUB)

Solicitud:
Imagen:
Búsqueda web:
Razonamiento interno:
Prompt (1K tokens):
Completion (1K tokens):

Parámetros por defecto

Temperatura:
0
Iniciar chat con DeepSeek: R1 Distill Qwen 32B

Comentarios de usuarios