DeepSeek: R1 Distill Qwen 32B
Deepseek R1 Distill Qwen 32b es un modelo de lenguaje grande destilado basado en [Qwen 2.5 32b] (https://huggingface.co/qwen/qwen2.5-32b), utilizando salidas de [Deepseek R1] (/Deepseek/Deepseek-R1).
Descripción
Deepseek R1 Distill Qwen 32b es un modelo de lenguaje grande destilado basado en [Qwen 2.5 32b] (https://huggingface.co/qwen/qwen2.5-32b), utilizando salidas de [Deepseek R1] (/Deepseek/Deepseek-R1).
ArquitecturaАрхитектура
- Modalidad:
- text->text
- Modalidades de entrada:
- text
- Modalidades de salida:
- text
- Tokenizador:
- Qwen
- Tipo de instrucción:
- deepseek-r1
Contexto y límites
- Longitud del contexto:
- 131072 tokens
- Máx. tokens de respuesta:
- 16384 tokens
- Moderación:
- Deshabilitada
Precios (RUB)
- Solicitud:
- ₽
- Imagen:
- ₽
- Búsqueda web:
- ₽
- Razonamiento interno:
- ₽
- Prompt (1K tokens):
- ₽
- Completion (1K tokens):
- ₽
Parámetros por defecto
- Temperatura:
- 0
Comentarios de usuarios