DeepSeek: Deepseek R1 0528 Qwen3 8B

Deepseek-R1-0528 es un lanzamiento ligeramente mejorado de Deepseek R1 que aprovecha más trucos de computa y posterior a la capacitación, empujando su razonamiento e inferencia al borde de modelos insignia como O3 y Gemini 2.5 Pro.

Descripción

Deepseek-R1-0528 es un lanzamiento ligeramente mejorado de Deepseek R1 que aprovecha más trucos de computa y posterior a la capacitación, empujando su razonamiento e inferencia al borde de modelos insignia como O3 y Gemini 2.5 Pro.

ArquitecturaАрхитектура

Modalidad:
text->text
Modalidades de entrada:
text
Modalidades de salida:
text
Tokenizador:
Qwen
Tipo de instrucción:
deepseek-r1

Contexto y límites

Longitud del contexto:
32768 tokens
Máx. tokens de respuesta:
32768 tokens
Moderación:
Deshabilitada

Precios (RUB)

Solicitud:
Imagen:
Búsqueda web:
Razonamiento interno:
Prompt (1K tokens):
Completion (1K tokens):

Parámetros por defecto

Temperatura:
0
Iniciar chat con DeepSeek: Deepseek R1 0528 Qwen3 8B

Comentarios de usuarios