inclusionAI: Ring 1T
Ring-1T ha experimentado una ampliación continua con entrenamiento de aprendizaje por refuerzo de recompensa verificable (RLVR) a gran escala, desbloqueando aún más las capacidades de razonamiento en lenguaje natural del modelo básico de billones de parámetros.
Descripción
Ring-1T ha experimentado una ampliación continua con entrenamiento de aprendizaje por refuerzo de recompensa verificable (RLVR) a gran escala, desbloqueando aún más las capacidades de razonamiento en lenguaje natural del modelo básico de billones de parámetros.
ArquitecturaАрхитектура
- Modalidad:
- text->text
- Modalidades de entrada:
- text
- Modalidades de salida:
- text
- Tokenizador:
- Other
Contexto y límites
- Longitud del contexto:
- 131072 tokens
- Máx. tokens de respuesta:
- 131072 tokens
- Moderación:
- Deshabilitada
Precios (RUB)
- Solicitud:
- ₽
- Imagen:
- ₽
- Búsqueda web:
- ₽
- Razonamiento interno:
- ₽
- Prompt (1K tokens):
- ₽
- Completion (1K tokens):
- ₽
Parámetros por defecto
- Temperatura:
- 0
Comentarios de usuarios