Z.ai: GLM 4.6V Z.ai

GLM-4.6V es un modelo multimodal de gran tamaño diseñado para la comprensión visual de alta fidelidad y el razonamiento de contexto prolongado en imágenes, documentos y medios mixtos.

Architecture

  • Modality: text+image+video->text
  • InputModalities: image, text, video
  • OutputModalities: text
  • Tokenizer: Other

ContextAndLimits

  • ContextLength: 131072 Tokens
  • MaxResponseTokens: 131072 Tokens
  • Moderation: Disabled

Pricing

  • Prompt1KTokens: 3e-07 ₽
  • Completion1KTokens: 9e-07 ₽
  • InternalReasoning: ₽
  • Request: ₽
  • Image: ₽
  • WebSearch: ₽