Z.ai: GLM 4.6V Z.ai

GLM-4.6V es un modelo multimodal de gran tamaño diseñado para la comprensión visual de alta fidelidad y el razonamiento de contexto prolongado en imágenes, documentos y medios mixtos.

Architecture

Modality: text+image+video->text
InputModalities: image, text, video
OutputModalities: text
Tokenizer: Other

ContextAndLimits

ContextLength: 131072 Tokens
MaxResponseTokens: 131072 Tokens
Moderation: Disabled

Pricing

Prompt1KTokens: 3e-07 ₽
Completion1KTokens: 9e-07 ₽
InternalReasoning: ₽
Request: ₽
Image: ₽
WebSearch: ₽