Z.ai: GLM 4.6V Z.ai
GLM-4.6V es un modelo multimodal de gran tamaño diseñado para la comprensión visual de alta fidelidad y el razonamiento de contexto prolongado en imágenes, documentos y medios mixtos.
Architecture
- Modality: text+image+video->text
- InputModalities: image, text, video
- OutputModalities: text
- Tokenizer: Other
ContextAndLimits
- ContextLength: 131072 Tokens
- MaxResponseTokens: 131072 Tokens
- Moderation: Disabled
Pricing
- Prompt1KTokens: 3e-07 ₽
- Completion1KTokens: 9e-07 ₽
- InternalReasoning: ₽
- Request: ₽
- Image: ₽
- WebSearch: ₽