Xiaomi: MiMo-V2-Omni Xiaomi
MiMo-V2-Omni es un modelo omnimodal de vanguardia que procesa de forma nativa entradas de imagen, video y audio dentro de una arquitectura unificada.
Architecture
- Modality: text+image+audio+video->text
- InputModalities: text, audio, image, video
- OutputModalities: text
- Tokenizer: Other
ContextAndLimits
- ContextLength: 262144 Tokens
- MaxResponseTokens: 65536 Tokens
- Moderation: Disabled
Pricing
- Prompt1KTokens: 4e-07 ₽
- Completion1KTokens: 2e-06 ₽
- InternalReasoning: ₽
- Request: ₽
- Image: ₽
- WebSearch: ₽