Xiaomi: MiMo-V2-Omni Xiaomi

MiMo-V2-Omni es un modelo omnimodal de vanguardia que procesa de forma nativa entradas de imagen, video y audio dentro de una arquitectura unificada.

Architecture

  • Modality: text+image+audio+video->text
  • InputModalities: text, audio, image, video
  • OutputModalities: text
  • Tokenizer: Other

ContextAndLimits

  • ContextLength: 262144 Tokens
  • MaxResponseTokens: 65536 Tokens
  • Moderation: Disabled

Pricing

  • Prompt1KTokens: 4e-07 ₽
  • Completion1KTokens: 2e-06 ₽
  • InternalReasoning: ₽
  • Request: ₽
  • Image: ₽
  • WebSearch: ₽