Xiaomi: MiMo-V2-Omni Xiaomi

MiMo-V2-Omni es un modelo omnimodal de vanguardia que procesa de forma nativa entradas de imagen, video y audio dentro de una arquitectura unificada.

Arquitectura

  • Modalidad: text+image+audio+video->text
  • Modalidades de entrada: text, audio, image, video
  • Modalidades de salida: text
  • Tokenizador: Other

Contexto y límites

  • Longitud del contexto: 262144 tokens
  • Máx. tokens de respuesta: 65536 tokens
  • Moderación: Deshabilitada

Precios

  • Prompt (1K tokens): 4e-07 ₽
  • Completion (1K tokens): 2e-06 ₽
  • Razonamiento interno: ₽
  • Solicitud: ₽
  • Imagen: ₽
  • Búsqueda web: ₽